ПОИСК Статьи Рисунки Таблицы Отбор признаков при помощи метрики расстояний из "Распознавание образом в химии" Разработан метод отбора признаков по критерию расстояния, который позволяет определять подлежащие исключению признаки [13]. [c.125] Определенное таким образом значение t представляет максимальную полутолщину конкретной решающей поверхности, при которой все еще обеспечивается сходимость решения, т. е. правильная классификация всех объектов обучающей выборки. [c.125] Чтобы оценить важность того или иного дескриптора, в процедуре отбора признаков было предусмотрено временное исключение этого дескриптора из совокупности данных. После этого были определены все расстояния di и найдены значения t. Предполагалось, что исключение важного дескриптора должно привести к значительному уменьшению t, тогда как отбрасывание постороннего дескриптора вызовет лишь незначительное изменение t. После выполнения таких расчетов для всех дескрипторов совокупности данных найденные значения t сравнивались. Этот алгоритм предполагает, что максимальная величина t соответствует самому малозначащему дескриптору, который подлежит исключению из совокупности данных. Такую процедуру можно неоднократно повторять, исключая дескриптор за дескриптором. Но, как оказалось, наилучшие результаты достигаются в том случае, когда в процессе отбора признаков весовой вектор периодически пересчитывается. [c.125] Спектры синтезированной выборки данных в действительности представляют набор случайных фонов, на которые можно накладывать различные признаки для проверки эффективности разных способов обучения. Преимущества подобной выборки перед совокупностью настоящих спектров заключаются в том, что ее составитель имеет возможность поставить задачу обучения в тщательно контролируемых условиях, когда ему заранее известно, какие признаки важны и информацию какого рода они несут. [c.126] Наконец, для сравнительной оценки на этой выборке данных был осуществлен отбор признаков по программе учета знаков весовых векторов. Программа предусматривала обучение двух весовых векторов всем компонентам одного из них приписывается первоначальное значение +1, а всем компонентам другого — значение —1. После обучения знаки отдельных компонент сопоставляют, отбрасывая те из них, которые имеют разные знаки. Обучение продолжают до тех пор, пока не прекращается исключение признаков. В рамках данной задачи это привело к отбрасыванию всего 12 из 50 признаков, но обеспечило высокую прогнозирующую способность — 97,8% при 38 оставшихся дескрипторах. [c.128] На базе массива из 500 реальных ИК-спектров были составлены отображающие карты весовых векторов для химических соединений нескольких классов. Для каждого случая массив этих данных разбивали следующим образом. Сначала для всего массива из 500 спектров определялось число положительных объектов. В обучающую выборку было включено /д положительных объектов наряду с вдвое большим числом случайно выбранных отрицательных объектов. Остальные спектры вошли в состав контрольной выборки. [c.129] Вернуться к основной статье