ПОИСК Статьи Рисунки Таблицы Теория опознавания образов из "Формирование гипотез в аналитической химии с помощью ЭВМ" К построению различных аналитических гипотез привлекаются методы теории опознавания образов. В литературе имеется достаточно большое число работ, в которых эти методы описываются на разных уровнях от чисто теоретического рассмотрения до приведения конкретных алгоритмов [48—52]. [c.62] Рассмотрим несколько примеров применения теории опознавания образов в практике аналитической деятельности. [c.63] Применение алгоритмов вероятностного подхода ограничено необходимостью использования на этапе обучения значительных экспериментальных массивов для получения надежных данных о виде распределения. В случае взаимокоррелированных признаков, что часто наблюдается в практических задачах, резко возрастает объем необходимых для принятия решений вычислений. [c.63] В зависимости от вида группы Aj (С = 0, = N, NO2. или др.) авторы получали от 70 до 90% правильных ответов. В экспериментах по различению молекул, содержащих функциональную группу С = 0, от молекул, содержащих атомы С, Н, О, но не содержащих С==0, для принятия правильного решения с вероятностью 0,8705 при пороговом отношении Ло= 1,4300 рекомендуются следующие интервалы частот 1850- 1800, 1800- -1750, 1750- 1700, 1700- 1650, имеющих отношение Р1/Р2 соответственно 1,8444, 12,6073, 15,8343, 4,5743. [c.64] Геометрический подход. Геометрический подход в опознавании образов основывается на гипотезе о компактности образов, гласящей, что в признаковом многомерном пространстве (где каждая координата — признак — известное свойство соединения, выраженное в виде числа) реализации, относящиеся к одному образу, достаточно четко отделены от реализаций, относящихся к другим образам. [c.64] Число ошибок при пользовании этим критерием упало до 3%. Удовлетворительного опознавания авторам удалось достичь даже в случае различения монооле-финов и циклопарафинов, спектры которых на глаз вообще не отличимы. [c.66] Функция принимает положительные значения для всех точек класса А и отрицательные значения для всех точек класса В. [c.67] Автором отмечаются следующие недостатки использованного алгоритма. [c.67] Приведенные работы могут служить примером автоматического построения гипотезы о структуре вещества с использованием косвенной информации. Для построения более сильной гипотезы необходимо привлекать данные других методов, т. е. строить гипотезу на комплексном использовании многих специализированных информационных банков. В принципе, геометрический подход теории опознавания образов можно использовать не только для построения гипотез о структуре исследуемого соединения, но также и для ориентировочной оценки физико-химических свойств, предполагаемых для использования в анализе. [c.68] В работе Б. Р. Ковальского и К. Ф. Бендера [56] также обсуждаются методы обнаружения или предсказания свойств соединений на основании использования других свойств, связанных с искомыми через неизвестное соотношение. Методы, рассмотренные в этой статье, называют дисплей-методами. Суть их заключается в том, чтобы представить структуру точек Л -мерного пространства в п-мерном пространстве. Дальнейшее распознавание ситуации при таком малом числе признаков ( 3) лучше всего производится человеком. [c.69] Решением Сцн=Хк11к находят собственные значения Хк и собственные вектора для к—, . .п. Используя как координаты плоскости основные векторы Ц1 и Л2, соот-ветствуюшие двум наибольшим собственным значениям Я1 и Яг, получают двумерное представление исходных Л/ -мерных данных, содержащее наибольшее различие. [c.70] Если при уменьшении исходного описания на один признак разность 0 по всей обучающей последовательности уменьшится на некоторую незначительную величину е б А, то этот признак можно исключить из описания. Действуя таким образом, уменьшают исходное описание до тех пор, пока не будет удовлетворяться неравенство 0 Д для всех образов. Аналогичным образом можно проверять влияние каждого признака на количество правильных ответов (в %) при использовании в качестве экзамена обучающей выборки. Следует отметить, что минимизация исходного описания с применением этой переборной схемы требует большого объема расчетов с использованием основной решающей функции, которая зачастую имеет довольно сложный вид. [c.72] Сравнивая дисперсии различных признаков, описывающих рассматриваемый образ, между собой, можно вывести суждение о степени привязанности каждого признака к данному образу. [c.73] Ввод исходных для обучения данных. Реализации, вводимые для обучения, должны быть заранее отнесены к некоторым образам. [c.74] Сокращение исходного описания согласно принятому критерию полезности признаков. [c.74] Выработка оптимальных эталонов для каждого образа. [c.74] Ввод экзаменуемых данных. Каждая реализация, представленная на экзамен, должна описываться признаками, выработанными на шаге 2. [c.74] Вернуться к основной статье