ПОИСК Статьи Рисунки Таблицы Преобразование Фурье из "Распознавание образом в химии" Другая трактовка преобразования Фурье выявляет все его преимущества при передаче информации в области преобразованного аргумента. Любая точка в этой области — взвешенная сумма всех точек исходной области, следовательно, данные о той или иной точке исходного пространства (координата которой есть отношение массы к заряду) распределяются по всему спектру в области Фурье. [c.147] Об этой особенности преобразования Фурье говорят как о его усредняющем свойстве. Поэтому ошибка или потеря битов при передаче информации в области Фурье минимально искажают исходный спектр, тогда как потеря одного бита при передаче информации как функции аргумента т/е может привести к утрате всякого смысла такого спектра. Как будет показано ниже, эта особенность преобразования Фурье успешно используется при классификации образов. [c.147] Применительно к классификации образов преобразованные данные содержат ту же информацию, но в форме, упрощающей задачу создания классификатора или способствующей ее решению линейными методами. Теперь мы должны показать, как использовать быстрое преобразование Фурье (БПФ) при классификации образов по действительным данным (масс-спектрам низкого разрешения) и как применять усредняющее свойство этого преобразования для сокращения размерности. [c.148] Такое исследование было проведено на массиве данных из 630 масс-спектров низкого разрешения, заимствованных из таблиц Американского нефтяного института. Это были масс-спектры 387 углеводородов и 243 соединений типов СНО, HN и HON с небольшим молекулярным весом (меньше 200 а. е. м.). [c.148] Преобразование Фурье выполнялось при помощи программы SHARE (SDA 3465), разработанной Кули. Все 630 масс-спектров после преобразования записали на диск ЭВМ типа IBM 360/75 в межуниверситетском вычислительном центре, что позволяло провести их быстрое считывание. Программы обучения предусматривали стандартную обработку преобразованных масс-спектров. Для этих универсальных программ было необходимо только, чтобы исходные данные представлялись в векторной форме, а то, в каком именно пространстве отображены эти данные, не имело значения. [c.148] Число точек при расчетах с помощью алгоритма БПФ должно быть равно 2 , где N — целое положительное число. Поэтому 200 координат каждого спектра пришлось пополнять еще 56 положениями с нулевыми пиками, чтобы довести общее число координат до 256. Алгоритм БПФ давал набор из 512 точек — по 256 для косинусоидальной и синусоидальной частей разложения. При работе с действительными данными важно то, что косинусоидальная часть является четной функцией, а синусоидальная — нечетной. Таким образом, в каждом случае вся информация заключается в 128 точках. Остальные 128 точек являются излишними, поскольку их без труда можно получить исходя из симметрии. [c.149] Массив данных состоял из четырех выборок по 630 образов и каждый образ имел 128 компонент. [c.149] Чтобы узнать, сохраняется ли основная информация в области Фурье, пришлось построить классификаторы образов для преобразованных данных и сравнить их с классификаторами, созданными для исходных спектров (интенсивности пиков как функции положения т/е). В обоих случаях категории, на которые подразделяли образы, были одинаковыми. Наиболее интересные результаты такого сопоставления приведены в табл. 6.3. В каждом случае положительная категория состояла из соединений с указанными в таблице значениями отношения числа атомов углерода к числу атомов водорода (С Н) в молекуле, а отрицательная — из всех прочих соединений. Исходный массив состоял из 387 углеводородов, из которых 200 случайно отобранных были включены в обучающую выборку, а остальные 187 — в контрольную. Наиболее важный результат проведенного исследования состоит в том, что преобразование Фурье оставляет основную информацию и что ее довольно легко извлекать из преобразованных данных. Скорос1ь сходимости (выражаемая числом коррекций через обратную связь, необходимых для обеспечения полной сходимости) и прогнозирующая способность (процентная доля верных ответов при классификации неизвестных образов) сопоставимы с соответствующими показателями при классификации образов по исходным масс-спектрам. [c.149] Как выяснилось в ходе предшествующего исследования [5], пять из 43 категорий углеводородов, для которых ожидалась линейная разделимость масс-спектров низкого разрешения, остались неразделенными за 2000 коррекций на обучающей выборке из 200 соединений. В табл. 6.4 сравниваются результаты пробной классификации для всех этих пяти категорий с применением к исходным данным преобразован ия Фурье и обычной классификации по непреобразованным масс-сп ектрам. Категории этил , н-пропил и винил охватывают соеди нения, в состав которых входят эти группы. Категория атомы у глерода в боковой цепи соответствует соединениям, в которых числ о связей углерод — углерод не меньше трех. Следует отметить, что при использовании фазовых спектров сходимость достигалась во всех случаях, тогда как классификация по данным в любой иной фор ме сходимости не обеспечивала. Следовательно, применение преобразования Фурье к исходным данным позволяет получить ответы на некоторые вопросы, на которые не-преобразованные исходные данные ответов не давали (по крайней мере в выбранных пределах сходимости). Этот результат удовлетворяет первому требованию, предъявляемому системам информационного поиска. Однако прогнозирующая способность во всех случаях была низкой, т. е. второе требование не выполнялось. [c.151] После этого числа коррекций обучение прекращали, не достигнув сходимости. [c.152] в некоторых случаях предпочтительны по сравнению с обыкновенными образами, например масс-спектрами. [c.153] В рассматриваемом исследовании размерность образов сокращали несколькими способами и строили классификаторы образов для масс-спектров и для полученной в результате преобразования Фурье косинусоидальной (действительной) компоненты. Задача состояла в отборе из совокупности углеводородов соединений с отношением числа атомов углерода к числу атомов водорода (С Н) в молекуле, равным 1 2. Во всех случаях использовалась обучающая выборка из 200 спектров углеводородов, среди которых 81 соединение имело отношение С Н, равное 1 2. Остальные 187 углеводородов, в том числе 74 соединения с отношением С Н, равным 1 2, составляли контрольную выборку. Результаты этой части исследования обобщены в табл. 6.5. (Во всех случаях расчеты прекращали по истечении заранее установленного машинного времени.) В каждом случае данные после преобразования Фурье обеспечивали возможность более значительного сокращения размерности образов без существенного ущерба для времени сходимости или прогнозирующей способности. Результаты исключения масс-спектрометрических данных были различными. Из нескольких опробованных способов наиболее благоприятным было отбрасывание координат по критерию наименьшей средней величины, по крайней мере в отношении скорости сходимости до последнего этапа, когда оставалось 16 измерений (координат). В двух из трех случаев с использованием преобразования Фурье прогнозирующая способность фактически была несколько выше лучшего результата, достигаемого при классификации масс-спектрометрических данных. Таким образом, размерность данных после преобразования Фурье допускает значительное произвольное сокращение, прежде чем проявится ухудшение прогноза, тогда как существенное уменьшение размерности исходных масс-спектров возможно только в том случае, если оно производится на базе какого-нибудь логического критерия, например минимизации средней амплитуды пиков. [c.153] Дальнейшему исследованию возможностей использования преобразования Фурье для предварительной обработки масс-спектрометрических данных посвящена статья одного из авторов настоящей книги [6] массив данных состоял из 450 масс-спектров низкого разрешения со 132 координатами (положениями т/е) в каждом. [c.153] Первый этап рассматриваемого исследования заключался в отборе признаков для спектров, подвергшихся преобразованию Фурье, и оценке характеристик классификаторов образов в зависимости от числа оставленных дескрипторов. Как уже отмечалось, отбрасывание тех или иных дескрипторов для образов после преобразования Фурье скорее равнозначно частичной потере информации о всех исходных масс-спектрах, чем потере всей информации о части образов [8]. [c.155] Результаты классификации образов, проведенной с отбором признаков для спектров после преобразования Фурье, представлены в табл. 6.6. Решалась химическая задача, в которой классификаторы обучали подразделять соединения на категорию с отношением числа атомов углерода к числу атомов водорода в молекуле больше 2 и категорию, для которой это отношение не больше 2. Таким образом, соединения с отношением С Н 2 (алканы, амины и т. п.) образовывали одну категорию, а соединения с отношением 2( С) /гН (алкены, кетоны, ароматические соединения и т. п.) входили в другую. Очевидно, что по масс-спектрам низкого разрешения такое разделение сразу провести невозможно. [c.155] В колонках с шестой по девятую приведены характеристики классификаторов образов после интенсивного отбора признаков. Для трех обучающих выборок из первоначальных 124 дескрипторов оставалось только 76, 70 и 78 соответственно. Число коррекций через обратную связь, необходимых для обучения классификатора безошибочному распознаванию всех объектов обучающих выборок, либо оставалось приблизительно таким же, как и в предшествующем случае, либо было несколько меньше. Прогнозирующая способность классификаторов образов, действовавших по сокращенному перечню дескрипторов, была практически такой же, как и для спектров, подвергшихся преобразованию Фурье до отбора признаков. Следовательно, отбор признаков, ускоряя вычисления, нисколько не ухудшает характеристики классификаторов образов. [c.156] В рассматриваемом исследовании была проведена также проверка надежности пороговых логических элементов при обучении на исходных масс-спектрометрических данных и на спектрах Фурье. Как выяснилось, более высокой надежностью обладают бинарные классификаторы образов при обучении на спектрах Фурье. [c.158] Функция F t) описывает непрерывный спектр ЯМР. Автокорреляционную функцию можно приближенно представить в виде ряда и вычислить непосредственно по определяющей формуле. Однако расчеты удобнее проводить, если эту функцию вычислять по этапам в следующей последовательности 1) выполнить преобразование Фурье для функции F t), чтобы найти функцию G(x) 2) умножить функцию G(x) на комплексно сопряженную ей функцию, чтобы получить спектр мощности G(x) исходной функции 3) обратным преобразованием Фурье по найденному спектру мощности G(x) найти автокорреляционную функцию. Эту процедуру из трех этапов удобно выполнять при помощи алгоритма БПФ. В задачу данного исследования входила проверка возможности сокращения таким путем размерности векторов образов, т. е. возможности отбора признаков. [c.158] Предварительную обработку масс-спектрометрических данных пробовали также осуществлять путем преобразования Адамара [10]. Это преобразование аналогично преобразованию Фурье, но разлагает функции не на синусоидальные, а на квадратно-волновые компоненты. Классификацию осуществляли по масс-спекфам низкого разрешения, предварительно подвергнутым преобразованию Адамара. Категории определяли по числу атомов углерода в молекулах углеводородов (шесть, семь или восемь). [c.159] Вернуться к основной статье