ПОИСК Статьи Рисунки Таблицы Анализ на основе математической обработки масс-спектров в сочетании с ЭВМ из "Молекулярный масс спектральный анализ органических соединений" В многолинейчатости масс-спектров органических молекуя заложен большой объем информации, необходимой для решения этих задач. Ранее для качественного анализа использовались эмпирические зависимости между структурой молекулы и распределением интенсивностей в ее масс-спектре [2]. Дальнейшее развитие работ по качественному анализу связано с применением машинного каталога масс-спектров органических соединений, их классификацией методами распознавания образо и интерпретацией масс-спектров с использованием искусственного интеллекта. [c.45] При разработке методов, используюших каталоги во внешней памяти ЭВМ, учитываются продолжительность поиска, эффективность критерия сравнения неизвестного масс-спектра со спектрами из каталога объем получаемой информации о соединении, масс-спектр которого не содержится в каталоге. [c.45] Время поиска масс-спектра в каталоге определяется способом кодирования масс-спектральной информации. При однобитном способе кодирования [54] пороговое значение у принимается равным 1% от максимального пика в масс-спектре, и интенсивности пика иона приписывается значение 1, если она выше заданного порога у, и нуль, если ниже у. [c.45] Проверка эффективности предложенного метода была осу - ществлена на каталоге из 7000 масс-спектров. В качестве неизвестных рассматривались масс-спектры 168 соединений 156 из них были идентифицированы правильно. При увеличении числа уровней кодирования масс-спектральной информации до 10 надежность идентификации повышается, однако при этом резкО возрастают затраты машинного времени, необходимого для сравнения масс-спектров. Оценка критериев сравнения с использованием теории информации показала, что наиболее надежная идентификация получается при N = 2 [55]. [c.45] При проверке предложенных критериев на примере идентификации кислородсодержащих соединений и углеводородов лучшие результаты были получены с использованием критериев Р2 и Р4 при разбиении масс-спектра на части, содержащие по 20 пиков ионов, с выделением внутри частей трех наиболее интенсивных пиков. В обоих случаях процент правильно определенных соединений близок к ста. [c.46] Для сопоставления достоинств и ограничений различных методов поиска масс-спектров неизвестного соединения была проведена идентификация терпенов — соединений, дающих весьма близкие масс-спектры. Результаты, полученные при использовании предложенных в [56, 57] методов сравнения, были существенно лучше, чем при применении способа однобитного кодирования. Повышение уровня порогового значения 7 от 1 до 12,5% от интенсивности максимального пика иона лишь незначительно улучшило качество идентификации [54]. [c.46] Для идентификации образцов, в которых наряду с основным компонентом содержится значительное количество примесей, весьма эффективным оказался метод обратного поиска [58, 41]. Сравнение проводится по наиболее характерным признакам масс-спектра неизвестного соединения. [c.46] В системе предварительно проводится выбор эталонов по признаку значимости присутствие — отсутствие спектральных особенностей, что позволяет значительно сократить число соединений из каталога, для которых следует сравнивать полные спектры. [c.47] При отсутствии в каталоге масс-спектра исследуемого соединения для качественного анализа используют методы распознавания. Классификация основана на исследовании масс-спектров известных соединений (обучающая выборка) и отнесении масс-спектров исследуемых образцов (экзаменационная выборка) к тому или иному классу. Применение для этой цели метода потенциальных функций с использованием разделяющих конических поверхностей показало, что после обучения ЭВМ. выработала достаточно точный критерий, позволяющий различать парафиновые, нафтеновые и моноолефиновые углеводороды. Ошибка распознавания не превышала 3% (отн.) 1[60]. [c.47] Дальнейшее развитие методов распознавания связано с использованием линейного классификатора и его различных модификаций. Идея метода заключается в построении вектора W (линейного классификатора), скалярное произведение которого на векторы х (масс-спектры) одного класса положительно, э на векторы другого класса — отрицательно. [c.47] Для определения предсказательной способности классификатора используются элементы из распознаваемых классов, не входящие в обучающую выборку (экзаменационная выборка . На примере различных классов органических соединений исследовалась предсказательная способность линейного классификатора. Правильность распознавания неизвестных соединений возрастала с увеличением объема обучающей выборки и снижалась с уменьшением числа вводимых параметров. [c.47] Расширению области применения классификатора способствовало использование предварительной информации о структуре молекул исследуемых соединений и преобразование масс-спектров (различные нормировки преобразование Уолша, быстрое преобразование Фурье и т. д.) [61]. [c.47] Для идентификации различных типов углеводородов и се-русодержащих соединений довольно успешно применялся метод последовательного распознавания [62], в котором каждой координате масс-спектра приписывалось число, называемое информативностью. Распознавание неизвестных соединений осуществляется последовательно — от наиболее информативных координат до координат с меньшей информативностью [63]. [c.47] Каждому из классов Ki соответствует вектор Ri. [c.48] Для определения класса неизвестного соединения х вычис-.ляется его ковариационная матрица Sx и значения соответствующих двоичных координат. Если полученный вектор совпадает с одним из Ri, то исследуемое соединение принадлежит к классу Ki, в противном случае х определяет новый класс Кх. [c.48] И что интенсивность пиков ионов с массой более половины массы молекулярного иона не превосходит 10% от интенсивности максимального пика [67]. [c.49] Матрица смежности должна описывать связный мультиграф [69] это означает, что для любой пары (1, ) существует такая степень к (I, матрицы На,/ , при которой а// 0. [c.50] Поскольку матрица смежности неоднозначно соответствует структуре и при перенумерации атомов скелета соответствующие столбцы и строки матрицы меняются местами, то для устранения этой неоднозначности используется лексикографический порядок в построении матрицы. [c.50] Программа генерации структурных изомеров первоначально была применена для идентификации ациклических соединений, содержащих водород, углерод, азот и кислород [66]. Построение структуры циклических изомеров предусматривало разделение эмпирической формулы на циклические и ациклические компоненты, построение циклических радикалов (суператомов), генерирование возможных структур (с использованием алгоритма построения ациклических изомеров). Для учета симметрии молекул, содержащих циклы, применяется аппарат теории групп 70]. [c.51] Вернуться к основной статье