ПОИСК Статьи Рисунки Таблицы Факторный анализ из "Распознавание образом в химии" К дополнительным методам преобразования исходных данных следует отнести также факторный анализ. Основу этого метода составляет диагонализация корреляционной матрицы для нахождения ее собственных значений, по которым производится оценка важности соответствующих собственных векторов. При этом предполагается, что исходные данные и классы, на которые эти данные подразделяются, связаны друг с другом через дисперсию (среднее отклонение) распределения вероятностей. [c.159] В последнее время факторный анализ успешно применяется при изучении основных свойств растворенных веществ и неподвижных фаз по временам удерживания в газохроматографических исследованиях [12, 13], растворов по химическим сдвигам в спектроскопии ЯМР [14—16], а также в полярографии [17]. [c.159] Цель факторного анализа — заменить исходное множество таким набором меньшего числа переменных, который должным образом описывал бы или выражал бы исходное множество. Что же именно следует понимать под должным образом , устанавливает экспериментатор. Возможно, что для этого достаточно воспроизвести данные в пределах ошибки эксперимента или не слишком строго отобразить главные отклонения, пренебрегая более слабыми эффектами. [c.159] Корреляционную матрицу тХт можно преобразовать в корреляционную матрицу в ортогональной системе координат, составленную из линейных комбинаций коэффициентов корреляции в матрице С с таким расчетом, чтобы по возможности неравномернее распределить дисперсию, которую отображает матрица С. Иными словами, первая координатная ось, т. е. линейная комбинация, должна вмещать столько дисперсии, сколько возможно для единственной оси. Вторая линейная комбинация должна содержать вторую по величине дисперсию с учетом того ограничения, что вторая ось ортогональна первой. Линейные комбинации, выражающие максимальную дисперсию, составляют до тех пор, пока не будет исчерпана вся дисперсия. Эту ортогональную систему координат находят диагонализацией корреляционной матрицы, чтобы определить набор собственных значений Е и набор сопряженных собственных векторов В . [c.160] Однако, по мере того как собственные значения приближаются к нулю, включение сопряженных собственных векторов в приближенное выражение для корреляционной матрицы дает все меньший и меньший вклад. Задача уменьшения числа собственных векторов, требующегося для воспроизведения корреляционных связей в исходных переменных, эквивалентна задаче уменьшения размерности исследуемого пространства изображений, и поэтому сжатие информации есть следствие выбора для представления случайных изменений более оптимальной системы координат, нежели исходная. [c.160] В табл. 6.8 приведены результаты расчетов по формуле (6.14) для семи функциональных групп. В случае карбонильной группы (С=0) наибольшую и приблизительно одинаковую значимость имеют два фактора — 18-й и 34-й, тогда как для гидроксильной группы самыми важными оказались 26-й, 40-й и 41-й факторы. (Второстепенные факторы отличаются от главных гораздо меньшим значением скалярного произведения, см. третью колонку табл. 6.8.) 26-й фактор имеет значимость и для простых эфиров это указывает на то, что в простом эфире и гидроксиле фрагменты образуются аналогичными путями, чего нельзя сказать о карбонильных группах. [c.162] Изменение интенсивности пиков в масс-спектрах 81 нитросоединения выявило связь с двумя факторами — 10-м и 24-м, тогда как для 58 аминов из массива данных наиболее важными были четыре фактора — 10-й, 4-й, 19-й и 37-й. Поскольку среди значимых для аминов факторов нет 24-го, его следует считать характерным для нитросоединений. [c.162] Отрицательное значение не обязательно означает, что связанные с факторами массы отрнцательно коррелируют с функциональной группой. Если значения отрицательны, то двойное отрицание приводит к положительной корреляции между функциональными группами и массами. [c.163] Для насыщенных углеводородов наиболее значимым является 16-й фактор, тогда как 23-й и 25-й играют меньшую роль. Поскольку суммы произведений факторов на нормированные спектры делят на число спектров в соответствующем классе, появляется возможность оценки факторов по их отношению к любой функциональной группе. Так, среди всех факторов для всех групп по значимости наиболее важен 26-й фактор, который для гидроксильных групп в два раза более существен, чем для простых эфиров. Действительно, приведенные в третьей колонке табл. 6.8 данные свидетельствуют о том, что все три гидроксильных фактора связаны с гидроксильными группами в большей степени, чем каждый из эфирных факторов с эфирами. Отсюда можно сделать вывод, что фрагментация простых эфиров протекает легче, чем гидроксильных групп, тем более, что в эфирах атом кислорода имеет более разнообразное структурное окружение. [c.164] Если для данной функциональной группы известны важные факторы, положения mie для нее находят непосредственно как массы с наибольшими коэффициентами в факторе. Эти коэффициенты равны корням квадратным из дисперсии в том положении, которое можно приписать данному фактору. [c.164] СИЛЬНО сказываются на распределении фрагментов в исследованных 630 масс-спектрах. [c.165] Из всех функциональных групп самой сильной зависимостью с факторными осями характеризуется фенильная группа, затем следуют такие параметры, как наличие до трех двойных связей (охватывающее и фенильную группу), амины, азот, наличие до двух двойных связей и структуры насыщенных углеводородов. [c.166] Вернуться к основной статье