Многомерные методы

из "Аналитическая химия Том 2"

Основные задачи многомерных методов хемометрики состоят в группировке и классификации химических объектов (образцов, веществ, материалов) и в моделировании взаимосвязей между различными типами аналитических данных. Вот некоторые характерные примеры. [c.518]
Можно добавить и третий параметр, например, величину pH крови. В этом случае графическое представление данных становится затруднительным, хотя еще возможным. При использовании же дополнительных параметров (например, содержания глюкозы, меди или билирубина) непосредственная визуализация данных невозможна, поскольку для этого необходимо изобразить пространство с числом измерений более трех. Одна из важных задач многомерных методов как раз и состоит в том, чтобы сделать наглядное представление данных возможным и в этом случае. Математическую основу многомерных методов составляют действия с векторами и матрицами. Кроме того, необходимо определить меру расстояния (различия) и меру подобия объектов в многомерном пространстве и, наконец, способы проекции многомерных данных в дву-или трехмерное пространство. [c.519]
Важнейшее достоинство многомерных методов состоит в том, что они позволяют эффективно разграничивать кластеры объектов на основе набора их различных характеристик. Предположим, что нам заранее неизвестно, к какой группе принадлежит тот или иной пациент. Если измерить только уровень фосфора в крови, то на основе этой единственной переменной разделение пациентов на группы невозможно (рис. 12.5-2). Но если задействовать и вторую переменную — содержание кальция, то наблкдается отчетливое различие между отдельными группами (рис. 12.5-1). Таким образом, измерение более чем одной переменной улучшает дискриминирующую способность. [c.519]
Для решения некоторых задач такие данные подразделяют на независимые и зависимые переменные, налример ири градуировке на основании спектральных данных. Для обозначения зависимых переменных используют специальный символ, например у. [c.520]
Класс представляет собой множество объектов, имеющих сходные признаки. Образ объекта —это совокупность его характерных признаков. Для обработки многомерных данных не всегда требуются все объекты или все их измеренные характеристики. В то же время, некоторые данные не всегда возможно использовать в их исходном виде. Поэтому для успешного анализа многомерных данных, как правило, требуется предварительная обработка данных. [c.520]
В первую очередь необходимо исследовать, все ли необходимые данные имеются. В принципе, отсутствие некоторых данных не является непреодолимым препятствием. Разумеется, пропущенные данные нельзя заменять нулями. Вакансии следует заполнять или средними величинами для соответствующего столбца (строки), или, в крайнем случае, случайными величинами, распределенными в пределах размаха данных рассматриваемого столбца (строки). Отдельные признаки (столбцы) можно вообще исключить из матрицы, если опи сильно коррелируют с другими признаками, избыточны или сохраняют 1Юстоянное значение для всех объектов. [c.520]
Здесь индекс г обозначает номер строки, а /с — столбца. [c.520]
Очень часто признаки характеризуют совершенно различные свойства объектов, поэтому масштабы величин могут сильно различаться от столбца к столбцу, как с точки зрения их абсолютных значений, так и размахов (стандартных отклонений). И то, и другое искажает результаты большинства статистических многомерных методов. Для устранения этих различий данные следует масштабировать. Существуют два основных метода масштабирования — иа величину размаха и на величину стандартного отклонения (автомасштабирование). [c.520]
Здесь —число объектов. [c.521]

Вернуться к основной статье

Справочник химика 21

Химия и химическая технология