Решающие поверхности

из "Распознавание образом в химии"

Представив совокупность масс-спектров в виде точек гиперпространства, мы получим совокупность точек, отображающих образы, которые содержат всю информацию, заключавшуюся в исходных спектрах. Теперь задача сводится к тому, чтобы эту совокупность точек разбить на две подсовокупности, определяемые распознаваемыми классами иными словами, речь идет о том. как преобразовать пространство образов в классифицирующее пространство. [c.21]
Один из способов классификации точек образов заключается в нахождении групп, принадлежащих одному и тому же классу, и размещению между ними решающей поверхности (границы). В простом двумерном пространстве такая классификация сводится к проведению линий (не обязательно прямых) между точками разных классов (например, коров можно отделить от лошадей, отгородив их друг от друга забором). [c.21]
В гиперпространстве точки образов, соответствующие соединениям с родственными характеристиками, должны, по-видимому, образовывать кластеры. Например, точки образов, представляющие масс-спектры спиртов, должны группироваться в какой-то ограниченной области гиперпространства, а точки образов, относящиеся к масс-спектрам алкенов, — в другой области этого пространства. Часто подобное предположение оказывается верным по отношению к совокупностям точек, отображающих химические данные, например масс-спектры. Если образуются кластеры, решающие поверхности удается располагать между ними. В простейшем таком случае решающая поверхность представляет гиперплоскость той же размерности, что и выбранное гиперпространство. [c.21]
Такая гиперплоскость может и не быть линейной или плоской в соответствии с размерностью пространства, однако, когда решающая поверхность линейна и проходит через начало координат, математически задача значительно упрощается. В этом случае гиперплоскость можно охарактеризовать вектором нормали, исходящим из начала координат. Иными словами, формально всякий вектор, исходящий из начала координат, определяет плоскость. [c.21]
Поскольку очень удобно, когда решающая плоскость проходит через начало координат в пространстве образов, стоит принять меры, чтобы при этом не возникало ущерба для способности к классификации (разделению). Для этого пространство образов расширяют за счет введения еще одной ортогональной координаты, приписывая всем векторам образов ( +1)-ю компоненту, которая может иметь любую величину, но ее принято выбирать равной единице. [c.22]
Хотя отнюдь не обязательно, чтобы решающие поверхности были линейными (плоскими), их линейность намного упрощает задачу. К тому же, как можно показать, более сложные решающие поверхности можно заменить линейными, если исходные данные должным образом преобразовать в препроцессоре. [c.22]

Вернуться к основной статье

Справочник химика 21

Химия и химическая технология