ПОИСК Статьи Рисунки Таблицы Представление аналитической информации из "Аналитическая химия Том 2" Числовая форма используется для представления данных спектроскопических, хроматографических, электрохимических исследований,. значений концентраций, погрешностей, информации о стоимости анализов. Примерами текстовых данных могут служить описания проб и методик. В топологической форме представляют химические структуры. Графическая информация может включать спектры, градуировочные графики, а также различные картинки, полученные с помощью таких методов, как электронно-микрозондовый. [c.577] Формат базы данных определяется требованиями, предъявляемыми к операциям хранения и обработки данных. Как правило, база данных состоит из следующих элементов. [c.579] Первичные аналитические данные хранятся в исходных файлах (см. рис. 13.2-1). В результате исключения из них ненужных данных, фильтрации и сжатия получают архивные файлы. Архивный файл аналитических данных состоит из заголовка и набора блоков данных. В заголовке содержится информация о способе хранения информации и контроля за ее сохранностью. Блоки данных содержат разнообразные массивы информации о спектрах, химических структурах и т. д., а также необходимые примечания. [c.579] Для передачи данных между различными носителями существуют файлы обмена фиксированного формата. В спектроскопии наиболее распространен формат J AMP/DX [13.2-3]. Он был разработан Объединенным комитетом по атомным и молекулярным данным (J AMP) для решения следующих задач. [c.579] В табл. 13.2-2 приведен пример данных в формате J AMP/DX, содержащий ИК-спектр паров эпихлоргидрина. Это лишь небольшой фрагмент файла. Кроме этого, в файле содержится информация о самом соединении (например, молекулярная масса или номер по классификации hemi al Abstra ts), о подготовке пробы, об аппаратуре, условиях измерения, способе обработки данных (сглаживание, дифференцирование). [c.579] Индексные файлы служат для доступа к другим данным или файлам. Для обработки информации, содержащейся в базах, необходимо дополнительное программное обеспечение. [c.580] Как правило, базы данных содержат дополнительную информацию — о точке начала измерений, разрешении или наличии мультиплетов в ЯМР-спектрах. [c.581] Простейшим способом преобразования структурной формулы в форму, доступную компьютеру, служит использование кодов структурных фрагментов. Примерами таких фрагментов являются ароматические кольца, алифатические радикалы, ОН- или азо-группы (-N=N-). Такие фрагменты нумеруют и заносят в соответствующий список. В более общем случае выбирают некоторый атом в качестве условного центра молекулы и последовательно описывают связанные с ним фрагменты в пределах четырех концентрических сфер от ближайших ко все более удаленным. [c.582] Простое перечисление отдельных фрагментов молекулы еще не позволяет приписать ей определенную структурную формулу. Следующим этапом построения структурной формулы является соединение фрагментов друг с другом в определенном порядке. Полученную гипотетическую структуру следует фавнить со всеми возможными структурными формулами атом за атомом. Разумеется, при этом следует рассматривать только те молекулы, которые содержат все перечисленные в коде фрагменты. [c.583] Для математического описания структурных формул можно использовать теорию графов. На рис. 13.2-4 приведен пример структурного графа для молекулы фосгена. [c.583] приведенные слева от матрищ 1 и над ней, означают номера узлов графа в соответствии с рис. 13.2-4. [c.584] Обычно при составлении таблицы связей исходят из перечня вершин графа (атомов). Ее можно получить из матрицы связей (табл. 13.2-5). Таблица связей содержит только перенумерованный список атомов, перечень атомов, связанных с каждым из них, и информацию о характере связей. Примером (для молекулы фосгена) может служить табл. 13.2-6. Та же информация в сокращенном виде представлена в табл. 13.2-7. [c.585] Как правило, при описании структурных формул атомы водорода вообще опускаются. При необходимости (например, для графического представления формулы) их положения автоматически восстанавливают с помощью спехщ-ального алгоритма. [c.585] Строки таблицы связей могут содержать и дополнительную информацию, например о чередующихся связях, циклических и нециклических структурах, стереохимии, о положении различных заместителей. Для описания положения заместителей применяют структурные формулы Маркуша. [c.586] В ходе поиска среди структурных формул часто требуется найти не индивидуальное вещество, а целый класс родственных структур. Описание таких (так назьшаемых родовых) классов легко осуществить с помощью структурных формул Маркуша (пример на рис. 13.2-5). Такая формула содержит ядро , в котором природа и расположение атомов четко определены, и по крайней мере один из заместителей, природа которого может быть дополнительно конкретизирована. Результатом поиска являются целые классы соединений. Такая процедура бывает особенно важна в патентном деле, поскольку в патентной заявке часто содержатся лишь общие указания о природе вещества. Впервые в 1923 г. целый класс химических соединений был запатентован Юджином А. Марку-шем, в честь которого и назван этот тип структурных формул. [c.586] При представлении структурной формулы в виде матрицы или таблицы важно однозначно указать взаимный порядок расположения атомов. Это можно сделать, например, при помощи алгоритма Моргана [13.2-5, 13.2-6]. [c.586] Вернуться к основной статье