2.10.4.5 InChI — химический идентификатор на основе молекулярной структуры
Установка
Синтаксис
Опции
Примеры использования
Окружение
- Версия РЕД ОС: 7.3
- Конфигурация: Рабочая станция
- Версия ПО: inchi-1.0.6
InChI — международный текстовый химический идентификатор. Предназначен для однозначного обозначения молекул. Он обеспечивает универсальный метод для облегчения поиска молекулярной информации в различных базах данных и в Интернете.
InChI и его компактная форма, InChIKey, являются открытыми стандартами, не ограниченными патентами. Эти идентификаторы преобразуют химические структуры в строки, которые могут быть использованы для описания, систематизации и поиска химических соединений.
Установка
Установить программу можно либо через графический менеджер пакетов, либо через терминал.
Для установки программы через графический менеджер пакетов dnfdragora перейдите в «Главное меню» — «Администрирование» — «Управление пакетами dnfdragora», выполните поиск необходимого пакета по ключевому слову «inchi» и отметьте флагом пакет последней версии. Далее нажмите кнопку «Применить» и дождитесь окончания установки.
Для установки программы через терминал выполните команду (потребуются права администратора):
sudo dnf install inchi
Данный пакет предоставляет утилиту для командной строки inchi-1. Утилита применяется для пакетной обработки нескольких структурированных файлов, в первую очередь файлов SDF. Список опций утилиты можно вывести, запустив её без аргументов:
inchi-1
Синтаксис
Утилита доступна для запуска через терминал при помощи команды следующего вида:
inchi-1 inputFile [outputFile [logFile [problemFile]]] [-option[ -option ...]]
где:
-
inchi-1 — название утилиты;
-
inputFile — путь к входному файлу с химическими структурами, который нужно конвертировать;
-
outputFile (необязательно) — путь к файлу, куда будет сохранён результат конвертации;
-
logFile (необязательно) — путь к файлу логов, где будут записаны сообщения о ходе выполнения;
-
problemFile (необязательно) — путь к файлу, куда будут записаны проблемные случаи;
-
[-option[ -option ...]] — одна или несколько опций, модифицирующих процесс конвертации.
inchi-1 inputFiles... -AMI [-option[ -option...]]
где:
-
inputFiles... — список входных файлов для обработки;
-
-AMI — опция, указывающая на использование дополнительного режима или модуля;
-
[-option[ -option...]] — дополнительные опции, настраивающие процесс.
Опции
Основные опции утилиты:
1. Опции ввода.
-
STDIO — использовать стандартные потоки ввода/вывода;
-
InpAux — ввод структур в формате дополнительной информации inchi;
-
SDF:DataHeader — читать из входного SD-файла идентификатор под этим заголовком данных;
-
START:n — начать с n-й входной структуры;
-
END:n — остановиться после n-й входной структуры;
-
RECORD:n — обработать только n-ю входную структуру;
-
AMI — разрешить множественные входные файлы (поддержка шаблонов);
-
AMIOutStd — записывать вывод в стандартный поток вывода (в режиме AMI);
-
AMILogStd — записывать логи в стандартный поток ошибок (в режиме AMI);
-
AMIPrbNone — подавить создание файлов с проблемами (в режиме AMI).
2. Опции вывода.
-
NoLabels — не включать номер структуры, DataHeader и ID в вывод inchi;
-
NoWarnings — подавить все предупреждающие сообщения;
-
AuxNone — не включать дополнительную информацию;
-
SaveOpt — сохранить пользовательские опции создания inchi (нестандартный inchi);
-
Tabbed — разделить номер структуры, inchi и AuxInfo с помощью табуляции;
-
MergeHash — объединить inchikey с дополнительными хешами, если они присутствуют;
-
NoInChI — не печатать саму строку inchi;
-
OutErrInChI — при ошибке печатать пустую строку inchi (по умолчанию ничего);
-
OutputSDF — преобразовать inchi, созданный с дополнительной информацией по умолчанию, в SD-файл;
-
SdfAtomsDT — выводить изотопы водорода в SD-файле как атомы D и T.
3. Опции структуры.
-
SNon — исключить стереохимию (по умолчанию включить абсолютные стереохимические свойства);
-
NEWPSOFF — оба конца клина указывают на стереоцентры;
-
LooseTSACheck — ослабить критерии неоднозначного рисунка для тетраэдрической стереохимии в кольце;
-
DoNotAddH — все атомы водорода являются явными (по умолчанию добавлять H в соответствии с обычными валентностями).
4. Модификаторы восприятия стереохимических свойств (нестандартный inchi).
-
SRel — относительная стереохимия;
-
SRac — рацемическая стереохимия;
-
SUCF — использовать флаг хиральности: включено означает абсолютную стереохимию, выключено — относительную стереохимию.
5. Опции настройки создания inchi (нестандартный inchi).
-
SUU — всегда включать опущенные неизвестные/неопределённые стереохимические свойства;
-
SLUUD — делать метки для неизвестных и неопределённых стереохимических свойств различными;
-
RecMet — включать результаты с реконнектированными металлами;
-
FixedH — включать слой фиксированного водорода;
-
KET — учитывать кето-енольный таутомеризм (экспериментально);
-
15T — учитывать 1,5-таутомеризм (экспериментально).
6. Опции генерации.
-
Wnumber — установить тайм-аут на структуру в секундах (W0 означает неограниченно);
-
WMnumber — установить тайм-аут на структуру в миллисекундах (WM0 означает неограниченно);
-
LargeMolecules — обрабатывать молекулы до 32766 атомов (экспериментально);
-
WarnOnEmptyStructure — предупреждать и производить пустой inchi для пустой структуры;
-
Polymers — разрешить обработку полимеров (экспериментально);
-
Polymers105 — разрешить обработку полимеров (экспериментально, устаревший режим версии 1.05);
-
FoldCRU — складывать CRU-полимера, если внутри повторяются;
-
NoFrameShift — отключить сдвиг рамки CRU-полимера;
-
NoEdits — отключить сдвиг рамки и складывание CRU-полимера;
-
NPZz — разрешить Zz-атомы, не связанные с полимерами (псевдоэлементы-заполнители);
-
SAtZz — разрешить стереохимию у атомов, связанных с Zz (по умолчанию отключено);
-
Key — генерировать inchikey;
-
XHash1 — генерировать расширение хеша (до 256 бит) для первого блока inchikey;
-
XHash2 — генерировать расширение хеша (до 256 бит) для второго блока inchikey.
7. Опции преобразования.
-
InChI2Struct — преобразовать строку inchi обратно в структуру молекулы, восстановить исходную структуру молекулы из ее уникального идентификатора inchi;
-
InChI2InChI — преобразовать строку inchi в другую строку inchi с использованием разных опций или стандартов, необходимо для сравнения и анализа различных представлений одной и той же молекулы.
Примеры использования
Перед выполнением данных примеров создайте файл InChI_TestSet.sdf, содержащий необходимые химические структуры для преобразования.
Для создания и редактирования sdf-файлов можно использовать молекулярные редакторы, например:
Avogadro - программа просмотра и редактирования молекул.
XDrawChem – программа для рисования и анализа химических структур и реакций.
1. Преобразование sdf-файла в txt-файл со строками inchi и inchikey с использованием опции -Key:
inchi-1 -Key ./InChI_TestSet.sdf

2. Опции –Start:n, –End:n, Record:n позволяют обрабатывать структуры в файле, начиная с определённой структуры, либо заканчивая или обрабатывая только её.
inchi-1 -Start:2180 ./InChI_TestSet.sdf
Дата последнего изменения: 24.09.2024
Если вы нашли ошибку, пожалуйста, выделите текст и нажмите Ctrl+Enter.