2.10.3.5 InChI — химический идентификатор на основе молекулярной структуры
Скачать документ Установка
Синтаксис
Опции
Примеры использования
Окружение
- Версия РЕД ОС: 7.3
- Конфигурация: Рабочая станция
- Версия ПО: inchi-1.0.6
InChI — международный текстовый химический идентификатор. Предназначен для однозначного обозначения молекул. Он обеспечивает универсальный метод для облегчения поиска молекулярной информации в различных базах данных и в Интернете.
InChI и его компактная форма, InChIKey, являются открытыми стандартами, не ограниченными патентами. Эти идентификаторы преобразуют химические структуры в строки, которые могут быть использованы для описания, систематизации и поиска химических соединений.
Установка
Установить программу можно либо через графический менеджер пакетов, либо через терминал.
Для установки программы через графический менеджер пакетов dnfdragora перейдите в «Главное меню» — «Администрирование» — «Управление пакетами dnfdragora», выполните поиск необходимого пакета по ключевому слову «inchi» и отметьте флагом пакет последней версии. Далее нажмите кнопку «Применить» и дождитесь окончания установки.
Для установки программы через терминал выполните команду (потребуются права администратора):
sudo dnf install inchi
Данный пакет предоставляет утилиту для командной строки inchi-1. Утилита применяется для пакетной обработки нескольких структурированных файлов, в первую очередь файлов SDF. Список опций утилиты можно вывести, запустив её без аргументов:
inchi-1
Синтаксис
Утилита доступна для запуска через терминал при помощи команды следующего вида:
inchi-1 inputFile [outputFile [logFile [problemFile]]] [-option[ -option ...]]
где:
inchi-1 — название утилиты;
inputFile — путь к входному файлу с химическими структурами, который нужно конвертировать;
outputFile (необязательно) — путь к файлу, куда будет сохранён результат конвертации;
logFile (необязательно) — путь к файлу логов, где будут записаны сообщения о ходе выполнения;
problemFile (необязательно) — путь к файлу, куда будут записаны проблемные случаи;
[-option[ -option ...]] — одна или несколько опций, модифицирующих процесс конвертации.
inchi-1 inputFiles... -AMI [-option[ -option...]]
где:
inputFiles... — список входных файлов для обработки;
-AMI — опция, указывающая на использование дополнительного режима или модуля;
[-option[ -option...]] — дополнительные опции, настраивающие процесс.
Опции
Основные опции утилиты:
1. Опции ввода.
STDIO — использовать стандартные потоки ввода/вывода;
InpAux — ввод структур в формате дополнительной информации inchi;
SDF:DataHeader — читать из входного SD-файла идентификатор под этим заголовком данных;
START:n — начать с n-й входной структуры;
END:n — остановиться после n-й входной структуры;
RECORD:n — обработать только n-ю входную структуру;
AMI — разрешить множественные входные файлы (поддержка шаблонов);
AMIOutStd — записывать вывод в стандартный поток вывода (в режиме AMI);
AMILogStd — записывать логи в стандартный поток ошибок (в режиме AMI);
AMIPrbNone — подавить создание файлов с проблемами (в режиме AMI).
2. Опции вывода.
NoLabels — не включать номер структуры, DataHeader и ID в вывод inchi;
NoWarnings — подавить все предупреждающие сообщения;
AuxNone — не включать дополнительную информацию;
SaveOpt — сохранить пользовательские опции создания inchi (нестандартный inchi);
Tabbed — разделить номер структуры, inchi и AuxInfo с помощью табуляции;
MergeHash — объединить inchikey с дополнительными хешами, если они присутствуют;
NoInChI — не печатать саму строку inchi;
OutErrInChI — при ошибке печатать пустую строку inchi (по умолчанию ничего);
OutputSDF — преобразовать inchi, созданный с дополнительной информацией по умолчанию, в SD-файл;
SdfAtomsDT — выводить изотопы водорода в SD-файле как атомы D и T.
3. Опции структуры.
SNon — исключить стереохимию (по умолчанию включить абсолютные стереохимические свойства);
NEWPSOFF — оба конца клина указывают на стереоцентры;
LooseTSACheck — ослабить критерии неоднозначного рисунка для тетраэдрической стереохимии в кольце;
DoNotAddH — все атомы водорода являются явными (по умолчанию добавлять H в соответствии с обычными валентностями).
4. Модификаторы восприятия стереохимических свойств (нестандартный inchi).
SRel — относительная стереохимия;
SRac — рацемическая стереохимия;
SUCF — использовать флаг хиральности: включено означает абсолютную стереохимию, выключено — относительную стереохимию.
5. Опции настройки создания inchi (нестандартный inchi).
SUU — всегда включать опущенные неизвестные/неопределённые стереохимические свойства;
SLUUD — делать метки для неизвестных и неопределённых стереохимических свойств различными;
RecMet — включать результаты с реконнектированными металлами;
FixedH — включать слой фиксированного водорода;
KET — учитывать кето-енольный таутомеризм (экспериментально);
15T — учитывать 1,5-таутомеризм (экспериментально).
6. Опции генерации.
Wnumber — установить тайм-аут на структуру в секундах (W0 означает неограниченно);
WMnumber — установить тайм-аут на структуру в миллисекундах (WM0 означает неограниченно);
LargeMolecules — обрабатывать молекулы до 32766 атомов (экспериментально);
WarnOnEmptyStructure — предупреждать и производить пустой inchi для пустой структуры;
Polymers — разрешить обработку полимеров (экспериментально);
Polymers105 — разрешить обработку полимеров (экспериментально, устаревший режим версии 1.05);
FoldCRU — складывать CRU-полимера, если внутри повторяются;
NoFrameShift — отключить сдвиг рамки CRU-полимера;
NoEdits — отключить сдвиг рамки и складывание CRU-полимера;
NPZz — разрешить Zz-атомы, не связанные с полимерами (псевдоэлементы-заполнители);
SAtZz — разрешить стереохимию у атомов, связанных с Zz (по умолчанию отключено);
Key — генерировать inchikey;
XHash1 — генерировать расширение хеша (до 256 бит) для первого блока inchikey;
XHash2 — генерировать расширение хеша (до 256 бит) для второго блока inchikey.
7. Опции преобразования.
InChI2Struct — преобразовать строку inchi обратно в структуру молекулы, восстановить исходную структуру молекулы из ее уникального идентификатора inchi;
InChI2InChI — преобразовать строку inchi в другую строку inchi с использованием разных опций или стандартов, необходимо для сравнения и анализа различных представлений одной и той же молекулы.
Примеры использования
Перед выполнением данных примеров создайте файл InChI_TestSet.sdf, содержащий необходимые химические структуры для преобразования.
Для создания и редактирования sdf-файлов можно использовать молекулярные редакторы, например:
Avogadro - программа просмотра и редактирования молекул.
XDrawChem – программа для рисования и анализа химических структур и реакций.
1. Преобразование sdf-файла в txt-файл со строками inchi и inchikey с использованием опции -Key:
inchi-1 -Key ./InChI_TestSet.sdf
2. Опции –Start:n, –End:n, Record:n позволяют обрабатывать структуры в файле, начиная с определённой структуры, либо заканчивая или обрабатывая только её.
inchi-1 -Start:2180 ./InChI_TestSet.sdf
Дата последнего изменения: 24.09.2024
Если вы нашли ошибку, пожалуйста, выделите текст и нажмите Ctrl+Enter.