SMILES :: Основные принципы построения SMILES
SMILES · Варианты спецификации SMILES · Определение в терминах теории графов · Основные принципы построения SMILES · Расширения · Преобразования · Близкие статьи · Примечания · Официальный сайт ·
Атомы
Атомы обозначаются символами химических элементов в квадратных скобках, к примеру, золото обозначается как [Au]. Для элементов-органогенов (B, C, N, O, P, S, F, Cl, Br, I) скобки могут быть опущены. В этом случае атомы водорода можно не указывать в явном виде, если их число соответствует наименьшей нормальной валентности в соответствии с явно заданными связями. Атомы в составе ароматических циклов обычно записываются строчными буквами вместо прописных, не смотря на то, что в некоторых диалектах SMILES используется явное чередование двойных и одинарных связей (как в структурной формуле бензола, предложенной Кекуле). При необходимости указать формальный заряд частицы атомы водорода и символ заряда записываются в явном виде. Изотопы записываются в квадратных скобках с указанием атомного веса перед символом атома, к примеру, изотоп 13C будет записан как [13C].
К примеру, запись SMILES для воды будет выглядеть как O, для этанола — CCO. Гидроксильный анион записывается [OH-], а ион железа (II) как [Fe+2].
Связи
Одинарная химическая связь может быть записана с использованием символа - между атомами, соединёнными связью, но на практике это не используется, символ дефиса опускают. Обозначение ароматической связи (:) обычно тоже опускают. Двойная связь обозначается с помощью знака равенства, например, двуокись углерода записывается в виде O=C=O. Тройная связь обозначается с помощью октоторпа, например, синильная кислота записывается как C#N.
Разветвления молекулы
Боковые цепи молекулы заключаются в круглые скобки. Например, пропионовая кислота записывается как CCC(=O)O. Каноническая форма записи трифторметана выглядит как C(F)(F)F, в тоже время такая запись неудобна для чтения из-за своей перегруженности скобками, поэтому ту же молекулу можно записать в неканонической форме как FC(F)F.
Циклические соединения
Атомы, находящиеся на концах разорванной при построении остовного леса связи, обозначаются одним и тем же номером. Например, циклогексан записывается как C1CCCCC1, а бензол — как c1ccccc1.
Стереохимия
Конфигурация относительно двойной связи записывается при помощи символов / и \. Например, F/C=C/F соответствует транс-дифторэтилену, а F/C=C\F или F\C=C/F соответствует цис-дифторэтилену (см. рис.).