QSAR

Материал из Википедии — свободной энциклопедии
Это текущая версия страницы, сохранённая РобоСтася (обсуждение | вклад) в 12:12, 13 сентября 2024 (checkwiki fixes (1, 2, 9, 17, 22, 26, 38, 48, 50, 52, 54, 64, 65, 66, 76, 81, 86, 88, 89, 101)). Вы просматриваете постоянную ссылку на эту версию.
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Поиск количественных соотношений структура-свойство — процедура построения моделей, позволяющих по структурам химических соединений предсказывать их разнообразные свойства. За моделями, позволяющими прогнозировать количественные характеристики биологической активности, исторически закрепилось англоязычное название Quantitative Structure-Activity Relationship (QSAR). Аббревиатура QSAR часто трактуется расширенно для обозначения любых моделей структура-свойство. За моделями, позволяющими прогнозировать физические и физикохимические свойства органических соединений, закрепилось англоязычное название Quantitative Structure-Property Relationship (QSPR). При качественном описании соотношений между структурами химических соединений и их биологической активностью употребляют англоязычный термин Structure-Activity Relationship (SAR).

Поиск количественных соотношений структура-свойство основан на применении методов математической статистики и машинного обучения для построения моделей, позволяющих по описанию структур химических соединений предсказывать их свойства (физические, химические, биологическую активность). При прогнозировании свойств на качественном уровне (например, будет ли данное химическое соединение обладать данным видом биологической активности) говорят о решении классификационной задачи, тогда как при прогнозировании числовых значений свойств говорят о решении регрессионной задачи. Описание структур химических соединений для этих целей может быть векторным либо невекторным (графовым).

Моделирование свойств при векторном описании химических соединений

[править | править код]

При векторном описании химической структуре ставится в соответствие вектор молекулярных дескрипторов, каждый из которых представляет собой инвариант молекулярного графа.

Молекулярные дескрипторы

[править | править код]

Существующие наборы молекулярных дескрипторов могут быть условно разделены на следующие категории:

  1. Фрагментные дескрипторы[1][2][3] существуют в двух основных вариантах — бинарном и целочисленном. Бинарные фрагментные дескрипторы показывают, содержится ли данный фрагмент (подструктура) в структурной формуле (то есть содержится ли данный подграф в молекулярном графе, описывающем данное химическое соединение), тогда как целочисленные фрагментные дескрипторы показывают, сколько раз данный фрагмент (подструктура) содержится в структурной формуле (то есть сколько раз содержится данный подграф в молекулярном графе, описывающем данное химическое соединение). В обзоре[3] описано 11 основных категорий фрагментных дескрипторов. Уникальная роль фрагментных дескрипторов заключается в том, что, как показано в работах[4][5], они образуют базис дескрипторного пространства, то есть любой молекулярный дескриптор (и любое молекулярное свойство), являющийся инвариантом молекулярного графа, может быть однозначно разложен по этому базису. Кроме моделирования свойств органических соединений, бинарные фрагментные дескрипторы в форме молекулярных ключей (скринов) и молекулярных отпечатков пальцев применяются при работе с базами данных для ускорения подструктурного поиска и организации поиска по подобию[3].
  2. Топологические индексы.
  3. Физико-химические дескрипторы[6] — это числовые характеристики, получаемые в результате моделирования физико-химических свойств химических соединений, либо величины, имеющие четкую физико-химическую интерпретацию. Наиболее часто используются в качестве дескрипторов: липофильность (LogP), молярная рефракция (MR), молекулярный вес (MW), дескрипторы водородной связи[7], молекулярные объёмы и площади поверхностей.
  4. Квантово-химические дескрипторы[8] — это числовые величины, получаемые в результате квантово-химических расчетов. Наиболее часто в качестве дескрипторов используются: энергии граничных молекулярных орбиталей (ВЗМО и НСМО), частичные заряды на атомах и частичные порядки связей, индексы реакционной способности Фукуи (индекс свободной валентности, нуклеофильная и электрофильная суперделокализуемость), энергии катионной, анионной и радикальной локализации, дипольный и высшие мультипольные моменты распределения электростатического потенциала.
  5. Дескрипторы молекулярных полей — это числовые величины, аппроксимирующие значения молекулярных полей путём вычисления энергии взаимодействия пробного атома, помещенного в узел решетки, с текущей молекулой. На построении корреляций между значениями дескрипторов молекулярных полей и числовым значением биологической активности при помощи метода частичных наименьших квадратов (Partial Least Squares — PLS) основаны методы 3D-QSAR, наиболее известным из которых является CoMFA[9].
  6. Константы заместителей[10] впервые были введены Л. П. Гамметом в рамках уравнения, получившего его имя, которое связывает константы скорости реакции с константами равновесия для некоторых классов органических реакций. Константы заместителей вошли в практику QSAR после появления уравнения Ганча-Фуджиты, связывающего биологическую активность с константами заместителей и значением липофильности. В настоящее время известно несколько десятков констант заместителей.
  7. Фармакофорные дескрипторы показывают, могут ли простейшие фармакофоры, состоящие из пар или троек фармакофорных центров со специфицированным расстоянием между ними, содержаться внутри анализируемой молекулы[11].
  8. Дескрипторы молекулярного подобия указывают на меру сходства (молекулярного подобия) с соединениями из обучающей выборки.

Молекулярные дескрипторы наиболее полно описаны в монографии[12], которую можно считать энциклопедией молекулярных дескрипторов, а также в учебном пособии[13].

Методы построения моделей структура-свойство

[править | править код]

Для решения регрессионных задач при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:

  1. Множественная линейная регрессия
  2. Метод частичных наименьших квадратов (Partial Least Squares — PLS)
  3. Искусственные нейронные сети
  4. Регрессия на опорных векторах
  5. Случайный лес
  6. Метод k ближайших соседей

Для решения двухклассовых (бинарных) либо многоклассовых классификационных задач при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:

  1. Наивный байесовский классификатор
  2. Линейный дискриминантный анализ (Linear Discriminant Analysis — LDA)
  3. Искусственные нейронные сети
  4. Метод опорных векторов
  5. Деревья принятий решений
  6. Случайный лес
  7. Метод k ближайших соседей

Для решения одноклассовых классификационных задач при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы машинного обучения:

  1. Автокодирующие нейронные сети
  2. Одноклассовая машина опорных векторов (1-SVM)

Методы построения моделей структура-свойство подробно рассмотрены в учебных пособиях[13][14].

Моделирование свойств при невекторном (графовом) описании химических соединений

[править | править код]

Моделирование свойств при невекторном описании химических соединений осуществляется либо при помощи нейронных сетей специальных архитектур, позволяющих работать непосредственно с матрицами смежности молекулярных графов, либо при помощи ядерных (kernel) методов с использованием специальных графовых (либо химических, фармакофорных) ядер.

Примерами служащих для этой цели нейронных сетей со специальной архитектурой являются:

  1. BPZ[15][16]
  2. ChemNet[17]
  3. CCS[18][19]
  4. MolNet[20]
  5. Graph machines[21]

Примерами служащих для этой цели графовых (либо химических, фармакофорных) ядер являются:

  1. Marginalized graph kernel[22]
  2. Optimal assignment kernel[23][24][25]
  3. Pharmacophore kernel[26]

Построение моделей структура-свойство при невекторных описаниях химических структур рассмотрены в учебном пособии[14].

Свободно доступные через Интернет вычислительные ресурсы

[править | править код]

Ресурсы, позволяющие строить новые модели структура-свойство

[править | править код]
  1. Online CHemical Modeling (OCHEM) — информационный и вычислительный ресурс, позволяющий работать через Web-интерфейс с базой данных по органическим соединениям и их свойствам, пополнять её, осуществлять в ней поиск и формировать выборки, рассчитывать широкий набор молекулярных дескрипторов, строить количественные модели структура-свойство и применять их для прогнозирования свойств новых соединений
  2. Chembench — ресурс, позволяющий строить модели структура-свойство и использовать их для прогнозирования

Примеры прогнозирования

[править | править код]

Примеры прогнозирования физико-химических свойств органических соединений

[править | править код]
  1. Физические свойства индивидуальных низкомолекулярных соединений
    1. Температура кипения (Тк)[27][28]
    2. Критическая температура (Tкр)[27]
    3. Вязкость[28][29]
    4. Давление насыщенного пара[27][28][29]
    5. Плотность[27][28][29]
    6. Показатель преломления[27]
    7. Температура плавления (Тпл)[27]
    8. Шкалы полярности растворителей[27]
    9. Индексы удержания в газовой хроматографии[27]
    10. Поляризуемость[30]
    11. Магнитная восприимчивость[31]
    12. Энтальпия сублимации[32]
  2. Физические свойства низкомолекулярных соединений в зависимости от условий
    1. Температура кипения углеводородов в зависимости от давления[33]
    2. Плотность углеводородов в зависимости от температуры[33]
    3. Динамическая вязкость углеводородов в зависимости от температуры[33]
  3. Спектроскопические свойства
    1. Положение длинноволновой полосы поглощения симметричных цианиновых красителей[34]
    2. Химические сдвиги в спектрах 1H ЯМР[35]
    3. Химические сдвиги в спектрах 13С ЯМР[36]
    4. Химические сдвиги в спектрах 31P ЯМР[37]
  4. Физическо-химические свойства низкомолекулярных соединений
    1. Температура вспышки и температура самовоспламенения[27][38]
    2. Октановые числа углеводородов[39]
    3. Константы ионизации (кислотности или основности)[40]
  5. Физические свойства, обусловленные межмолекулярными взаимодействиями молекул разного типа
    1. Растворимость в воде (LogSw)[27][41]
    2. Коэффициент распределения n-октанол/вода (LogP)[42]
    3. Коэффициент распределения низкомолекулярных веществ между водой и мицеллами Pluronic P85[43]
    4. Свободная энергия сольватации органических молекул в различных растворителях[44]
  6. Реакционная способность органических соединений
    1. Константа скорости кислотного гидролиза сложных эфиров[45]
  7. Супрамолекулярные свойства
    1. Стабильность комплексов включения органических соединений с бета-циклодекстрином[46]
    2. Сродство красителей к целлюлозному волокну[47]
    3. Константы устойчивости комплексов ионофоров с ионами металлов[48]
  8. Физические свойства поверхностно-активных веществ (ПАВ)
    1. Критическая концентрация мицеллообразования (ККМ)[27]
    2. Температура помутнения[27]
  9. Физические и физико-химические свойства полимеров
    1. Температура стеклования[27]
    2. Показатель преломления полимеров[27]
    3. Ускорение вулканизации резин[27]
    4. Коэффициент проницаемости через полиэтилен низкой плотности[49]
  10. Физические свойства ионных жидкостей
    1. Температура плавления[50]

Примеры прогнозирования свойств ADMET

[править | править код]
  1. Фармакокинетические свойства
    1. Проникновение через гематоэнцефалический барьер[51]
    2. Скорость проникновения через кожу[52]
  2. Метаболизм
    1. Сайты ароматического гидроксилирования при метаболической активации цитохромом P450[53]
  3. Токсичность
    1. Канцерогенность[54]
    2. Эмбриотоксичность[55]

Примеры прогнозирования биологической активности органических соединений

[править | править код]
  1. Спектр биологической активности[56]
  2. Принадлежность к фармакологическим группам[57]

Литература

[править | править код]
  1. N. S. Zefirov, V. A. Palyulin. Fragmental Approach in QSPR (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2002. — Vol. 42, no. 5. — P. 1112—1122. — doi:10.1021/ci020010e.
  2. I. Baskin, A. Varnek. Building a chemical space based on fragment descriptors (англ.) // Combinatorial Chemistry & High Throughput Screening[англ.] : journal. — 2008. — Vol. 11, no. 8. — P. 661—668.
  3. 1 2 3 I. Baskin, A. Varnek. «Fragment Descriptors in SAR/QSAR/QSPR Studies, Molecular Similarity Analysis and in Virtual Screening». In: Chemoinformatic Approaches to Virtual Screening, A. Varnek, A. Tropsha, eds., RCS Publishing, 2008, ISBN 978-0-85404-144-2, P. 1-43
  4. И. И. Баскин, М. И. Скворцова, И. В. Станкевич, Н. С. Зефиров. О базисе инвариантов помеченных молекулярных графов // Докл. РАН : журнал. — 1994. — Т. 339, № 3. — С. 346—350.
  5. I. I. Baskin, M. I. Skvortsova, I. V. Stankevich, N. S. Zefirov. On basis of invariants of labeled molecular graphs (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 1995. — Vol. 35, no. 3. — P. 527—531. — doi:10.1021/ci00025a021.
  6. О. А. Раевский. Дескрипторы молекулярной структуры в компьютерном дизайне биологически активных веществ // Успехи химии : журнал. — Российская академия наук, 1999. — Т. 68, № 6. — С. 555—575.
  7. О. А. Раевский. Дескрипторы водородной связи в компьютерном молекулярном дизайне // Рос. хим. ж. (Ж. Рос. хим. об-ва им. Д.И.Менделеева) : журнал. — 2006. — Т. L, № 2. — С. 97—107.
  8. M. Karelson, V. S. Lobanov, A. R. Katritzky. Quantum-Chemical Descriptors in QSAR/QSPR Studies (англ.) // Chem. Rev.[англ.] : journal. — 1996. — Vol. 96, no. 3. — P. 1027—1044. — doi:10.1021/cr950202r.
  9. R. D. Cramer, D. E. Patterson, J. D. Bunce. Comparative molecular field analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins (англ.) // J. Am. Chem. Soc.[англ.] : journal. — 1988. — Vol. 110, no. 18. — P. 5959—5967. — doi:10.1021/ja00226a005.
  10. Пальм, В. А. Основы количественной теории органических реакций. — 2-е, пер. и доп.. — Л.: Химия, 1977. — 360 с.
  11. F. Bonachera, B. Parent, F. Barbosa, N. Froloff, D. Horvath. Fuzzy Tricentric Pharmacophore Fingerprints. 1. Topological Fuzzy Pharmacophore Triplets and Adapted Molecular Similarity Scoring Schemes (англ.) // J. Chem. Inf. Model. : journal. — 2006. — Vol. 46, no. 6. — P. 2457—2477. — doi:10.1021/ci6002416.
  12. R. Todeschini, V. Consonni: Handbook of Molecular Descriptors. WILEY-WCH Publishers, Weinheim, 2000. ISBN 3-527-29913-0
  13. 1 2 Баскин И. И., Маджидов Т. И., Варнек А. А. Введение в хемоинформатику: учебное пособие. Часть 3. Моделирование «структура-свойство», Казань: Казанский университет, 2015, ISBN 978-5-00019-442-3
  14. 1 2 Баскин И. И., Маджидов Т. И., Варнек А. А. Введение в хемоинформатику: учебное пособие. Часть 4. Методы машинного обучения, Казань: Казанский университет, 2016, ISBN 978-5-00019-695-3
  15. И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Методология поиска прямых корреляций между структурами и свойствами органических соединений при помощи вычислительных нейронных сетей // Докл. РАН : журнал. — 1993. — Т. 333, № 2. — С. 176—179.
  16. I. I. Baskin, V. A. Palyulin, N. S. Zefirov. A Neural Device for Searching Direct Correlations between Structures and Properties of Organic Compounds (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 1997. — Vol. 37, no. 4. — P. 715—721. — doi:10.1021/ci940128y.
  17. D. B. Kireev. ChemNet: A Novel Neural Network Based Method for Graph/Property Mapping (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 1995. — Vol. 35, no. 2. — P. 175—180. — doi:10.1021/ci00024a001.
  18. A. M. Bianucci. Application of Cascade Correlation Networks for Structures to Chemistry (англ.) // Applied Intelligence : journal. — 2000. — Vol. 12, no. 1—2. — P. 117—146.
  19. A. Micheli, A. Sperduti, A. Starita, A. M. Bianucci. Analysis of the Internal Representations Developed by Neural Networks for Structures Applied to Quantitative Structure-Activity Relationship Studies of Benzodiazepines (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2001. — Vol. 41, no. 1. — P. 202—218. — doi:10.1021/ci9903399.
  20. O. Ivanciuc. Molecular Structure Encoding into Artificial Neural Networks Topology (англ.) // Roumanian Chemical Quarterly Reviews : journal. — 2001. — Vol. 8. — P. 197—220.
  21. A. Goulon, T. Picot, A. Duprat, G. Dreyfus. Predicting activities without computing descriptors: Graph machines for QSAR (англ.) // SAR and QSAR in Environmental Research : journal. — 2007. — Vol. 18, no. 1—2. — P. 141—153. — doi:10.1080/10629360601054313.
  22. H. Kashima, K. Tsuda, A. Inokuchi, Marginalized Kernels Between Labeled Graphs, The 20th International Conference on Machine Learning (ICML2003), 2003. PDF
  23. H. Fröhlich, J. K. Wegner, A. Zell, Optimal Assignment Kernels For Attributed Molecular Graphs, The 22nd International Conference on Machine Learning (ICML 2005), Omnipress, Madison, WI, USA, 2005, 225—232. PDF
  24. H. Fröhlich, J. K. Wegner, A. Zell. Kernel Functions for Attributed Molecular Graphs - A New Similarity Based Approach To ADME Prediction in Classification and Regression (англ.) // QSAR Comb. Sci. : journal. — 2006. — Vol. 25, no. 4. — P. 317—326. — doi:10.1002/qsar.200510135.
  25. H. Fröhlich, J. K. Wegner, A. Zell, Assignment Kernels For Chemical Compounds, International Joint Conference on Neural Networks 2005 (IJCNN’05), 2005, 913—918. CiteSeer
  26. P. Mahe, L. Ralaivola, V. Stoven, J. Vert. The pharmacophore kernel for virtual screening with support vector machines (англ.) // J. Chem. Inf. Model. : journal. — 2006. — Vol. 46, no. 5. — P. 2003—2014. — doi:10.1021/ci060138m.
  27. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A. R. Katritzky, U. Maran, V. S. Lobanov, M. Karelson. Structurally Diverse Quantitative Structure-Property Relationship Correlations of Technologically Relevant Physical Properties (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2000. — Vol. 40, no. 1. — P. 1—18. — doi:10.1021/ci9903206.
  28. 1 2 3 4 Н. В. Артеменко, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Прогнозирование физических свойств органических соединений при помощи искусственных нейронных сетей в рамках подструктурного подхода // Докл. АН : журнал. — 2001. — Т. 381, № 2. — С. 203—206.
  29. 1 2 3 Н. В. Артеменко, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Искусственные нейронные сети и фрагментный подход в прогнозировании физико-химических свойств органических соединений // Известия РАН, Серия химическая : журнал. — 2003. — № 1. — С. 19—28.
  30. Н. И. Жохова, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Фрагментные дескрипторы в QSPR: применение для расчета поляризуемости молекул // Известия РАН, Серия химическая : журнал. — 2003. — № 5. — С. 1005—1009.
  31. Н. И. Жохова, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Фрагментные дескрипторы в QSPR: применение для расчета магнитной восприимчивости // Журнал структурной химии : журнал. — 2004. — Т. 45, № 4. — С. 660—669.
  32. Н. И. Жохова, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Расчет энтальпии сублимации методом QSPR с применением фрагментного подхода // Журнал прикладной химии : журнал. — 2003. — Т. 76, № 12. — С. 1966—1970.
  33. 1 2 3 Н. М. Гальберштам, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Построение нейросетевых зависимостей структура-условия-свойство. Моделирование физико-химических свойств углеводородов // Докл. АН : журнал. — 2002. — Т. 384, № 2. — С. 202—205.
  34. И. И. Баскин, А. О. Айт, Н. М. Гальберштам, В. А. Палюлин, Н. С. Зефиров. Применение методологии искусственных нейронных сетей для прогнозирования свойств сложных молекулярных систем. Предсказание положения длинноволновой полосы поглощения симметричных цианиновых красителей // Докл. АН : журнал. — 1997. — Т. 357, № 1. — С. 57—59.
  35. Y. Binev, J. Aires-de-Sousa. Structure-Based Predictions of 1H NMR Chemical Shifts Using Feed-Forward Neural Networks (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2004. — Vol. 44, no. 3. — P. 940—945. — doi:10.1021/ci034228s.
  36. J. P. Doucet, A. Panaye, E. Feuilleaubois, P. Ladd. Neural Networks and 13C NMR Shift Prediction (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 1993. — Vol. 33, no. 3. — P. 320—324. — doi:10.1021/ci00013a007.
  37. G. M. J. West. Predicting Phosphorus NMR Shifts Using Neural Networks (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 1993. — Vol. 33, no. 4. — P. 577—589. — doi:10.1021/ci00014a009.
  38. Н. И. Жохова, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Фрагментные дескрипторы в QSAR: применение для расчета температуры вспышки // Известия РАН, Серия химическая : журнал. — 2003. — № 9. — С. 1787—1793.
  39. А. В. Сидорова, И. И. Баскин, В. А. Палюлин, Д. Е. Петелин, Н. С. Зефиров. Исследование зависимостей между структурой и октановыми числами углеводородов // Докл. АН : журнал. — 1996. — Т. 350, № 5. — С. 642—646.
  40. А. А. Иванова, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Оценка значений констант ионизации для различных классов органических соединений с использованием фрагментного подхода к поиску зависимостей «структура-свойство» // Докл. АН : журнал. — 2007. — Т. 413, № 6. — С. 766—770.
  41. D. Butina, J. M. R. Gola. Modeling Aqueous Solubility (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2003. — Vol. 43, no. 3. — P. 837—841. — doi:10.1021/ci020279y.
  42. I. V. Tetko, V. Yu. Tanchuk, A. E. P. Villa. Prediction of n-Octanol/Water Partition Coefficients from PHYSPROP Database Using Artificial Neural Networks and E-State Indices (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2001. — Vol. 41, no. 5. — P. 1407—1421. — doi:10.1021/ci010368v.
  43. В. С. Бугрин, М. Ю. Козлов, И. И. Баскин, Н. С. Мелик-Нубаров. Межмолекулярные взаимодействия, определяющие солюбилизацию в мицеллах полиалкиленоксидных поверхностно активных веществ // Высокомолекулярные соединения, Серия А : журнал. — 2007. — Т. 49, № 4. — С. 701—712.
  44. А. А. Кравцов, П. В. Карпов, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. «Бимолекулярный» QSPR: Оценка свободной энергии сольватации органических молекул в различных растворителях // Докл. АН : журнал. — 2007. — Т. 414, № 3. — С. ???.
  45. N. M. Halberstam, I. I. Baskin, V. A. Palyulin, N. S. Zefirov. Quantitative Structure – Conditions – Property Relationships Studies. Neural Network Modelling of the Acid Hydrolysis of Esters (англ.) : journal. — 2002. — Vol. 12, no. 6. — P. 185—186.
  46. Н. И. Жохова, Е. В. Бобков, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Расчет стабильности комплексов органических соединений с β-циклодекстрином с помощью метода QSPR // Вестник МГУ, сер. 2, Химия : журнал. — 2007. — Т. 48, № 5. — С. 329—332.
  47. Н. И. Жохова, И. И. Баскин, В. А. Палюлин, А. Н. Зефиров, Н. С. Зефиров. Исследование сродства красителей к целлюлозному волокну в рамках фрагментарного подхода в QSPR // Журнал прикладной химии : журнал. — 2005. — Т. 78, № 6. — С. 1034—1037.
  48. I. V. Tetko, V. P. Solov'ev, A. V. Antonov, X. Yao, J. P. Doucet, B. Fan, F. Hoonakker, D. Fourches, P. Jost, N. Lachiche, A. Varnek. Benchmarking of Linear and Nonlinear Approaches for Quantitative Structure-Property Relationship Studies of Metal Complexation with Ionophores (англ.) // J. Chem. Inf. Model. : journal. — 2006. — Vol. 46, no. 2. — P. 808—819. — doi:10.1021/ci0504216.
  49. M. P. Gonzalez, A. M. Helguera, H. G. Diaz. A TOPS-MODE approach to predict permeability coefficients (англ.) // Polymer : journal. — 2004. — Vol. 45. — P. 2073—2079.
  50. Varnek, A.; Kireeva, N.; Tetko, I.V.; Baskin, I.I.; Solov’ev, V.P. Exhaustive QSPR Studies of Large Diverse Set of Ionic Liquids: How Accurately Can We Predict Melting Points? (англ.) // J. Chem. Inf. Model. : journal. — 2007. — Vol. 47. — P. 1111—1122.
  51. A. R. Katritzky, M. Kuanar, S. Slavov, D. A. Dobchev, D. C. Fara, M. Karelson, W. E. Acree, Jr., V. P. Solov'ev, A. Varnek. Correlation of blood-brain penetration using structural descriptors (англ.) // Bioorg. Med. Chem.[англ.] : journal. — 2006. — Vol. 14. — P. 4888—4917. — doi:10.1016/j.bmc.2006.03.012.
  52. A. R. Katritzky, D. A. Dobchev, D. C. Fara, E. Hur, K. Tamm, L. Kurunczi, M. Karelson, A. Varnek, V. P. Solov'ev. Skin permeation rate as a function of chemical structure (англ.) // J. Med. Chem.[англ.] : journal. — 2006. — Vol. 49, no. 11. — P. 3305—3314. — doi:10.1021/jm051031d.
  53. Yu. Borodina, A., Rudik, D. Filimonov, N. Kharchevnikova, A. Dmitriev, V. Blinova, V. Poroikov. New Statistical Approach to Predicting Aromatic Hydroxylation Sites. Comparison with Model-Based Approaches (англ.) // J. Chem. Inf. Comput. Sci. : journal. — 2004. — Vol. 44, no. 6. — P. 1998—2009. — doi:10.1021/ci049834h.
  54. A. A. Lagunin, J. C. Dearden, D. A. Filimonov, V. V. Poroikov. Computer-aided rodent carcinogenicity prediction (неопр.) // Mutation Research[англ.]. — Elsevier, 2005. — Т. 586, № 2. — С. 138—146. — PMID 16112600.
  55. И. И. Баскин, Г. А. Бузников, А. С. Кабанкин, М. А. Ландау, Л. А. Лексина, А. А. Ордуханян, В.А.Палюлин, Н.С.Зефиров. Компьютерное изучение зависимости между эмбриотоксичностью и структурами синтетических аналогов биогенных аминов // Известия РАН, серия биологическая : журнал. — 1997. — № 4. — С. 407—413.
  56. Д. А. Филимонов, В. В. Поройков. Прогноз спектра биологической активности органических соединений // Рос. хим. ж. (Ж. Рос. хим. об-ва им. Д.И.Менделеева) : журнал. — 2006. — Т. L, № 2. — С. 66—75.
  57. Е. П. Кондратович, Н. И. Жохова, И. И. Баскин, В. А. Палюлин, Н. С. Зефиров. Фрагментные дескрипторы при исследовании соотношений структура-активность: применение для прогнозирования принадлежности органических соединений к фармакологическим группам с использованием метода опорных векторов // Известия Академии наук. Серия химическая : журнал. — 2009. — Т. 4. — С. 641—647.