WWW.ДЕНЬСИЛЫ.РФ

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Медицина

 

Pages:     | 1 | 2 || 4 | 5 |   ...   | 8 |

Информационная технология прогноза фармакологической активности химических соединений

-- [ Страница 3 ] --

Новая информационная технология была всесторонне апробирована на различных молекулярных системах. Это структурно-разнородные синтетические и природные соединения самых разнообразных химических классов; структурно-сходные синтетические производные 22 химических рядов; соли органических соединений с неорганическими и органическими кислотами и основаниями; смеси соединений; молекулярные комплексы; сайты связывания биомишеней. Впервые был выполнен прогноз активности солей с учетом влияния солеобразующего остатка и активности смесей с учетом синергизма компонентов.

Теоретические основы и методы компьютерного прогноза фармакологической активности химических соединений

Информационная технология прогноза свойств органических соединений «Микрокосм» есть совокупность теоретических концепций, математических методов и правил и основанных на них компьютерных алгоритмов и программ, позволяющих расчетным способом оценивать свойство химического соединения по его структурной формуле. Основой методики прогноза являются полученные методами ТРО закономерности, связывающие между собой факт наличия/отсутствия активности (в том числе, для полуколичественных градаций) и структуру соединений, представ­ленную в виде матрицы структурных де­скрипторов [Васильев П. М., Спасов А. А. и др., 2004, 2005]. При прогнозе модель образа соединения сравнивается с моделями обобщенных образов классов активных/неактивных соединений и по результатам такого сравнения рассчитывается спектр прогнозных оценок активности.

Парадигма ИТ «Микрокосм». Биологическая активность химического соединения обусловлена комплексным воздействием этого соединения, как единого целого, на все компоненты биологической системы через множество характеристик его структуры. В парадигму входят восемь теоретических концепций.

1. Химическая динамическая система высокой сложности – совокупность очень большого числа химических соединений, находящихся в пространстве ограниченного объема, которые взаимодействуют между собой и внешней средой и отделены от нее и друг от друга полупроницаемыми поверхностями. Активность (свойство) химического соединения – способность вызывать изменение внешних параметров сложной химической системы при взаимодействии с ней соединения.

2. Обобщенный образ класса соединений с заданным свойством – совокупность всех соединений, проявляющих данное свойство, описанных совокупностью всех параметров, характеризующих эти соединения. Обобщенный образ является абстрактным объектом, число соединений и параметров в нем стремится к бесконечности. Можно построить модель этого образа, рассматривая как можно большее число активных соединений и их параметров. Для этого в ИТ «Микрокосм» используется специальный язык описания структуры химических соединений QL.

3. Мультидескрипторное иерархическое многоуровневое описание заключается в использовании для представления структуры соединений разных по физико-химическому смыслу способов описания – групп параметров, с одновременным разделением этих групп на несколько возрастающих по сложности уровней описания; каждый последующий уровень описания порождается из предыдущего. Расширяющаяся по параметрам избыточность описания (добавление новых групп параметров) обеспечивает увеличение мощности формируемой модели обобщенного образа. В ИТ «Микрокосм» язык QL обеспечивает 11 уровней описания химической структуры дескрипторами разной сложности и физико-химического смысла.

4. Концепция контекстно-зависимых локальных метрик предполагает, что каждый объект существует в собственном пространстве признаков, свойства которого определяются самим этим объектом [Дюк В., 1997]. Индивидуально сконструированные локальные метрики обеспечивают каждому объекту максимально возможную «область применимости», чего нельзя достигнуть при использовании общего пространства признаков и одинаковой метрики для всех объектов.

5. Мегамерное пространство – нелинейное пространство с переменной кривизной сверхбольшой размерности. Такое пространство является дискретно-непрерывным, сильно коррелированным, не ортогональным и не нормируемым.

6. Взаимодополнение решающих правил предполагает совместное использование для прогноза нескольких существенно различных математических методов, в результате чего происходит взаимная компенсация ошибок. В ИТ «Микрокосм» применяются четыре метода классификации: Байеса, расстояния, ближайшего соседа и локального распределения. Для каждого соединения каждый из методов дает 11 прогнозных оценок активности (по числу уровней QL-описания).

7. Стратегия прогноза – интегральное правило принятия решения об итоговой активности соединения по совокупности промежуточных прогнозных оценок его активности. В ИТ «Микрокосм» определены три стратегии: а) консервативная – учитывает наиболее устойчивые, характерные именно для данного вида свойств, закономерности и применяется для поиска новых высокоактивных, но типичных соединений; б) нормальная – учитывает как стандартные, так и специфические зависимости и используется для прогноза активности нетипичных структур; в) рисковая – учитывает наиболее тонкие, нестандартные закономерности, в частности, связанные с механизмом действия, максимально отражает особенности строения и степень новизны прогнозируемых соединений.

8. Комплексная методология прогноза свойств химических соединений. Адекватный прогноз активности химических соединений возможен только путем обобщения спектра прогнозных оценок, полученных несколькими существенно различающимися по математическому формализму методами для различных по сложности уровней и различных по физико-химическому смыслу способов описания структуры, с использованием всех доступных переменных описания и расширяющейся по параметрам избыточности такого описания, на основе нескольких концептуальных по результату схем принятия решений [Васильев П. М., Спасов А. А. и др., 2004]. Это центральная концепция ИТ «Микрокосм», которая представляет собой синтез всех предыдущих теоретических концепций и служит основой для построения прикладных составляющих технологии.





Данной концепции соответствует следующая схема построения прогнозных зависимостей: 1) формирование обучающей выборки из достоверно активных и неактивных соединений; 2) создание моделей обобщенных образов классов этих соединений на основе мегамерного многоуровневого описания их структуры группами параметров разного физико-химического смысла; 3) расчет ансамбля решающих правил с использованием нескольких существенно различающихся методов распознавания, отдельно для каждого уровня описания каждой группы параметров, по всем параметрам описания, без выявления «значимых» переменных; 4) вычисление спектра прогнозных оценок активности соединений обучающей выборки с применением всех полученных правил классификации; 5) построение с помощью различных стратегий по спектру прогнозных оценок интегральных многомодельных решающих правил и оценка их прогностической способности.

Использование комплексной методологии позволяет получать решающие правила, контекстно-независимые от состава обучающей выборки, способов описания структуры соединений и методов выявления зависимостей. В ИТ «Микрокосм» это реализовано посредством обобщения для каждого соединения с помощью трех стратегий прогноза спектра из 44 промежуточных прогнозных оценок активности, полученных четырьмя методами для 11 типов QL-дескрипторов.

Язык QL. Представляет собой специализированный мультидескрипторный иерархический многоуровневый язык описания структуры химических соединений с подструктурной нотацией [Васильев П. М., Спасов А. А., 2006].

Алфавит QL постулирован и задается тремя типами элемен­тарных дескрипторов. 1. Структурный дескриптор (СД) – фрагмент структуры соединения c лабильной электронной системой. Определено 4352 вида СД: 378 гетероатомных (напр., –NH2), 11 углеродных (напр., –CH3) и 3963 циклических (напр., CycAr06). 2. Дескриптор длины (ДД) – число связей ме­жду двумя СД или число общих атомов у циклического дескриптора и другого СД. Определено 197 значений ДД: от 1 до 99 и от -1 до 98. 3. Дескриптор связи (ДС) – тип электронной системы на ДД. Включает 4 индекса наличия кратных (p, P), аромати­ческих (a, A), нековалентных (n, N) связей и индекс сопряжения (0, 1). Определено 54 вида ДС (напр., pAn0).

Всего в QL определены 11 типов дескрипторов: 3 типа 1-го ранга (СД, ДД, ДС), 4 типа 2-го ранга (СД–ДД, СД1–СД2, СД–ДС и ДД–ДС), 3 типа 3-го ранга (СД1–ДД–СД2, СД1–ДД–ДС и СД1–СД2–ДС), 1 тип 4-го ранга (СД1–ДД–СД2–ДС). Структура соединения описывается совокупностью входящих в нее QL-дескрипто-ров. Модели обобщенных образов классов активных/неактивных соединений формируются по обучающей выборке в виде матрицы, каждым элементом которой является число QLдескрипторов данного вида в структуре конкретного соединения.

Методы прогноза. Разработаны четыре высокоточных метода распознавания, устойчиво работающие в мегамерных пространствах.

Метод Байеса. Логарифм вероятности принадлежности соеди­нения C к классу k = {a, n} при наличии в нем di дескрипторов i-го типа j-го вида Bij

,

где P(Bij | C  k) – априорная вероятность дескриптора Bij в классе k. Соединение C по деск­рипторам i-го типа принадлежит к тому классу, вероятность которого больше.

Метод расстояния. Взвешенное L1-расстояние Пирсона в пространстве дескрипторов i-го типа от соединения C до центра класса k

,

где cij – координаты соединения C по де­скриптору ij; zijk – координаты центра класса k по де­скриптору ij; wij = (zija + zijn)-1 – весовой коэффициент для дескриптора ij. Соединение C по деск­рипторам i-го типа принадлежит к тому классу, расстояние до центра которого меньше.

Метод ближайшего соседа. Расстояние Евклида в пространстве дескрипторов i-го типа от соединения C до каждого соединения Hl обучающей выборки

 ,   ,

где hijl – координаты соединения Hl по де­скриптору ij; N – число соединений в обучающей выборке. По дескрипторам i-го типа соединение С принадлежит к тому классу, активность которого имеет ближайшее к нему соединение обучающей выборки.

Метод локального распределения. Коэффициент сходства соединения C и каждого соединения Hl обучающей выборки в пространстве дескрипторов i-го типа

 ,   ,

где BijC – число де­скрипторов ij в соединении С; Bijl – число де­скрипторов ij в соединении Hl. Для каждого класса k формируется подмножество соединений, имеющих по дескрипторам i-го типа коэффициент сходства Qi(Hl)  0.8. На полученной локальной обучающей выборке производится классификация методом Байеса. Соединение C относят к тому классу, для которого больше локальная вероятность принадлежности соединения C к структурно сходному с ним подклассу.

Стратегии прогноза. Разработаны три концептуально разных стратегии для принятия решения об итоговой активности соединения.

Консервативная стратегия. Использует процедуру простого голосования, в которой все 44 прогнозных оценки считаются равнозначными, а решение принимается по большинству в 27 и более совпадающих оценок.

Нормальная стратегия. Основана на выборе по результатам автотестирования лучшего по точности метода прогноза, с обобщением 11 вычисленных каждым методом оценок с помощью взвешенного голосования с использованием Байесовского бинарного классификатора [Голендер В. Е. и др., 1978]

, .

Весовые коэффициенты и ,

где pkli = (nkli + 1)/(nail + nnli + 2) – априорная вероятность классификации соединения C по дескриптору i-го типа методом l в класс k; nkli – число соединений в классе k обучающей выборки, классифицированных методом l по дескриптору i-го типа как активные. В рамках метода l соединение C считается активным по всему QLописанию, если L(l)  0, и неактивным, если L(l) < 0.

Рисковая стратегия. Основана на выборе по результатам автотестирования, отдельно по каждому из 11 уровней QLописания, лучшего по точности метода прогноза с учетом типа дескрипторов. Процедуры итогового голосования нет, каждое из 44 прогнозных множеств рассматривается как самостоятельное информационное пространство. Классификационная метрика для соединения C рассчитывается по той формуле, которая соответствует выбранному методу.

Точность решающих правил оценивалась способами автопрогноза, скользящего, перекрестного и двойного скользящего контролей. Для повышения надежности прогноза итоговые оценки по всем трем стратегиям обобщались; для полуколичественных градаций активности результаты проверялись на непротиворечивость.

Фармакофоры-образы. Являются новым классом QSAR-объектов, каждый из которых включает в себя множество традиционных фармакофоров. Построение фармакофоров-образов происходит в два этапа [Спасов А. А. и др., 2007]: 1) рассчитываются списки статистически значимых по гипергеометрическому критерию QL-признаков активности; 2) формируются фармакофоры-образы путем пошагового объединения значимых QLпризнаков, имеющих структурно близкие особенности.

Прогноз и экспериментальная проверка вида и уровня фармакологической активности структурно-разнородных соединений

Разработанная технология была проверена в прогнозе наличия/отсутствия 34 видов активности на базе данных из структурно-разнородных известных лекарственных и биологически активных веществ. В скользящем контроле точность прогноза по консервативной стратегии изменяется от 65 до 100 %; по нормальной стратегии – от 69 до 100 %; по рисковой стратегии – от 67 до 100 %. При использовании консервативной стратегии найдена 31 адекватная прогнозная зависимость (точность прогноза не менее 60%). В случае нормальной стратегии все 34 зависимости достоверны. Для рисковой стратегии получены 33 адекватных прогнозных зависимости. При использовании лучшей из трех стратегий адекватный прогноз возможен для всех 34 видов активности.

Полученные решающие правила были проверены на 815 испытанных производных бензимидазола, ГАМК и пирролидона при прогнозе наличия/отсутствия 10 видов фармакологической активности – адекватно прогнозируются 8 видов. В частности, для H1-антигистаминной активности точность прогноза составила 73,7 %, а для 5-HT2-антисеротониновой активности – 71,0 %.

Указанные решающие правила использованы для направленного поиска в ряду 112 адамантил-производных имидовых кислот соединений с психотропной активностью. При прогнозе совместно по трем стратегиям 76 % этих веществ с высокой достоверностью должны проявлять ноотропную активность. В результате последовательного применения рисковой стратегии и метода ближайшего соседа, совместно с правилом Липински [Lipinski C. A. et al., 1997], по прогнозу для испытаний было отобрано 4 соединения. После их экспериментального изучения оказалось, что три из них проявляют ноотропную активность, причем одно превосходит по активности препарат сравнения пирацетам. Следовательно, точность поиска производных адамантана с ноотропной активностью составила 75 %.

С помощью этих же решающих правил выполнен направленный поиск соединений с антивирусной активностью среди десяти адамантил-производных биологически активных веществ. При прогнозе 19 видов активности по трем стратегиям оказалось, что наиболее перспективной для изучения в данном ряду является антиортовирусная активность (83,3 % положительных оценок). По результатам прогноза совместно по трем стратегиям, с последующей оценкой 2D- и 3D-структурного сходства к реперному препарату тромантадину, к испытанию на антиортовирусную активность рекомендованы три вещества.

По этой же базе данных структурно-разнородных соединений для 19 видов активности была также проведена проверка точности прогноза высокого уровня активности, как наиболее интересного в практическом отношении. В скользящем контроле точность прогноза по консервативной стратегии изменяется от 83 до 99 %; по нормальной стратегии – от 72 до 97 %; по рисковой стратегии – от 73 до 99 %. При использовании консервативной стратегии получено 9 адекватных прогнозных зависимостей. Для нормальной и рисковой стратегий выявлено по 14 адекватных прогнозных зависимостей. При использовании лучшей из трех стратегий адекватный прогноз высокого уровня возможен для 16 из 19 видов активности.



Pages:     | 1 | 2 || 4 | 5 |   ...   | 8 |
 




Похожие работы:







 
2013 www.деньсилы.рф - «МЕДИЦИНА-ЛЕЧЕНИЕ-ОЗДОРОВЛЕНИЕ»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.