Жизнь малой молекулы
День зельеварения
Поскольку я имею некоторое профессиональное отношение к разработке малых молекул, решила поделиться кое-каким крайне общим и не претендующим на полноценное перечисление всех возможных вариантов (а также содержащий упрощения для большего понимания всеми) текстом, описывающим отдельные моменты ранней разработки малой молекулы. Везде, где в статье говорится "лекарство" без уточнения контекста, имеется в виду маломолекулярный препарат.
Жизнь малой молекулы условно делится на 5 этапов:
- Выбор мишени
- Выбор прототипа / исследование активного сайта
- Разработка малой молекулы
- Передача на фармацевтическую разработку
- Выход на КИ, получение разрешения, etc
Или вот более красивая схема:
Первые три пункта (1-3) относятся к ранней разработке, пункт 4 — к фармацевтической, пункт 5 — всё, что про дальнейший жизненный путь и связано с регуляторами Про пункт 4 стоит сказать сейчас, поскольку он интересует нас меньше прочих, да и я не специализируюсь на деталях фармразработки, так как не работаю в ней. Если кратко, фармразработка — это оптимизация схемы синтеза, заработка значительного количества малой молекулы и разработка лекарственной формы (таблетка, капли, инъекция, etc). Мы разрабатываем именно таблетированные формы для персонального приёма, так что молекулы должна быть биодоступной, а потому — растворимой, и эти параметры отслеживаются на этапе 3. Касательно пункта 5 — это в основном общение с регуляторами, очень значительные финансовые траты, подбор пациентов и прочие дебри, в детальное описание которых пускаться мне не хочется, но могу отметить, что КИ делятся на три этапа (первый, второй и третий), хотя сейчас наиболее популярна совмещённая первая и вторая фазы.
Касательно всего того, что является ранней разработкой.
Начнём с выбора мишени. Правильный подбор мишени — это уже половина успеха. Мы занимаемся таргетной терапией, то есть у каждой нашей малой молекулы есть конкретный набор белков, хотя не всегда мишень может быть и обязана быть белком, это может быть фактически что угодно, даже РНК —https://link.springer.com/article/10.1186/s40478-023-01521-0, однако мы занимаемся исключительно белками. Да и большинство известных маломолекулярных лекарств нацелены на белки.
Схема ниже взята отсюда — https://www.researchgate.net/publication/311356392_A_comprehensive_map_of_molecular_drug_targets.
В целом, с белками проще всего работать.
Бывает также такое, что сначала делается малая молекула (или была сделана когда-то), а после под неё подбирается мишень, но мы такое не практикуем, хотя примеры есть —https://bmcbiotechnol.biomedcentral.com/articles/10.1186/s12896-023-00815-4, конкретно стоит обратить внимание на описанные в статье методы и на примеры таких молекул —https://bmcbiotechnol.biomedcentral.com/articles/10.1186/s12896-023-00815-4/tables/1
Важный вопрос и в том, какие в целом бывают типы малых молекул по их механизму действия. Классификация ниже весьма условная, конечно, и иногда классы пересекаются (например, продраг может быть как ингибитором, так и агонистом, но я предпочла вынести его отдельно как явление).
- Ингибитор — классическая вещь, наиболее активно разрабатываемая всеми подряд. Связывается в определённом сайте белка и мешает тому выполнять его функции, из-за чего рассыпается абсолютно всё, что только можно. Впрочем, раковые клетки (я буду делать некоторый фокус на них, поскольку работаю по онкологическому направлению) достаточно хитры, и у них есть способы обходить даже “упавшие” метаболические пути.
- Ортостерический — ингибитор, который связывается в сайте нативного лиганда, над которым проводит манипуляции целевой белок. Практически любой киназный ингибитор может быть примером, да и в целом это самый популярный сайт. Например, фотоактивные ингибиторы транспортера глутамата (https://pubs.acs.org/doi/full/10.1021/jacs.0c11336), фотоактивные ингибиторы eDHFR (https://pubs.acs.org/doi/10.1021/acs.jmedchem.1c01962), пара киназных фотоактивных ингибиторов (https://www.mdpi.com/1422-0067/23/10/5326 и https://pubs.rsc.org/en/content/articlehtml/2021/cc/d1cc04125h)
- Аллостерический — ингибитор, который связывается в специальном сайте, ответственном за конформационные изменения белка. Например, ингибиторы MAT2a (https://doi.org/10.1021/acs.jmedchem.1c00067 и https://doi.org/10.1021/acs.jmedchem.0c01895), глюкокиназа (https://pubs.thesciencein.org/a657/), K-Ras4B (https://pubs.acs.org/doi/full/10.1021/jacs.3c11396, а вот тут чисто вычислительная работа, делали молекулярную динамику), P2X4 (https://www.nature.com/articles/s41467-023-42164-y), AKT1 (https://link.springer.com/article/10.1007/s11030-022-10582-7, тут делали докинг в чужие кристаллы и молдинамику), PCSK9 (https://www.mdpi.com/2227-9059/12/2/286). Если обратить внимание на “внутренности” статей (особенно первых) про аллостерические ингибиторы, можно заместить, что это — достаточно трудоёмкий процесс, который требует постоянного получения кристаллов (буквально на каждому шаге), чтобы уточнять положение полученного ингибитора, так как стандартных вычислительных методов (докинг, даже молдинамика) недостаточно, чтобы отловить серьёзные конформационные изменения белка. Так, в https://doi.org/10.1021/acs.jmedchem.1c00067 сначала сделали скрининг библиотеки, нашли два фрагмент-хита, получили на них кристаллы, подтвердив способ связывания, потом постепенно наращивали и снова подтверждали все способы связывания кристаллами, по сути, не использовали стандартные вычислительные методы (докинг, молекулярная динамика, etc), реализовав ligand-based подход и активно синтезируя молекулы, чтобы их проверить и сделать выводы на основе SAR.
- PPI — ингибитор, который связывается в месте взаимодействия двух или более белков, из-за чего те не способны образовать активный комплекс. Например, Keap1-Nrf2 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c02171) и большая статья про PPI в противовирусных (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01543). Достаточно сложная вещь, которая требует, во-первых, найти такие удачные PPI в плане белков, а во-вторых, понять, где тот самый сайт PPI, без которого всё сломается.
- В принципе, если есть другие удачные сайты, то можно нацелиться и на них.
- Активатор — менее классическая вещь, из-за которой белок начинает, в отличие от ингибитора, работать. Они могут варьироваться внутри себя по классам, но, опять-таки, я недостаточно специализируюсь на активаторах, чтобы писать о них подробнее. В качестве примера могу оставить etavopivat — аллостерический активатор пируват-киназы (https://drughunter.com/molecule/etavopivat/).
- Агонист — лиганд, который заставляет рецептор действовать. Например, danuglipron (https://drughunter.com/molecule/danuglipron/) для терапии ожирения или агонисты TAAR1 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.4c00195), а ещё — фотоактивные агонисты рецептора мелатонина (https://pubs.acs.org/doi/10.1021/acs.jmedchem.2c00717) или вот ещё фотоактивные агонисты TRPA1 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.1c01579)
- Антагонист — лиганд, который заставляет рецептор не действовать. Например, антагонисты GPR183 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01905), LPA1 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01827), PAR4 (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01986)
- PROTAC — малые молекулы, вызывающие протеолиз таких белков, на которые достаточно сложно нацелиться при более классических классов (например, ингибиторов). Например, https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01468, https://pubs.acs.org/doi/10.1021/jacsau.4c00040, https://pubs.acs.org/doi/10.1021/acsmedchemlett.3c00571
- Молекулярный клей — такая малая молекула, которая одновременно взаимодействует и с самим белком, и с его кофактором. Например, обзорная статья (https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c00449).
- Продраг — малая молекула, которая подаётся “на вход” организму в неактивном виде, но в процессе метаболизма она становится действующей — например, от неё отцепляется какая-то группа, и в итоге получается активная молекула. Зачастую это нужно для улучшения ФК-профиля молекулы (например, она была нерастворимой, но на неё нацепили легко гидролизуемую группировку, благодаря которой молекула стала растворимой и может приниматься перорально). Продрагом может быть как ингибитор, так и антагонист, да и в целом практически что угодно, но вынесено, как говорилось выше, это в отдельный класс, чтобы не возникало вопросов о том, что это вообще такое.
Классические ортостерические ингибиторы — наиболее простая, широко исследуемая и изученная вещь с понятной кинетикой. Разумеется, у всех прочих вариантов тоже есть свои плюсы: например, нацеливание на аллостерический сайт может помочь сделать малую молекулу селективной там, где невозможно пройти через активный сайт, да и не всегда ингибирование по активному и аллостерическому сайтам даёт результат — и тогда в бой вступают уже всевозможные дегрейдеры и PPI.
Немного разобрались с типами малых молекул, так что вернёмся снова к выбору мишени. Как уже было сказано выше, мишень в большинстве случаев — это какой-то белок, работать с ними проще всего. Такой белок должен иметь доказанную роль в патологических процессах, обладать структурой на PDB (так как кристаллизация своего белка требует ресурсов, а альфафолду не всегда можно доверять, да и после сворачивания белка потребуется прогнать молекулярную динамику, чтобы погенерировать состояния белка, да и лучше всего исследовать сайт, уже связанный с каким-то, хотя бы нативным, лигандом, чтобы лучше понять аминокислотные взаимодействия), а также быть (желательно) валидированным на каких-то других малых молекулах — например, желательно, чтобы были какие-то in vivo данные (ксенографты мышей подойдут) о том, что такие ингибиторы действительно работают и имеют смысл, если, конечно, речь не идёт о разработке first-in-class препарата (такого, какому нет аналогов) — тогда допустимо рассматривать и малоизученные мишени, которые можно валидировать и своими силами.
После того, как мишень выбрана, можно переходить к разработке малой молекулы. Выше уже было сказано о разных типах малых молекул — первоначально необходимо выбрать, какой именно тип будет разрабатываться, и про некоторые недостатки вариантов я тоже написала выше.
Также сейчас есть смысл чуть более детально сказать про некоторые подходы к дизайну (кое-что упоминалось ранее, и стоит дать справку об этом):
- Ligand-based — ситуация, в которой получение белка затруднено или невозможно. Общий алгоритм: синтезируем какие-то молекулы, тестируем их, делаем выводы про SAR, не зная, как конкретно связываются с целевым белком наши молекулы. Типичная ситуация для аллостерических ингибиторов и всевозможных агонистов/антагонистов.
- Structure-based — классическая ситуация, когда у нас есть белок (как правило — с нативным лигандом, каким-нибудь АТФ для киназ), на основании которого делается молекула.
- Fragment-based — не отдельное направление, а реализуемое внутри первых двух. Ситуация, когда мы берём фрагменты и пытаемся на них основе “дорастить” полноценную молекулу. Например, тут есть анализ таких молекул за 2020 год - https://pubs.acs.org/doi/10.1021/acs.jmedchem.1c01803. Можно, как в случае с аллостерическими ингибиторами (https://doi.org/10.1021/acs.jmedchem.1c00067), реализовать нечто смешанное между ligand и structure, а можно — что-то более определённое.
- AI-based — не отдельное направление, а такое, которое можно реализовать внутри первых двух. Как понятно из названия, берём искусственный интеллект и генерируем молекулы на своё усмотрение. Например, из последних работ для Nurr1 агонистов (реализован достаточно классический для AI-driven de novo drug design подход, который реализовывали десятки раз до до этого) — https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c00485
Прежде чем рассматриваться детали разработки, я бы ещё остановилась на основных свойствах малой молекулы:
- Активность на целевом белке — IC50 для целевого белка. Чем меньше (и чем более молекула наномолярна), тем лучше.
- Селективность — IC50 к потенциальным офф-таргетам. Чем больше, тем лучше.
- Токсичность — следствие недостаточной селективности или каких-то токсофоров, триггерящих клетку. Измеряется на клеточных линиях, не являющихся целевыми (в частности, на клетках печени и не являющихся онко-линиями). Чем меньше токсичность, тем лучше.
- Растворимость — в воде. Молекула должна быть достаточно растворима, чтобы быть биодоступной, но при этом достаточно липофильной, чтобы проникать через требуемые физиологические барьеры (например, ГЭБ). Сложная характеристика.
- Активность на клеточной линии — EC50 на целевых линиях. Молекула должна быть как можно более активной, но при этом не за счёт нецелевой токсичности.
- Метаболическая стабильность — влияет также на ФК-профиль, период полувыведения и косвенно на эффективность терапии. Молекула не должна метаболизироваться за три секунды и выводиться за пять минут... если, конечно, в этом нет какого-то отдельного смысла — я могу представить ситуацию с диагностическими препаратами, которым бы лучше вывестись достаточно быстро из тела пациента.
- Проницаемость через ГЭБ — или иные физиологические барьеры. Может требоваться, может не требоваться. Требует для измерения специальных тестов. Зачастую связаны с липофильностью молекулы (которая при этом должна быть не слишком велика, чтобы молекула сохраняла биодоступность).
- Биодоступность — чем выше биодоступность, тем меньше потери. Зависит от целого комплекса показателей — от активности до растворимости.
Обычно сначала добиваются хорошей активности, затем — селективности (которая порой определяется конкретными точечными заместителями), после — всё остальное, начиная с растворимости и активности на клеточной линии и заканчивая метаболической стабильностью. Это связано с тем, что зачастую растворимость и метаболическая стабильность — вопрос единичных заместителей, хотя и не всегда. Например, бывает достаточно ввести одну-две растворимые группы, чтобы закрыть вопрос, а метаболическая стабильность может потребовать перекрыть, допустим, одну-две точки метаболизма условными и крайне популярными фторами, чтобы замедлить этот самый метаболизм. Впрочем, снова отмечу, что это не всегда так будет просто работать.
Дальнейшие этапы я рассмотрю на примере одной конкретной малой молекулы, поскольку придумывать сейчас с нуля какую-то молекулу и подбирать новую мишень — весьма трудоёмкая задача. Сделаю поправку на то, что я пропускаю такие этапы выбора мишени, как поиски в литературе описанного механизма действия, анализа конкурентов на клинических исследованиях (если есть), разработку биоаналитических тестов (без которых разработка не продвинется) и некоторые другие, которыми занимаются другие специалисты.
Допустим, мы выбрали мишень B3GNT2.
B3GNT2 отвечает за удлинение длинноцепочечного полилактозамина на клеточной поверхности, что влияет на регуляцию иммунного ответа, что делает его привлекательной мишенью для иммуномодуляции. Звучит достаточно интересно.
Первым делом пойдём на ПДБ:
В наличии — 12 человеческих белков разной степени качественности. Выше 2,5 ангстрём брать смысла нет, поэтому отсечём лишнее.
Одна из очевидно отличных структур — 8SZ3: 2.32 Å, закристаллизована с ингибитором:
Понятное дело, что первым делом надо прочитать статью — https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c01517. Дополнительно — исследовать JOMC и иные журналы на предмет наличия аналогичных ингибиторов, поизучать патенты. В процессе выяснилось, что родственные молекулы также являются ингибиторами NAMPT:
И модуляторами TRP-P8:
Однако эти патенты не актуальны для нас как стартовая точка. Не хочется лезть в дебри патентования, но различие в мишенях — это уже разные патенты.
Поскольку статья закрыта (и nexus её пока не вскрыл), сделаем визуализацию активного сайта самостоятельно, для чего загрузим структуру в PyMol и при помощи команды show sticks, byres all within 7 of (sele_name), где (sele_name) — название sele для выделенного ингибитора оценим аминокислоты на расстоянии 7 ангстрём от ингибитора, чего должно хватить.
Очевидных взаимодействий не так много, но рассмотрим некоторые из них:
| Взаимодействие | Комментарий |
| Вероятно, взаимодействие брома с аргинином-115 | |
| Вероятно (но совсем не обязательно, это надо подтверждать дополнительно), может иметь место пи-стекинг с фенилаланином-217 | |
| Контакт с лизином-288 | |
| Контакт с аспарагином-215 | |
| Контакт с серином-150 |
Попробуем составить фармакофорную модель через pharmit для этого лиганда:
Небольшое визуальное саммари фич:
И визуализация с поверхностью:
Я бы начала с биоизостерических замен центрального бицикла — это наиболее оптимальное пространство для замен, чтобы добиться патентной чистоты. Ацетамид, представляющий собой отчасти линкер, а отчасти — акцептора водородов, оставила бы без изменений, скорее всего. Помимо прочего, очевидно, есть большое пространство для роста самой малой молекулы, которое потенциально может позволить увеличить аффинность ингибитора к активному центру и поднять в перспективе активность не только на белке, но и на клеточных линиях. Затем — поиграть вокруг получившейся молекулы, подумать о растворимости и метаболической стабильности молекулы.
Однако, прежде всего, в норме составляется стратегия дизайна — неподробное описание логических шагов, которые необходимо предпринять, чтобы получить молекулу. Нечто наподобие стратегии я описала выше, но более логичное и выстроенное.
Внутри стратегии существуют тактические шаги, выраженные в виде отдельных утверждений (гипотез). Например: Биоизостерическая замена центральной бициклической замены сохранит активность (и в качестве бонуса позволит отойти от прототипа). Затем для каждой гипотезы предлагается пул молекул, которые, прежде всего, отправляются на докинг в референсный кристалл — докинг бывает как жесткий (с сохранением положений аминокислот активного сайта), так и мягкий (наоборот, похож на молекулярную динамику с меньшими затратами ресурсов и предполагает подвижность аминокислот, более предпочтителен, если предполагается более серьёзный отход от прототипа). Основное, что нас интересует — это не докинг скор как просто какое-то число, как могло бы показаться, а связка этого числа с сохранением референсной позы и целевых взаимодействий с аминокислотами (если гипотеза предполагает формирование новых, то появление новых, конечно).
Как правило, на первых этапах, когда речь идёт о замене кора и поиске собственного будущего хита для оптимизации в лида, проведение дополнительных расчётов не так актуально, хотя тоже может проводиться. Например, я могу сравнить растворимости коров при помощи специальных моделей или программ:
| Кор | Растворимость |
| Log S (ESOL) -2.01Solubility1.46e+00 mg/ml ; 9.85e-03 mol/lClass Soluble Log S (Ali) -1.40 Solubility5.85e+00 mg/ml ; 3.95e-02 mol/l Class Very soluble Log S (SILICOS-IT) -2.36 Solubility6.48e-01 mg/ml ; 4.38e-03 mol/l Class Soluble | |
| Log S (ESOL) -1.64Solubility3.68e+00 mg/ml ; 2.27e-02 mol/lClass Very soluble Log S (Ali) -0.94 Solubility1.88e+01 mg/ml ; 1.16e-01 mol/l Class Very soluble Log S (SILICOS-IT) -2.60 Solubility4.06e-01 mg/ml ; 2.50e-03 mol/l Class Soluble |
Допустим, мы нашли какой-то кор, который нас устраивает. Он хорош по целевым показателям, отлично проявил себя в биохимических и клеточных тестах, легко и не дорого синтезируется, не противоречит логике и здравому смыслу, согласуется с расчётами.
В дальнейшем мы можем перейти к ним свойствам. Например:
- Заместитель X1 образует водородные связи с Asp-245, что увеличит активность
- Заместитель X2 образует водородные связи с Arg-15, что увеличит активность
- Заместитель X3 образует водородные связи с Asp-215, что увеличит активность
- Введение заместителя X4 по положению Y1 закроет точку метаболизма, что увеличит стабильность
- Замена заместителя X5, являющегося токсикофором, на X6 позволит избежать токсических эффектов
- Введение заместителя X6 по положению Y2 увеличит растворимость
- Заместитель X7 по положению Y3 обеспечит селективность по отношению к Белку 2
И так далее.
Здесь, пожалуй, важно отметить, что выбирать аминокислоты тоже надо с умом и в первую очередь ориентироваться необходимо на те аминокислоты, которые напрямую задействованы в каталитических реакциях, если речь идёт об ортостерическом ингибиторе.
Для каждого конкретного случая применяются свои расчётные методы — или здравый смысл, опирающийся на данные тестов. Например, мы посчитали, что по точке W идёт метаболизм, а также подтвердили это экспериментально; или только подтвердили экспериментально, потому что заранее не подумали - значит, необходимо что-то с этим делать. Для этого медицинский химик обращается к литературе, каким-то известным примерам и своим знаниям, чтобы предложить такой заместитель, который не позволит иным белкам так быстро распознавать молекулу и уничтожать её — часто таким заместителем можем быть фтор, достаточно похожий на водород, чтобы не вносить критических изменений в структуру, но при этом перекрыть сайт метаболизма.
Такими темпами, шаг за шагом, получается новая малая молекула. Или не получается, тут как пойдёт: процент неуспеха в этой области критически большой.




— сдаётся мне, это была шутка.
И да, приведённая цитата — это шутка. В которой много правды (:
А с книгой удачи, пусть всё получится!
Вопросик, а оценка той же токсичности — это молмоделирование взаимодействия с основными ферментами метаболизма ксенобиотиков? Или делается как-то по другому? Оценка схожести структуры?
Однако, например, можно рассуждать о вероятной токсичности, если в молекуле присутствуют токсикофорные группы, и тут достаточно просто посмотреть на саму структуру. Токсичность может вызываться и за счёт действия на какие-то специфические белки, на тот же HERG (и известные CYP-ы), и для отдельных белков токсического интереса существуют свои алертные структуры (те же токсикофоры, но уже не общего характера, а специфические для конкретных белков), так что тут тоже можно отделаться именно анализом самой структуры, хотя возможно и некоторое молекулярное моделирование. Есть нейросетевые (и не только) модели для предсказания токсичности, например, условный toxCSM, который использует и токсикофоры, и оценку схожести структур с известными токсичными молекулами, и общие дескрипторы (подозреваю, что там внутри подшиты всякие ТПСА, молекулярные массы, липофильность и прочие), и что-то ещё, но тут надо лезть в статью смотреть. Токсичность может быть обеспечена ещё и действием на офф-таргеты, и тогда здесь в бой могут вступить стандартные вычислительные методы (докинг и молдинамика те же). До кучи токсичность может обеспечиваться не самой исходной молекулой, а какими-то её метаболитами, и стоит сначала предсказать сайты метаболизма и возможные пути метаболизма, а уже после оценить, не токсичны ли эти самые метаболиты.
Надеюсь, смогла дать общее представление (:
данунетнехочутри пузырькаЗа познавательность и расширение представлений о современном зельеварении)
блинблог вышел отлично: интересным, познавательным, прекрасно иллюстрированным и ироничным.p.s:
1) Вот здесь споткнулась на слове «лекарство»:
И пошла грызть матчасть. Оказывается, маломолекулярные из-за стабильности дешевле и проще в производстве, принимаются перорально, но в отличие от биологических препаратов имеют больше побочек.
2) Перепутала даты завершения голосования, не могу поощрить пузырьками, от меня сердечко
Алиса, молодец, поздравляю с почином!