QSAR-анализ активности ингибирования ацетилхолинэстеразы с использованием базы данных ChEMBL.

Абстрактный

Ацетилхолинэстераза (АХЭ) является ключевым ферментом, который регулирует нейротрансмиттер ацетилхолин в нервной системе и является мишенью для лечения болезни Альцгеймера и других неврологических расстройств (Zaki et al., 2020). Моделирование количественной зависимости структура-активность (QSAR) представляет собой вычислительный подход, связывающий химическую структуру соединений с их биологической активностью (Galton et al., 2017). База данных ChEMBL является ценным ресурсом для моделирования QSAR, предоставляя большую коллекцию данных о биологической активности и молекулярных дескрипторов для различных биологических целей (Kamboj et al., 2022). Алгоритмы машинного обучения продемонстрировали большой потенциал для разработки моделей QSAR для открытия лекарств (Mamada et al., 2022).

Целью данного исследования было создание моделей QSAR для прогнозирования ингибирующей активности АХЭ с использованием базы данных ChEMBL и алгоритмов машинного обучения. Мы извлекли из базы данных ChEMBL набор данных примерно из 4695 соединений с ингибирующей активностью АХЭ. Данные были дополнительно обработаны путем получения различных молекулярных дескрипторов и отпечатков пальцев соединений. Для создания моделей QSAR использовались различные алгоритмы машинного обучения, такие как случайный лес и линейная регрессия. Самая эффективная модель имела среднее значение R-квадрата 0,62 и среднеквадратичную ошибку 0,9879, что указывает на хорошую предсказуемость. Мы также провели внешнюю проверку моделей с использованием независимого набора тестов и получили сопоставимые результаты. Результаты анализа важности признаков показали, что PubchemFP3, PubchemFP528, PubchemFP559, PubchemFP821 и PubchemFP601 входят в первую пятерку признаков с самыми высокими значениями IncNodePurity и, следовательно, вносят наибольший вклад в активность ингибирования АХЭ. Эти особенности, вероятно, являются важными молекулярными дескрипторами, играющими важную роль в биологической активности соединений. Наше исследование демонстрирует полезность базы данных ChEMBL и алгоритмов машинного обучения для разработки моделей QSAR для ингибирующей активности АХЭ. Эти модели могут быть полезны для разработки ингибиторов АХЭ и, таким образом, ускорить процесс открытия лекарств от неврологических расстройств. Однако для подтверждения биологической активности молекулярных дескрипторов требуется дальнейшая экспериментальная проверка с использованием таких методов, как молекулярный докинг.

Предыстория и цели

Нейродегенеративные заболевания, такие как болезнь Альцгеймера, болезнь Паркинсона, болезнь Хантингтона и боковой амиотрофический склероз (БАС), поражают миллионы людей во всем мире, особенно пожилое население (Prince et al., 2016).

Доступные методы лечения нейродегенеративных заболеваний имеют ограничения с точки зрения эффективности и побочных эффектов. Поэтому существует необходимость в поиске новых и более эффективных ингибиторов этих заболеваний (Cummings et al., 2014).

Одним из многообещающих подходов к лечению нейродегенеративных заболеваний является ингибирование фермента ацетилхолинэстеразы (АХЭ). Ингибиторы АХЭ предотвращают распад ацетилхолина. Ацетилхолин — нейротрансмиттер, играющий решающую роль в процессах обучения и памяти (Liu et al., 2015).

Открытие лекарств — сложный процесс, включающий идентификацию и оптимизацию малых молекул. Эти молекулы могут взаимодействовать с белками-мишенями, модулируя их активность. Вычислительные методы, такие как моделирование количественной зависимости структура-активность (QSAR), стали мощными инструментами для открытия лекарств. QSAR позволяет прогнозировать биологическую активность на основе химической структуры соединения. Это снижает потребность в экстенсивных экспериментах и ​​снижает затраты, связанные с разработкой лекарств. Моделирование QSAR может облегчить идентификацию новых и сильнодействующих лекарств-кандидатов (Roy et al., 2015).

Это исследование было направлено на поиск лекарств от нейродегенеративных заболеваний с использованием анализа QSAR для прогнозирования активности соединений против АХЭ. Для этой цели была использована база данных ChEMBL, которая обеспечивает исчерпывающую и курируемую коллекцию данных о биологической активности малых молекул, включая данные об активности соединений против АХЭ (Gaulton et al., 2012).

Модели QSAR были разработаны с использованием алгоритмов машинного обучения, таких как случайный лес и линейная регрессия. Эффективность этих моделей оценивалась с использованием статистических показателей, таких как MSE, RMSE, R-квадрат. Результаты показали, что разработанные модели QSAR имеют хорошую прогностическую точность для активности AChE. Это исследование подчеркивает потенциал использования анализа QSAR при поиске лекарств от нейродегенеративных заболеваний и обеспечивает ценный подход для прогнозирования активности соединений против АХЭ.

Вычислительные методы

Цель этого исследования заключалась в том, чтобы улучшить поиск лекарств с помощью машинного обучения путем выполнения анализа QSAR ингибирующей активности ацетилхолинэстеразы (AChE) с использованием базы данных ChEMBL. Рабочий процесс исследования показан на рисунке 1, который включал: (i) использование набора данных с определенной конечной точкой; (ii) использование однозначного алгоритма обучения; (iii) определение области применимости модели QSAR; (iv) использование соответствующих показателей согласия, устойчивости и предсказуемости.

Рисунок 1. Рабочий процесс моделирования QSAR для исследования ингибирующей активности АХЭ.

Сбор и предварительная обработка данных

В исследовании использовалась база данных ChEMBL для сбора и предварительной обработки данных об ингибиторах АХЭ против АХЭ человека (идентификатор мишени CHEMBL220). Первоначальный поиск проводился с использованием запроса «ацетилхолинэстераза», и для ацетилхолинэстеразы человека (CHEMBL220) были получены только данные о биологической активности, представленные в виде значений pChEMBL. Результирующий набор данных состоял из 7026 точек данных биологической активности для 5835 соединений.

Стандартизатор ChemAxon использовался для курирования обозначений соединений SMILES, в результате чего был получен окончательный набор данных из 4695 соединений. Все соединения с отсутствующими значениями в столбцах standard_value и canonical_smiles были исключены, как и дубликаты canonical_smiles. Столбцы molecule_chembl_id, canonical_smiles, standard_value и bioactivity_class были объединены в DataFrame с соединениями, помеченными как активные, неактивные или промежуточные на основе их значений биологической активности, которые были преобразованы в pIC50.

Промежуточный класс был удален, а дескрипторы Липинского были рассчитаны с использованием канонического SMILES для количественного описания соединений в наборе данных. Чтобы создать более равномерно распределенный набор данных IC50, значения IC50 были преобразованы в отрицательную логарифмическую шкалу путем применения -log10 с использованием пользовательской функции под названием pIC50(). Кураторские данные о биологической активности ChEMBL (https://raw.githubusercontent.com/dataprofessor/bioinformatics_freecodecamp/main/acetylcholinesterase_04_bioactivity_data_3class_pIC50.csv) были загружены, предварительно обработаны и использованы для исследовательского анализа данных.

Канонические улыбки из приведенного выше набора данных были использованы для получения дескрипторов PaDEL. Дескрипторы PaDEL были рассчитаны с использованием 12 различных отпечатков пальцев для кодирования ингибиторов AChE. Этот набор данных использовался для последующего анализа и построения модели, и его можно найти по адресу https://raw.githubusercontent.com/dataprofessor/bioinformatics_freecodecamp/main/acetylcholinesterase_06_bioactivity_data_3class_pIC50_pubchem_fp.csv.

Эти шаги были необходимы для сбора и предварительной обработки данных, чтобы обеспечить надежность и качество последующего анализа и построения модели.

Исследовательский анализ данных

Исследовательский анализ данных был выполнен на основе отобранных данных с использованием дескрипторов Липински. Обработанные данные были проанализированы путем вычисления правила пяти дескрипторов Липинского. Правило пяти Липински - это руководство, используемое фармацевтами для оценки лекарственного сходства небольших органических молекул на основе их физических и химических свойств. Он был разработан доктором Кристофером Липински в 1997 году и в настоящее время используется для выявления потенциально эффективных лекарств, которые могут выйти на рынок. (Мишра и др., 2009 г.)

Чтобы соответствовать критериям правила пяти, лекарство должно иметь молекулярную массу не более 500 дальтон, липофильность не более 5, не более 5 доноров водородных связей и не более 10 водородных связей. акцепторы. Считается, что молекулы, отвечающие этим критериям, имеют более высокую вероятность прохождения через клеточные мембраны, достижения намеченной цели и проявления желаемых фармакологических свойств. Однако важно отметить, что правило пяти не является жестким правилом, и из него есть много исключений, поэтому его следует использовать в качестве общего руководства, а не правила (Mishra., et al, 2009).

Были выбраны только два класса биологической активности: активный и неактивный. Таким образом, можно сравнить активные и неактивные соединения. Этот анализ позволяет нам взглянуть на химическое пространство молекулы. Были построены частотный график, а также диаграмма рассеяния, показывающая 2 класса (см. рис. 2). Для определения активного и неактивного были выбраны пороговые значения 5 и 6. Если pIC50 >6 мы определили его как активный. С другой стороны, если pIC50 ‹ 5, мы определяем его как неактивный. Мы обнаружили, что еще несколько препаратов были определены как активные, чем неактивные.

Рисунок 2. Частотная диаграмма (A) и диаграмма рассеяния MW в зависимости от logP (B) для активных и неактивных классов

Был проведен U-тест Манна-Уитни для дальнейшего изучения активных и неактивных форм соединений. Мы хотели увидеть, отличаются ли активные и неактивные формы, проверив, являются ли они статистически значимыми различиями. Очень маленькое p-значение было получено с помощью U-критерия Манна-Уитни, что указывает на то, что мы должны отвергнуть нулевую гипотезу о том, что активные и неактивные связаны и имеют сходное распределение.

U-критерий Манна-Уитни также был выполнен для всех других дескрипторов Липинского: MW, значений logP, NumHdonors и NumHacceptors. Мы пришли к выводу, что для всех дескрипторов мы отвергаем нулевую гипотезу об отсутствии статистически значимых различий между активными и неактивными.

Рисунок 3: (A) Диаграмма рассеяния количества доноров водорода для неактивных и активных классов (B) Критерий Манна-Уитни для значений количества доноров водородных связей.

QSAR-моделирование

В разделе исследования, посвященном моделированию QSAR, использовались различные методы для построения и оценки регрессионных моделей, которые предсказывали непрерывную переменную отклика (т. е. pIC50) как функцию дескрипторов отпечатков пальцев. Первоначально пакет Caret в R использовался для удаления низкой дисперсии и уменьшения размерности признаков с [4695, 881] до [4695, 323], с последующим разделением набора данных на внутренние и внешние наборы с 80% и 20% данных. , соответственно.

Регрессионные модели были построены с использованием методов обучения с учителем, с помощью линейной регрессии (LM), регрессии основных компонентов (PCR), алгоритмов случайного леса, а две ансамблевые модели были реализованы с использованием пакета superLearner R. Модели оценивались на основе трех статистических параметров: среднеквадратичной ошибки (MSE), среднеквадратичной ошибки (RMSE) и значения R-квадрата.

Работоспособность моделей была проверена путем построения графика экспериментальных значений в сравнении с предсказанными значениями тестовых данных. Кроме того, были определены 20 наиболее важных функций с использованием важности функций из модели RandomForest.

Таким образом, шаги, предпринятые в этом разделе, имели решающее значение для построения и оценки моделей QSAR для точного прогнозирования значений pIC50.

Результаты и обсуждение

В этом исследовании сравнивались пять различных моделей регрессии, чтобы определить наиболее точную и надежную для прогнозирования целевой переменной с использованием методов машинного обучения. Производительность каждой модели оценивалась с использованием различных показателей, таких как среднеквадратическая ошибка, среднеквадратическая ошибка и R-квадрат. После анализа результатов была выбрана наиболее эффективная модель на основе ее точности и прогностической способности. Затем эта модель использовалась для прогнозирования новых данных. Выбрав наиболее подходящую модель регрессии, можно добиться большей точности прогнозов и улучшить общую производительность алгоритма машинного обучения.

  1. Линейная регрессия

Модель линейной регрессии имела остаточную стандартную ошибку 1,175 на 3454 степенях свободы, что указывает на то, что среднее отклонение наблюдаемых значений от прогнозируемых значений составляет 1,175 единиц.

Множественное значение R-квадрата, равное 0,4766, указывает на то, что примерно 47,66% изменчивости переменной отклика можно объяснить независимыми переменными, включенными в модель. Скорректированное значение R-квадрата, равное 0,4307, предполагает, что независимые переменные, включенные в модель, объясняют значительную часть дисперсии переменной отклика после корректировки количества переменных в модели.

Диагностические графики (рис. 4) обычно используются для оценки качества моделей линейной регрессии. Графики включают в себя остаточный график, график нормальной вероятности и график стандартизированных остатков по сравнению с подобранными значениями. Остатки случайным образом распределяются вокруг горизонтальной оси без каких-либо различимых закономерностей. Это говорит о том, что предположения модели относительно однородности дисперсии и линейности выполняются. График нормальной вероятности показывает, что остатки примерно нормально распределены.

Наконец, график стандартизированных остатков по сравнению с подобранными значениями указывает на отсутствие существенной закономерности или связи между остатками и подобранными значениями. Это говорит о том, что модель работает достаточно хорошо. В целом, диагностические графики подтверждают достоверность модели линейной регрессии и предполагают, что модель подходит для анализируемых данных.

  1. Регрессия основного компонента

В этом анализе модель ПЦР была подобрана с использованием метода SVDPC, и было рассмотрено 323 компонента. Среднеквадратическая ошибка (MSE) для модели PCR составила 2,056211, что является мерой точности модели в прогнозировании переменной отклика.

Чтобы оценить прогностическую эффективность модели, модель прошла перекрестную проверку с использованием 10 случайных сегментов, а среднеквадратическая ошибка прогноза (RMSEP) использовалась в качестве метрики проверки.

2. Регрессия случайного леса

Модель была основана на 500 деревьях решений, каждое из которых строилось на случайно выбранном подмножестве доступных независимых переменных. При каждом разбиении алгоритм учитывал 107 переменных, что помогло уменьшить корреляцию между деревьями и повысить точность модели.

Значение среднего квадрата остатков, равное 1,104924, указывает на то, что предсказания модели в среднем отличаются от фактических значений на 1,104924 единицы. Значение % Var Explained, равное 54,42, предполагает, что независимые переменные, включенные в модель, могут объяснить примерно 54,42% дисперсии зависимой переменной.

3. Метод ансамбля

Ансамблевые методы SuperLearner, которые объединяют несколько моделей для повышения точности прогнозирования, использовались для прогнозирования зависимой переменной. В первом случае в методе SuperLearner использовались две модели: линейная регрессия (Lm) и K-ближайший сосед (KNN), с результирующей среднеквадратичной ошибкой (MSE) 1,32.

Во втором случае в методе SuperLearner использовались три модели: случайный лес (RF), KNN и обобщенная линейная модель (glm), с результирующей MSE 0,984, что указывает на лучшую прогностическую эффективность, чем в первом случае.

Более низкое значение MSE во втором случае предполагает, что объединение моделей RF, KNN и glm повышает точность прогнозирования метода ансамбля.

Сравнение и выбор моделей регрессии

Судя по данным в таблице 1, модели регрессии Random Forest и SuperLearner (RF, KNN, glm) работают лучше всего. Регрессия случайного леса имеет самые низкие значения MSE и RMSE 0,987 и 0,965 соответственно и самое высокое значение R-квадрата 0,62, что указывает на хорошее соответствие модели данным. Модель SuperLearner (RF, KNN, glm) имеет еще более низкие MSE и RMSE 0,984 и 0,96825 соответственно. Модель линейной регрессии имеет относительно высокие значения MSE и RMSE, равные 1,338 и 1,79 соответственно, и умеренное значение R-квадрата, равное 0,47. Регрессия основного компонента имеет самые высокие значения MSE и RMSE 2,056 и 4,228 соответственно и очень низкое значение R-квадрата 0,0066, что указывает на плохую прогностическую эффективность.

Таким образом, модели регрессии Random Forest и SuperLearner (RF, KNN, glm) являются наиболее эффективными моделями для прогнозирования зависимой переменной.

Оценка прогностической способности модели

Для дальнейшей оценки прогностической способности регрессионной модели Random Forest ее использовали для прогнозирования pIC50 неизвестных соединений. Результирующий коэффициент корреляции между предсказанными и истинными значениями оказался равным 0,7638, что указывает на умеренно сильную положительную связь между двумя переменными.

Диаграмма рассеяния и красная линия на рис. 5 наглядно свидетельствуют о том, что модель обладает некоторой предсказательной силой. Тем не менее, есть еще некоторая степень изменчивости в прогнозируемых значениях.

В целом, умеренный коэффициент корреляции и визуальные данные на диаграмме рассеяния позволяют предположить, что регрессионная модель Random Forest обладает некоторой предсказательной силой для рассматриваемой задачи.

Рисунок 5. График рассеяния предсказанных значений pIC50 по сравнению с экспериментальными значениями pIC50. Каждая точка представляет соединение в наборе данных, а цвет точки отражает абсолютную разницу между истинным и прогнозируемым значениями. На диаграмму рассеяния наложена красная линия, представляющая идеальный случай, когда прогнозируемые значения полностью соответствуют истинным значениям.

Случайный лес также использовался для извлечения важности признаков. Были выбраны 20 лучших молекулярных дескрипторов, исходя из их важности для прогнозирования ингибирующей активности АХЭ (см. рис. 6). Этими молекулярными дескрипторами были PubchemFP3, PubchemFP528, PubchemFP559, PubchemFP821, PubchemFP601, PubchemFP758, PubchemFP335, PubchemFP308, PubchemFP813, PubchemFP750, PubchemFP193, PubchemFP493, PubchemFP621, PubchemFP391, PubchemFP1. 80, PubchemFP672, PubchemFP258, PubchemFP623, PubchemFP261 и PubchemFP688.

В целом результаты показывают, что алгоритмы машинного обучения можно использовать для точного прогнозирования ингибирующей активности АХЭ с использованием молекулярных дескрипторов и отпечатков пальцев. Алгоритм случайного леса оказался наиболее эффективной моделью. Эта модель может быть полезна для предсказания ингибирующей активности новых соединений в отношении АХЭ и помощи в разработке новых ингибиторов АХЭ.

Заключение

В заключение, исследование было направлено на разработку моделей QSAR для прогнозирования ингибирующей активности АХЭ с использованием базы данных ChEMBL и алгоритмов машинного обучения. В ходе исследования удалось извлечь набор данных примерно из 4695 соединений с ингибирующей активностью АХЭ из базы данных ChEMBL и получить различные молекулярные дескрипторы и отпечатки пальцев соединений. В исследовании использовались различные алгоритмы машинного обучения, такие как случайный лес и линейная регрессия, для создания моделей QSAR, и было обнаружено, что алгоритм случайного леса превосходит другие модели.

Исследование дополнительно подтвердило модели с использованием независимого тестового набора и обнаружило, что модель случайного леса показала высокую прогностическую силу, что указывает на то, что модель можно использовать для прогнозирования биологической активности соединений. В ходе исследования был проведен анализ важности признаков для определения молекулярных дескрипторов, которые играют решающую роль в биологической активности соединений, и были найдены 20 лучших молекулярных дескрипторов, включая PubchemFP3, PubchemFP528 и PubchemFP559. Результаты исследования демонстрируют полезность базы данных ChEMBL и алгоритмов машинного обучения для разработки моделей QSAR для ингибирующей активности АХЭ и ускорения процесса поиска лекарств от неврологических расстройств.

Биологическое значение

Анализ модели QSAR для прогнозирования ингибирующей активности AChE выявил 20 молекулярных дескрипторов, критически важных для прогнозирования биологической активности, которые потенциально могут служить целями для дизайна и разработки лекарств. Чтобы проверить выводы модели, можно провести биохимические анализы для проверки предсказанной активности выбранных молекул. Выбранные молекулярные дескрипторы могут помочь идентифицировать соединения, которые могут проявлять высокую активность ингибирования АХЭ, которые затем могут быть синтезированы и протестированы экспериментально. Важность характеристик, полученная в результате моделирования QSAR, дает ценную информацию для разработки лекарств, позволяя разработчикам лекарств сосредоточиться на разработке соединений, оптимизированных для молекулярных дескрипторов, наиболее важных для прогнозирования биологической активности. Улучшая химическую структуру соединений с критическими молекулярными дескрипторами, разработчики лекарств могут повысить их ингибирующую активность в отношении АХЭ.

В целом, этот подход имеет большое значение для разработки лекарств, особенно для лечения неврологических расстройств, таких как болезнь Альцгеймера. Используя алгоритмы машинного обучения и базу данных ChEMBL, исследователи могут быстро идентифицировать соединения с потенциальной активностью ингибирования АХЭ и расставлять приоритеты для дальнейших исследований. Результаты этого исследования также подчеркивают важность анализа важности молекулярных дескрипторов и признаков при разработке точных моделей QSAR, что потенциально сокращает время и затраты, связанные с традиционными методами обнаружения лекарств.

Рекомендации

Бадван, Б., Лиаропулос, Г., Киродимос, Э., Скальтсас, Д., Циригос, А., и Горгулис, В. (2023). Подходы машинного обучения для прогнозирования эффективности и токсичности лекарств в онкологии. Методы сотовых отчетов 3.

Бенто А.П., Голтон А., Херси А., Беллис Л.Дж., Чемберс Дж., Дэвис М., Крюгер Ф.А., Лайт Ю., Мак Л., МакГлинчи С., Новотка М., Пападатос Г., Сантос Р., Оверингтон Д.П. (2014). База данных биоактивности ChEMBL: обновление. Нуклеиновые Кислоты Res. 42 (проблема с базой данных)

Buonfiglio R, Prati F, Bischetti M, Cavarischia C, Furlotti G, Ombrato R. (2020). Открытие новых имидазопиридиновых ингибиторов GSK-3β, подкрепленное вычислительными подходами. Молекулы. 5;25(9):2163

Кэрон, Н., Дорси, Э. и Хейден, М. (2018) Терапевтические подходы к болезни Хантингтона: от скамейки до клиники. Nat Rev Drug Discov 17, 729–750.

Черкья, К., и Лавеккья, А. (2023). Новые возможности для открытия лекарств с помощью искусственного интеллекта. Открытие наркотиков сегодня, 28 (4), 103516.

Ченг, С., Сонг, В., и Юань, X. (2017). Движения ущелья ацетилхолинэстеразы, выявленные микросекундным моделированием молекулярной динамики. Научный представитель 7, 3219.

Чен Х., Энгквист О., Ван Ю, Оливекрона М., Блашке Т. (2018). Развитие глубокого обучения в поиске лекарств. Наркотиков Дисков сегодня. 23 июня (6): 1241–1250. doi: 10.1016/j.drudis.2018.01.039. Epub 2018, 31 января. PMID: 29366762.

Даррант, Дж.Д., Маккаммон, Дж.А. (2011) Моделирование молекулярной динамики и открытие лекарств. БМК Биол 9, 71. https://doi.org/10.1186/1741-7007-9-71

Голтон А., Х.А.-У. (2017). База данных ChEMBL в 2017 году. Nucleic Acids Res., D945-D954.

Giau, VV, Bagyinszky, E., Ann (2018)Клинические генетические стратегии для ранних нейродегенеративных заболеваний. Мол. Клетка. Токсикол. 14, 123–142. https://doi.org/10.1007/s13273-018-0015-3

Джованной Г., Нойс А. Дж., Шелтенс П., Берг Д., Браун Л., Дириккс К. и Траут Р. (2019) Время имеет значение. Призыв сделать здоровье мозга приоритетом. Оксфордский форум политики здравоохранения CIC.

Гонсалес-Медина, М., Навеха, Дж. Дж., Санчес-Крус, Н., и Медина-Франко, Дж. Л. (2017). Откройте хемоинформационные ресурсы для изучения структуры, свойств и химического пространства молекул. RSC Advances, 7, 54153–54163. https://doi.org/10.1039/C7RA11831G

Камбой, С. Р. (2022). Нацеливание на неструктурные белки вируса гепатита С для прогнозирования перепрофилирования лекарств с использованием подходов QSAR и машинного обучения. . Журнал вычислительной и структурной биотехнологии, 3422–3438.

Мамада, HN (2022). Новый подход QSAR для регрессионной модели очистки, сочетающий DeepSnap-Deep Learning и обычное машинное обучение. САУ Омега 7, 17055–17062.

Шадуанграт, Н.Л. (2020). На пути к воспроизводимому компьютерному открытию лекарств. Химинформ 12.

Шумбуатонг, WS (2017). Раскрытие биологической активности противоопухолевых пептидов на основе машинного обучения. Журнал EXCLI, 734–752.

Симеон С, А. Н. (2016). Изучение происхождения ингибирования ацетилхолинэстеразы человека с помощью моделирования QSAR и молекулярного докинга. Пир Дж.

Meng H, Yan WY, Lei YH, Wan Z, Hou YY, Sun LK и Zhou JP (2019) Регулирование SIRT3 контроля качества митохондрий при нейродегенеративных заболеваниях. Передний. Стареющие нейроски. 11:313. дои: 10.3389/fnagi.2019.00313

Мишра Х., Сингх Н., Лахири Т., Мисра К. (2009) Сравнительное исследование молекулярных дескрипторов для прогнозирования лекарственного сходства малых молекул. Биоинформация. 13;3(9):384–8

Моррис, Г.М., Гудсел, Д.С., Холлидей, Р.С., Хьюи, Р., Харт, В.Е., Белью, Р.К., и Олсон, А.Дж. (1998). Автоматическая стыковка с использованием генетического алгоритма Ламарка и эмпирической функции свободной энергии связывания. Журнал вычислительной химии, 19 (14), 1639–1662.

Лю И, Ян Т, Чу Дж. М., Чен И, Даннет С., Хо Ю. С., Вонг Г. Т., Чанг Р. С. (2009) Благотворное влияние физических упражнений на мозг и связанные с ними патофизиологические механизмы при нейродегенеративных заболеваниях. Лаборатория Инвест. ;99(7):943–957. doi: 10.1038/s41374–019–0232-y. Epub 2019, 26 февраля. PMID: 30808929.

Шарма К. Ингибиторы холинэстеразы как средства для лечения болезни Альцгеймера (обзор). (2009) Mol Med Rep.; 20(2):1479–1487. doi: 10.3892/mmr.2019.10374. Epub 2019, 11 июня. PMID: 31257471; PMCID: PMC6625431.

Лавеккья, А. (2015). Подходы машинного обучения в поиске лекарств: методы и приложения. Открытие наркотиков сегодня, 20 (3), 318–331. https://doi.org/10.1016/j.drudis.2014.10.012

Лазаревич-Пасти, Т., Лесковац, А., Момич, Т., Петрович, С., и Васич, В. (2017). Модуляторы активности ацетилхолинэстеразы: от болезни Альцгеймера к противораковым препаратам. Текущая медицинская химия, 24 (30), 3283–3309. https://doi.org/10.2174/0929867324666170705123509

Рац А., Баюш Д., Хебергер К. (2018) Методы моделирования и варианты перекрестной проверки в QSAR: многоуровневый анализ, SAR и QSAR в исследованиях окружающей среды, 29: 9, 661–674, DOI: 10.1080/1062936X.2018.1505778 .

Шах Х., Албанезе Э., Дагган К., Рудан И., Ланга К.М., Каррильо М.С., Чан К.Ю., Джоанетт Ю., Принс М., Россор М., Саксена С. ., Снайдер, Х.М., Сперлинг, Р., Варгезе, М., Ван, Х., Вортманн, М., и Дуа, Т. (2016). Приоритеты исследований по снижению глобального бремени деменции к 2025 г. The Lancet Neurology, 15(12), 1285–1294. https://doi.org/10.1016/S1474-4422(16)30235-6

Таки, Р., Дебнат, М., Ахмед, С., и Гош, А. (2022). Достижения в области растительных экстрактов и фитосоединений с активностью ингибирования ацетилхолинэстеразы для возможного лечения болезни Альцгеймера. Фитомедицина Плюс, 2(1), 100184. https://doi.org/10.1016/j.phytol.2022.100184

Кубиньи, Х. (2003). Исследования наркотиков: мифы, шумиха и реальность. Nat Rev Drug Discov 2, 665–668 https://doi.org/10.1038/nrd1156

Рой К., Кар С., Дас Р.Н. (2015). Статистические методы в QSAR/QSPR. В: Учебник по моделированию QSAR/QSPR. SpringerBriefs по молекулярным наукам. Спрингер, Чам. https://doi.org/10.1007/978-3-319-17281-1_2

Павар Г., Мэдден Дж. К., Эббрелл Д., Фирман Дж. В. и Кронин МТД (2019) Ресурсы токсикологических данных In Silico для поддержки сквозного чтения и (Q) SAR. Передний. Фармакол. 10:561. doi: 10.3389/fphar.2019.00561

Яп, CW (2011). PaDEL-дескриптор: программное обеспечение с открытым исходным кодом для расчета молекулярных дескрипторов и отпечатков пальцев. Вычислительная химия.

Захра, В. и др. (2020). Глобальное экономическое влияние нейродегенеративных заболеваний: возможности и проблемы. В: Кесвани, К. (ред.) Биоэкономика для устойчивого развития. Спрингер, Сингапур. https://doi.org/10.1007/978-981-13-9431-7_17

Заки А.Г. (2020). Ингибиторы микробной ацетилхолинэстеразы для терапии болезни Альцгеймера: последние тенденции в области извлечения, обнаружения, улучшения производства с помощью облучения и доставки наноструктурированных лекарств. Appl Microbiol Biotechnol, 4717–4735.

Приложение

Код: https://github.com/Fellylove/AChe-inhibition