從選擇一個靶點,到形成潛在的新藥候選分子,這個過程需要多長的時間?過去的回答可能是數(shù)月,乃至數(shù)年。但在今日,來自Insilico Medicine、藥明康德、以及多倫多大學的科學家們在《自然》子刊Nature Biotechnology上給出了不同的答案。利用人工智能技術,他們將這一數(shù)字縮短到了短短21天!
這一技術有望為早期藥物發(fā)現(xiàn)帶來變革。眾所周知,新藥研發(fā)之路并非坦途。在高達近9成的失敗率面前,每一款上市新藥的背后,都是平均10多年的漫長道路,以及20多億美元的高昂開支。其中,光是早期藥物發(fā)現(xiàn),就占去了將近一半的成本。
為了突破這一瓶頸,業(yè)內諸多創(chuàng)新者在近年來不斷嘗試各種技術,而人工智能就是他們的選擇之一:通過快速尋找到具有成藥潛力的分子,人工智能有望加速新藥發(fā)現(xiàn)的進程,并減少所需的成本。但美好的愿景之下,我們也不得不承認,由人工智能進行設計,且能夠在實驗中證實自身潛力的分子,還非常少見。
這正是本篇論文的一大亮點所在。在研究中,科學家們首先將DDR1設為目標靶點。這是一種在上皮細胞中表達的酪氨酸激酶,參與到了組織纖維化(fibrosis)的進程之中。為了尋找到潛在的DDR1抑制劑,研究人員們開發(fā)了一種機器學習算法,用于設計新藥分子。
▲本研究的算法示意圖(圖片來源:參考資料[1])
具體來看,這個算法的訓練用到了多個不同的數(shù)據(jù)庫。其中的一個數(shù)據(jù)庫里包含海量的分子結構,其他的數(shù)據(jù)庫則分別為已知的DDR1抑制劑及其3D結構、具有激酶抑制劑活性的常見分子(作為正對照)、無法靶向激酶結構的分子(作為負對照)、以及已被醫(yī)藥企業(yè)申請專利的分子。
在對數(shù)據(jù)庫進行優(yōu)化之后,研究人員們使用了強化學習的方法,初步得到了大約3萬個不同的結構。隨后,他們又根據(jù)反應基團與化學空間等指標,對所得到的結構做了進一步的篩選。完成這些潛在新藥分子的篩選時,距離最初確認DDR1為目標靶點,僅僅過去了21天!
接下來,就是實際檢驗這些分子的成藥潛力了。從篩選結果中,研究人員們隨機挑選出了40個結構,其中39個具有新穎性。從中,科學家們根據(jù)合成的難易程度,挑選出了6個分子,用作后續(xù)的體外與體內實驗。
▲對候選分子進行藥代動力學分析和作用機理探索(圖片來源:參考資料[1])
體外實驗結果表明,其中的2個化合物對于DDR1具有很高的抑制性。在細胞系中,這兩個化合物同樣展現(xiàn)了可喜的DDR1抑制能力,且能有效降低與纖維化進程有關的標志物。最后,研究人員們選擇1號化合物進行動物實驗。結果表明,無論是通過靜脈注射,還是通過口服,它的藥代動力學特性均令人滿意。
值得一提的是,在人工智能技術與研發(fā)人員的協(xié)同下,在選定靶點的46天后,新篩選出的分子就完成了初步的生物學驗證。此外,科學家們也決定公開該算法的源代碼,供產業(yè)更多研發(fā)人員使用。
▲選定靶點的46天后,新篩選出的分子就完成了初步的生物學驗證(圖片來源:參考資料[1])
在論文的最后,研究人員們也指出,在邁入臨床試驗之前,由人工智能設計出的分子還有進一步優(yōu)化的空間。但考慮到新藥研發(fā)周期之漫長,能在早期新藥發(fā)現(xiàn)過程中縮短時間,已是一個喜人的進步。我們也期待在人工智能的助力下,未來能夠更多新藥的研發(fā)得到加速,最終造福全球病患!
參考資料:
[1] Alex Zhavoronkov et al., (2019), Deep learning enables rapid identification of potent DDR1 kinase inhibitors, Nature Biotechnology, DOI: https://doi.org/10.1038/s41587-019-0224-x
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com