在靶向這類(lèi)平坦的口袋時(shí),在特大化合物庫(kù)中進(jìn)行篩選是非常有必要的,因?yàn)槠教沟目诖芴峁┑淖饔昧τ邢?只有極少數(shù)小分子能完美地貼合到口袋上,并充分...,遼寧省醫(yī)藥行業(yè)協(xié)會(huì)坐落在沈陽(yáng)市,是經(jīng)省民政廳注冊(cè)登記、具有法人資格的社會(huì)團(tuán)體。該協(xié)會(huì)吸納了省內(nèi)知名的醫(yī)藥工業(yè)商業(yè)企業(yè),協(xié)會(huì)為積極開(kāi)展和拓寬雙向服務(wù)的工作領(lǐng)域,除常設(shè)機(jī)構(gòu)(秘書(shū)處)外,還設(shè)有科技咨詢(xún)專(zhuān)家委員會(huì)、藥事管理專(zhuān)家委員會(huì)兩個(gè)議事機(jī)構(gòu)和八個(gè)分支機(jī)構(gòu),從各方面應(yīng)對(duì)入世后的新形勢(shì)、新情況、新任務(wù),樹(shù)立政府助手和行業(yè)代表的社團(tuán)形象。">
GPX4是細(xì)胞鐵死亡過(guò)程中的重要靶點(diǎn),GPX4負(fù)責(zé)催化還原的過(guò)氧化脂質(zhì)都是嵌入在細(xì)胞膜中的,為了貼合平坦的細(xì)胞膜表面,GPX4的催化口袋非常平坦,類(lèi)似于蛋白蛋白界面,不是常規(guī)意義上的可藥口袋,這對(duì)非共價(jià)靶向GPX4的催化口袋造成了很大的難度。
在靶向這類(lèi)平坦的口袋時(shí),在特大化合物庫(kù)中進(jìn)行篩選是非常有必要的,因?yàn)?/span>平坦的口袋能提供的作用力有限,只有極少數(shù)小分子能完美地貼合到口袋上,并充分利用這些作用力來(lái)達(dá)到較高的活性。特大化合物庫(kù)中的分子一般由化學(xué)砌塊通過(guò)不同類(lèi)型的單步化學(xué)反應(yīng)組合而成,其分子數(shù)量能達(dá)到10億以上,這為找到那些極少數(shù)能靶向GPX4催化口袋的分子提供了足夠大的基數(shù)。
目前還沒(méi)有任何濕實(shí)驗(yàn)方法能夠支撐10億級(jí)別化合物庫(kù)的實(shí)體篩選。
苗頭化合物篩選的濕實(shí)驗(yàn)方法中,目前主流的方法有高通量篩選(HTS)和DNA編碼化合物庫(kù)(DEL)等。但和特大化合物庫(kù)相比,兩者所覆蓋的化學(xué)空間就小了很多。HTS測(cè)試的分子數(shù)量很難超過(guò)一百萬(wàn),也就是僅有特大化合物庫(kù)千分之一的數(shù)量。DEL所包含的分子能達(dá)到一億個(gè),但是因?yàn)槭艿交瘜W(xué)反應(yīng)類(lèi)型的限制,DEL的分子多樣性遠(yuǎn)遠(yuǎn)不如特大化合物庫(kù)。
雖然濕實(shí)驗(yàn)方法無(wú)法覆蓋特大化合物庫(kù)的所有分子,但在虛擬篩選中,通過(guò)采用不同顆粒度的親和力打分算法,并結(jié)合機(jī)器學(xué)習(xí)算法可以實(shí)現(xiàn)對(duì)10億分子的高效篩選,并具有高度的準(zhǔn)確性。
但在特大化合物庫(kù)中搜索時(shí),傳統(tǒng)的虛擬篩選策略是不適用的。
? 傳統(tǒng)的虛擬篩選方法主要包含以下步驟:
1)分子對(duì)接:把庫(kù)中所有的小分子對(duì)接到要靶向的口袋上,獲得小分子在口袋上的結(jié)合模式。
2)對(duì)接打分:對(duì)結(jié)合模式用對(duì)接打分進(jìn)行評(píng)估,并挑選對(duì)接打分較好的分子;
3)評(píng)估排序:對(duì)挑選出的分子用精度更高的方法,如MMGBSA或者FEP進(jìn)行評(píng)估;
4)挑選驗(yàn)證:挑選MMGBSA或者FEP打分較好的分子進(jìn)行合成測(cè)試。
在傳統(tǒng)虛篩流程的1)和2)步驟中,即使對(duì)千萬(wàn)級(jí)別化合物庫(kù)中的每個(gè)分子進(jìn)行對(duì)接打分,也需要花費(fèi)一整天的時(shí)間來(lái)完成。而對(duì)于一個(gè)規(guī)模達(dá)到10億的虛擬化合物庫(kù),要完成全部的對(duì)接打分則需要長(zhǎng)達(dá)3個(gè)月的時(shí)間。
顯然,這樣的時(shí)間成本是不切實(shí)際的。
? 晶泰科技的解決方案——定制化的虛擬篩選策略
在GPX4案例中,晶泰科技使用了針對(duì)特大化合物庫(kù)開(kāi)發(fā)的虛篩流程。
1)片段對(duì)接:首先用10,000個(gè)片段作為“探針”對(duì)接到GPX4的催化口袋上,這些片段擁有不同的化學(xué)性質(zhì)和結(jié)構(gòu),代表了不同類(lèi)型的藥效團(tuán)。
2)FEP計(jì)算:接著用XFEP(晶泰科技自由能微擾技術(shù))來(lái)評(píng)估這些片段在口袋上各個(gè)位置的結(jié)合強(qiáng)度。
3)主動(dòng)學(xué)習(xí):運(yùn)用Active Learning (主動(dòng)學(xué)習(xí)) 技術(shù)通過(guò)多輪迭代,對(duì)分子庫(kù)進(jìn)行采樣和分析,在一天時(shí)間內(nèi)總計(jì)進(jìn)行了超過(guò)5000個(gè)FEP計(jì)算,并用預(yù)測(cè)的結(jié)合強(qiáng)度訓(xùn)練AI模型,用于加速在化學(xué)空間中的探索。
4)藥效團(tuán)模型構(gòu)建:通過(guò)FEP預(yù)測(cè)出的結(jié)合強(qiáng)度排序這些片段,得到GPX4催化口袋上各個(gè)位置所對(duì)應(yīng)的藥效團(tuán)。
5)快速檢索:使用這些藥效團(tuán)快速檢索特大化合物庫(kù),并挑出8000+個(gè)擁有這些藥效團(tuán)且空間排布正確的分子。
6)虛擬篩選:通過(guò)傳統(tǒng)虛篩流程對(duì)這8000+個(gè)分子進(jìn)行排序,最終挑選了159個(gè)分子進(jìn)行自動(dòng)化庫(kù)合成。
根據(jù)藥效團(tuán)和它們的空間排布,研究團(tuán)隊(duì)從晶泰自動(dòng)化可及的虛擬化合物庫(kù)中挑選了8,000多個(gè)化合物,并根據(jù)它們的物理化學(xué)性質(zhì)、預(yù)測(cè)的ADMET屬性FEP打分和AI模型預(yù)測(cè)的可合成性進(jìn)行篩選,最后挑選了159個(gè)化合物進(jìn)行合成,成功合成了124個(gè)化合物(純度95%,重量5mg)。最后,團(tuán)隊(duì)使用商業(yè)試劑盒對(duì)這124個(gè)分子的酶活進(jìn)行了測(cè)試,在這些全新骨架的分子中,有3個(gè)分子的活性達(dá)到了IC50<10μM,活性最好的分子其酶活與已報(bào)道的共價(jià)抑制劑相當(dāng)。在高通量FEP計(jì)算平臺(tái)和自動(dòng)化庫(kù)合成技術(shù)的幫助下,整個(gè)虛擬篩選+合成的過(guò)程僅用了28個(gè)工作日。這些苗頭化合物有望作為非共價(jià)靶向GPX4的起點(diǎn),為進(jìn)一步在動(dòng)物模型中驗(yàn)證GPX4的靶向效果奠定基礎(chǔ)。
正如前文所述,通過(guò)在特大化合物庫(kù)中進(jìn)行篩選,可以提高針對(duì)GPX4等口袋較淺的靶點(diǎn)的成功率。通常情況下,在苗頭化合物篩選階段,每個(gè)分子的成本和交付時(shí)間都受到嚴(yán)格控制。在成本和交付時(shí)間的雙重壓力下,市面上的特大化合物庫(kù)中的分子通常是通過(guò)不同的分子砌塊進(jìn)行一步合成得到的,這也限制了庫(kù)中分子的多樣性。
晶泰科技的特大虛擬化合物庫(kù)由200萬(wàn)個(gè)分子砌塊通過(guò)化學(xué)反應(yīng)規(guī)則生成得到,除了一步反應(yīng)組合成的分子,也包括需要兩步化學(xué)合成才能得到的分子,這使得晶泰的虛擬特大化合物庫(kù)的多樣性遠(yuǎn)遠(yuǎn)大于其他供應(yīng)商。而且,這些兩步反應(yīng)合成的分子的單價(jià)和交付周期依然適用于苗頭化合物篩選的場(chǎng)景。一個(gè)原因是公司實(shí)現(xiàn)了化學(xué)合成中多個(gè)重要環(huán)節(jié)的完全自動(dòng)化,并且擁有200多臺(tái)自動(dòng)化合成工站。這讓在傳統(tǒng)實(shí)驗(yàn)室中一個(gè)合成人員需要3周才能完成的反應(yīng);而在晶泰,可以在5天內(nèi)用幾臺(tái)自動(dòng)化合成工站輕松完成。第二個(gè)原因是,公司使用合成工站產(chǎn)生了大量高質(zhì)量的常用反應(yīng)合成數(shù)據(jù)(每月產(chǎn)生30,000個(gè)反應(yīng)數(shù)據(jù)),然后針對(duì)不同的反應(yīng)類(lèi)型訓(xùn)練了反應(yīng)可行性預(yù)測(cè)AI模型。根據(jù)這些AI模型預(yù)測(cè)結(jié)果,可以直接跳過(guò)合成小試,從而大幅縮短人工、物料成本以及交付時(shí)間。
基于這兩個(gè)因素,晶泰科技成功地將兩步化學(xué)合成所需的成本和時(shí)間降低到與傳統(tǒng)實(shí)驗(yàn)室中完成一步合成相當(dāng)?shù)乃?。這一創(chuàng)新使得公司的虛擬化合物庫(kù)能夠擴(kuò)展到那些只能通過(guò)兩步合成才能獲得的分子,從而在分子總量和多樣性方面實(shí)現(xiàn)了突破。
另一個(gè)技術(shù)關(guān)鍵點(diǎn)在于使用了FEP進(jìn)行結(jié)合親和力的打分,根據(jù)晶泰內(nèi)部的實(shí)踐經(jīng)驗(yàn)和文獻(xiàn)報(bào)道【1】,FEP在虛擬篩選中對(duì)親和力的評(píng)估精度遠(yuǎn)遠(yuǎn)高于對(duì)接打分,根本的原因在于對(duì)接打分作為上世紀(jì)90年代的產(chǎn)物,在算法上采用了大量的近似來(lái)適應(yīng)當(dāng)時(shí)的計(jì)算機(jī)算力。而相對(duì)于對(duì)接打分,F(xiàn)EP在預(yù)測(cè)親和力時(shí),不但考慮了基本的蛋白配體相互作用力,同時(shí)也考慮了配體分子內(nèi)能、去溶劑化能和結(jié)合口袋的柔性變化等對(duì)接打分不考慮的部分,對(duì)于決定親和力的因素描述更完整。FEP在虛擬篩選中的應(yīng)用可以說(shuō)讓虛擬篩選的成功率相比于過(guò)去得到了數(shù)量級(jí)的飛躍。
據(jù)統(tǒng)計(jì),在晶泰內(nèi)部60多個(gè)虛擬篩選項(xiàng)目的應(yīng)用表明, XFEP的精度超越現(xiàn)有的大部分商業(yè)軟件,并得到了國(guó)際頭部藥企的普遍認(rèn)可。得益于XFEP的使用,晶泰的虛擬篩選成功率達(dá)到90%以上(IC50<100μM),有70%的虛篩項(xiàng)目達(dá)到了IC50<10μM。
當(dāng)然,F(xiàn)EP能有更高的精度也需要更大的算力來(lái)支撐。晶泰的XFEP平臺(tái)通過(guò)優(yōu)化硬件利用率,相對(duì)于開(kāi)源的FEP軟件提升了一倍的計(jì)算效率。同時(shí),晶泰擁有大規(guī)模云平臺(tái)調(diào)度能力,覆蓋全球主流的云平臺(tái)供應(yīng)商,來(lái)保證5000個(gè)分子/天的親和力評(píng)估通量。目前,只有極少數(shù)虛擬篩選服務(wù)供應(yīng)商,如晶泰,具備進(jìn)行大規(guī)模FEP計(jì)算的能力。盡管市場(chǎng)上普遍使用的是上個(gè)世紀(jì)開(kāi)始應(yīng)用的傳統(tǒng)虛擬篩選流程,這種流程在許多靶點(diǎn)上已被證明有效,并能夠降低化合物篩選的成本,但與HTS和DEL篩選相比,傳統(tǒng)虛擬篩選流程并不能提供差異化的結(jié)果。一些供應(yīng)商在傳統(tǒng)虛擬篩選流程中引入了FEP計(jì)算,在對(duì)接打分篩選之后,對(duì)于對(duì)接打分排名TOP100的分子進(jìn)行FEP計(jì)算。然而,由于對(duì)接打分的精度限制,對(duì)于像GPX4這樣難以靶向的小分子靶點(diǎn),這100個(gè)分子中可能沒(méi)有任何陽(yáng)性分子,因此這100個(gè)FEP計(jì)算對(duì)虛擬篩選結(jié)果沒(méi)有任何幫助。虛擬篩選是一種基于AI和計(jì)算化學(xué)的高效藥物發(fā)現(xiàn)工具,能夠加速新藥的發(fā)現(xiàn)和開(kāi)發(fā)過(guò)程。隨著AI技術(shù)和計(jì)算能力的不斷提升,以及自動(dòng)化技術(shù)的快速發(fā)展,虛擬篩選在藥物設(shè)計(jì)領(lǐng)域?qū)⒗^續(xù)發(fā)揮重要作用。晶泰科技將致力于進(jìn)一步優(yōu)化篩選方法,大力發(fā)展AI模型和自動(dòng)化技術(shù),提高篩選的準(zhǔn)確性和效率,為藥物研發(fā)持續(xù)賦能。
信息來(lái)源:醫(yī)藥魔方
聲明:本文系轉(zhuǎn)載內(nèi)容,版權(quán)歸原作者所有,涉及作品問(wèn)題,我們將在第一時(shí)間刪除!