圖片來(lái)源@視覺(jué)中國(guó)
文 | 同寫意,作者 | Daisy,編輯 | 于靖
2月14日,百度宣布完成對(duì)醫(yī)療信息化數(shù)據(jù)提供商GBI的并購(gòu),期望結(jié)合“文心一言”,利用AI技術(shù)為醫(yī)療垂直行業(yè)助力,以實(shí)現(xiàn)“AI+醫(yī)療大數(shù)據(jù)智能化全鏈條洞察”。
GBI的服務(wù)客戶不僅覆蓋禮來(lái)、賽諾菲、輝瑞等跨國(guó)藥企,也包括信達(dá)生物、復(fù)星醫(yī)藥、基石藥業(yè)等創(chuàng)新藥企業(yè)和藥明康德等CRO企業(yè)。隨著GBI的加入、“文心一言”的發(fā)布在即,百度跨入制藥行業(yè)并不是多么難以預(yù)料的事情。
早在2020年,百度就成立百圖生科,專攻AI制藥。2022年,百圖生科透露,其將基于生物計(jì)算引擎de novo設(shè)計(jì)全新蛋白質(zhì)藥物。其實(shí)不只是百度,更多的科技公司對(duì)于這種結(jié)合表現(xiàn)出濃厚興趣。
如果說(shuō),過(guò)去幾年是以AlphaFold為代表的產(chǎn)品挑動(dòng)業(yè)界的情緒,那么當(dāng)下,ChatGPT似乎將“大行其道”。2月,隨著ChatGPT在國(guó)內(nèi)的熱度走高,業(yè)界對(duì)AI制藥產(chǎn)生了更多的遐想。
ChatGPT是一款基于AI技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,檢索信息并綜合處理的能力讓人驚訝。比爾·蓋茨稱,ChatGPT等模型在全球范圍內(nèi)開(kāi)啟了一種新形式的革命。Forbes上的一篇文章也寫道,ChatGPT等先進(jìn)的生成式AI工具將深刻變革醫(yī)療健康領(lǐng)域。
我們走到AI制藥的關(guān)鍵節(jié)點(diǎn)了嗎?或許需要放置在更廣泛的背景下討論。
雖然AI制藥“熱潮”在去年似乎有所退卻,但縱觀全球,該領(lǐng)域還是取得了許多里程碑進(jìn)展。
7月,DeepMind在官網(wǎng)公布,其與歐洲生物信息研究所(EMBL-EBI)合作,利用蛋白結(jié)構(gòu)AI預(yù)測(cè)算法AlphaFold成功預(yù)測(cè)了來(lái)自100萬(wàn)個(gè)物種的約2億種蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋了地球上所有已知的蛋白質(zhì)。
11月,Meta(前身為Facebook)的研究人員使用AI僅花了2周時(shí)間預(yù)測(cè)了來(lái)自細(xì)菌、病毒和其他尚未表征的微生物約6億種蛋白質(zhì)的結(jié)構(gòu)。
此外,Science和Nature Biotechnology也分別報(bào)道了利用AI生產(chǎn)全新蛋白和預(yù)測(cè)蛋白結(jié)構(gòu)的新技術(shù)。
融資方面,雖增速放緩,但依舊吸引著大量資本的投入。
根據(jù)智藥局不完全統(tǒng)計(jì),2022年全年AI+藥物研發(fā)相關(guān)融資總事件達(dá)144起(2021年是73起),總金額為62.02億美元(2021年總金額為42億美元)。
得益于AI制藥的蓬勃發(fā)展,2022年,眾多MNC不斷加碼與AI企業(yè)的合作,以期利用AI技術(shù)為自身研究添磚加瓦。
其中最大的訂單來(lái)自賽諾菲與Exscientia的合作,潛在總額高達(dá)53億美元。作為頭部AI制藥公司,Exscientia此前已與拜耳、BMS、華東醫(yī)藥等多家跨國(guó)藥企建立合作。此次與賽諾菲簽約也成為Exscientia有史以來(lái)單筆最高的訂單。
此外,賽諾菲還與Atomwise建立了合作,將利用后者AtomNet平臺(tái)進(jìn)行計(jì)算發(fā)現(xiàn)和研究多達(dá)5個(gè)藥物靶點(diǎn)。
來(lái)自國(guó)內(nèi)的AI制藥公司英矽智能也官宣了與賽諾菲的合作。賽諾菲將利用英矽智能的Pharma.AI藥物發(fā)現(xiàn)平臺(tái),推進(jìn)基于不超過(guò)6個(gè)創(chuàng)新靶點(diǎn)的候選藥物研發(fā),總潛在價(jià)值達(dá)12億美元。
與賽諾菲同樣大力布局AI賽道的還有禮來(lái),在TOP10 AI合作中也占據(jù)了三席。
![]()
國(guó)內(nèi)另一AI制藥公司晶泰科技,也在去年與新加坡國(guó)家藥物研發(fā)平臺(tái)實(shí)驗(yàn)藥物研發(fā)中心(EDDC)、 齊魯制藥、啟德醫(yī)藥、正大天晴、青煜醫(yī)藥、聯(lián)邦制藥、華潤(rùn)醫(yī)藥研究院、楊森制藥等達(dá)成或進(jìn)一步擴(kuò)大學(xué)術(shù)或商業(yè)合作,開(kāi)發(fā)藥物涉及新型ADC、抗腫瘤小分子新藥等。
除了尋求合作之外,很多制藥公司已經(jīng)開(kāi)始建立內(nèi)部AI能力,GSK在2017年成立了內(nèi)部AI部門,成為“第一個(gè)吃螃蟹的人”;2019年,諾華宣布成立AI創(chuàng)新實(shí)驗(yàn)室,并選擇微軟作為其AI戰(zhàn)略和數(shù)據(jù)科學(xué)合作伙伴;羅氏、拜耳等公司也都開(kāi)始嘗試。
據(jù)市場(chǎng)研究機(jī)構(gòu)Research and Markets發(fā)布的一份報(bào)告預(yù)測(cè),全球醫(yī)療保健市場(chǎng)的AI規(guī)模預(yù)計(jì)將從2020年的42億美元增長(zhǎng)到2025年的272億美元,年復(fù)合增長(zhǎng)率為45.3%。
AI與制藥已有諸多交叉,而ChatGPT這類語(yǔ)言生成模型的巨大突破,讓研究者開(kāi)始探索能否在生物制藥領(lǐng)域搭建類似的AI模型。生成式AI因其在靶點(diǎn)發(fā)現(xiàn)上的優(yōu)異表現(xiàn)引起了業(yè)界的興趣。
生成式AI技術(shù)始于2014年,誕生于Yoshua Bengio與Ian Goodfellow發(fā)表的開(kāi)創(chuàng)性論文“生成對(duì)抗網(wǎng)絡(luò)(GAN)”。如今,生成式AI已被用于縮短各種用途的藥物設(shè)計(jì)周期,減少了制藥行業(yè)的藥物研發(fā)成本和時(shí)間。
從條件來(lái)說(shuō),生成式AI模型通常要在大型數(shù)據(jù)集上進(jìn)行訓(xùn)練學(xué)習(xí),并使用機(jī)器學(xué)習(xí)算法生成與訓(xùn)練數(shù)據(jù)相似的新內(nèi)容。比較有代表性的生成式AI模型包括DALL-E、DALL-E2、ProGen以及ChatGPT等。該算法的突破也意味著AI開(kāi)始走向了創(chuàng)造新內(nèi)容的發(fā)展路徑。
那么,生成式AI能否為生物醫(yī)藥帶來(lái)創(chuàng)造性變革?
Gartner分析師Brian Burke表示,制藥公司正在使用生成式AI設(shè)計(jì)針對(duì)疾病的蛋白質(zhì)模型的特性或功能。“幾乎所有大型制藥公司和許多小型制藥初創(chuàng)公司都在致力于生成式人工智能,它已經(jīng)開(kāi)發(fā)了幾年。一些藥物現(xiàn)在正在進(jìn)行臨床試驗(yàn)。這將是制藥行業(yè)的重大轉(zhuǎn)變。”
早在2019年,研究人員發(fā)表在ACS Central Science上的一篇論文中就描述了如何使用ChatGPT識(shí)別新的抗菌藥物。該研究表明,ChatGPT在藥物發(fā)現(xiàn)中的應(yīng)用可以幫助藥物研發(fā)人員更快速、高效地開(kāi)發(fā)新的化合物。
劍橋大學(xué)的研究人員已經(jīng)利用ChatGPT確定了一個(gè)治療阿爾茨海默病的新靶點(diǎn);舊金山加利福尼亞大學(xué)的研究人員也通過(guò)ChatGPT分析電子健康記錄,識(shí)別了現(xiàn)實(shí)環(huán)境中存在的潛在藥物間相互作用關(guān)系。
ChatGPT之外,英矽智能剛于本月宣布其新冠小分子藥物ISM3312正式獲批進(jìn)入臨床,這是英矽智能第二款使用生成式AI設(shè)計(jì)的小分子藥物。
去年12月,Meta AI利用其基于2.5億條天然蛋白質(zhì)序列的預(yù)訓(xùn)練語(yǔ)言模型,生成了228條蛋白質(zhì)序列,其中152條序列能夠進(jìn)行可溶性表達(dá),且蛋白序列的新穎性極佳。
Salesforce Research在Nature Biotechnology上發(fā)表的一篇文章也力證了生成式AI制藥的可能性:通過(guò)ProGen模型進(jìn)行蛋白質(zhì)生成的工作,該模型生成的具備特定屬性的蛋白序列多樣性強(qiáng),且生成的酶能夠展現(xiàn)出與天然酶相似的活性。
除了藥物發(fā)現(xiàn)外,生成式AI在藥物設(shè)計(jì)、劑量選擇等藥物開(kāi)發(fā)環(huán)節(jié)中也為提高效率、完善治療效果扮演著令人驚喜的角色。
根據(jù)公開(kāi)數(shù)據(jù),去年生成式AI領(lǐng)域投資超過(guò)13.7億美元。預(yù)計(jì)到2040年,生成式AI可能會(huì)為醫(yī)療健康行業(yè)帶來(lái)1萬(wàn)億美元的價(jià)值。
在制藥領(lǐng)域,生成式AI可能在某種程度上可以幫助發(fā)現(xiàn)靶點(diǎn)、生成分子,甚至產(chǎn)生一些之前未曾考慮過(guò)的新想法。業(yè)界也不僅僅滿足于其在藥物發(fā)現(xiàn)階段的成功,但將其應(yīng)用到其他環(huán)節(jié)還需要很多的研究和探索。
以ChatGPT舉例,一方面,它是基于大數(shù)據(jù)大模型,核對(duì)事實(shí)能力有限,更適合比較寬泛的邏輯梳理和信息歸納。然而,生物醫(yī)藥領(lǐng)域?qū)ι伤惴ǖ慕Y(jié)果有更高、更具體的要求,需要更精確的產(chǎn)出(比如同時(shí)具有多個(gè)特定性質(zhì)的小分子或者蛋白質(zhì)片段),以ChatGPT目前的能力還無(wú)法勝任。
另一方面,基礎(chǔ)數(shù)據(jù)源無(wú)法得到保證。首當(dāng)其沖的是準(zhǔn)確性,ChatGPT沒(méi)有接受過(guò)整個(gè)生物醫(yī)學(xué)數(shù)據(jù)庫(kù)的培訓(xùn),也沒(méi)有經(jīng)過(guò)生物醫(yī)學(xué)專家的測(cè)試或培訓(xùn),所以AI系統(tǒng)的響應(yīng)未必正確。臨床部分,雖然ChatGPT可以進(jìn)行一些醫(yī)學(xué)檢查,但AI工具具體的應(yīng)用范圍以及在通過(guò)監(jiān)管機(jī)構(gòu)認(rèn)可等方面還需要更多討論。此外,全球能否公開(kāi)真實(shí)數(shù)據(jù)也還要打個(gè)問(wèn)號(hào)。更重要的是,人類對(duì)醫(yī)學(xué)仍然知之甚少。
晶泰科技聯(lián)合創(chuàng)始人賴力鵬也曾表示,如何開(kāi)源分享私有數(shù)據(jù)、防止濫用和數(shù)據(jù)偏見(jiàn)也都是類似生成式AI工具應(yīng)用在生命科學(xué)領(lǐng)域中需要面對(duì)的問(wèn)題。
而對(duì)于大分子藥物能否利用生成式AI迅速生成,這個(gè)問(wèn)題也仍然無(wú)解。
晶泰科技的一篇文章解釋了一些原因:一是沒(méi)有滿足常規(guī)的以靶點(diǎn)為對(duì)象的藥物設(shè)計(jì)理念,二是沒(méi)有納入對(duì)多種成藥性目標(biāo)(如免疫原性、理化性質(zhì))的考量。換句話說(shuō),上述技術(shù)可以一鍵生成接近“天然”、可以正常折疊表達(dá)的蛋白,并使其符合某種寬泛要求(如具備溶菌酶活性),但還不足以成藥。
除了數(shù)據(jù)訓(xùn)練外,研發(fā)費(fèi)用和時(shí)間精力也是不菲的一項(xiàng)投入,對(duì)于應(yīng)用于醫(yī)療這一細(xì)分賽道眾多且精細(xì)度高的領(lǐng)域更是如此。
另外,去年底由Facebook母公司Meta的Galactica生成式系統(tǒng)引發(fā)了大家對(duì)版權(quán)、剽竊等原創(chuàng)性問(wèn)題的討論,也為這類模型的發(fā)展添上了一些不穩(wěn)定因素。該模型使用學(xué)術(shù)論文作為數(shù)據(jù)集進(jìn)行訓(xùn)練,然而該系統(tǒng)按要求生成的文章實(shí)際上完全虛假。Meta幾天后不得不撤回了這一系統(tǒng)。
從長(zhǎng)遠(yuǎn)來(lái)看,生成式AI仍然具備顛覆現(xiàn)有AI的能力,而要獲得更加通用、好用的模型,還需要更多領(lǐng)域相關(guān)的數(shù)據(jù)積累和算法創(chuàng)新。同時(shí),由于相關(guān)方向跨學(xué)科的性質(zhì),各專業(yè)的科學(xué)家需要通力合作,以期產(chǎn)生新的變革。
說(shuō)到底,AI只是一個(gè)輔助工具,即使幫助我們提高了尋找到靶點(diǎn)的概率,但成藥的困難依舊,創(chuàng)新藥仍然是一條漫長(zhǎng)的“打怪升級(jí)”之路。
參考文獻(xiàn):
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論