- 首頁
- 民文
- English
- 網(wǎng)站無障礙
- 舉報(bào)
- 登錄
用AI設(shè)計(jì)蛋白質(zhì) 滿足“定制”需求(探一線)

在上海張江科學(xué)城的實(shí)驗(yàn)室里,科學(xué)家正見證一場(chǎng)生命極限的突破——90攝氏度的密閉罐里,酶正在快速“瓦解”塑料。這款耐高溫的塑料降解酶,是上海交通大學(xué)洪亮教授團(tuán)隊(duì)用AI設(shè)計(jì)改造的“新品”蛋白質(zhì)。
當(dāng)傳統(tǒng)生物學(xué)家還在實(shí)驗(yàn)室用移液槍逐個(gè)測(cè)試蛋白質(zhì)功能、組裝“理想型”蛋白質(zhì)時(shí),洪亮團(tuán)隊(duì)的AI大模型“啟明星”已構(gòu)建出億級(jí)蛋白質(zhì)的“功能圖譜”,能夠精準(zhǔn)、高效地設(shè)計(jì)出耐熱、耐堿、耐酸等“超能”蛋白質(zhì),滿足“定制”蛋白質(zhì)的需求。
蛋白質(zhì)是生命活動(dòng)的物質(zhì)基礎(chǔ),自然界中參與構(gòu)成蛋白質(zhì)的氨基酸有20種,一個(gè)蛋白質(zhì)分子通常由幾十個(gè)至上千個(gè)數(shù)量不等的氨基酸按照特定順序排列而成。排序的細(xì)微差別,可能讓蛋白質(zhì)表現(xiàn)出截然不同的功能特性,比如穩(wěn)定性、活性、親和力等。過去數(shù)十年間,生物學(xué)家只能依靠實(shí)驗(yàn)方法來測(cè)定蛋白質(zhì)的結(jié)構(gòu),揭示復(fù)雜的蛋白質(zhì)結(jié)構(gòu)會(huì)耗費(fèi)生物學(xué)家大量時(shí)間。2018年,谷歌DeepMind團(tuán)隊(duì)發(fā)布了AI大模型AlphaFold,它能精準(zhǔn)地解析蛋白質(zhì)的三維構(gòu)造,為科研人員更高效、更精準(zhǔn)地進(jìn)行藥物開發(fā)、疫苗設(shè)計(jì)奠定基礎(chǔ)。
“使用AI設(shè)計(jì)蛋白質(zhì)時(shí),我們就在思考,設(shè)計(jì)的目的是滿足某些功能需求,為何不訓(xùn)練AI模型,把滿足功能需求的蛋白質(zhì)直接設(shè)計(jì)出來?”洪亮團(tuán)隊(duì)決定訓(xùn)練一個(gè)與AlphaFold不同的AI大模型,挑戰(zhàn)蛋白質(zhì)功能設(shè)計(jì)的難關(guān)。
“我們利用AI技術(shù)學(xué)習(xí)不同自然環(huán)境下,各種生物體內(nèi)蛋白質(zhì)鏈條中氨基酸的排列規(guī)則。更重要的是,我們從溫度、酸堿度、壓強(qiáng)這3個(gè)維度,為5億個(gè)蛋白質(zhì)打上功能標(biāo)簽,然后把這海量的功能標(biāo)簽‘投喂’給AI大模型,使之能快速、精準(zhǔn)地設(shè)計(jì)出耐熱、耐酸、耐堿的‘皮實(shí)’蛋白產(chǎn)品?!焙榱琳f。
如果把一個(gè)蛋白質(zhì)看作一塊模具,那么整個(gè)數(shù)據(jù)集就是裝滿90億塊模具的超級(jí)工具箱,這是迄今為止全球最大的蛋白質(zhì)數(shù)據(jù)集。由36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列、0.6億條病毒蛋白質(zhì)序列等組成的蛋白質(zhì)數(shù)據(jù)集中,蘊(yùn)藏著從地表到極地冰川、深海溝壑的“適者生存法則”。
“比如這款耐熱的塑料降解酶,我們先從‘啟明星’中挑出幾個(gè)具備耐熱功能的蛋白質(zhì)‘模具’,再使用AI技術(shù)修飾改造這些蛋白質(zhì)‘模具’的氨基酸序列,提高它的耐熱性,同步進(jìn)行實(shí)驗(yàn)驗(yàn)證,從而避免了過去的高通量篩選,提升了蛋白質(zhì)設(shè)計(jì)與改造的效率?!焙榱琳f。
在上海交通大學(xué)張江校區(qū)的自動(dòng)化實(shí)驗(yàn)室里,機(jī)械臂正飛快地驗(yàn)證著AI設(shè)計(jì)的蛋白質(zhì)。這里每天產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù),又會(huì)回流到AI系統(tǒng)中持續(xù)優(yōu)化蛋白質(zhì)模具,形成“數(shù)據(jù)—模型—實(shí)驗(yàn)”的增強(qiáng)循環(huán),洪亮形象地稱之為“蛋白質(zhì)的自動(dòng)駕駛模式”。“我們的目的就是讓設(shè)計(jì)AI化、實(shí)驗(yàn)自動(dòng)化,把復(fù)雜的蛋白質(zhì)科學(xué)變成簡(jiǎn)單的工程過程?!焙榱琳f。
截至目前,已有8個(gè)產(chǎn)業(yè)項(xiàng)目使用“啟明星”大模型設(shè)計(jì)蛋白質(zhì),成功率達(dá)70%。這種突破正在改寫產(chǎn)業(yè)規(guī)則:某生物醫(yī)藥企業(yè)利用“啟明星”設(shè)計(jì)的極度耐堿的蛋白質(zhì),使用壽命提高一倍多,每年可為企業(yè)節(jié)省上千萬元的成本。
談及未來圖景,洪亮這樣描繪:生物學(xué)家只需在電腦上輸入需求,AI就能自動(dòng)生成候選蛋白質(zhì)“模具”,自動(dòng)化平臺(tái)完成驗(yàn)證優(yōu)化。這不僅能夠?qū)⒖蒲腥藛T從重復(fù)實(shí)驗(yàn)中解放,更可能催生“定制化合成生物”的全新產(chǎn)業(yè)形態(tài)。
由中國科研團(tuán)隊(duì)建立的蛋白質(zhì)大模型及部分?jǐn)?shù)據(jù)集已于日前發(fā)布,并在軟件托管平臺(tái)GitHub上開源,供全世界的科研機(jī)構(gòu)接入。
站在合成生物產(chǎn)業(yè)的新賽道,洪亮說,當(dāng)AI開始理解生命的“設(shè)計(jì)邏輯”,我們或許正在見證新的產(chǎn)業(yè)革命——在這個(gè)蛋白質(zhì)可以被精準(zhǔn)“編程”的時(shí)代,從醫(yī)藥研發(fā)到環(huán)境保護(hù),生命科學(xué)將向前邁出更大的步伐。
《 人民日?qǐng)?bào) 》( 2025年05月17日 06 版)
分享讓更多人看到