中國(guó)科大建立新的蛋白質(zhì)從頭設(shè)計(jì)方法

?
中國(guó)科學(xué)技術(shù)大學(xué)劉海燕教授、陳泉副教授團(tuán)隊(duì)采用數(shù)據(jù)驅(qū)動(dòng)策略,開(kāi)辟出一條全新的蛋白質(zhì)從頭設(shè)計(jì)路線,相關(guān)成果以“用于蛋白質(zhì)設(shè)計(jì)的以主鏈為中心的神經(jīng)網(wǎng)絡(luò)能量函數(shù)”為題于北京時(shí)間2月10日發(fā)表于Nature。
蛋白質(zhì)是生命的基礎(chǔ),是生命功能的主要執(zhí)行者,其結(jié)構(gòu)與功能由氨基酸序列所決定。目前,能夠形成穩(wěn)定三維結(jié)構(gòu)的蛋白質(zhì),幾乎全部是天然蛋白質(zhì),其氨基酸序列是長(zhǎng)期自然進(jìn)化形成。在天然蛋白結(jié)構(gòu)功能不能滿足工業(yè)或醫(yī)療應(yīng)用需求時(shí),想要得到特定的功能蛋白,就需要對(duì)其結(jié)構(gòu)和序列進(jìn)行設(shè)計(jì)。目前,國(guó)際上報(bào)道的蛋白質(zhì)從頭設(shè)計(jì)工作主要使用天然結(jié)構(gòu)片段作為構(gòu)建模塊來(lái)拼接產(chǎn)生人工結(jié)構(gòu)。然而,這種方法存在設(shè)計(jì)結(jié)果單一、對(duì)主鏈結(jié)構(gòu)細(xì)節(jié)過(guò)于敏感等不足,限制了設(shè)計(jì)主鏈結(jié)構(gòu)的多樣性和可變性。蛋白質(zhì)從頭設(shè)計(jì)中最困難的問(wèn)題,是如何充分地探索蛋白質(zhì)主鏈結(jié)構(gòu)空間,發(fā)現(xiàn)新穎的、“高可設(shè)計(jì)性”主鏈結(jié)構(gòu),對(duì)這一問(wèn)題目前還缺乏系統(tǒng)性的解決方法。
中國(guó)科學(xué)技術(shù)大學(xué)相關(guān)團(tuán)隊(duì)長(zhǎng)期深耕計(jì)算結(jié)構(gòu)生物學(xué)方向的基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究;施蘊(yùn)渝院士是國(guó)內(nèi)這一領(lǐng)域的開(kāi)拓者;劉海燕教授、陳泉副教授團(tuán)隊(duì)十余年來(lái)致力于發(fā)展數(shù)據(jù)驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)方法,經(jīng)過(guò)長(zhǎng)期不懈努力,建立并實(shí)驗(yàn)驗(yàn)證了給定主鏈結(jié)構(gòu)設(shè)計(jì)氨基酸序列的ABACUS模型,進(jìn)而發(fā)展了能在氨基酸序列待定時(shí)從頭設(shè)計(jì)全新主鏈結(jié)構(gòu)的SCUBA模型(圖1)。SCUBA采用了一種新的統(tǒng)計(jì)學(xué)習(xí)策略,基于核密度估計(jì)(或近鄰計(jì)數(shù),NC)和神經(jīng)網(wǎng)絡(luò)擬合(NN)方法,從原始結(jié)構(gòu)數(shù)據(jù)中得到神經(jīng)網(wǎng)絡(luò)形式的解析能量函數(shù),能夠高保真地反應(yīng)實(shí)際蛋白質(zhì)結(jié)構(gòu)中不同結(jié)構(gòu)變量間的高維相關(guān)關(guān)系,在不確定序列的前提下,連續(xù)、廣泛地搜索主鏈結(jié)構(gòu)空間,自動(dòng)產(chǎn)生“高可設(shè)計(jì)性”主鏈。
? ?

圖1.用SCUBA模型進(jìn)行蛋白質(zhì)設(shè)計(jì)的原理。(a) SCUBA主鏈能量面上的極小對(duì)應(yīng)了蛋白質(zhì)的可設(shè)計(jì)主鏈結(jié)構(gòu),即特定氨基酸序列下的最低自由能結(jié)構(gòu);(b) SCUBA中用神經(jīng)網(wǎng)絡(luò)表示的統(tǒng)計(jì)能量項(xiàng);(c)和(d) 用近鄰計(jì)數(shù)(NC)-神經(jīng)網(wǎng)絡(luò)(NN)方法從蛋白質(zhì)結(jié)構(gòu)原始數(shù)據(jù)中學(xué)習(xí)解析能量函數(shù)的方法框架。
理論計(jì)算和實(shí)驗(yàn)證明,用SCUBA設(shè)計(jì)主鏈結(jié)構(gòu),能夠突破只能用天然片段來(lái)拼接產(chǎn)生新主鏈結(jié)構(gòu)的限制,顯著擴(kuò)展從頭設(shè)計(jì)蛋白的結(jié)構(gòu)多樣性,進(jìn)而設(shè)計(jì)出不同于已知天然蛋白的新穎結(jié)構(gòu)?!癝CUBA模型+ABACUS模型”構(gòu)成了能夠從頭設(shè)計(jì)具有全新結(jié)構(gòu)和序列的人工蛋白完整工具鏈,是RosettaDesign之外目前唯一經(jīng)充分實(shí)驗(yàn)驗(yàn)證的蛋白質(zhì)從頭設(shè)計(jì)方法,并與之互為補(bǔ)充。在論文中,團(tuán)隊(duì)報(bào)道了9種從頭設(shè)計(jì)的蛋白質(zhì)分子的高分辨晶體結(jié)構(gòu)(圖2),它們的實(shí)際結(jié)構(gòu)與設(shè)計(jì)模型一致,其中5種蛋白質(zhì)具有天然蛋白質(zhì)中尚未觀察到的新型拓?fù)浣Y(jié)構(gòu)。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

圖2.從頭設(shè)計(jì)蛋白的高分辨晶體結(jié)構(gòu)(天藍(lán)色)與設(shè)計(jì)模型(綠色)比較。
Nature雜志的審稿人認(rèn)為,“與現(xiàn)有方法不同,現(xiàn)有方法要么使用參數(shù)方程來(lái)描述預(yù)定義螺旋結(jié)構(gòu)的空間,要么基于片段組裝的方法依賴(lài)于已知蛋白質(zhì)片段。SCUBA方法原則上允許人們探索任意主鏈結(jié)構(gòu),然后填充序列,允許人們?cè)O(shè)計(jì)比自然界中觀察到的更廣泛的蛋白質(zhì)幾何結(jié)構(gòu)”;“蛋白質(zhì)從頭設(shè)計(jì)仍然具有挑戰(zhàn)性,本工作中六種不同蛋白質(zhì)的高分辨率設(shè)計(jì)是一項(xiàng)重要成就,表明此方法工作良好”;“本研究中報(bào)道的成功設(shè)計(jì)數(shù)量之多令人印象深刻,并提供了強(qiáng)有力的證據(jù),證明了基礎(chǔ)技術(shù)是魯棒的。所采用的基于神經(jīng)網(wǎng)絡(luò)的能量項(xiàng)是新穎的,因?yàn)樗鼈兛坍?huà)了更傳統(tǒng)的統(tǒng)計(jì)方法無(wú)法企及的多維特征,該方法具有足夠的新穎性和實(shí)用性”。
我校生命科學(xué)與醫(yī)學(xué)部劉海燕教授和陳泉副教授為論文通訊作者。博士生黃斌、許洋、胡秀紅為論文共同第一作者。中國(guó)科大團(tuán)隊(duì)的工作在蛋白質(zhì)設(shè)計(jì)這一前沿科技領(lǐng)域?qū)崿F(xiàn)了關(guān)鍵核心技術(shù)的原始創(chuàng)新,為工業(yè)酶、生物材料、生物醫(yī)藥蛋白等功能蛋白的設(shè)計(jì)奠定了堅(jiān)實(shí)的基礎(chǔ)。
該研究工作得到了科技部、國(guó)家自然科學(xué)基金委和中國(guó)科學(xué)院的資助支持。
原文鏈接:https://www.nature.com/articles/s41586-021-04383-5
(生命科學(xué)與醫(yī)學(xué)部、合肥微尺度物質(zhì)科學(xué)國(guó)家研究中心、無(wú)膜細(xì)胞器與細(xì)胞動(dòng)力學(xué)教育部重點(diǎn)實(shí)驗(yàn)室、科研部)

