分子結(jié)構(gòu)預(yù)測(cè)是生物信息學(xué)的“圣杯”,2024年諾貝爾化學(xué)獎(jiǎng)授予了AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)AlphaFold的兩位開發(fā)者,標(biāo)志著人工智能(AI)預(yù)測(cè)方法能給生命科學(xué)研究帶來革命性推進(jìn)。然而,AlphaFold仍然未解決核酸結(jié)構(gòu)預(yù)測(cè)的問題,RNA三維結(jié)構(gòu)預(yù)測(cè)領(lǐng)域仍亟需明確其瓶頸和發(fā)展方向。
RNA-Puzzles是一個(gè)2012年開始的國(guó)際合作項(xiàng)目,致力于評(píng)估RNA三維結(jié)構(gòu)預(yù)測(cè)的最新進(jìn)展。組織者在RNA三維結(jié)構(gòu)數(shù)據(jù)發(fā)表之前將需要預(yù)測(cè)的序列發(fā)給全球的結(jié)構(gòu)預(yù)測(cè)團(tuán)隊(duì),在預(yù)測(cè)結(jié)束后各個(gè)團(tuán)隊(duì)反饋預(yù)測(cè)結(jié)果,等三維結(jié)構(gòu)數(shù)據(jù)發(fā)表以后將預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)測(cè)定的結(jié)構(gòu)進(jìn)行比較。從而評(píng)估RNA三維結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確性。
2024年12月2日,廣州國(guó)家實(shí)驗(yàn)室、廣醫(yī)-廣州生物院聯(lián)合生科院苗智超教授團(tuán)隊(duì)聯(lián)合中國(guó)科學(xué)院溫州醫(yī)學(xué)研究所 Eric Westhof 院士,在 Nature Methods 期刊發(fā)表了題為:RNA-Puzzles Round V:Blind predictions of 23 RNA structures 的論文,公布了RNA-Puzzles Round V 的結(jié)果,對(duì)來自全球18個(gè)團(tuán)隊(duì)的預(yù)測(cè)進(jìn)行了大規(guī)模評(píng)估,涉及23個(gè)RNA結(jié)構(gòu),包括RNA元件、適配體、病毒元件、核酶和核開關(guān)等多種RNA類型。

本輪比賽(Round V)的預(yù)測(cè)結(jié)果顯示,在RNA結(jié)構(gòu)建模方面,一些關(guān)鍵步驟仍需克服。特別是,堿基配對(duì)的識(shí)別:準(zhǔn)確識(shí)別形成RNA螺旋的堿基對(duì)仍然是一個(gè)挑戰(zhàn);non-Watson-Crick結(jié)構(gòu)模塊的識(shí)別:正確識(shí)別non-Watson-Crick堿基對(duì)和RNA結(jié)構(gòu)模塊對(duì)于精確建模至關(guān)重要;螺旋間的同軸堆積(coaxial):避免螺旋間的打結(jié),并實(shí)現(xiàn)正確的同軸堆積是提高預(yù)測(cè)準(zhǔn)確性的關(guān)鍵。論文還討論了RNA結(jié)構(gòu)預(yù)測(cè)的難度取決于是否存在同源模板或者預(yù)測(cè)序列的長(zhǎng)度,鏈數(shù)等因素。
為了對(duì)預(yù)測(cè)結(jié)果進(jìn)行客觀評(píng)估,本輪比賽采用了多種評(píng)估指標(biāo),包括:均方根偏差(RMSD):用于衡量預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)結(jié)構(gòu)之間的整體相似性,較低的RMSD值表示預(yù)測(cè)精度較高;相互作用網(wǎng)絡(luò)保真度(INF):評(píng)估預(yù)測(cè)結(jié)構(gòu)中堿基配對(duì)和堿基堆積相互作用的準(zhǔn)確性;變形指數(shù)(DI):綜合考慮RMSD和INF值,更全面地反映預(yù)測(cè)結(jié)構(gòu)的質(zhì)量;IDDT分?jǐn)?shù)和ARES分?jǐn)?shù):分別側(cè)重于局部和全局精度,以及RNA樣結(jié)構(gòu)特性的評(píng)估。這些算法工具和測(cè)評(píng)數(shù)據(jù)都已經(jīng)開源,發(fā)布在RNA-Puzzles官網(wǎng)(www.rnapuzzles.org)。
本輪比賽中,排名前四的團(tuán)隊(duì)中有三個(gè)團(tuán)隊(duì)也曾在CASP15蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽的RNA賽道中名列前茅,這表明前幾名的預(yù)測(cè)方法具有較好的穩(wěn)定性。尤其是陳世杰教授和Rhiju Das團(tuán)隊(duì),陳世杰教授也在CASP16的比賽中獲得全球第一,但不同預(yù)測(cè)方法在具體表現(xiàn)上差異不大。未來RNA結(jié)構(gòu)預(yù)測(cè)領(lǐng)域有望借助人工智能結(jié)合經(jīng)典物理模擬方法和專家經(jīng)驗(yàn)實(shí)現(xiàn)進(jìn)一步突破。
論文詳細(xì)分析了不同功能類型RNA的預(yù)測(cè)結(jié)果,具體有——
RNA元件:對(duì)一些簡(jiǎn)單的RNA元件,預(yù)測(cè)結(jié)果較為理想;
適配體:對(duì)與配體結(jié)合的適配體,預(yù)測(cè)精度相對(duì)較低,尤其是在識(shí)別配體結(jié)合位點(diǎn)方面;
病毒元件:一些病毒RNA元件的預(yù)測(cè)結(jié)果較好,但也存在一些預(yù)測(cè)精度較低的情況,尤其是一些包含假結(jié)的結(jié)構(gòu);
核酶:對(duì)核酶的催化位點(diǎn)殘基的預(yù)測(cè),準(zhǔn)確性與RMSD值密切相關(guān);
核開關(guān):對(duì)一些具有同源結(jié)構(gòu)的核開關(guān),預(yù)測(cè)結(jié)果較好;而對(duì)于一些復(fù)雜的核開關(guān),例如T-box核開關(guān),預(yù)測(cè)精度仍然有待提高。
歡迎全球?qū)NA結(jié)構(gòu)模擬和結(jié)構(gòu)解析有興趣的同仁加入我們,歡迎參與RNA-Puzzles結(jié)構(gòu)預(yù)測(cè),也歡迎結(jié)構(gòu)生物學(xué)家把解析的結(jié)構(gòu)提供給RNA-Puzzles進(jìn)行預(yù)測(cè)!
廣醫(yī)-廣州生物院聯(lián)合生科院為論文第一單位,廣州實(shí)驗(yàn)室博士生卜凡是論文第一作者,法國(guó)科學(xué)院院士Eric Westhof和廣州國(guó)家實(shí)驗(yàn)室研究員、廣醫(yī)-廣州生物院聯(lián)合生科院苗智超教授為共同通訊作者。
苗智超教授和Eric Westhof院士長(zhǎng)期專注于生物大分子結(jié)構(gòu)模擬和設(shè)計(jì),十多年來一直擔(dān)任全球RNA三維結(jié)構(gòu)預(yù)測(cè)比賽的負(fù)責(zé)人,制定了該領(lǐng)域的評(píng)價(jià)標(biāo)準(zhǔn)。苗智超課題組近年來的通訊作者工作在 Nature Medicine、Nature Methods、Nature Neurosciences、Nature Communications、Nucleic Acids Research 等學(xué)術(shù)期刊上發(fā)表。團(tuán)隊(duì)非常歡迎有單細(xì)胞組學(xué)、空間轉(zhuǎn)錄組學(xué)、生物信息和人工智能等科研背景的博士和碩士研究生、博士后、副研究員的加入。