Step 2: 選擇合適的模板蛋白

Swiss-model會給出通過一級序列匹配到的模板蛋白,以及每一個模板蛋白的匹配度和模板蛋白的參數(shù),通過以下標準,我們選擇最優(yōu)的模板蛋白用于同源建模:

1. 目的蛋白和模板蛋白一級序列一致性要求:identity>30%;優(yōu)先選擇identity最高的模板蛋白;

2. 優(yōu)先選擇SARS-COV的模板蛋白用于同源建模;

3. 當identity比較相似的時候,優(yōu)先選擇通過高精度X-ray方法構(gòu)建晶體結(jié)構(gòu)的模板;如果沒有X-ray,需要點進PDB看蛋白結(jié)構(gòu)分辨率,優(yōu)先選分辨率高的;

4. 如果Oligo State存在有Homo和heter,就兩個都要選擇。

聯(lián)合科研團隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

Step 3:同源建模

選定好最優(yōu)的模板蛋白之后,點擊頁面的“Build Models”,即可自動的做同源建模;對于序列比較短的蛋白(<100 殘基),該過程通?;ㄙM幾分鐘;對于序列比較長的蛋白(>1000 殘基),該過程通?;ㄙM約二十分鐘左右; 建模完成后,可直接下載模板蛋白和目的蛋白的三維空間結(jié)構(gòu)用于后續(xù)的分析。

聯(lián)合科研團隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

Step 4:分子動力學模擬

同源建模得到的蛋白質(zhì)結(jié)構(gòu)可以用于分子動力學(Molecular Dynamics)模擬。分子動力學模擬可以通過GROMACS等工具完成,這一步驟通常比較耗時。華為云醫(yī)療智能體平臺已經(jīng)提供加速版的GROMACS,加速后的GROMACS消耗的時間僅有傳統(tǒng)版本的1/6。

聯(lián)合科研團隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

結(jié)果

建模結(jié)果統(tǒng)計

針對2019-nCOV的20個蛋白質(zhì)一級序列,有15個蛋白和SARS-COV的蛋白質(zhì)有比較高的同源性,identity>70%;通過蛋白質(zhì)三維工具可視化之后,也可以看到這些蛋白質(zhì)的三維空間構(gòu)象和模板蛋白比較相似;

其中有一個蛋白質(zhì),NSP4,在SARS-COV中沒有很好的同源蛋白,是以小鼠肝炎病毒的A59進行建模,其identity>60%;

另外有四個蛋白質(zhì)的同源建模效果不是很好,其中NSP2,NSP6和M均沒有很好的目的模板,匹配度最好的蛋白質(zhì)序列的identity < 30%;所以建模的結(jié)果不太理想;同時NSP11蛋白質(zhì)的長度只有11個殘基,長度太短,不滿足建模要求;

目的蛋白的長度,模板蛋白的選擇和同源建模的參數(shù)整理在以下的表格中供參考:

聯(lián)合科研團隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

數(shù)據(jù)和可視化

模板蛋白和同源建模得到的2019-nCoV蛋白質(zhì)三維結(jié)構(gòu)都以PDB格式進行保存,為了方便用戶查閱,華為云醫(yī)療智能體平臺的Notebook工具已經(jīng)內(nèi)置了可視化所需要的插件和工具,用戶可以交互式拖動和展示感興趣的蛋白質(zhì)三維結(jié)構(gòu)。

聯(lián)合科研團隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

以上涉及到的數(shù)據(jù)、算法和工具都已經(jīng)集成在華為云醫(yī)療智能體平臺,基于華為云AI昇騰集群服務的強大算力,用戶可省時省力地完成端到端的分析。

分享到

songjy

相關(guān)推薦