會上,中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)大數(shù)據(jù)中心主任蔣太交先生發(fā)表了名為《醫(yī)療大數(shù)據(jù)分析挖掘》的主題演講。他從中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)大數(shù)據(jù)中心發(fā)展目標(biāo)和定位,生物醫(yī)學(xué)大數(shù)據(jù)分析挖掘和大數(shù)據(jù)醫(yī)療,團隊針對公共衛(wèi)生所獲得的大數(shù)據(jù)挖掘成果三個方面進行了闡述,并斷言,健康醫(yī)療大數(shù)據(jù)的發(fā)展將來肯定不僅僅是對公共衛(wèi)生的管控會提出新技術(shù)新方法,也會對健康養(yǎng)生,未來的精準(zhǔn)醫(yī)學(xué),個性化醫(yī)療提出新技術(shù)、新方法。

以下為蔣太交的演講實錄:

大家上午好,非常感謝大家來參加這次大會。今天上午我們邀請的嘉賓從基礎(chǔ)醫(yī)學(xué)、政策解讀都給我們大數(shù)據(jù)做了很好的闡述,我的報告今天分為三個內(nèi)容:首先給大家介紹一下中國醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)大數(shù)據(jù)中心發(fā)展目標(biāo)和定位,然后介紹一下生物醫(yī)學(xué)大數(shù)據(jù)分析挖掘和大數(shù)據(jù)醫(yī)療,三是我們團隊工作進展匯報,就是大數(shù)據(jù)通過挖掘以后解決的公共衛(wèi)生很重要的問題就是傳染病的預(yù)測預(yù)警。

剛才周主任前面反復(fù)提到健康中國已經(jīng)成為國家的戰(zhàn)略,我們知道影響疾病健康是多因素的非常復(fù)雜,這就急需大數(shù)據(jù)的支持。我們中國醫(yī)學(xué)科學(xué)院在這個行業(yè)里面非常具有優(yōu)勢,不僅在基礎(chǔ)醫(yī)學(xué),而且在臨床醫(yī)學(xué)都是有非常豐富的資源,擁有6家附屬醫(yī)院、協(xié)和醫(yī)院,腫瘤醫(yī)院、整形醫(yī)院、天津血液病和南京皮膚病醫(yī)院,還有12個研究所。同時我們還具有全國的疑難重癥指導(dǎo)中心。所以我們醫(yī)科院長期以來不僅有豐富的資源也有大量的醫(yī)療大數(shù)據(jù)。

我們提到有國家的疑難重癥診治中心還有新農(nóng)合也在我們醫(yī)科院信息所,在這樣一個其他下我們中國醫(yī)學(xué)科學(xué)院是去年底通過成立了中國醫(yī)學(xué)科學(xué)院大數(shù)據(jù)研究中心,我們這個研究中心將圍繞臨床醫(yī)療、衛(wèi)生健康、基礎(chǔ)醫(yī)學(xué)大數(shù)據(jù),把它統(tǒng)稱為生物醫(yī)學(xué)大數(shù)據(jù),今天的概念比較多,有健康醫(yī)療大數(shù)據(jù),也有醫(yī)療大數(shù)據(jù),還有生物醫(yī)學(xué)大數(shù)據(jù),對我們來說這可能是差不多的,可能從不同的側(cè)面對整個大數(shù)據(jù)的理解。我們主要是從事生物醫(yī)學(xué)大數(shù)據(jù)關(guān)鍵的技術(shù)問題和重大的醫(yī)學(xué)問題進行探索研究,著力打造生物醫(yī)學(xué)大數(shù)據(jù)的技術(shù)支撐平臺和轉(zhuǎn)化應(yīng)用平臺,以提升我國在生物醫(yī)學(xué)大數(shù)據(jù)的能力。

第一屆學(xué)生委員會邀請劉德培院士和陳潤生院士擔(dān)任我們主席,邀請伯曉晨研究員、陳杰主任、陳翔主任、韓敬東教授、劉保延教授、尹嶺教授還有我本人擔(dān)任第一屆學(xué)術(shù)委員會。

我們這個大數(shù)據(jù)中心它的建設(shè)目的,大數(shù)據(jù)的特點就是形成規(guī)范標(biāo)準(zhǔn),互聯(lián)互通,實現(xiàn)數(shù)據(jù)的互聯(lián)互通和規(guī)范標(biāo)準(zhǔn),打破信息屏障。第二發(fā)展人工智能和深度學(xué)習(xí)技術(shù),從健康醫(yī)療大數(shù)據(jù)中發(fā)現(xiàn)新知識和新規(guī)律。建立系列醫(yī)療模型,推動基于大數(shù)據(jù)轉(zhuǎn)化應(yīng)用,促進“智慧醫(yī)療”和分級診療的實施。

所有我們這個大數(shù)據(jù)中心希望與國內(nèi)外的同行合作,全面提升我國醫(yī)療大數(shù)據(jù)行業(yè)的特色創(chuàng)新能力,發(fā)展新技術(shù)、新應(yīng)用和新業(yè)態(tài)。

第二個部分簡單給大家介紹大數(shù)據(jù)的分析挖掘和大數(shù)據(jù)醫(yī)療。剛才大家都提到大數(shù)據(jù)的確是對于我們現(xiàn)在生活造成了深遠的影響,比如說我們知道商品大數(shù)據(jù)已經(jīng)改變了購物方式,交通大數(shù)據(jù)改變了人們的出行方式,通過滴滴打車平臺改變了人們的出行方式。大家可以想象醫(yī)療大數(shù)據(jù)的發(fā)展對于未來的分級診療和落地也會改變?nèi)藗兊木歪t(yī)方式。

國家還有一個難題就是老百姓看病難看病貴的問題,從老百姓看病難看病貴的問題,從政策,從資源層面講還有很多問題,從基層層面講也有問題。我做了一個簡單的總結(jié),就是我們把現(xiàn)在的醫(yī)療理解為傳統(tǒng)的醫(yī)療,它存在什么?醫(yī)療衛(wèi)生資源稀缺,分布不均勻。同時因為醫(yī)療資源段,也浪費了,醫(yī)療效率比較低下。這一塊可以講通過大數(shù)據(jù)醫(yī)療,大數(shù)據(jù)與醫(yī)療融合的解決方案希望有提升,通過互聯(lián)互通為醫(yī)療資源共享提供基礎(chǔ)支撐,通過共享交換與業(yè)務(wù)協(xié)同達到提升醫(yī)療服務(wù)的質(zhì)量和效率,通過移動互聯(lián)和安全可靠,為遠程醫(yī)療和分級診療提供保障,這就是未來大數(shù)據(jù)醫(yī)療產(chǎn)生的一些特點。

我們知道醫(yī)院信息化的發(fā)展,特別是國家“十一五”、“十二五”以來,在醫(yī)療信息化已經(jīng)積累了大量的數(shù)據(jù),以電子病例為核心的臨床信息系統(tǒng)里面,也蘊藏了跟疾病、診療相關(guān)的大數(shù)據(jù)。目前只是我們醫(yī)院的臨床數(shù)據(jù)再利用還是存在很大的困難。一方面我們知道醫(yī)院里面業(yè)務(wù)系統(tǒng)比較多,但是形成信息孤島。第二方面我們國家的規(guī)范化、標(biāo)準(zhǔn)化互通性程度低,三是信息需要二次加工,利用。所以它的未來肯定是要建立醫(yī)院標(biāo)準(zhǔn)化的臨床數(shù)據(jù)中心。

今天上午陳院士也提到了,基因組學(xué)的發(fā)展推動了精準(zhǔn)醫(yī)學(xué)的發(fā)展,在組學(xué)這塊我們還產(chǎn)生了海量的數(shù)據(jù),所以可以講從未來一個人的角度來思考,我們?nèi)思词且粋€大數(shù)據(jù),從健康臨床數(shù)據(jù),包括家族病史,體檢數(shù)據(jù)、影像數(shù)據(jù)、診療數(shù)據(jù)、醫(yī)療預(yù)約號等等數(shù)據(jù)以外產(chǎn)生了組學(xué)數(shù)據(jù),包括基因組學(xué)、轉(zhuǎn)錄組學(xué)等等,這些數(shù)據(jù)都是多維度的動態(tài)的數(shù)據(jù)。

一方面我們國家在醫(yī)療信息化方面取得了大量的很好的基礎(chǔ),包括臨床醫(yī)學(xué)的數(shù)據(jù),基礎(chǔ)醫(yī)學(xué)的數(shù)據(jù),人口健康的數(shù)據(jù)。但是另一方面國家沒有很好的把這些數(shù)據(jù)發(fā)揮作用。簡單來講就是沒有為臨床的合作診療和醫(yī)療的監(jiān)管和衛(wèi)生經(jīng)濟的分析和公共衛(wèi)生政策評價沒有提供很好的支撐作用。究其原因是因為大數(shù)據(jù)層面還存在很多問題,這些問題只有通過把這些數(shù)據(jù)通過互聯(lián)共享形成醫(yī)療大數(shù)據(jù),在大數(shù)據(jù)進行深度分析挖掘才能夠發(fā)揮它的價值。

醫(yī)療大數(shù)據(jù)應(yīng)用需突破的核心問題,一個是在互聯(lián)共享這一塊,在規(guī)范采集與標(biāo)準(zhǔn)化,怎樣進行醫(yī)療大數(shù)據(jù)的智能導(dǎo)航,怎樣解決信息安全與隱私保護問題。在分析挖掘這塊,怎么進行疾病早期診斷與預(yù)警,怎樣輔助診療與智慧醫(yī)療的方案,怎樣基于大數(shù)據(jù)進行精準(zhǔn)醫(yī)學(xué)與個性化治療。

可以講生物醫(yī)學(xué)大數(shù)據(jù)還是一個沉睡的金礦,這個金礦需要大家一起來挖掘。我下面的內(nèi)容由于時間的問題也是簡單介紹一下我自己的團隊在這方面的一些工作。

我這個實驗室研究方向是生物信息學(xué)與醫(yī)學(xué)信息需,我們主要開展大數(shù)據(jù)的異源和多維度信息關(guān)聯(lián)與整合,我們一方面開展生物信息研究,包括基因核蛋白結(jié)構(gòu)模擬,同時開展臨床大數(shù)據(jù),包括數(shù)據(jù)挖掘和機器學(xué)習(xí),同時開展像傳染病和慢病的流行病大數(shù)據(jù)的研究,所以今天介紹怎么從大數(shù)據(jù)的角度出發(fā)開展全病的新技術(shù)、新方法。

我們知道新發(fā)病和傳染病在國際造成了很大的影響,我們實驗室以流感作為實驗對象,我們知道流感世紀性流感大流行會導(dǎo)致全球數(shù)百萬甚至千萬人死亡,季節(jié)性流感也會導(dǎo)致每年數(shù)十萬人死亡,每年都會感染5%-15%的人口,所以流感的防控也是全球公共衛(wèi)生一個重要的任務(wù)。我們知道大數(shù)據(jù)在公共衛(wèi)生領(lǐng)域里面應(yīng)用最成功的范例就是谷歌通過瀏覽器的搜索來預(yù)測流感的流行,我們知道當(dāng)?shù)貌〉臅r候,得流感的時候很多人都會在互聯(lián)網(wǎng)上搜索跟流感相關(guān)的癥狀,跟流感的用藥,谷歌就是根據(jù)人們搜索的行為,跟流感相關(guān)的行為預(yù)測流感的爆發(fā)。大家看,黑色的線是谷歌通過互聯(lián)網(wǎng)大數(shù)據(jù)進行的流感的爆發(fā)情況與輿情。但是互聯(lián)網(wǎng)數(shù)據(jù)是比監(jiān)控的數(shù)據(jù)至少要早一個禮拜。

我們知道互聯(lián)網(wǎng)數(shù)據(jù)還是存在很大缺點,不能確定是哪一種流感病毒在流行,也不能判斷流感冰毒性的是否變異,因此它只能做預(yù)報,但是不能指導(dǎo)流感疫苗的使用也不能指導(dǎo)用藥。后來我們實驗室跟國家CTC合作,提出來一個新的方案,我們能不能整合互聯(lián)網(wǎng)大數(shù)據(jù)和基因大數(shù)據(jù)進行流感防控,首先基于百度的流感搜索指數(shù)和吸納的微博搜索指數(shù),在全國監(jiān)控流感爆發(fā)地點,一旦發(fā)現(xiàn)疫情的時候要獲得病毒的樣本病人的樣本,兩個樣本進行分析流感的變異和爆發(fā)情況,我們采取了互聯(lián)網(wǎng)大數(shù)據(jù)和基因大數(shù)據(jù)進行防控。這兩個大數(shù)據(jù)的融合分析挖掘能夠回答和傳遞一些重要問題,一個是新的傳染病是怎么起源的,第二個是能否進行危害程度的早期預(yù)測預(yù)警。我們做了一系列的工作,包括發(fā)明了流感疫苗株推薦新方法。由于時間的問題我主要介紹這兩個方面的結(jié)果。

我們知道接種疫苗是防控流感最有效的手段,為了有效提供疫苗,世界流行病組織有一個監(jiān)控網(wǎng)絡(luò),雖然有這么大的監(jiān)控網(wǎng)絡(luò),但是到目前為止世界衛(wèi)生組織推薦疫苗是很低的,這條線是世界衛(wèi)生組織推薦的疫苗情況,在中國地區(qū)只有兩次是吻合的,有五次是不匹配的。在美國地區(qū)也只有四次是吻合的,有三次沒有吻合,因此流感疫苗推薦的準(zhǔn)確率很低。準(zhǔn)確率很低的原因是在于流感病毒快速變異,從而導(dǎo)致其抗原性不斷改變。

我們實驗室通過流感的基因序列和流感的血清學(xué)結(jié)合起來發(fā)展了機器學(xué)習(xí)與網(wǎng)絡(luò)模擬相結(jié)合的技術(shù),大家看這是我們預(yù)測的流感的抗原,流感的疫苗改變的情況,它跟實驗項結(jié)果是一致的。然后我們把這個方法發(fā)展成自動的醫(yī)療推薦方法,所以我們模擬流感它的抗原改變,在需要推薦疫苗的時候如果發(fā)現(xiàn)新的疫苗株會在下一個疫苗期間發(fā)展。

這就是我們推薦的疫苗,我們推薦的疫苗跟中國地區(qū)比較只有一次沒有匹配,所以我們這個方法也申請了專利,同時我們這個方法現(xiàn)在也在向世界衛(wèi)生組織發(fā)表。我們這個工作發(fā)表到國際雜志上以后得到了很好的表彰。同時新華社也報道了我國科學(xué)家發(fā)明流感疫苗株快速選擇新技術(shù)、新方法。

我再花兩三分鐘時間介紹一下華東地區(qū)禽流感,這個工作我們也是和國家疾控中心和農(nóng)業(yè)部合作完成的試點工作。我們知道2013年華東地區(qū)的H7N9發(fā)展的很快,當(dāng)時病毒起源和發(fā)起的原因不清楚,之后我們進行了精確的分析,華東地區(qū)的H7N9基因很復(fù)雜,我們通過統(tǒng)計與遺傳的推理,我們發(fā)現(xiàn)這個病毒通過兩次重配現(xiàn)象產(chǎn)生的。第一次重配發(fā)生在2012年由歐亞起源的一個病毒跟中國地區(qū)的一個病毒進行第一次重配,然后在2012年早期的時候又到華東地區(qū)的家禽流行的H9N2進行第二次重配,然后形成了H7N9。所以我們的就闡明了H7N9是從野鳥傳播到家禽,然后再開始傳播到人,是這樣一個途徑。之后在國際上引起了很大的關(guān)注。

我們可以想像,健康醫(yī)療大數(shù)據(jù)的發(fā)展將來肯定不僅僅是對公共衛(wèi)生的管控會提出新技術(shù)新方法,也對我們健康養(yǎng)生,也對我們未來的精準(zhǔn)醫(yī)學(xué),個性化醫(yī)療提出新技術(shù)、新方法,由于時間的原因我就講到這里,謝謝大家!

分享到

崔歡歡

相關(guān)推薦