4月14日上午的健康醫(yī)療大數(shù)據(jù)應(yīng)用與創(chuàng)新論壇上,軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所研究員伯曉晨發(fā)表了名為《精準(zhǔn)醫(yī)療大數(shù)據(jù)中心的建設(shè)及其應(yīng)用》的主題演講。伯曉晨介紹了為啟動(dòng)2016年精準(zhǔn)醫(yī)學(xué)專(zhuān)項(xiàng)而專(zhuān)門(mén)搭建的精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理和共享技術(shù)平臺(tái)的建設(shè),并結(jié)合國(guó)內(nèi)生物醫(yī)學(xué)大數(shù)據(jù)中心現(xiàn)狀展望了該平臺(tái)的未來(lái)應(yīng)用。

據(jù)伯曉晨稱(chēng),這個(gè)未上線(xiàn)的平臺(tái)在一個(gè)現(xiàn)有的基礎(chǔ)平臺(tái)之上搭建了兩個(gè)數(shù)據(jù)庫(kù),一個(gè)是疾病的數(shù)據(jù)庫(kù)群,一個(gè)是基礎(chǔ)組學(xué)的數(shù)據(jù)庫(kù)群。然后需要對(duì)后臺(tái)開(kāi)發(fā)提交的系統(tǒng),所謂數(shù)據(jù)匯交系統(tǒng),對(duì)于前臺(tái)要支持大家的檢索、展示、挖掘等等功能,屬于一個(gè)門(mén)戶(hù)。疾病數(shù)據(jù)庫(kù)群主要提供6個(gè)以上的疾病數(shù)據(jù)庫(kù)匯交管理系統(tǒng),架構(gòu)主要涉及到數(shù)據(jù)整合、關(guān)聯(lián)、查詢(xún)、數(shù)據(jù)庫(kù)建設(shè)方面。在基礎(chǔ)組學(xué)數(shù)據(jù)庫(kù),支撐數(shù)據(jù)庫(kù)方面要建立20個(gè)以上的跟醫(yī)學(xué)研究相關(guān)的標(biāo)準(zhǔn)組學(xué)數(shù)據(jù)庫(kù)的鏡像,總量要達(dá)到PB級(jí)。

以下為伯曉晨的演講實(shí)錄:

大家早上好,我報(bào)告的是我們?nèi)ツ昴甑讍?dòng)的一個(gè)國(guó)家精準(zhǔn)醫(yī)學(xué)研究重點(diǎn)研發(fā)專(zhuān)項(xiàng)的一個(gè)非?;A(chǔ)性的重要的平臺(tái)項(xiàng)目,叫精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理和共享技術(shù)平臺(tái),這個(gè)平臺(tái)怎么建?國(guó)家對(duì)它的期望怎么樣,設(shè)想怎么樣?我們后來(lái)在展望它將來(lái)的應(yīng)用怎么樣,我希望今天花一點(diǎn)時(shí)間跟大家分享一下。

昨天大家討論的比較多,說(shuō)咱們生命科學(xué)邁入大數(shù)據(jù)的時(shí)代,到底這個(gè)數(shù)據(jù)有多大?我們從科研的角度來(lái)說(shuō)更關(guān)注質(zhì)量比較高的,標(biāo)準(zhǔn)化的數(shù)據(jù),這個(gè)數(shù)據(jù)有多大?可以以歐洲生物信息研究所為例,他現(xiàn)在參考的數(shù)據(jù)是20PB,更可怕的是它的增長(zhǎng),從2008年之后這個(gè)數(shù)據(jù)每年翻一番,未來(lái)今天你覺(jué)得他是20PB,明天就是40PB的量,增長(zhǎng)速度不得了。

之所以產(chǎn)生這么多的數(shù)據(jù),是因?yàn)閮x器設(shè)備近兩年的發(fā)展。拿儀器來(lái)說(shuō)從小規(guī)模的1G的到最新的低成本的一次產(chǎn)生167個(gè)G的,到中型的可以產(chǎn)生600G的一直到可以產(chǎn)生18T,這個(gè)數(shù)據(jù)量傳統(tǒng)的實(shí)驗(yàn)室做不了。這也是為什么有一些生物云計(jì)算的一些支持,主要是醫(yī)院和實(shí)驗(yàn)室都對(duì)付不了這么大的數(shù)據(jù)。

11

可以看數(shù)據(jù)本身的質(zhì)量,以人類(lèi)基因組為例,從人類(lèi)基因組計(jì)劃,相當(dāng)于5個(gè)人的樣品混在一起,這代表了咱們地球上60億人,這個(gè)族譜不具有醫(yī)學(xué)上的價(jià)值!因?yàn)?個(gè)人代表地球上這么多人,基本上這5個(gè)人還都是健康的。后來(lái)千人基因組計(jì)劃就跟后來(lái)有關(guān)系了,可以體現(xiàn)出種族、年齡、不同的差異,到萬(wàn)人基因組3年就做完了,這樣1萬(wàn)個(gè)人的比較很快就發(fā)現(xiàn)一些比如說(shuō)像發(fā)現(xiàn)了骨質(zhì)疏松相關(guān)的基因。

這是從內(nèi)涵角度,從維度角度來(lái)說(shuō)生物醫(yī)學(xué)大數(shù)據(jù)絕不僅僅是基因組測(cè)序的問(wèn)題,既是基因組這一個(gè)層面,蛋白質(zhì)組、代謝組多種角度起來(lái)了,可以看到多種建模的問(wèn)題??吹匠嘶蚪M以外引起關(guān)注的叫表觀組,揭示了DNA之外的跟醫(yī)學(xué)方面的重要的聯(lián)系。

在這樣的情況下生物醫(yī)學(xué)大數(shù)據(jù)它的內(nèi)涵,它的維度來(lái)說(shuō)越來(lái)越支撐現(xiàn)代醫(yī)學(xué)向這方面的應(yīng)用,當(dāng)時(shí)發(fā)了一篇文章就是講它的歷程,生物大數(shù)據(jù)對(duì)醫(yī)學(xué)推動(dòng)的歷程,就是剛開(kāi)始從認(rèn)識(shí)基因組到了解基因組的生物學(xué),到了解基因組跟DNA之間的關(guān)系,到未來(lái)健康促進(jìn),可以走這樣一條路,這個(gè)熱點(diǎn)會(huì)不斷地往健康促進(jìn)這方面頻推。

在這樣的情況下還有一些生物醫(yī)學(xué)大數(shù)據(jù)的項(xiàng)目,本身就是針對(duì)某種特種疾病,或者直接針對(duì)轉(zhuǎn)化醫(yī)學(xué),比如癌癥基因組圖譜,大家比較熟悉,就是測(cè)2000多個(gè)腫瘤病人完整的臨床資料,有各種組學(xué)的,有基因組、表觀組、轉(zhuǎn)錄組、蛋白組。

另外現(xiàn)在不知道大家關(guān)注沒(méi)有,2010年啟動(dòng)以后2011年發(fā)表第一版本的基因表達(dá)譜大數(shù)據(jù)計(jì)劃,這個(gè)直接針對(duì)各種小分子藥物,和各種對(duì)大家健康有危害的毒物,附著在不同的所有細(xì)胞系當(dāng)中,不同濃度下它的反應(yīng),這就直接指向藥物開(kāi)發(fā)。

在這樣的情況下咱們海量數(shù)據(jù)不斷增長(zhǎng),臨床數(shù)據(jù)也在不斷增長(zhǎng),一個(gè)精準(zhǔn)醫(yī)學(xué)數(shù)據(jù)中心的建設(shè)就成為了將來(lái)應(yīng)用當(dāng)中的一個(gè)必須的平臺(tái)。我們可以看到最近幾年生物醫(yī)學(xué)數(shù)據(jù)從GB到EB跨了幾個(gè)量,很快就增長(zhǎng)到EB這個(gè)量級(jí)。

咱們看看國(guó)內(nèi)外對(duì)平臺(tái)建設(shè)的情況,在臨床大數(shù)據(jù)方面其實(shí)美國(guó)很早就開(kāi)始在做,像他現(xiàn)在比較有代表性的ClinicalTrials這種臨床醫(yī)學(xué)的平臺(tái)。在生物學(xué)、組學(xué)的數(shù)據(jù)平臺(tái)上,以前國(guó)家一直缺失,大家都很熟悉,美國(guó)、歐洲和日本三個(gè)數(shù)據(jù)是權(quán)威,他們互相之間交流,中國(guó)一直是依賴(lài)三方的,這里面依賴(lài)的時(shí)候,有的時(shí)候不完全能夠一直是免費(fèi)的,比如說(shuō)2007年的時(shí)候產(chǎn)生的地震,將近一個(gè)月的時(shí)候中國(guó)訪(fǎng)問(wèn)不了這三個(gè)數(shù)據(jù)庫(kù),這三個(gè)月對(duì)個(gè)醫(yī)藥界的相關(guān)的工作都受到很大影響。國(guó)內(nèi)一直呼吁建立生物組學(xué)大數(shù)據(jù)中心,直到去年推了一個(gè)平臺(tái),叫BIG這個(gè)平臺(tái),可以說(shuō)在世界組學(xué)范圍內(nèi)有了中國(guó)這么一級(jí)。我們有這樣一個(gè)聯(lián)合平臺(tái),這個(gè)平臺(tái)在國(guó)外已經(jīng)看到雛形了,比如i2b2,咱們國(guó)家還是空白的,相對(duì)來(lái)講可能作為類(lèi)似的是咱們國(guó)家在兒科領(lǐng)域一些小的平臺(tái),總的來(lái)說(shuō)還是一個(gè)空白。

33

所以在精準(zhǔn)醫(yī)學(xué)專(zhuān)項(xiàng)2016年啟動(dòng)的時(shí)候?qū)iT(mén)設(shè)置了精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理共享技術(shù)平臺(tái),要建立這樣一個(gè)平臺(tái),這個(gè)平臺(tái)實(shí)際上還不是一個(gè)面向?qū)?lái)的科學(xué)醫(yī)學(xué)應(yīng)用的平臺(tái),只是說(shuō)把精準(zhǔn)醫(yī)學(xué)專(zhuān)項(xiàng)設(shè)計(jì)好,做90多個(gè)病種相關(guān)的組學(xué)數(shù)據(jù)匯聚到這個(gè)平臺(tái)上來(lái),我們看到的是將來(lái)面向社會(huì)的一個(gè)大平臺(tái)的縮影。

我們這個(gè)平臺(tái)大概是什么模樣?雖然還沒(méi)有上線(xiàn),但是可以大概描述一下。它是在一個(gè)現(xiàn)有的基礎(chǔ)平臺(tái)之上有兩個(gè)數(shù)據(jù)庫(kù)去,一個(gè)是疾病的數(shù)據(jù)庫(kù)群,一個(gè)是基礎(chǔ)組學(xué)的數(shù)據(jù)庫(kù)群。然后需要對(duì)后臺(tái)開(kāi)發(fā)提交的系統(tǒng),所謂數(shù)據(jù)匯交系統(tǒng),對(duì)于前臺(tái)要支持大家的檢索、展示、挖掘等等,屬于一個(gè)門(mén)戶(hù)。

我們這個(gè)項(xiàng)目設(shè)計(jì)的技術(shù)指標(biāo)未來(lái)在2019年或者2020年最終要達(dá)到的技術(shù)指標(biāo),從基礎(chǔ)平臺(tái)存儲(chǔ)來(lái)說(shuō)達(dá)到PB級(jí)的分布式存儲(chǔ),一次查詢(xún)時(shí)間要小于0.5秒,滿(mǎn)足1萬(wàn)人次以上的并發(fā)檢索。在疾病數(shù)據(jù)庫(kù)群這方面要建匯交系統(tǒng)、管理平臺(tái)、協(xié)作平臺(tái),這里要把精準(zhǔn)醫(yī)學(xué)支持的將近90多個(gè)群打包成6個(gè)以上的群。

在基礎(chǔ)組學(xué)數(shù)據(jù)庫(kù),支撐數(shù)據(jù)庫(kù)方面要建立20個(gè)以上的跟醫(yī)學(xué)研究相關(guān)的標(biāo)準(zhǔn)組學(xué)數(shù)據(jù)庫(kù)的鏡像,總量要達(dá)到PB級(jí)。而且我們?cè)谶@里有一個(gè)設(shè)計(jì),基因組學(xué)也好針對(duì)不同的人種是混在一起的,所以我們還要把二次的抽體,涉及到一些明確標(biāo)簽,標(biāo)中中國(guó)人形成中國(guó)標(biāo)準(zhǔn)組學(xué)的參考記錄。在整合與注釋上面要有10個(gè)以上的標(biāo)準(zhǔn)工作流。最后一個(gè)是門(mén)戶(hù)。

項(xiàng)目分解就分成5大塊,最基礎(chǔ)的是基礎(chǔ)平臺(tái),依托國(guó)內(nèi)幾乎生物醫(yī)學(xué)界的比較華麗的平臺(tái)都貢獻(xiàn)給大家去做這樣一個(gè)平臺(tái)。疾病數(shù)據(jù)庫(kù)群是對(duì)接整個(gè)醫(yī)學(xué)專(zhuān)項(xiàng)的,基礎(chǔ)支撐的數(shù)據(jù)庫(kù)群是咱們正在建立國(guó)家生物大數(shù)據(jù)中心,這個(gè)也快上線(xiàn)跟大家見(jiàn)面了。中間是一個(gè)醫(yī)學(xué)的整合和注釋的平臺(tái),最終是面向大家提供一個(gè)醫(yī)學(xué)的黏度。為什么要提供注釋?zhuān)烤褪桥R床整合的數(shù)據(jù)是沒(méi)有參考的,比如說(shuō)一個(gè)突變,是稀有的突變還是很普通的突變?這里面要參考來(lái)說(shuō),是針對(duì)于最早的5個(gè)基因組來(lái)說(shuō)的,還是針對(duì)千人基因組來(lái)說(shuō)還是萬(wàn)人基因組來(lái)說(shuō),如果針對(duì)5個(gè)人來(lái)說(shuō)好像它很稀有,但是如果千人來(lái)說(shuō)可能發(fā)現(xiàn)200人跟他一樣,所以這里面一定要有參比的數(shù)據(jù),你用什么數(shù)據(jù)就決定了整合和注釋這方面的工作量多大。比如說(shuō)要用10萬(wàn)人的數(shù)據(jù)級(jí),全球現(xiàn)在人的情況,但是你相對(duì)起來(lái)用一個(gè)病例就要跟10萬(wàn)人進(jìn)行比較?;A(chǔ)平臺(tái)主要是提供安全可靠高效的PB級(jí)的大數(shù)據(jù)存儲(chǔ)計(jì)算的平臺(tái)。

這是它的基礎(chǔ)架構(gòu),我們這個(gè)平臺(tái)基本上是集IT界的這些時(shí)髦詞語(yǔ)為大成,涉及到基礎(chǔ)設(shè)施建設(shè)、產(chǎn)業(yè)系統(tǒng)、存儲(chǔ)系統(tǒng)、數(shù)據(jù)服務(wù),支撐各種應(yīng)用,這里大家可以看到很多新的技術(shù)都要用起來(lái)。

這里面解決重大問(wèn)題就是超大數(shù)據(jù)處理及服務(wù)能力的基礎(chǔ)平臺(tái)架構(gòu)及技術(shù),這個(gè)肯定是多家放在一起分布式,但是要讓后面應(yīng)用的、開(kāi)發(fā)的感覺(jué)到這實(shí)際上對(duì)他來(lái)說(shuō)是一個(gè)結(jié)構(gòu),一個(gè)平臺(tái)。

疾病這個(gè)數(shù)據(jù)庫(kù)群主要是提供6個(gè)以上的疾病數(shù)據(jù)庫(kù)匯交管理系統(tǒng),這是它的統(tǒng)一架構(gòu),主要是涉及到數(shù)據(jù)整合、關(guān)聯(lián)、查詢(xún)、數(shù)據(jù)庫(kù)建設(shè)方面。

這里它的困難點(diǎn)大家可以想像得到,就是怎么樣統(tǒng)一模型的問(wèn)題,這么多數(shù)據(jù),這么多病種,每個(gè)病種需要關(guān)注的問(wèn)題都不一樣,怎么建設(shè)模型讓大家能夠知道,如果匯交系統(tǒng)定的太狹窄就不能達(dá)到目的。所以這里面怎么來(lái)劃分疾病數(shù)據(jù)庫(kù)群,怎么來(lái)制定相應(yīng)的規(guī)范這是一個(gè)要面對(duì)的困難。

基礎(chǔ)支撐數(shù)據(jù)庫(kù)群這方面咱們有比較好的技術(shù),基因組所、北京大學(xué)他們有很好的基礎(chǔ),這方面應(yīng)該來(lái)說(shuō)瓶頸主要在后面這一步,就是怎么來(lái)把中國(guó)人群相關(guān)的參考數(shù)據(jù)級(jí)專(zhuān)門(mén)抽出來(lái),因?yàn)楝F(xiàn)在有千人基因組、萬(wàn)人基因組,這里面就可以形成相當(dāng)規(guī)模的中國(guó)人組學(xué)數(shù)據(jù),但是現(xiàn)在沒(méi)有看到美國(guó)的奧巴馬有百萬(wàn)人基因組的計(jì)劃,到底這個(gè)樣品采集的方案,但是預(yù)期這里面華人是占到了1/5以上。這是我們要鏡像的數(shù)據(jù)組。

難點(diǎn)就是剛剛說(shuō)的要把中國(guó)人抽出來(lái)。任務(wù)量最大的是中間這一步,就是怎么來(lái)把90個(gè)病種提交數(shù)據(jù),通過(guò)其他的基因組來(lái)注釋出來(lái),因?yàn)樘峤簧蟻?lái)的肯定都是直接測(cè)完的結(jié)果,并沒(méi)有標(biāo)注哪個(gè)地方是基因上的異常,這個(gè)完全靠你這個(gè)注釋平臺(tái)注釋?zhuān)f(shuō)白了要做大規(guī)模的運(yùn)算。

這是整個(gè)的我們?cè)O(shè)計(jì)的一個(gè)架構(gòu),它涉及到從基因組到轉(zhuǎn)錄組、蛋白組一系列的互相注釋?zhuān)麄€(gè)的運(yùn)算數(shù)據(jù)也達(dá)到了PB級(jí)的運(yùn)算,而且現(xiàn)在沒(méi)有任何一個(gè)計(jì)算機(jī)能解決這個(gè)問(wèn)題,肯定要分布式計(jì)算。

最后是面向公眾、面向科學(xué)家,面向醫(yī)生的門(mén)戶(hù),搜索可視化的一個(gè)系統(tǒng),這個(gè)系統(tǒng)最主要的困難就是讓用戶(hù)體驗(yàn)比較好,讓用戶(hù)比較直觀,能夠看到數(shù)據(jù),未來(lái)挖掘深度學(xué)習(xí)能力做一個(gè)接口。這里面其實(shí)也很有挑戰(zhàn),想要做到PB級(jí)的或者萬(wàn)人同時(shí)在線(xiàn)的搜索是相當(dāng)有挑戰(zhàn)的。

我們這個(gè)硬件平臺(tái)資源基本上調(diào)動(dòng)了國(guó)家生物醫(yī)學(xué)界的資源都在里面,最后總共會(huì)聚了70個(gè)PB的資源,超過(guò)500TFLOPS的計(jì)算資源,通過(guò)中科院網(wǎng)絡(luò)信息中心可聚合40PFLOPS超算資源,擁有國(guó)家骨干網(wǎng)和教育科研網(wǎng)接入能力,依托國(guó)家網(wǎng)格實(shí)現(xiàn)高性能計(jì)算專(zhuān)網(wǎng)互聯(lián)。將來(lái)大家的精準(zhǔn)醫(yī)學(xué)整個(gè)專(zhuān)項(xiàng)課題如果靠近這兩個(gè)網(wǎng)絡(luò)主接點(diǎn)的話(huà),可以通過(guò)這兩個(gè)網(wǎng)絡(luò)往北京來(lái)匯交。這是靠國(guó)家網(wǎng)格的能力,能夠存儲(chǔ)50個(gè)P的作為一個(gè)臨時(shí)存儲(chǔ)。

計(jì)算方面主要依托兩個(gè),一個(gè)是北京蛋白質(zhì)中心的200萬(wàn)的高性能計(jì)算機(jī),還有中山大學(xué)的天河二號(hào)有相當(dāng)大的資源,它現(xiàn)在不是最快的,應(yīng)該是全球第二的。北京大學(xué)還有中國(guó)醫(yī)學(xué)科學(xué)院生物技術(shù)研究中心都有一些高性能計(jì)算平臺(tái)。

因?yàn)樵蹅儏⒓雍芏鄬?zhuān)項(xiàng)任務(wù)的都是高校的團(tuán)隊(duì),所以他們通過(guò)教育科研網(wǎng)通過(guò)這種可以把數(shù)據(jù)匯交到北京來(lái)。

現(xiàn)在我們的建設(shè)進(jìn)度因?yàn)閱?dòng)還不到半年,從去年12月啟動(dòng)到現(xiàn)在,我們先搭一個(gè)實(shí)驗(yàn)床,做一個(gè)小的實(shí)驗(yàn)平臺(tái),搭建72個(gè)存儲(chǔ)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)36個(gè)T存儲(chǔ)平臺(tái),我們?cè)谥锌圃壕W(wǎng)絡(luò)中心搭建平臺(tái),通過(guò)這個(gè)平臺(tái)把上面的關(guān)鍵技術(shù)滾出來(lái)。

更重要的是大家可能會(huì)想到說(shuō)現(xiàn)在沒(méi)有數(shù)據(jù),精準(zhǔn)醫(yī)學(xué)專(zhuān)項(xiàng)剛剛開(kāi)始,各個(gè)課題剛啟動(dòng)沒(méi)有數(shù)據(jù),怎么來(lái)說(shuō)你的平臺(tái)將來(lái)能夠負(fù)載TB級(jí)的數(shù)據(jù)?這是有這個(gè)問(wèn)題,所以我們現(xiàn)在正在做的一個(gè)很重要的事情就是建虛擬數(shù)據(jù)級(jí),不能等到大家把數(shù)據(jù)匯交過(guò)來(lái)再做數(shù)據(jù),那是來(lái)不及,所以我們現(xiàn)在是想把能夠代表這兩個(gè)一個(gè)是TCG兩千多個(gè)腫瘤病人的臨床信息,還有ICGC一千多個(gè)腫瘤的臨床數(shù)學(xué),我們把這兩個(gè)數(shù)據(jù)集合在一起虛擬處10萬(wàn)人、20萬(wàn)人、40萬(wàn)人達(dá)到PB級(jí),然后測(cè)試整個(gè)平臺(tái)的能力,而且這個(gè)話(huà)題通過(guò)檢索我們發(fā)現(xiàn)通過(guò)已有的基因組按照一定的遺傳學(xué)規(guī)律給他人工造出多少萬(wàn)人,很少有人去做這個(gè)事,所以我們把這一招運(yùn)用到平臺(tái)建設(shè)上面。

最后暢想一下就是有了這個(gè)數(shù)據(jù)中心將來(lái)對(duì)醫(yī)療有什么用途,有什么支撐作用。我們這里也做了一個(gè)展望,這是我們自己做了一篇文章。就是將來(lái)可能我們暢想一下將來(lái)可能一個(gè)醫(yī)療模式可能是一種基于案例推理,現(xiàn)在大家都談人工智能或什么組學(xué)大數(shù)據(jù)的挖掘分析,實(shí)際上這個(gè)想法是一個(gè)比較理想化的,就是你希望通過(guò)組學(xué)智能分析最后給出一個(gè)規(guī)律來(lái),但是現(xiàn)在這個(gè)抽樣就算你是弄一千人、兩千人的很不得了,但是相對(duì)地球60億人,相對(duì)病種的人是小抽樣,能不能得到規(guī)律是打問(wèn)號(hào)的。而且醫(yī)生很多推理實(shí)際上不一定按照診斷的標(biāo)準(zhǔn)來(lái),也可能按照跟自己既往看的病人回顧,很向往幾年前的病人,實(shí)際上在精準(zhǔn)醫(yī)學(xué)可以走這樣一條路,我們這個(gè)數(shù)據(jù)中心建起來(lái)之后直接可以做案例推理這個(gè)事。這是多組學(xué)的整個(gè)基因組對(duì)基因組,轉(zhuǎn)錄組對(duì)轉(zhuǎn)錄組整個(gè)基因組學(xué)整體的,然后劃分來(lái)分類(lèi)。

而且如果你維持這樣一個(gè)關(guān)系的話(huà),醫(yī)生和醫(yī)生之間可以交流自己的新數(shù)據(jù),比如我增加一個(gè)病人進(jìn)來(lái)然后傳另外一個(gè)ID給另外一個(gè)醫(yī)生,另外一個(gè)醫(yī)生同樣檢測(cè)這個(gè)數(shù)據(jù)庫(kù),大家討論這個(gè)病人出在這個(gè)病例當(dāng)中處在什么位置,但是這是我們想的簡(jiǎn)單的應(yīng)用。

通過(guò)我們自己也做了小的算例,最后發(fā)現(xiàn)計(jì)算量很大,多組學(xué)在一起哪怕幾十個(gè)病例一起做聚類(lèi),這個(gè)計(jì)算量都不是咱們想象的一下能出來(lái),所以未來(lái)如果是真的我們做10萬(wàn)人的參考來(lái)做案例推理,來(lái)做制定的話(huà),對(duì)計(jì)算是一個(gè)很大的挑戰(zhàn)。

最后是一個(gè)關(guān)于運(yùn)營(yíng)的設(shè)想,國(guó)家投這個(gè)錢(qián)投這個(gè)平臺(tái),但是有一個(gè)疑問(wèn),說(shuō)將來(lái)課題結(jié)題了,國(guó)家資助斷了以后國(guó)家熱點(diǎn)就轉(zhuǎn)到其他熱點(diǎn)上,誰(shuí)來(lái)用這個(gè)平臺(tái)?我們也想象一下,就是將來(lái)其實(shí)可以做一個(gè)國(guó)家跟企業(yè)共同運(yùn)營(yíng)的模式。比如說(shuō)這個(gè)平臺(tái)硬件也好,軟件也好還是相當(dāng)?shù)暮馁M(fèi)金錢(qián)的,尤其相關(guān)的企業(yè)進(jìn)來(lái)可以維護(hù)這個(gè)平臺(tái)。然后對(duì)于科研人員來(lái)說(shuō),對(duì)于國(guó)家指定的一些機(jī)構(gòu)永遠(yuǎn)可以是免費(fèi)的,因?yàn)檫@是國(guó)家納稅人的錢(qián)做出來(lái)的數(shù)據(jù),但是可以開(kāi)放一些專(zhuān)業(yè)服務(wù),比如病例的匹配、檢索、病例的比對(duì)這樣的服務(wù),這樣的服務(wù)可以來(lái)支撐產(chǎn)業(yè)方面的運(yùn)營(yíng),然后他們的盈利再回歸到這個(gè)平臺(tái)上,讓這個(gè)平臺(tái)上精準(zhǔn)醫(yī)學(xué)專(zhuān)項(xiàng)收集的這些數(shù)據(jù)能夠一直為咱們的科研醫(yī)療服務(wù),這是我們的一個(gè)設(shè)想,但是因?yàn)楝F(xiàn)在首當(dāng)其沖的是先把平臺(tái)做好。

我大概就講這么多,最后這是我們整個(gè)團(tuán)隊(duì)的一個(gè)心愿,就是希望通過(guò)先進(jìn)的、安全的大數(shù)據(jù)平臺(tái),支撐咱們國(guó)家的精準(zhǔn)醫(yī)學(xué)計(jì)劃,再次感謝大會(huì)的邀請(qǐng),謝謝大家!

分享到

崔歡歡

相關(guān)推薦