中國醫(yī)學(xué)科學(xué)院信息中心主任何毅
在下午的大數(shù)據(jù)助力智慧醫(yī)療發(fā)展論壇上,中國醫(yī)學(xué)科學(xué)院信息中心主任何毅發(fā)表了名為《從國家人口與健康科學(xué)數(shù)據(jù)共享看醫(yī)療大數(shù)據(jù)》的主題演講。何毅談及了國家人口與健康科學(xué)數(shù)據(jù)共享平臺中對異構(gòu)型數(shù)據(jù)包括數(shù)據(jù)融合和大數(shù)據(jù)的處理方式,并從數(shù)據(jù)組織和規(guī)劃,數(shù)據(jù)共享和所取得的進(jìn)展三方面給出了詳細(xì)的介紹。
何毅表示這個(gè)人口健康平臺已建立了統(tǒng)一身份認(rèn)證,包括統(tǒng)一機(jī)構(gòu)的身份認(rèn)證,密鑰中心,基于各個(gè)不同應(yīng)用之間互通的電子簽章,能夠?qū)崿F(xiàn)總中心和分中心的知識檢索,精準(zhǔn)醫(yī)學(xué)的WEB server檢索。下一步計(jì)劃就是在人口健康平臺上做一個(gè)測評中心,基于現(xiàn)有技術(shù)構(gòu)架和技術(shù)標(biāo)準(zhǔn)包括元數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)元標(biāo)準(zhǔn)構(gòu)建,生成的數(shù)據(jù)和提交的數(shù)據(jù),包括臨床的數(shù)據(jù),都會按照標(biāo)準(zhǔn)來進(jìn)行評測。
以下為何毅的演講實(shí)錄:
大家下午好,我今天跟大家分享一下我們從2005年就開始做了一件事情,這件事情就是2005年可能更早,科技部當(dāng)時(shí)感覺到要借力全國的科學(xué)數(shù)據(jù)共享,大家做了那么多科研項(xiàng)目都鎖在柜子里了,包括一些科研項(xiàng)目都是重復(fù)的進(jìn)行建設(shè),這樣就浪費(fèi)資源,科技部就開始抓這個(gè)事情。到了衛(wèi)生系統(tǒng),科技部門我們中國醫(yī)學(xué)科學(xué)院劉院長受衛(wèi)生部的委托,現(xiàn)在是衛(wèi)生計(jì)生委,來代表全國的衛(wèi)生系統(tǒng)參加科學(xué)數(shù)據(jù)共享,現(xiàn)在這個(gè)已經(jīng)是正式運(yùn)行了,就是國家人口與健康科學(xué)數(shù)據(jù)共享平臺,這里面提供很多的一些科學(xué)的數(shù)據(jù),包括臨床的數(shù)據(jù),包括研究的很多方面的數(shù)據(jù),我們這個(gè)中心現(xiàn)在是有很多的分中心,包括地方節(jié)點(diǎn)來構(gòu)成。
我們這個(gè)中心具體本人在這兒主要是干IT技術(shù)支撐的,在這一塊就把我們做的一些體會主要是給一些IT的同志來一些分享。我們在這塊覺得有意義的是告訴大家對于一個(gè)異構(gòu)的、分散的系統(tǒng)的信息的共享、融合,也就是緊貼著大數(shù)據(jù),怎么辦?怎么處理它,我們提供一些方法、思路和經(jīng)驗(yàn)。
第一,談到異構(gòu)性的數(shù)據(jù)的時(shí)候,包括數(shù)據(jù)的融合的時(shí)候,大數(shù)據(jù)的時(shí)候,首先一個(gè)問題就是這些數(shù)據(jù)如何組織,如何規(guī)劃?這就歸結(jié)到數(shù)據(jù)資源的建設(shè)問題。
第二,數(shù)據(jù)如何共享?大數(shù)據(jù)建設(shè),這里面可能要牽扯到一些技術(shù)手段。
第三,我們現(xiàn)在中心已經(jīng)在這個(gè)平臺上做了哪些事情,這些事情我們覺得比較有意義。
一、數(shù)據(jù)如何組織?如何規(guī)劃。
國家人口健康是一項(xiàng)十分復(fù)雜龐大的工程,涉及到醫(yī)療衛(wèi)生各個(gè)方方面面,需要權(quán)威的資源、單位、數(shù)據(jù),建立醫(yī)療衛(wèi)生領(lǐng)域規(guī)范化的數(shù)據(jù),這種規(guī)范化的數(shù)據(jù)我們把它定位成一級的原數(shù)據(jù),原數(shù)據(jù)就是數(shù)據(jù)的數(shù)據(jù),我們一般的把它理解為數(shù)據(jù)的標(biāo)簽。對于這些數(shù)據(jù)你要說明的東西,怎么去描述它?所以我們叫原數(shù)據(jù),它是數(shù)據(jù)的數(shù)據(jù)。要把一些異構(gòu)的內(nèi)容,所謂異構(gòu)就是建的時(shí)代和各個(gè)HIS都不一樣,把這些叫異構(gòu)的系統(tǒng),異構(gòu)的系統(tǒng)跟數(shù)據(jù)產(chǎn)生的時(shí)候都是在各家自己內(nèi)部定義的,這種怎么辦?我們要跨出這個(gè)園區(qū),院和院之間,各種不同單位之間要共享,首先在雁數(shù)據(jù)這塊我們可以做工作,原數(shù)據(jù)就是數(shù)據(jù)的數(shù)據(jù),在這方面我們做了很多的工作。具體的元數(shù)據(jù)它的作用我就不講了,可能很多同志都知道。它主要是對定義數(shù)據(jù)的對象包括數(shù)據(jù)的性質(zhì),是對信息的一個(gè)性質(zhì)的定義。
現(xiàn)在國家人口健康有這樣一個(gè)構(gòu)成,我們有這樣一些分中心,包括總中心,各個(gè)分中心提供他們基礎(chǔ)的數(shù)據(jù),我們在元數(shù)據(jù)這一塊是共享的。我們說一個(gè)詞一個(gè)字,大家都是相互呼應(yīng)的,都是能找到的,這就是干這個(gè)事的第一個(gè)意義。
二、數(shù)據(jù)如何共享?
那么元數(shù)據(jù)建設(shè)好了以后要實(shí)現(xiàn)數(shù)據(jù)共享又要干什么呢?數(shù)據(jù)共享要解決的問題除了定義以外,我們IT怎么定義支撐,我們要解決這個(gè),包括信息怎么利用它,怎么檢索它。我們發(fā)現(xiàn)經(jīng)過這十多年的跟蹤,對于異構(gòu)的數(shù)據(jù),把原始的數(shù)據(jù)產(chǎn)生單位推倒重來重新定義數(shù)據(jù)是不可能的,因?yàn)槿祟愒籍a(chǎn)生的很多數(shù)據(jù)都是在沒有你的科學(xué)數(shù)據(jù)共享之前人家就有數(shù)據(jù),這些數(shù)據(jù)只有他們自己知道,我們就要解決這個(gè)問題怎么辦?我們首先要把數(shù)據(jù)和數(shù)據(jù)之間的關(guān)系怎么表達(dá)?包括元數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系一定要表達(dá)出來,這就一定要有一個(gè)本體數(shù)據(jù)的架構(gòu)意識。就是說我們把不同專業(yè)的,各種各樣的專業(yè),我們按照一個(gè)數(shù)據(jù)的架構(gòu)整體的描述出來,這都要引用到數(shù)據(jù)的本體服務(wù),這是我們要做的第二件事情。
做完了本體服務(wù)以后是不是又能夠用了呢?后來又發(fā)現(xiàn)對于數(shù)據(jù)的基本量,把數(shù)據(jù)的基本例子,數(shù)據(jù)的基本單位,如果你把這個(gè)地方定義好了以后,大家對一個(gè)事情的基本量,這樣就好度量,包括好標(biāo)準(zhǔn)化,如果是一個(gè)基本元素都定義不清楚的話,大家共享起來就很麻煩。要定義一個(gè)數(shù)據(jù)的基本單位這里面怎么辦?就要應(yīng)用一個(gè)數(shù)據(jù)概念,這里不是元數(shù)據(jù),而是數(shù)據(jù)元,數(shù)據(jù)元指的是數(shù)據(jù)的最小顆粒,我們要實(shí)現(xiàn)共享,我們的數(shù)據(jù)要形成有意義的集合的時(shí)候,除了要做標(biāo)準(zhǔn)化,還要做數(shù)據(jù)元,做數(shù)據(jù)的最小化的度量。這樣的話我們才能夠把我們的一些在分散于各個(gè)不同的醫(yī)院的,各個(gè)不同的臨床的,各個(gè)不同的單位的這些內(nèi)容集合起來。我們說一個(gè)醫(yī)學(xué)術(shù)語的時(shí)候,大家不但說話的聲音是一致的,而且我們在數(shù)據(jù)表示的最基本的顆粒那塊,在它的基本代碼那個(gè)地方也是一致的,你這樣才能有意義,這就是我們要做的第三件事情,就是說數(shù)據(jù)元的最基本的量化問題。
數(shù)據(jù)元這塊量化以后我們還發(fā)現(xiàn)除了有這個(gè),我們要在異構(gòu)性的、復(fù)雜的、跨庫的數(shù)據(jù)的時(shí)候,檢索怎么辦?我們就一定要有一個(gè)推送式的分散式的跨庫檢索,而且這種數(shù)據(jù)檢索一定要有真實(shí)性、權(quán)威性,不能說這個(gè)數(shù)據(jù)提交上來以后明天再把那個(gè)數(shù)據(jù)改變了,別人就沒法兒引用,這就是我們說數(shù)據(jù)跨庫的檢索以及數(shù)據(jù)的真實(shí)性、安全性的問題。這個(gè)問題后來顯得尤為重要,比方說我們在魏則西事件,主要就是數(shù)據(jù)提供的質(zhì)量有問題,或者是數(shù)據(jù)的真實(shí)性有問題,這樣的話就是給我們也進(jìn)行了提醒。就是你的數(shù)據(jù)怎么能夠在共享的時(shí)候要做到真實(shí)性、可靠性,這也是我們要特別關(guān)注的,要解決的一些問題。在技術(shù)上我們是用了HL7這個(gè)技術(shù),我們對各位提供的數(shù)據(jù)資源的各個(gè)分中心都進(jìn)行資源的提供數(shù)據(jù)的認(rèn)證,你提供這個(gè)數(shù)據(jù),我們之間以前有認(rèn)證關(guān)系,而且你提交的數(shù)據(jù)以后也是抵賴不掉的,這些我們是采用了這樣一些技術(shù)來對于數(shù)據(jù)的檢索和數(shù)據(jù)的安全來進(jìn)行一些處理。
最后我們還要考慮到數(shù)據(jù)除了它的安全,還要解決數(shù)據(jù)在全生命周期的安全性,包括數(shù)據(jù)的隱私。有些我們說的數(shù)據(jù)提交上來以后還是希望你把患者各方面的信息省去,包括有一些數(shù)據(jù)提交上來的時(shí)候是在一定范圍內(nèi)知道,比如說醫(yī)保信息,它不宜全公開,這些情況我們又應(yīng)該怎么辦?如果我們是在自己的一個(gè)獨(dú)立的園區(qū),獨(dú)立的封閉的系統(tǒng),那這些問題相對容易一些,特別是對于這種跨庫的異構(gòu)的系統(tǒng)的時(shí)候,而且是基于互聯(lián)網(wǎng)的時(shí)候,我們要對這種信息特別加以關(guān)注。我們考慮到除了用戶的身份要進(jìn)行認(rèn)證,用戶的提交單位、數(shù)據(jù)單位要進(jìn)行認(rèn)證,包括還有用戶特別重要的信息提交的線路上還要進(jìn)行加密。對于身份、統(tǒng)一認(rèn)證這些我們都進(jìn)行了一些考慮。
最后我借用在去年的時(shí)候我們申報(bào)國家大數(shù)據(jù)的片子,只有這樣處理這樣的片子的時(shí)候才構(gòu)成大數(shù)據(jù)的基本框架,因?yàn)槲覀円呀?jīng)解決了分散性的異構(gòu)的這些元數(shù)據(jù)和數(shù)據(jù)元這樣相互的數(shù)據(jù)標(biāo)準(zhǔn),包括它的技術(shù)架構(gòu),包括它的檢索,那么我們只有這樣以后才能說我們的數(shù)據(jù)是基于互聯(lián)網(wǎng)的,能夠形成大數(shù)據(jù)。基于互聯(lián)網(wǎng)和形成大數(shù)據(jù)這是相輔相成的,大數(shù)據(jù)一定是基于互聯(lián)網(wǎng)的,互聯(lián)網(wǎng)也構(gòu)造了大數(shù)據(jù)的基本要素。這樣來看要構(gòu)成一個(gè)大數(shù)據(jù),包括科學(xué)數(shù)據(jù)共享,那么我們說剛才提到一定要處理異構(gòu)的不同機(jī)構(gòu)的,單位的建設(shè)時(shí)期是不一致的,參差不齊的這種建設(shè)系統(tǒng)的他們的老數(shù)據(jù)和已有數(shù)據(jù)怎么能夠融合在一起,我們就是解決這樣的問題。這樣的手段我們還是基于互聯(lián)網(wǎng)的,我們所采用一系列的技術(shù)都是基于互聯(lián)網(wǎng),所以我們數(shù)據(jù)的交換、處理、各種各樣的標(biāo)準(zhǔn)都是基于互聯(lián)網(wǎng)的,都是基于現(xiàn)在采用的基本數(shù)據(jù)標(biāo)準(zhǔn)和IT的技術(shù)標(biāo)準(zhǔn),都是引進(jìn)吸收和消化了HL7,就是衛(wèi)生的基本信息標(biāo)準(zhǔn)來實(shí)現(xiàn)的。這樣的話我們也跟國家衛(wèi)生計(jì)生委和相關(guān)的單位進(jìn)行了探討,我們認(rèn)為這樣的一條路是構(gòu)成我們國家以后的醫(yī)療大數(shù)據(jù)的一個(gè)基本框架。
在這里供大家分享一下我們現(xiàn)在在這一套系統(tǒng)已經(jīng)建立了一個(gè)統(tǒng)一身份認(rèn)證,包括統(tǒng)一機(jī)構(gòu)的身份認(rèn)證,包括密鑰中心,包括基于各個(gè)不同應(yīng)用的電子簽章,就在各個(gè)不同應(yīng)用之間的互通的電子簽章。包括總中心和分中心的知識檢索,包括元精準(zhǔn)醫(yī)學(xué)的WEB server檢索,這些現(xiàn)在在我們的人口健康平臺都已經(jīng)實(shí)現(xiàn)了。下一步我們的計(jì)劃就是說在我們?nèi)丝诮】灯脚_上做一個(gè)測評中心,所有按照我們這樣的技術(shù)構(gòu)架和技術(shù)標(biāo)準(zhǔn)包括元數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)元標(biāo)準(zhǔn)構(gòu)建的生成的數(shù)據(jù)和提交的數(shù)據(jù),包括臨床的數(shù)據(jù),都按照我們的標(biāo)準(zhǔn)來進(jìn)行評測。評測以后它就可以順暢的跟我們?nèi)跒橐惑w,以后就構(gòu)成了我們國家的一個(gè)基本的大數(shù)據(jù)骨干的核心研發(fā)和評測的基本基地。這個(gè)工作一直不斷地在持續(xù)進(jìn)行當(dāng)中,整體情況就是這樣,我們把我們的一些工作跟大家進(jìn)行一些分享,謝謝大家!