端到端支持用友醫(yī)療數據大挖掘
許振新 發(fā)表于:13年05月20日 00:00 [原創(chuàng)] DOIT.com.cn
“2009年開始我們已經開始做Hadoop,當時是作為一個創(chuàng)新主題,看看Hadoop的架構、應用場景是什么。由于當時中國有具體的需求,大數據環(huán)境非常好,并且有電信行業(yè)典型的用戶需求。這都推動我們馬上把Hadoop變成了一個產品來滿足客戶的需求。”苗凱翔博士回憶說。
英特爾中國行業(yè)合作解決方案服務部企業(yè)技術銷售與數據中心咨詢資深經理張哲源表示,正是有了Hadoop的加入,英特爾才能實現“軟硬”的有機組合,構成了英特爾針對大數據應用提供的端到端支持,推動更多的合作伙伴在其上開發(fā)適合行業(yè)需求的大數據解決方案。
端到端支持用友醫(yī)療數據大挖掘
作為英特爾醫(yī)療行業(yè)大數據的重要合作伙伴,用友展示了其基于英特爾平臺的大數據解決方案。用友醫(yī)療衛(wèi)生信息系統有限公司副總裁、用友智慧健康研究院首席專家徐春華介紹, 醫(yī)療行業(yè)和大數據相關的主要有三大領域,也即電子健康檔案、城市級的電子病歷數據中心和衛(wèi)生醫(yī)療相關的統計數據。這三個領域的數據有著共性的特征:海量數據、結構化半結構化并存、版本隨著時間而改變。有鑒于此,用友將大數據技術主要用于三大數據庫的建設上。
“這些領域必須采用大數據處理手段來處理,關鍵要素涉及到兩個:一是通過引入并行計算框架提高整個解決方案的運行性能,到了PB級數據以后,運行時間成為了關鍵參數;二是基于列的數據庫架構,它和傳統的關系型數據庫有很大的差異。”徐春華說。
在過去一年中,用友醫(yī)療和英特爾上海Hadoop團隊開展了深入的合作,采用基于英特爾x86服務器集群+Hadoop綜合解決方案來嘗試處理大型電子健康檔案和區(qū)域性的醫(yī)療質量分析。目前從運轉情況來看效果非常理想。
在醫(yī)療行業(yè),用友采用的計算架構有三類:x86服務器、小型機、大型主機。談到大數據領域用友為什么會選擇x86集群?徐春華表示,傳統做計算架構或者存儲架構的時候,經常要考慮3年到5年的存儲量。但這樣往往存在著大量的浪費,因為剛開始往往用不到那么大的量。而英特爾提倡的橫向擴展模式,可以根據業(yè)務的規(guī)模而隨時增加計算和存儲能力,這是用友和用友的客戶非常樂于接受的一種模式。