軍事醫(yī)學(xué)科學(xué)院數(shù)據(jù)中心主任趙東升
隨著新一代高通量測序技術(shù)、醫(yī)學(xué)影像技術(shù)的發(fā)展,產(chǎn)生的海量數(shù)據(jù)為醫(yī)學(xué)信息處理帶來新的機遇和挑戰(zhàn)。如何對數(shù)據(jù)進行科學(xué)的搜集、管理、挖掘、注釋已經(jīng)成為醫(yī)學(xué)信息處理研究的熱點,同時要考慮如何以更低的成本,更高效地完成大量的數(shù)據(jù)分析處理。
普通的數(shù)據(jù)分析工具面對當(dāng)今的海量數(shù)據(jù)已經(jīng)力不從心,迫切需要采用新的數(shù)據(jù)分析引擎。
開源的Hadoop已經(jīng)在過去五年之中證明了自己是市場中最成功的數(shù)據(jù)處理平臺之一。Gartner和IDC的分析師認為海量數(shù)據(jù)的處理速度和處理各種數(shù)據(jù)的能力都是Hadoop吸引人們的地方。
Hadoop模仿和實現(xiàn)了google云計算的主要技術(shù),是目前最知名的云計算開源系統(tǒng)。特別適用于使用簡單計算模型的集群處理大規(guī)模數(shù)據(jù)集。