什么是非關(guān)鍵業(yè)務(wù)數(shù)據(jù)?
第一是以溝通為中心,主要是以溝通消息為主。溝通過程中會形成一些記錄或者是一些結(jié)果出來,這些結(jié)果會保存在各個郵件系統(tǒng),但是以人為中心的時候,企業(yè)中的用戶,他們會寫一些文件或者是做一些文檔,往往以共享、協(xié)同或者是搜索來去做的事情。這個時候文件實際上在個人電腦或者在服務(wù)器上面,比如說共享服務(wù)器或者是其他一些地方或者是郵件,從郵件把附件找出來,對文件進行編輯。第三,就是傳統(tǒng)以業(yè)務(wù)為中心,比如說ERP、CRM客戶關(guān)系系統(tǒng)或者是供應(yīng)鏈系統(tǒng)包括很多合同,面向結(jié)構(gòu)化的數(shù)據(jù),這個時候需要登錄業(yè)務(wù)系統(tǒng)或者是新找到一個銷售客戶,需要把信息登錄上去,電話或者是地址各種信息登錄上去,信息最終保存到業(yè)務(wù)系統(tǒng)當(dāng)中去了。這里的主要目標(biāo)就是非關(guān)鍵業(yè)務(wù),更多是文件或者是文檔,或者是半結(jié)構(gòu)化、結(jié)構(gòu)化、非結(jié)構(gòu)化的結(jié)構(gòu)存在的,我們可以看到溝通和以人為中心的時候,各個之間是要交互的,實際上數(shù)據(jù)最終是分散的,比如存在郵件、即時通訊、OA,存在各個地方去了。早期我們企業(yè)說白了是以結(jié)構(gòu)化應(yīng)用數(shù)據(jù),以業(yè)務(wù)性為中心的時候,對數(shù)據(jù)關(guān)注度不夠,第一個分散很難管,第二個這個數(shù)據(jù)量相當(dāng)大,結(jié)構(gòu)化應(yīng)用顆粒度相對小,比如盤陣和塊存儲來存儲,幾個T就可以搞定。但是如果集中去存這些非結(jié)構(gòu)化,非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的時候,它的顆粒度相對要大,難于管理,而且沒有一定的邏輯,往往是跟人相關(guān)或者是跟溝通相關(guān)。企業(yè)非關(guān)鍵業(yè)務(wù)往往是在零散的存儲、分散性的存儲,如果說隨著新的第二存儲,分布式存儲、對象存儲成熟以后,企業(yè)會考慮到把分散的數(shù)據(jù)存到分布式或者對象上面去。這時會產(chǎn)生新的業(yè)態(tài),怎么樣把溝通為中心的應(yīng)用或者以人為中心的應(yīng)用,甚至是以業(yè)務(wù)中心為應(yīng)用這些非結(jié)構(gòu)化,非關(guān)鍵性的數(shù)據(jù)怎么能夠存到對象和分布式,這是數(shù)據(jù)在其中的表現(xiàn)形式一個簡單的分析。第二存儲的應(yīng)用場景在不斷擴大傳統(tǒng)的塊和文件市場在下降,分布式增長很快,比例不多說了。第二存儲應(yīng)用場景也在不斷擴大,剛才梁總談到了數(shù)據(jù)保護、數(shù)據(jù)備份、數(shù)據(jù)存儲,包括逐漸延展到數(shù)據(jù)管理,數(shù)據(jù)管理和數(shù)據(jù)存儲是兩層關(guān)系,它倆之間從技術(shù)視角來看沒有絕對的關(guān)聯(lián)性,還有從共享、數(shù)據(jù)分析、數(shù)據(jù)安全領(lǐng)域。
從傳統(tǒng)分布式存儲、對象存儲、第二存儲,以存儲保護和備份的場景主要延展到管理共享和分析,我們先看看管理。所謂談到管理一定有集中的概念,怎么能夠管得住。第二非結(jié)構(gòu)化數(shù)據(jù)或者非關(guān)鍵業(yè)務(wù)數(shù)據(jù)更強調(diào)共享。共享剛剛談到了,我在郵件里面發(fā)給別人,別人在郵件里面接收,如果在企業(yè)微信或者是即時通訊工具共享數(shù)據(jù)的時候,只能在這里做,或者在個人電腦做或者是其他的方式去做。這個時候共享的能力僅僅局限于文件本身,共享的通道和入口是很零散的過程,共享并不是很方便。既然這個非結(jié)構(gòu)化的數(shù)據(jù)價值出來以后一定是在存儲集中完成以后,能夠?qū)蚕砟芰υ偃ネ诰騼r值。比如說是不是基于合同優(yōu)化過程包括供應(yīng)鏈過程,是不是能夠把文件快速發(fā)送出去或者共享出去,這就是在分析過程中,包括數(shù)據(jù)安全,數(shù)據(jù)安全除了數(shù)據(jù)備份和保護,在結(jié)構(gòu)化應(yīng)用包括容器方面,從應(yīng)用視角來看,非結(jié)構(gòu)化數(shù)據(jù)備份是一個很復(fù)雜的事情。比如,企業(yè)有一萬員工,備份5000員工個人PC數(shù)據(jù),這就是很復(fù)雜的事,不單單是存儲,一個PB的存儲。第二個還有網(wǎng)絡(luò),第三個用什么樣的軟件來存,如果是傳統(tǒng)的NBU來做,那個成本一個點要三百塊錢的話,5000個人就是150萬,企業(yè)很難推行,是不是有新的方法幫助客戶完成個人數(shù)據(jù),甚至是應(yīng)用中的一些非結(jié)構(gòu)化數(shù)據(jù)備份能力?
從場景來看怎么樣有新的場景和新的方法。協(xié)議互通、EC、重刪壓縮、高密、全閃、內(nèi)置搜索引擎等技術(shù)達成極致效率是分布式存儲的核心競爭力。軟硬件深度配合,云上云下協(xié)同,實現(xiàn)極致性能和智能管理成為分布式存儲發(fā)展的重要趨勢。
應(yīng)用融合提供的是數(shù)據(jù)服務(wù)橋梁一定是數(shù)據(jù)服務(wù)的概念,數(shù)據(jù)服務(wù)應(yīng)該為應(yīng)用能夠提供服務(wù)這樣一個能力。從及時性能和智能管理應(yīng)該成為分布式發(fā)展重要趨勢,結(jié)合所有分布式或者說對象核心競爭力發(fā)展趨勢會影響到整個非關(guān)鍵業(yè)務(wù)數(shù)據(jù)管理能力。換句話說,第二存儲是基礎(chǔ),這個基礎(chǔ)打的牢靠,后面才有可能做這件事情。
如何提升非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的價值?
提升非關(guān)鍵業(yè)務(wù)數(shù)據(jù)價值,首先數(shù)據(jù)要有價值,第一,企業(yè)逐漸向互聯(lián)網(wǎng)轉(zhuǎn)型,數(shù)字化轉(zhuǎn)型或者是互聯(lián)網(wǎng)轉(zhuǎn)型,這種傳統(tǒng)的應(yīng)用模式,數(shù)據(jù)庫加存儲。制造業(yè)里,現(xiàn)在推電商賣空調(diào),開店要借很多的服務(wù)器,不管是公有云資源還是私有云的服務(wù)器,借大量的服務(wù)器來做業(yè)務(wù)形態(tài),如果是傳統(tǒng)模式來看,比如原來應(yīng)用可能支持內(nèi)部用戶就一萬人企業(yè),只能支持一萬人企業(yè),應(yīng)用形態(tài)是能夠定義出來的,比如說需要十臺服務(wù)器,需要多少存儲,需要多少備份,是可以算出來的。但是在互聯(lián)網(wǎng)行業(yè)里面,尤其是做手機銀行,大部分建手機銀行,這種形態(tài)來看用戶數(shù)是不確定的,這個時候怎么搭建應(yīng)用平臺,這是需要反反復(fù)復(fù)思考的問題。
第二,分布式存儲解決了海量數(shù)據(jù)的存儲問題,但企業(yè)如何解決數(shù)據(jù)管理的問題,管理就包含很多剛剛談到的共享、分析甚至以后的備份,新的備份問題怎么去做。第三個數(shù)據(jù)安全、合規(guī),以前結(jié)構(gòu)化應(yīng)用很多方法在保護它的安全甚至保護合規(guī),但是非結(jié)構(gòu)化應(yīng)用,如果用傳統(tǒng)方式來做那個代價太高昂,對于非關(guān)鍵業(yè)務(wù)數(shù)據(jù)本身的價值來說,可能企業(yè)也做不起,我們需要用新的方法來迎合數(shù)據(jù)安全和合規(guī)的問題從這三個點來看,剛剛談到企業(yè)的價值要和傳統(tǒng)做結(jié)構(gòu)化運營有一定的轉(zhuǎn)化轉(zhuǎn)型。從金融行業(yè)、制造業(yè)、醫(yī)療行業(yè),這三個行業(yè)里面找了一些典型的應(yīng)用,我們先看一下,金融行業(yè)里面做的文件數(shù)據(jù)管控。金融行業(yè)相對來說也算走得比較快,大規(guī)模完成了信息化平臺建設(shè),比如像OA、郵件反反復(fù)復(fù)更新好幾輪了,包括以企業(yè)微信、釘釘?shù)纫沧呦蛄似髽I(yè)的平臺化。第二可能從門戶角度,剛剛談到了OA,包括生產(chǎn)應(yīng)用、安全,包括第三方接口都做了很多場景建設(shè)。
如果企業(yè)以前大規(guī)模自己開發(fā)了一些,即時通信軟件,但是效果不是特別好,企業(yè)微信走到金融客戶以后,它有一個訴求。第一,所有這些數(shù)據(jù)應(yīng)該是能夠通過企業(yè)微信快速轉(zhuǎn)發(fā)或共享;第二,所有這些數(shù)據(jù)保存,比如說移動端不能落到本地,剛剛談到數(shù)據(jù)安全,不能夠落在本地,也就是手機端不能存文件只能看。第三個這個數(shù)據(jù)必須落在企業(yè)內(nèi)部,一方面引入了公有云服務(wù),這也是一個趨勢,以后應(yīng)用會逐漸地用到公有云的SaaS服務(wù),突破口就在移動即時通訊工具,企業(yè)微信這個突破口,這個數(shù)據(jù)要保存內(nèi)部,同時應(yīng)用是互聯(lián)網(wǎng)化的SaaS服務(wù),這是第三個訴求。第四,所有在企業(yè)內(nèi)部安全部署都要走DIM,要符合安全管理一套策略,數(shù)據(jù)的流轉(zhuǎn)包括中間痕跡跟蹤都要做明確。
同時企業(yè)生產(chǎn)應(yīng)用接口,ERP的生產(chǎn)或者類似合同管理、合規(guī)性管理,類似所有的入口都應(yīng)該希望能夠共享互聯(lián)互通。以前企業(yè)要做內(nèi)審的時候,其他的應(yīng)用要導(dǎo)出多少文件以后做內(nèi)審檢查?,F(xiàn)在來看,是不是內(nèi)審系統(tǒng)直接看到所有權(quán)限或者允許做的檢查的事情,這是從用戶文件管理場景需求。第二個很大的一個訴求來自于員工,金融行業(yè)桌面云或者是系統(tǒng)化更多在研發(fā)領(lǐng)域比較多,真正在辦公行業(yè)還是以個人電腦,就是純物理機方式,筆記本的方式,甚至有的企業(yè)出現(xiàn)了平板電腦。也就是說,員工以前開會找數(shù)據(jù),領(lǐng)導(dǎo)跟你要數(shù)據(jù)都得從自己的電腦找,甚至從部門去找,這個面臨一個問題,既然有一定價值就要考慮備份的問題,通過評估一套傳統(tǒng)方式備份代價太高了。換句話說,幾萬人梳理出核心員工也有大幾千人,這些人的備份就是很困難的事情。第三,我們企業(yè)這些應(yīng)用要打通,以前我們結(jié)構(gòu)化應(yīng)用靠傳統(tǒng)方式去做是可以的,但是非結(jié)構(gòu)化數(shù)據(jù)怎么打通?我們把這種文件作為一個應(yīng)用附件,它本身并不參與到客戶應(yīng)用流程中去,它提供的是什么?共享的能力,因為我本身也是做應(yīng)用出身的,其實對于應(yīng)用來講,它最喜歡什么事情?首先第一個不用關(guān)注存儲存在哪里,第二個存儲權(quán)限管理信息或者是數(shù)據(jù)管理信息是能夠被我所用,我只要用它就可以,因為我上面有一套邏輯,每個應(yīng)用都有業(yè)務(wù)邏輯的概念。視角和關(guān)注度放在邏輯角度來看,按照需求隨機取所需要的數(shù)據(jù),能夠提供共享,權(quán)限管理甚至是安全的管理,這就夠了。通過這樣一種方式,我們幫助客戶建立這樣的數(shù)據(jù)服務(wù)平臺,比如說提供共享的能力,包括一些版本能力,包括權(quán)限管理能力,包括一些用戶管理的統(tǒng)計報表,還有一些搜索的東西。
非結(jié)構(gòu)化數(shù)據(jù)管理價值第一點是搜索,能夠幫助用戶快速找到這個數(shù)據(jù),以前我們說找數(shù)據(jù)只能從自己的電腦去找,甚至去郵件里面去找,現(xiàn)在是不是在微信里面,企業(yè)微信就可以找到這個文件,這個文件有可能在郵件系統(tǒng),我能不能找到郵件。我們通過這樣一層數(shù)據(jù)服務(wù)的能力,通過跟企業(yè)應(yīng)用來做橋梁,相當(dāng)于中間是一個橋梁,把各個應(yīng)用之間的數(shù)據(jù)匯總到數(shù)據(jù)服務(wù)平臺,通過數(shù)據(jù)服務(wù)平臺給企業(yè)應(yīng)用提供數(shù)據(jù)共享、數(shù)據(jù)權(quán)限管理,數(shù)據(jù)安全管理。這樣的話,企業(yè)的應(yīng)用關(guān)注點在于怎么樣做好自己的應(yīng)用,這是在金融行業(yè)企業(yè)應(yīng)用需求、場景需求包括解決方案。我們再看一下金融互聯(lián)網(wǎng)業(yè)務(wù)數(shù)據(jù)管理案例分享,這是更細分的事情。金融行業(yè)如果說做手機銀行,手機銀行做會員交易,以前開戶是在柜臺開,在營業(yè)廳開是可以的,因為都是排隊,這個系統(tǒng)的壓力可以算出來,根據(jù)一天開多少個通道,一共有多少個營業(yè)廳,多少分行或者是支行,有多少營業(yè)所可以算出來,這個應(yīng)用到底需要多大的能力,我可以讓他排隊。但是在手機銀行或者是銀行開發(fā)了很多互聯(lián)網(wǎng)業(yè)務(wù),比如說開飯票或者是聚餐,互聯(lián)網(wǎng)業(yè)務(wù)的時候,它的客戶群體會變得很模糊,像一些股份制銀行,保守估計客戶群體應(yīng)該在幾千萬,我們的應(yīng)用數(shù)據(jù)跟著它做幾千萬,這肯定是不可行的。一定回到技術(shù)傳統(tǒng)方式,我們說把應(yīng)用和數(shù)據(jù)分開,應(yīng)用要做業(yè)務(wù)邏輯,比如說從用戶的認證,比如說從一個APP進去之后,比如說找一個賬單或者找一個飯票,進入飯票業(yè)務(wù)或者是電影票業(yè)務(wù),打印什么什么東西,下載電影票的票根或者是票據(jù),真正生成單據(jù)的時候是可以拍照截圖,這些都是應(yīng)用邏輯做的事情。但是存在里面的交易中間形成的圖片或者是文件,我們是不是可以放在存儲上面去,對于銀行客戶來說,一定要把存儲放在內(nèi)部,這是核心和基本要求。在企業(yè)里面來看,我們能夠把一個應(yīng)用和數(shù)據(jù)的通道打通分開,分開以后讓應(yīng)用走應(yīng)用的邏輯,比如后面都是做結(jié)構(gòu)化的處理,真正的用戶通過本身的客戶端包括移動的應(yīng)用,包括PC的應(yīng)用,可以直接存儲。把存儲暴露到互聯(lián)網(wǎng)當(dāng)中,里面一定有很多控制的邏輯,包括傳統(tǒng)ATB協(xié)議可以提供簽名驗證,還可以提供時效,各種各樣的問題都會出來了,我們通過這種方法的解決降低用戶在手機業(yè)務(wù)、手機銀行或者是互聯(lián)網(wǎng)業(yè)務(wù)的硬投入,硬投入對于企業(yè)來講根據(jù)算產(chǎn)值和模式算出來的,一定是有新的方法或者是比較好的解決方法,幫助用戶解決同時滿足互聯(lián)網(wǎng)業(yè)務(wù)場景,同時又解決安全問題,這是需要更多考慮的一個場景,這就是一個應(yīng)用與數(shù)據(jù)分離的場景。應(yīng)用和數(shù)據(jù)非結(jié)構(gòu)化和非關(guān)鍵業(yè)務(wù)來說,這種數(shù)據(jù)分離場景會越來越多,而且以后對于用戶來講,如果用戶的應(yīng)用和數(shù)據(jù)分開以后,應(yīng)用選擇面會更廣。
我們說重應(yīng)用在企業(yè)中逐漸會變成SaaS應(yīng)用,為什么?只要數(shù)據(jù)和應(yīng)用能夠分開,選擇會更容易,如果這個應(yīng)用不好用,可能要換一家,發(fā)展方向還是有很多問題。從場景來看結(jié)果來看,應(yīng)用會越來越輕,數(shù)據(jù)會越來越重。我們再看一下制造業(yè),制造業(yè)比金融業(yè)慢一個節(jié)奏,因為它的應(yīng)用,信息化建設(shè)角度來說還是一個,雖然做了虛擬化,只是虛擬化的煙囪而已,以前是物理的煙囪,現(xiàn)在是虛擬化的煙囪而已。它的訴求很明顯,有幾百套共享服務(wù)器,部門甚至以項目組都申請了一個20個T或者是幾百個T的共享服務(wù),這種共享服務(wù)對于企業(yè)來講,企業(yè)以前的存儲主要是塊,文件后來出現(xiàn)一些包括對象。隨著對象存儲這種分布式存儲逐漸這種價格,包括技術(shù)成熟度逐漸上來以后,會考慮到是不是能夠用分布式存儲和對象存儲,來解決大規(guī)模散布在幾百臺數(shù)量NAS或共享塊存儲。這樣的話,第一個降低了管理復(fù)雜度,因為以前最痛苦的就是換盤,第二個這個內(nèi)部用戶需要一臺共享服務(wù)器,因為對制造業(yè)來說,內(nèi)部的IT有很強的管控能力,安全的要求,數(shù)據(jù)要加密,很嚴格,所以為了共享數(shù)據(jù)方便,本身不能拿出U盤共享,發(fā)郵件數(shù)據(jù)量很大,不能那么做,通道不暢通,怎么辦?他們逐漸通過建設(shè)統(tǒng)一文件數(shù)據(jù)管理平臺,從以前辦公的概念變成生產(chǎn)的概念,以前只負責(zé)解決辦公的問題,現(xiàn)在涵蓋辦公、生產(chǎn)、開發(fā)、營銷、售后服務(wù)文件型數(shù)據(jù),隨著電商業(yè)務(wù)逐漸拓展,它會逐漸把電商業(yè)務(wù)形態(tài)搬回到公司內(nèi)部來,上面存了大量的信息,如何搬到數(shù)據(jù)共享平臺來解決數(shù)據(jù)管理問題。制造業(yè)對于身份安全管理,包括操作留痕要求很高,制造業(yè)對文件管理還是在集中的概念,如何安全存的問題,因為它們的應(yīng)用是煙囪式,這種虛擬化煙囪式的打通還是任重道遠,這是制造業(yè)文件管理案例。
再看一下產(chǎn)線,現(xiàn)在制造業(yè)對產(chǎn)線質(zhì)量的跟蹤,自動化產(chǎn)線的時候會拍照,我會存在本地的服務(wù)器上,比如說存三個月,剩下通過移動硬盤導(dǎo)走,導(dǎo)到一個大的硬盤上或者導(dǎo)到共享服務(wù)器,或者是文件服務(wù)器。但是制造業(yè)質(zhì)量跟蹤時間越來越長,以前可能在線查三個月,現(xiàn)在要查一年兩年,因為零部件一旦出現(xiàn)問題,通過前端的應(yīng)用系統(tǒng)包括追蹤到拍照的痕跡,這就面臨一個問題,怎么樣解決效率問題?比如一分鐘拍一次或者每30秒拍一張,24小時不停這個產(chǎn)線,中間照片數(shù)量會很高很大,以前的方式傳到小服務(wù)器或者是PC上,再導(dǎo)到存儲上面去,這種方式很慢,而新的方式,比如傳到對象存儲,這樣快很多,容量大很多,可能支持在線一年兩年三年。我們剛才說追溯的時候,以前產(chǎn)線圖片雖然有規(guī)則,但是找起來也不容易,是不是可以通過對象存儲,內(nèi)設(shè)搜索引擎,通過這種來去對接文件進行搜索,照片快速照片,包括批量的下載,一次要找一組圖出來,追溯這個圖,通過搜索引擎的方式,這都是對象存儲或者是分布式存儲自帶的生態(tài),進而簡化了用戶做應(yīng)用,簡化了方式。他們對數(shù)據(jù)進行上傳的時候打標(biāo)簽,比如說進行的批次或者是對照片操作人都可以打進去,通過這種方式存到對象存儲以后,我們支持對目標(biāo)搜索。現(xiàn)在應(yīng)用對存儲來說,打標(biāo)簽的話能夠?qū)崿F(xiàn)快速的,這就是分布式存儲和對象存儲的優(yōu)勢。比如說它有兩個GB之間的關(guān)聯(lián)關(guān)系,以前怎么做?
需要把這邊的數(shù)據(jù)拿移動硬盤寄到那邊去或者發(fā)到那邊去或者是出差帶過去?,F(xiàn)在應(yīng)用只要標(biāo)記,對重點跟蹤的圖片,只要應(yīng)用打標(biāo)記,這個時候底下的存儲會把數(shù)據(jù)轉(zhuǎn)移到另一個存儲上面,利用對象存儲分發(fā)能力或者是轉(zhuǎn)移能力,這樣降低整個企業(yè)使用應(yīng)用復(fù)雜度,因為他的關(guān)注點就是在產(chǎn)線數(shù)據(jù)怎么能夠快速保存,經(jīng)濟化保存,快速找到數(shù)據(jù)快速處理,這是它的目標(biāo)。
制造業(yè)來看,目前還是比金融行業(yè)慢一點,更多是解決存儲以后怎么高效利用數(shù)據(jù)或者是管理數(shù)據(jù)。醫(yī)療影像領(lǐng)域更加復(fù)雜,第一個醫(yī)療里面的應(yīng)用系統(tǒng)比較多,一般三甲醫(yī)院都是比較多一些。從醫(yī)療影像數(shù)據(jù)來看,基本上有三個場景,第一個是臨床整治,疾病整治領(lǐng)域,還有就是科研,第三個就是教學(xué),通過醫(yī)療影像進行教學(xué)。傳統(tǒng)的方式通過PACS系統(tǒng),PACS系統(tǒng)實際上就是ECM典型應(yīng)用場景或者是應(yīng)用模式。現(xiàn)在醫(yī)療影像產(chǎn)品越來越多,以前一個醫(yī)院可能有幾十臺CT,像核磁共振、CT、B超,現(xiàn)在隨著產(chǎn)品價格下來。第二個以租代買,甚至說商業(yè)模式變化以后,導(dǎo)致一個三甲醫(yī)院基本一半的科室都是跟影像關(guān)系,連看牙都有影像的概念。這個時候數(shù)據(jù)量增加會很快,但是醫(yī)生閱片的時延時效,包括清晰度,照片的顆粒度上來了。每次醫(yī)生都要去幾百張照片瀏覽,這種對時延要求很高,現(xiàn)在基本上跨科室是一個老大難的問題,比如內(nèi)科的人怎么看其他科室的影像。這是很困難很復(fù)雜的事情,涉及到很多管理上包括實際上的應(yīng)用場景問題,但是這個場景來看是存在的,這是醫(yī)生告訴我:從多模視角幫助病人發(fā)現(xiàn)問題。我們現(xiàn)在的做法,到內(nèi)科看完了,外科再拍一個,或者一個醫(yī)院到另外一個醫(yī)院都要重新拍,它需要大量的樣本。
其實對于科研研究也是一樣的,需要大量的樣本進行訓(xùn)練,通過快速訓(xùn)練提升對疑難雜癥效果的分析,醫(yī)學(xué)教學(xué)關(guān)注一些典型或者是原始圖像獲取的問題。從一線目前醫(yī)學(xué)影像來看,PACS來看,PACS系統(tǒng)從原來造價很高到現(xiàn)在造價很低,廠家逐漸從原來一千多家到現(xiàn)在幾百家、幾十家,但是現(xiàn)在面臨一個問題,PACS系統(tǒng)越來越慢,這是很多醫(yī)院的共識。對于用戶來講就是換PACS,這家服務(wù)不好,選擇一家產(chǎn)品的時候支持能力是很重要的選擇。但是對于應(yīng)用來講要換它,就存在歷史數(shù)據(jù)的遷移問題,因為ECM產(chǎn)品遷移又帶數(shù)據(jù)庫又帶存儲的時候,這個數(shù)據(jù)量小是可以的沒問題,現(xiàn)在一個三甲醫(yī)院歷史五年數(shù)據(jù)都在兩百T到三百T,這個數(shù)據(jù)怎么能夠遷得出來?這是很痛苦的事情。第二,現(xiàn)在PACS系統(tǒng)本身這種共享權(quán)限通過很多方式來做,第三個備份很復(fù)雜,醫(yī)院的信息科都是孫子輩的,現(xiàn)在影像是粗放式管理,投入產(chǎn)出比嚴重不匹配,本身來說影像數(shù)據(jù)有30%到40%是垃圾數(shù)據(jù),我怎么對影像數(shù)據(jù)從源頭上治理,我們提出了跟醫(yī)院在探討的,能不能把應(yīng)用分開,把PACS和數(shù)據(jù)分開,PACS作為數(shù)據(jù)標(biāo)記,因為PACS前面更多是一些應(yīng)用,怎么通過數(shù)據(jù)去看圖像,分析圖像。
真正數(shù)據(jù)存儲要分開,通過應(yīng)用和存儲分開,包括存儲和數(shù)據(jù)存儲,因為醫(yī)院不像傳統(tǒng)的金融行業(yè),它有大量的空間有機房有電力,很多醫(yī)院缺乏電力,沒有電沒有空間,公有云是否是一個選擇方向。現(xiàn)在很多三甲醫(yī)院逐漸在公有云上把整個IT托管到公有云上,這也是一個選擇方向,數(shù)據(jù)要存儲,通過這種解耦的方式來解決數(shù)據(jù)共享的問題,解耦以后才能可能共享。第二個包括醫(yī)政,醫(yī)院醫(yī)政跟企業(yè)管理部門是一樣的,必須解決數(shù)據(jù)信息安全問題,我們都知道病人的片子有一些個人隱私信息在里面,這時候怎么樣道德合規(guī)的問題,包括安全合規(guī)的問題,通過解耦以后才可能做數(shù)據(jù)質(zhì)量治理,輔助解決大量無效數(shù)據(jù)、從源頭治理。怎么通過治理的方式盡量降低存儲的成本,在這個基礎(chǔ)上在線時間更長,這都是需要解決的問題。我們通過解耦的方式來幫助客戶滿足科研、臨床、教學(xué)這樣一些數(shù)據(jù)需求。剛才整個介紹了三個行業(yè),從金融行業(yè)到制造業(yè)到醫(yī)療行業(yè)這些數(shù)據(jù)管理案例,我們看了一下非結(jié)構(gòu)數(shù)據(jù)發(fā)展方向。第一個存儲概念,分布式存儲、對象存儲是我們的基礎(chǔ),我們隨著利用隨著分布式存儲和對象存儲技術(shù)本身成長成熟,我們?nèi)ダ贸墒旒夹g(shù)或者構(gòu)建,通過以它為基礎(chǔ)構(gòu)建一個新的生態(tài)方式,用這種低成本解決非關(guān)鍵業(yè)務(wù)數(shù)據(jù)量關(guān)鍵問題。第三個談到非關(guān)鍵業(yè)務(wù)數(shù)據(jù)很大的場景是共享,怎樣能夠隨時獲取。隨著整個企業(yè)業(yè)態(tài),從PC電腦到桌面云,到平板到移動化辦公,是不是能夠更好支持共享,尤其智能終端出來以后,是不是能夠支持共享。第三個很難做就是行業(yè)發(fā)展方向怎么樣做數(shù)據(jù)分類,非結(jié)構(gòu)化的數(shù)據(jù)分類有點像百度搜索做的網(wǎng)頁爬蟲,怎么去做分類,包括預(yù)處理。非結(jié)構(gòu)化數(shù)據(jù)或者非關(guān)鍵性數(shù)據(jù)量很大,只有通過預(yù)處理方式才能加速找到數(shù)據(jù),如果一個企業(yè)從十個億數(shù)據(jù)找一個數(shù)據(jù),通過預(yù)處理能力,來解決數(shù)據(jù)快速獲取問題,包括已經(jīng)開始做的像監(jiān)控數(shù)據(jù)挖掘甚至是圖像分析,已經(jīng)有很多案例,通過數(shù)據(jù)分析的方式,場景也是逐漸在豐富逐漸在完整化,通過這種方式來提升非關(guān)鍵業(yè)務(wù)的價值。
最后談到安全的概念,現(xiàn)在有加密技術(shù),比如醫(yī)療數(shù)據(jù)的脫敏問題,但實際上從企業(yè)來看,我們碰到了電子制造業(yè)問題,比如國際化部署的問題,比如分公司在歐洲,在美洲美國,有很多在東南亞、新加坡,怎么解決數(shù)據(jù)合規(guī)問題?這都涉及到數(shù)據(jù)流轉(zhuǎn)問題,剛剛談到非關(guān)鍵業(yè)務(wù)基礎(chǔ)一定是數(shù)據(jù)量很大,這個量大到一定程度的時候這個問題就會顯現(xiàn)出來。所以我們說安全也是一個非結(jié)構(gòu)性管理很重的方向。
—— END ——
2020中國數(shù)據(jù)與存儲峰會演講嘉賓PPT下載頁面來了!(點擊此處下載活動資料)
2020中國數(shù)據(jù)與存儲峰會圓滿落幕,大會由百易傳媒(DOIT)主辦,以“新數(shù)智,新未來”為主題,特邀中國工程院鄭緯民院士以及中國電子學(xué)會、中國計算機學(xué)會存儲專委會、SNIA等單位的嘉賓,與西部數(shù)據(jù)、英特爾、浪潮、IBM、華為、戴爾科技集團、新華三、深信服、紫晶存儲、青云QingStor、威固、Memblaze等領(lǐng)先供應(yīng)商以及北京建工、平安科技、紅星酒業(yè)等典型企業(yè)用戶代表,探討新數(shù)據(jù)時代存儲技術(shù)發(fā)展趨勢,分享數(shù)字化轉(zhuǎn)型成果,共話智慧未來。