作為峰會重要的環(huán)節(jié)之一——CIO高峰論壇也于當(dāng)天舉行。參加對話的四位嘉賓分別是中國石油東方地球物理公司研究院總工程師賴能和先生,大連恒力石化股份有限公司CIO余斌先生,華泰財(cái)產(chǎn)保險有限公司信息技術(shù)部副總經(jīng)理?xiàng)钚聞傁壬约皝碜陨钲趪一驇焐镄畔?shù)據(jù)庫曾文君主任。
對話主持人由DOIT高級顧問、資深技術(shù)專家 董唯元先生擔(dān)任。
董唯元:首先感謝各位。按理本來應(yīng)該請各位嘉賓都先介紹一下各自的行業(yè)和單位的情況,但是我想今天聚在這里更多是討論的技術(shù)話題,每年都有這樣的話題。結(jié)合專業(yè)討論干貨之前,先請專家從各自的總體趨勢上對數(shù)字化時代這樣一個大的前景做一些分享,如何看待這樣一些大的技術(shù)趨勢。
賴能和: 大家下午好,數(shù)字化轉(zhuǎn)型是當(dāng)今新時代發(fā)展的必然趨勢。要做數(shù)字化轉(zhuǎn)型,首先要做信息化、流程標(biāo)準(zhǔn)化。數(shù)字化轉(zhuǎn)型是技術(shù)和管理創(chuàng)新一個很好的引擎,各單位目前都在抓這一點(diǎn)。數(shù)字化、智能化,是將來整個IT基礎(chǔ)設(shè)施建設(shè)很重要的一塊,對企業(yè)技術(shù)創(chuàng)新和管理創(chuàng)新來說是很好的驅(qū)動力。
余斌:數(shù)字化轉(zhuǎn)型是大勢所趨。對石油石化行業(yè)來說,大家更多聽到的是兩化融合,這些事情都不沖突。我們可能從生產(chǎn)、銷售、包括產(chǎn)品的設(shè)計(jì)等各個層面都在做數(shù)字化的轉(zhuǎn)型,可能大家接受的更多是數(shù)字銷售轉(zhuǎn)化。對于生產(chǎn)型、重資產(chǎn)企業(yè),數(shù)字化轉(zhuǎn)型給我們帶來了更多的發(fā)展機(jī)會。
智能化,其實(shí)有三個階段,首先是數(shù)字化,然后是網(wǎng)絡(luò)化,第三步才是智能化,從這個層面來講,要實(shí)現(xiàn)智能化,首先要做轉(zhuǎn)型,從生產(chǎn)企業(yè)的角度,我們現(xiàn)在數(shù)字化的任務(wù)就是圍繞工業(yè)互聯(lián)網(wǎng)的這個基礎(chǔ)設(shè)施的建設(shè),通過數(shù)據(jù)的提取建模方式,實(shí)現(xiàn)人機(jī)各個方面數(shù)字化的建立。
楊新剛:對保險行業(yè)來說,數(shù)字化轉(zhuǎn)型有幾個比較明顯的問題。最突出的一個問題就是宏觀管理層面上的問題。在過去,CEO經(jīng)常關(guān)注重點(diǎn)項(xiàng)目,匯報的時候項(xiàng)目已經(jīng)做完,但是數(shù)據(jù)沒有保存下來。為什么?這里既有數(shù)據(jù)思維的緣故,也有體制的原因,這里面我可能思考比較多一點(diǎn)。數(shù)字化負(fù)責(zé)人關(guān)注業(yè)務(wù)的穩(wěn)定,技術(shù)的穩(wěn)定性、客戶的體驗(yàn),一個問題是,數(shù)據(jù)到底保存下來有多少。我看到行業(yè)里面很多公司都存在這樣的問題。數(shù)字化項(xiàng)目一個一個上線,到了最后發(fā)現(xiàn)很多數(shù)據(jù)沒有保存下來,這是我個人體會比較深的一個點(diǎn)。
曾文君:大家下午好!我這邊主要分享一下生命科學(xué)領(lǐng)域如何進(jìn)行數(shù)字化轉(zhuǎn)型。非常贊同楊總的分享,數(shù)字化并不是CIO、CTO一個人的事情,是企業(yè)內(nèi)部的變革。生命是數(shù)字化的,因?yàn)槊恳粋€人都是有ATCG 4種堿基對,每一個人的基因組有3GB大小,經(jīng)過測序下來每個人數(shù)據(jù)量達(dá)到100 GB,基因數(shù)據(jù),我們叫生命大數(shù)據(jù),遠(yuǎn)比社交數(shù)據(jù)或者是金融交易數(shù)據(jù)更有研究價值和產(chǎn)業(yè)價值。因?yàn)檫@些數(shù)據(jù)里面包含著人類生老病死所有相關(guān)的信息,我們致力于這些信息的挖掘。
生命數(shù)字化的過程,依賴的一個重要工具就是測序儀;我們也致力于支撐國產(chǎn)測序儀的研發(fā)和應(yīng)用工作。生命數(shù)字化之后,可以采用大數(shù)據(jù)分析+AI的方式探索健康疾病方面一些信息。
今天主要是跟各嘉賓去探討一下我們在生命大數(shù)據(jù)發(fā)展過程中遇到的一些挑戰(zhàn)和機(jī)遇。
董唯元:剛才在私下交流的時候,四位專業(yè)人士已經(jīng)從各自的領(lǐng)域談到了各自的感悟,像賴總在石油勘探領(lǐng)域,余總在石油化工領(lǐng)域,楊總在保險領(lǐng)域,曾總在生命科學(xué)領(lǐng)域提了很多各自的想法。今天會議的主題跟數(shù)據(jù)相的,接下來希望各位各自行業(yè)角度出發(fā),談一下各自角度對數(shù)據(jù)的地位和數(shù)據(jù)價值挖掘的特別的感悟。
曾文君:剛才說到,生命大數(shù)據(jù)是一個尚待開發(fā)的區(qū)域,因?yàn)榇蠹覍】捣浅jP(guān)注。一個人的基因數(shù)據(jù)是100GB,一個人一生的醫(yī)療數(shù)據(jù),包括影像生化檢測能產(chǎn)生幾個T的數(shù)據(jù),如果一千萬人口城市里面,大家都做這個,整個數(shù)據(jù)的需求不是小數(shù)量。測序通量的增長超過了摩爾定律發(fā)展速度,華大智造的測試儀性能通量在過去4年增長了11.5倍,這給IT帶來了巨大的挑戰(zhàn),這些數(shù)據(jù)如何保存、分析還有合規(guī)安全性。今天參加這個會,和很多專家廠商進(jìn)行交流,能得到一些解答,因?yàn)槟壳拔艺J(rèn)為BT+IT方面的性能和一些價格成本沒法滿足整個生命大數(shù)據(jù)時代需求,我認(rèn)為還沒有做好準(zhǔn)備的。
楊新剛:我特別贊同曾總的觀點(diǎn),很多企業(yè)都沒有做好數(shù)字化來臨的準(zhǔn)備。為什么這么說呢,因?yàn)橛幸豁?xiàng)基礎(chǔ)性工作,數(shù)據(jù)資產(chǎn)的盤點(diǎn),僅有相當(dāng)一部分企業(yè)在做。從一個公司角度,你的數(shù)據(jù)有多少是用戶的熱數(shù)據(jù),有多少是歷史數(shù)據(jù),基于什么樣的場景產(chǎn)生的,有什么樣的價值。
我每到一個公司,首先做的第一件事就是數(shù)據(jù)資產(chǎn)的盤點(diǎn),對數(shù)據(jù)資產(chǎn)進(jìn)行分類,在什么場景下產(chǎn)生的數(shù)據(jù),體量多大,有什么樣的價值,未來怎么樣使用,等等,要有這樣一份完整的規(guī)劃,用以指導(dǎo)我們未來對數(shù)據(jù)價值的挖掘方向,這是一個基礎(chǔ)性的工作,也是一個非常重要的工作,要從一個公司整體戰(zhàn)略層面去做推進(jìn),才更加有效落地。我自己的體會,數(shù)字化轉(zhuǎn)型根上兩點(diǎn),一個思維轉(zhuǎn)型,一個組織架構(gòu)的轉(zhuǎn)型。只要有了兩點(diǎn)保證,基礎(chǔ)性工作前瞻性的工作才能有效的推進(jìn)。
董唯元:這也是很多趨勢里邊的一個很重要的一個主張。
余斌:關(guān)于數(shù)據(jù)的重要性,從我的角度來說,一陰一陽為之道,數(shù)據(jù)和業(yè)務(wù)正好是一陰一陽。從IT基礎(chǔ)技術(shù)負(fù)責(zé)人的角度,關(guān)心的是外面的這些展板,還有今天的一些演講,以及這些KP內(nèi)容,而CIO層面更關(guān)心的是業(yè)務(wù)解決方案,因?yàn)橛袠I(yè)務(wù)解決方案,所以我需要什么樣的數(shù)據(jù)。這些數(shù)據(jù)存在哪兒,實(shí)際CIO層面并不關(guān)心,要的是結(jié)果。換一句話。很多內(nèi)容,如果僅僅從技術(shù)層面、存儲層面做介紹還不夠,還要和業(yè)務(wù)要有一個結(jié)合。所以我們在陽面看到的是業(yè)務(wù)解決方案,背后才是數(shù)據(jù)怎么存儲。
剛才講了關(guān)心這些PPT內(nèi)容的是技術(shù)負(fù)責(zé)人,但決策權(quán)在企業(yè)CIO手里,如果不把業(yè)務(wù)和我們的數(shù)據(jù)之間打通,不了解什么樣的業(yè)務(wù)需要什么樣的數(shù)據(jù)存儲,需要什么樣的分析方式解決它,不把業(yè)務(wù)場景講清楚,這個事情很難讓CIO下決心說要購買什么樣的獨(dú)特技術(shù)存儲的方案。
我們對數(shù)據(jù)非常的重視,今年投資4000多萬元建設(shè)了一個小規(guī)模的數(shù)據(jù)中心。我知道EMC存儲,但沒有看過相關(guān)技術(shù)方案。我更關(guān)心的就是技術(shù)方案能不能響應(yīng)現(xiàn)場的業(yè)務(wù)。如果響應(yīng)不了,那就更多的考慮邊緣計(jì)算,盡量數(shù)據(jù)在現(xiàn)場能解決一部分,然后回到數(shù)據(jù)中心進(jìn)行存儲和進(jìn)一步處理。這是我作為應(yīng)用方一點(diǎn)點(diǎn)體會。
董唯元:余總為供應(yīng)商群體提出了更多的要求,相信供應(yīng)商認(rèn)為會有一定的難度有一定的挑戰(zhàn)。
賴能和:關(guān)于數(shù)據(jù)的價值,大家還要結(jié)合各自單位的實(shí)際情況和數(shù)據(jù)特點(diǎn)做冷靜分析。其實(shí)不是所有數(shù)據(jù)都是有價值的。從工業(yè)生產(chǎn)應(yīng)用的角度看,工業(yè)生產(chǎn)應(yīng)用有一部分?jǐn)?shù)據(jù)是非常有價值的,比如說油田一些設(shè)備運(yùn)行狀態(tài)的歷史數(shù)據(jù),用大數(shù)據(jù)分析輔助預(yù)測一些設(shè)備故障,這些數(shù)據(jù)還是有用的。還有就是通過非常昂貴的成本采集來的地震數(shù)據(jù),這些數(shù)據(jù)要永久保留的。這些數(shù)據(jù)價值非常大,受到現(xiàn)有的一些數(shù)學(xué)方法或者計(jì)算能力的制限,可能還不能完全被挖掘出來,這些數(shù)據(jù)需要永久保留。保存這些海量數(shù)據(jù),對我們來說也是一項(xiàng)很不容易的事情。
董唯元:賴總高屋建瓴來談數(shù)據(jù)價值,當(dāng)然也是我們必須要面對的挑戰(zhàn)。我知道各位都在各自的領(lǐng)域里,在日常工作當(dāng)中是結(jié)結(jié)實(shí)實(shí)面對很多具體的問題,解決了很多具體的問題。
從各位嘉賓的分享中,大家聽到的是一些要求,其實(shí)背后可能暗示著一些對產(chǎn)品解決方案還是有不滿意的地方,作為乙方,實(shí)際上已經(jīng)很努力創(chuàng)新,今天很多的介紹都是蠻新穎蠻有創(chuàng)意的創(chuàng)新,但從甲方的角度還是有更高的要求和更多的希望。代表乙方做產(chǎn)品的人,我們其實(shí)更希望聽到來自甲方的跟場景相關(guān)的、跟日常工作相關(guān)的干貨,如果各位能夠從自己行業(yè)應(yīng)用具體場景出發(fā),講一講技術(shù)落地過程中具體有哪些要求,或者說踩過哪些坑,帶來哪些麻煩,可以更完善更打磨好產(chǎn)品。
賴能和:我覺得其實(shí)沒什么坑,因?yàn)檎型稑?biāo)書寫的很清楚,能不能用,或者是產(chǎn)品的性能、質(zhì)量要求標(biāo)書都寫的很清楚。所以我覺得還是要真正了解這個產(chǎn)品,以及產(chǎn)品的性能,了解自己的應(yīng)用到底需要什么樣的性能產(chǎn)品。結(jié)合今天的主題,也就是是存儲,我希望解決存儲高性能、高帶寬、低延遲還有就是高并發(fā)性的技術(shù)要求,以及產(chǎn)品的穩(wěn)定性。采購的時候只要把握很清楚,不會有太大的問題。
董唯元:我是不是可以這么理解:給您容量更大、性能更好的設(shè)備,只要夠便宜就可以買單了?
賴能和:按照招標(biāo)法的綜合評分法??赡芗夹g(shù)不是很好,但價格很低,也一樣不會入選的,這是從設(shè)備采購的角度。從企業(yè)數(shù)字化轉(zhuǎn)型方面,我個人體會是要做好這幾個方面的工作:第一個是做好企業(yè)信息化、流程標(biāo)準(zhǔn)化,做完以后關(guān)鍵要把它真正應(yīng)用起來,信息化是一把手工程,做好落實(shí);第二個是要搞清楚信息化、數(shù)字化有什么區(qū)別。過去我們都做過很多信息化管理平臺,但做信息化是從管理的思維、從管理的角度想把每一個管理環(huán)節(jié)管住,而數(shù)字化轉(zhuǎn)型是要強(qiáng)調(diào)用戶的體驗(yàn)、強(qiáng)調(diào)數(shù)據(jù)的共享,兩者的思維和理念不同。
董唯元:數(shù)據(jù)存儲和安全的關(guān)系如何?
賴能和:油氣勘探的數(shù)據(jù)是國家重要資產(chǎn),是不允許對外的,我自己平時講報告的時候從來都是不會把數(shù)據(jù)坐標(biāo)顯示出來,你看不到是哪里數(shù)據(jù),坐標(biāo)是不能公開的,包括數(shù)據(jù)所在的地區(qū)名字都不能出現(xiàn)。講到數(shù)據(jù)安全的問題,這是個很重要的議題,企業(yè)數(shù)據(jù)如要上公有云,數(shù)據(jù)的安全性怎么辦?對我們來說,生產(chǎn)網(wǎng)是生產(chǎn)網(wǎng),辦公網(wǎng)是辦公網(wǎng),兩者絕對不可能聯(lián)通,這是從網(wǎng)絡(luò)上來說。另一方面,從數(shù)據(jù)存儲的角度,我們對存儲的要求是非常高,要求采用很可靠的存儲,當(dāng)然重要數(shù)據(jù)還要做好備份,甚至還有一些要放到磁帶上去永久保存,現(xiàn)在磁帶記錄數(shù)據(jù)的速度也非常快,達(dá)到360MB/s。
余斌:結(jié)合行業(yè)談需求,首先我覺得可能要了解國家的政策,了解當(dāng)前的主要發(fā)展趨勢。其實(shí)在前面五年,國家推智能制造,這五年推工業(yè)互聯(lián)網(wǎng),最近國家剛推的區(qū)塊鏈,未來五年推AI、VR、AR方面的應(yīng)用,這些不同的技術(shù)都有不同的應(yīng)用場景,對應(yīng)不同的數(shù)據(jù)存儲分析各方面的需求,具體到石油石化行業(yè)最近正在做的工業(yè)互聯(lián)網(wǎng)平臺這一塊,之前我們生產(chǎn)的這些數(shù)據(jù),對存儲要求很簡單。就是講的夠大夠快就可以了,現(xiàn)在隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展進(jìn)入到數(shù)字孿生的階段,數(shù)字孿生的階段要求形成控制這種閉環(huán),就是說通過數(shù)字化建模,分析系統(tǒng)返回系統(tǒng),對數(shù)據(jù)存儲數(shù)據(jù)分析就是安全可靠,不能在傳輸?shù)倪^程中或者說在存儲的過程中發(fā)生了修改,或者發(fā)生一些變化,反饋回控制系統(tǒng)不是閉環(huán),那就是災(zāi)難了。結(jié)合大的發(fā)展趨勢和行業(yè)的具體需求應(yīng)用,我們基本上從又大又快到安全可靠,而且我剛才講的邊緣計(jì)算,盡量要少存數(shù)據(jù)。盡量把無用的數(shù)據(jù)在邊緣計(jì)算階段處理掉,各種各樣傳感器參數(shù)拷過來,在前端要做一些臨時性的存儲,這種存儲對性能的要求可能要求快,未必要求大。很多企業(yè)已經(jīng)不關(guān)心數(shù)據(jù)存在哪兒,反正是存在云端,如何應(yīng)對這些需求提供解決方案,我覺得這個時候解決方案盯著邊緣計(jì)算可能更有效一些。
董唯元:剛才余總介紹工業(yè)互聯(lián)網(wǎng)的平臺,尤其您講到大企業(yè)建平臺,小企業(yè)使用它的服務(wù)化交付的IT服務(wù)結(jié)果,我覺得這是我們這些做傳統(tǒng)存儲的人很關(guān)心的。面臨行業(yè)涌現(xiàn)起來的工業(yè)4.0,小企業(yè)沒有基礎(chǔ)設(shè)施的需求,全都集中到一個大平臺上來,這個時候?qū)ψ龃鎯Φ囊埠?,對整體解決方案備份也好,肯定還是會有很多異化。
剛才您講到邊緣計(jì)算,數(shù)據(jù)上行的過程中特殊處理,這些東西和哪些存儲相關(guān),或者不相關(guān),我也想更多知道現(xiàn)在有哪些技術(shù)解決不了的細(xì)節(jié)。
余斌:前一段時間擔(dān)任中國工業(yè)互聯(lián)網(wǎng)大賽的評委,我看到很多杰出解決方案,就是邊緣計(jì)算解決方案。小企業(yè)上云,我們要了解發(fā)展趨勢,在這種發(fā)展趨勢下,存儲賣給誰;都賣給云廠商,肯定不現(xiàn)實(shí),所以我們看到很多很好的解決方案,就是在邊緣計(jì)算層做了很多集數(shù)據(jù)分析集存儲把MBS都做進(jìn)去,把邊緣計(jì)算越做越成為一個獨(dú)立的整體。我看到,一家國產(chǎn)企業(yè),從芯片一直到操作系統(tǒng)整體都是國產(chǎn)解決方案的廠商,甚至把PLC都虛擬化,大量的計(jì)算和存儲功能都在邊緣計(jì)算端完成,直接對接云端應(yīng)用就可以了,這也是一個思路。
董唯元:這種比較新穎的解決方案,邊緣計(jì)算業(yè)務(wù)邏輯跑到了一個封裝好的系統(tǒng)里,作為用戶會不會擔(dān)心被一家廠商鎖定,將來只能買他們家東西?
余斌:邊緣計(jì)算看用在哪些方面。用在工藝上、用在設(shè)備上,聽著好像市場變小,其實(shí)市場變大了,前端做了數(shù)據(jù)分析存儲處理,接著把一些更有用的管理數(shù)據(jù)提取出來,或者說建模完到云端去,現(xiàn)場需要不是一個兩個問題,需要大批量,包括賴總勘探油井的數(shù)據(jù),原來都傳到數(shù)據(jù)中心分析,一個油井配一個邊緣計(jì)算的服務(wù)器,有多少個油井,都現(xiàn)場把這個問題解決了。沒有必要說一家通吃,所有的接口數(shù)據(jù)傳輸有標(biāo)準(zhǔn)的。
楊新剛:我著重分享一下安全和合規(guī)。數(shù)字化情況下,很多用戶觸點(diǎn)數(shù)據(jù)都涉及到安全和合規(guī),一個國家政策層面的合規(guī),讓外面很多P2P大數(shù)據(jù)廠商,基本上銷聲匿跡。
董唯元:在金融保險行業(yè)要求比較高。
楊新剛:一個典型案例是大數(shù)據(jù)風(fēng)控。在金融行業(yè),保險叫投保風(fēng)險,銀行叫貸款人的違約,基本的思路是建立一個風(fēng)控的模型,和外部的一些比較知名的廠商做數(shù)據(jù)合作。但本來大家合作好好的,突然說對不起,因?yàn)榉N種原因,從明天開始服務(wù)要停掉了。這說明,數(shù)據(jù)合作包括建模,應(yīng)該建立在安全合規(guī)的基礎(chǔ)上。這是外部數(shù)據(jù)合作。
對于金融企業(yè)來講,最大的合規(guī)風(fēng)險是客戶信息的泄露,這類似于制造企業(yè)的生產(chǎn)安全事故,從存儲的角度,所有的客戶信息、敏感信息,比如說證件號郵箱號都要進(jìn)行加密的存儲,從甲方的角度,希望提供一個便捷的方案,很便捷對這個用戶敏感信息進(jìn)行加密。但是加密之后,外面又有數(shù)據(jù)合作的需求,總有一方要把數(shù)據(jù)還原,按照對方加密方式進(jìn)行數(shù)據(jù)合作,這里邊有很多細(xì)節(jié)性包括方案性的問題。我們一直希望有比較好的廠商提供一個完整的交鑰匙的方案。
董唯元:現(xiàn)在是山頭林立的階段,從剛才的角度,將來在整個金融保險領(lǐng)域里面有一個行業(yè)互聯(lián)網(wǎng)能夠平臺化的統(tǒng)一解決接口數(shù)據(jù)問題,數(shù)據(jù)一致性的問題,或者整體資源協(xié)調(diào)的問題。有這種可能嗎?
楊新剛: 是大概率事件、也是我們期望的,有監(jiān)管牽頭、行業(yè)協(xié)會牽頭提供一個叫做安全合規(guī)的服務(wù)的平臺。比方說買保險的時候,做核保分布識別,提供一個風(fēng)險的評分。這個基礎(chǔ)是安全合規(guī),從而能夠有效識別客戶的風(fēng)險。
目前行業(yè)里面有一些原型,有一家行業(yè)公司叫中保信,全部客戶保單數(shù)據(jù)整合起來,作為監(jiān)管上面的行業(yè)性的這樣一個平臺。但還沒有完全正式提供這種服務(wù),有一些愿景和平臺,有一些場景上的服務(wù)可以提供的。如拿保單要申請貸款,這個時候保單是真的還是假的?通過行業(yè)協(xié)會平臺能夠驗(yàn)證保單是真的。
董唯元:曾總其實(shí)和我們?nèi)粘I钭钕嚓P(guān)了。
曾文君:剛才提到了,我們每個人數(shù)據(jù)基因數(shù)蠻大的,因?yàn)閱误w體積很大,現(xiàn)在是100個TB,隨著基因測序成本不斷下降,隨著大家對整個癌癥診斷的需求(這是很現(xiàn)實(shí)的問題),現(xiàn)在測序的話三十層,未來的話測序到一百層,上TB的數(shù)據(jù),到醫(yī)院做檢測,一個小時拿到結(jié)果而不是一個星期拿到結(jié)果,對處理數(shù)據(jù)上性能要求很高,同時對成本的要求也是蠻高的?,F(xiàn)在大部分還是采用硬盤作為介質(zhì)。
我們給廠家提出要求,能不能盡快把SSD價格降到我們可以普遍接受的合理的水平?這是一個很大的問題,并不是說我們處理的要求性能高,基因數(shù)據(jù)按照國家法規(guī)存儲, 上百個PB, 這么大量的數(shù)據(jù)面臨很大的問題,壽命大概五年左右,五年要倒一次,數(shù)據(jù)管理是非常大的風(fēng)險。另外,系統(tǒng)里面有不同廠家的產(chǎn)品,互相去做生命周期的管理,也是非常大的挑戰(zhàn)。
在數(shù)據(jù)安全方面,也會遇到不可預(yù)測的人為操作,數(shù)據(jù)的備份尤其異地備份,是最后一道防線,我們的要求是不能丟數(shù)據(jù),最最基本核心的要求,這么大的體量怎么樣去傳輸,存到什么地方,目前對我們來說是非常大的挑戰(zhàn),現(xiàn)在的數(shù)據(jù)交互備份都通過拷盤的方式,網(wǎng)絡(luò)太慢了。
董唯元:據(jù)我所知,很多行業(yè)初創(chuàng)公司,一臺服務(wù)器可以跑起來,只有生命科學(xué)行業(yè),一個初創(chuàng)公司是PB存儲起步,蠻受搞存儲的人歡迎。您剛才說的,不同幾十年對存儲性能的要求各種各樣,現(xiàn)在出現(xiàn)了一些云服務(wù)商,專門以云化服務(wù)的方式提供云端數(shù)據(jù)存儲,未來5G之后,有可能云端可以解決這些問題嗎?
曾文君:生命科學(xué)里分析過程和高性能計(jì)算密不可分,整個計(jì)算和存儲過程都是數(shù)據(jù)產(chǎn)生的流程, 計(jì)算和存儲設(shè)備都在靠近數(shù)據(jù)產(chǎn)出端(測序儀)這里,所以基本很少放到云端分析。 從目前來說,從帶寬的限制,基本上比較少,基本數(shù)據(jù)哪里產(chǎn)生,算力和存儲能力都一起解決這個問題,我們嘗試過和云廠商合作,整體來說還是沒那么方便,一方面, 公有云產(chǎn)品的價格還是比自建數(shù)據(jù)中心要略貴,二是有政策法規(guī)的要求,人的基因數(shù)據(jù)現(xiàn)在國家監(jiān)管非常嚴(yán),放在公有云上是否合規(guī)合法,尚沒有明確的政策指引。此外,基因數(shù)據(jù)作為國家的戰(zhàn)略資源,我很關(guān)注它會不會因?yàn)橹忻蕾Q(mào)易戰(zhàn)的制裁或者黑客的情況導(dǎo)致供應(yīng)鏈或者安全受影響,我們這邊非常樂意看到支持國內(nèi)的自主可控的存儲的技術(shù),不會被人卡脖子,不會有后顧之憂。
董唯元:以前沒有想到,生命科學(xué)對自主可控還有那么明確的要求。
本來我們還希望更多的和各位專家去探討一些干貨,今天時間有限,交流就暫時告一段落。每年都會有這么一個環(huán)節(jié),感謝大家,感謝各位專家,來年再見,謝謝!
關(guān)于主持人:
董唯元先生,曾任中科院計(jì)算所863課題組產(chǎn)品技術(shù)顧問,多年來持續(xù)專注大型數(shù)據(jù)中心的建設(shè)與運(yùn)維工作,曾主持規(guī)劃并建設(shè)了數(shù)十個大型數(shù)據(jù)中心系統(tǒng)。