華為大數(shù)據(jù)存算分離方案創(chuàng)新性的在存儲層實現(xiàn)了原生的HDFS的語義,打破了傳統(tǒng)大數(shù)據(jù)平臺計算存儲緊耦合的部署架構(gòu),不僅實現(xiàn)大數(shù)據(jù)平臺建設成本的大幅降低,而且通過存儲層全分布式架構(gòu)和協(xié)議融合互通的能力,提升數(shù)據(jù)分析效率,完全滿足中國聯(lián)通對于大數(shù)據(jù)平臺的期望和要求。

華為大數(shù)據(jù)存算分離方案創(chuàng)新點:

√ 計算存儲分離,按需擴展

在存儲層構(gòu)建了原生HDFS能力,將存儲從服務器本地盤剝離,形成計算和存儲完全分離的方案,既滿足業(yè)務彈性擴展需求,又避免資源浪費,為統(tǒng)一的大數(shù)據(jù)分析平臺打下技術(shù)基礎(chǔ)。

√ 大比例EC算法,提高存儲資源利用率

在大數(shù)據(jù)存算分離方案中,采用存儲層成熟的EC技術(shù),替代Hadoop的多副本,存儲資源利用率提升到91.6%,同樣的數(shù)據(jù)量,機柜數(shù)下降45%,大幅節(jié)省了運維成本。

√ 全分布式NameNode,海量數(shù)據(jù)統(tǒng)一管理

采用存儲層提供的全分布式的NameNode架構(gòu),每個節(jié)點既是數(shù)據(jù)存儲節(jié)點,也是元數(shù)據(jù)管理節(jié)點,單個NameSpace能夠支撐百億文件的存儲,為大數(shù)據(jù)平臺提供堅實的數(shù)據(jù)存儲底座,很好的支撐了集團的數(shù)據(jù)中臺戰(zhàn)略。

√ 原生HDFS,新老共存,保護投資

在大數(shù)據(jù)存儲層構(gòu)建了HDFS的納管功能——元數(shù)據(jù)網(wǎng)關(guān),通過納管現(xiàn)網(wǎng)已經(jīng)部署的HDFS,實現(xiàn)了應用層數(shù)據(jù)訪問的統(tǒng)一入口,且支持優(yōu)先寫入存儲層HDFS、基于配置選擇寫入HDFS、負載均衡寫入HDFS等多種寫入策略,真正做到了業(yè)務無感知的平滑演進。

√ 企業(yè)級存儲數(shù)據(jù)保護技術(shù),提升可靠性

在存儲層,采用多故障域技術(shù),每個故障域都允許4個節(jié)點同時故障,上百個存儲節(jié)點集群,即能夠容忍12個節(jié)點同時故障,極大的延長了維護周期。當出現(xiàn)硬盤或節(jié)點故障時,存儲層提供遠高于傳統(tǒng)Hadoop的數(shù)據(jù)重構(gòu)速度,將故障修復時間從天級縮減至小時級,進一步加強數(shù)據(jù)層的可靠性。

由于是新技術(shù),中國聯(lián)通聯(lián)合華為制定了非常全面的測試計劃,同時搭建了存算一體和存算分離兩套測試環(huán)境,采用現(xiàn)網(wǎng)脫敏的真實業(yè)務數(shù)據(jù),通過鏡像對比,從功能、性能、可靠性、可擴展性等多個維度,論證方案的可行性和價值。經(jīng)過數(shù)個月的聯(lián)合測試,測試結(jié)果得到中國聯(lián)通集團信息化部數(shù)據(jù)中心的認可,最終促成中國聯(lián)通對于華為OceanStor存儲Pacific系列的規(guī)?;少?。

客戶價值

目前,基于存算分離技術(shù)建設的運營支撐平臺已正式上線,已經(jīng)承載了互聯(lián)網(wǎng)分析、IoT、日志等系統(tǒng)15PB的數(shù)據(jù)量,實現(xiàn)了聯(lián)通各省公司2/3/4/5G xDR、網(wǎng)絡信令、互聯(lián)網(wǎng)日志、IoT等數(shù)據(jù)的接入分析,日導入數(shù)據(jù)量超過70TB。

存算分離方案給中國聯(lián)通帶來如下顯著價值:

1) 節(jié)省成本:大幅降低采購和運維成本,總TCO降低30%,節(jié)省千萬以上投資;

2) 運營效率提升:該項目投入運營后,分析效率提升20%,每年將帶來千萬以上的收入增長。

3) 提升可靠性:存儲層通過多故障域、快速重構(gòu)、亞健康檢測等技術(shù),可靠性提升30倍以上。

展望未來

未來,華為將持續(xù)為中國聯(lián)通數(shù)據(jù)基礎(chǔ)設施創(chuàng)新注入動力,結(jié)合華為OceanStor存儲Pacific系列的多協(xié)議融合互通的能力和開放的數(shù)據(jù)分析生態(tài),實現(xiàn)BOM多域的數(shù)據(jù)融合,突破生產(chǎn)系統(tǒng)和分析系統(tǒng)之間的壁壘,建設統(tǒng)一的數(shù)據(jù)存儲底座,降低數(shù)據(jù)的存儲成本,加速數(shù)據(jù)流動;在無狀態(tài)的計算基礎(chǔ)上,引入更加多樣的計算引擎,如BI、深度學習、圖計算、時空分析等新興引擎,快速推陳出新,支撐應用系統(tǒng)快速創(chuàng)新。通過持續(xù)創(chuàng)新,共同打造存得下、流得動、管得好的數(shù)據(jù)基礎(chǔ)設施,釋放海量數(shù)據(jù)的價值。

分享到

zhangnn

相關(guān)推薦