面對(duì)小張遇到的棘手問(wèn)題,云湖湖推薦了一款華為云大數(shù)據(jù)查詢分析神器——數(shù)據(jù)湖探索(DLI)服務(wù);一個(gè)DLI即可撬動(dòng)EB級(jí)數(shù)據(jù)量聯(lián)合查詢,每CU僅需0.35元/小時(shí)(1CU=1Core4G Mem),1CU包月僅需150元。
數(shù)據(jù)湖探索(DLI)服務(wù) 2.0是完全兼容Apache Spark和Apache Flink生態(tài)的Serverless大數(shù)據(jù)計(jì)算分析服務(wù),用戶僅需使用標(biāo)準(zhǔn)SQL或程序即可查詢分析各類異構(gòu)數(shù)據(jù)源。
DLI是如何解決小張問(wèn)題的呢?
1、 DLI服務(wù)架構(gòu)——Serverless
DLI是無(wú)服務(wù)器化的大數(shù)據(jù)查詢分析服務(wù)它的優(yōu)勢(shì)在于:
01. 按量計(jì)費(fèi):真正的按使用量(掃描量/CU時(shí))計(jì)費(fèi),不運(yùn)行作業(yè)時(shí)0費(fèi)用。
02. 自動(dòng)擴(kuò)縮容:根據(jù)業(yè)務(wù)負(fù)載,對(duì)計(jì)算資源進(jìn)行預(yù)估和自動(dòng)擴(kuò)縮容。
DLI Serverless架構(gòu)就可輕松解決小張成本、資源不足和臨時(shí)性業(yè)務(wù)需求的問(wèn)題。
2、 DLI核心引擎——Spark+Flink
Spark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎,聚焦于查詢計(jì)算分析。DLI在開(kāi)源Spark基礎(chǔ)上進(jìn)行了大量的性能優(yōu)化與服務(wù)化改造,不僅兼容Apache Spark生態(tài)和接口,性能較開(kāi)源提升了2.5倍,在小時(shí)級(jí)即可實(shí)現(xiàn)EB級(jí)數(shù)據(jù)查詢分析。同時(shí),DLI也提供用于實(shí)時(shí)處理的Flink引擎。
3、 DLI王牌功能——跨源分析
DLI支持云上多種云服務(wù)、自建數(shù)據(jù)庫(kù)以及線下數(shù)據(jù)庫(kù),可直接實(shí)現(xiàn)多數(shù)據(jù)源跨庫(kù)分析,構(gòu)建企業(yè)的統(tǒng)一視圖。
小張將線下數(shù)倉(cāng)A與數(shù)倉(cāng)B同時(shí)接入DLI,就可直接在DLI上進(jìn)行聯(lián)合查詢。避免了兩倉(cāng)數(shù)據(jù)遷移再重新建倉(cāng)進(jìn)行聯(lián)合查詢的過(guò)程,輕松搞定跨庫(kù)查詢。
數(shù)據(jù)湖探索(DLI)服務(wù)的其他優(yōu)勢(shì)
1. 純SQL操作:提供標(biāo)準(zhǔn)SQL接口,用戶僅需使用SQL便可實(shí)現(xiàn)海量數(shù)據(jù)查詢分析。
2. 存算分離:存儲(chǔ)和計(jì)算解耦,分開(kāi)申請(qǐng)和計(jì)費(fèi),降低成本的同時(shí),提高了資源利用率。
3. 企業(yè)級(jí)多租戶:支持計(jì)算資源按租戶隔離,數(shù)據(jù)權(quán)限控制到隊(duì)列、作業(yè),幫助企業(yè)實(shí)現(xiàn)部門(mén)間數(shù)據(jù)共享和權(quán)限管理
4. 免運(yùn)維、高可用:用戶無(wú)需感知底層運(yùn)維、升級(jí)、跨AZ高可用,跨AZ雙活。
數(shù)據(jù)湖探索(DLI)服務(wù)的應(yīng)用場(chǎng)景
1. 數(shù)據(jù)庫(kù)分析+DLI 2.0 :一鍵建倉(cāng) 保留數(shù)據(jù)庫(kù)的易用體驗(yàn)
痛點(diǎn):
01. 數(shù)據(jù)庫(kù)多無(wú)法做全量分析
02. 數(shù)據(jù)庫(kù)復(fù)雜關(guān)系無(wú)法查詢
03. 影響在線其他數(shù)據(jù)業(yè)務(wù)
解決方案:
僅使用標(biāo)準(zhǔn)SQL即可完成大數(shù)據(jù)查詢分析
2. 精準(zhǔn)營(yíng)銷+DLI 2.0:電商智能推薦 跨庫(kù)跨源海量數(shù)據(jù)秒級(jí)查詢
痛點(diǎn):
01. 數(shù)據(jù)源太多怎么聯(lián)合分析
02. 智能推薦需要短時(shí)間內(nèi)實(shí)現(xiàn)
解決方案:
DLI跨源能力,輕松打破數(shù)據(jù)孤島?,F(xiàn)已支持10類數(shù)據(jù)源和線下自建數(shù)據(jù)。
3. 日志分析+DLI 2.0:公司必備場(chǎng)景 按量計(jì)費(fèi)成本更低
痛點(diǎn):
01. 日志分析時(shí)間跨度大
02. 資源空閑大利用率低
解決方案:
DLI按量計(jì)費(fèi),單CU每小時(shí)僅需0.35元。
4. 實(shí)時(shí)風(fēng)控+DLI 2.0:金融、運(yùn)維等實(shí)時(shí)場(chǎng)景 減少風(fēng)險(xiǎn)事件發(fā)生
痛點(diǎn):
01. 數(shù)據(jù)刷新不及時(shí),風(fēng)險(xiǎn)事件頻繁發(fā)生
02. 需要深入了解Flink后臺(tái)架構(gòu)進(jìn)行實(shí)時(shí)數(shù)據(jù)分析
解決方案:
風(fēng)控系統(tǒng)對(duì)實(shí)時(shí)性要求很高,DLI采用高性能計(jì)算資源,單CPU每秒吞吐1千~2萬(wàn)條消息。