經(jīng)過(guò)域名解析階段后,靜態(tài)資源命中CDN后直接返回,無(wú)命中時(shí)會(huì)回源去拉取,動(dòng)態(tài)請(qǐng)求直接訪(fǎng)問(wèn)WEB服務(wù),在請(qǐng)求到達(dá)四層和七層ELB之前,多數(shù)企業(yè)應(yīng)用也會(huì)選擇WAF來(lái)清洗異常流量。

經(jīng)過(guò)ELB后,請(qǐng)求到達(dá)業(yè)務(wù)應(yīng)用服務(wù)器,業(yè)務(wù)實(shí)例多為分布式構(gòu)架,微服務(wù)之間相互調(diào)用,一般情況下企業(yè)運(yùn)維人員較多的關(guān)注點(diǎn)是應(yīng)用實(shí)例這一層,多為企業(yè)自行開(kāi)發(fā)的服務(wù)。

持久化層當(dāng)前各CSP提供的中間件不一樣,華為云上用戶(hù)使用較多的如分布式緩存,分布式數(shù)據(jù)庫(kù)等。由于提供動(dòng)態(tài)擴(kuò)容及較高級(jí)別的SLA,越來(lái)越多的企業(yè)不再需要專(zhuān)業(yè)的DBA,轉(zhuǎn)而使用云上的服務(wù),開(kāi)發(fā)上也更加敏捷。

如此多的云服務(wù)和各種資源,任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,都將導(dǎo)致應(yīng)用KPI異常,用戶(hù)體驗(yàn)下降,進(jìn)而導(dǎo)致企業(yè)運(yùn)營(yíng)受到影響,而每個(gè)使用云服務(wù)的企業(yè),如果投入大量人力去自建運(yùn)維系統(tǒng)并且將整個(gè)請(qǐng)求的各個(gè)環(huán)節(jié)關(guān)聯(lián)起來(lái),成本會(huì)非常高。因此華為云通過(guò)實(shí)踐構(gòu)建了一套立體運(yùn)維體系,幫助企業(yè)更好的進(jìn)行一站式運(yùn)維。下面將為您介紹立體運(yùn)維定位、架構(gòu)及特點(diǎn)。

立體運(yùn)維的定位和架構(gòu)

立體運(yùn)維主要是圍繞應(yīng)用進(jìn)行監(jiān)控,一站式完成基礎(chǔ)設(shè)施層、應(yīng)用層及用戶(hù)體驗(yàn)層的監(jiān)控。

參考以上典型云應(yīng)用架構(gòu),將業(yè)務(wù)請(qǐng)求路徑上經(jīng)過(guò)的不同資源進(jìn)行分層,分層如下:

QQ截圖20190710161504.png

圍繞分層設(shè)計(jì)不同的專(zhuān)業(yè)運(yùn)維服務(wù)子系統(tǒng),將不同數(shù)據(jù)在不同子系統(tǒng)上串聯(lián)協(xié)同、關(guān)聯(lián)分析,構(gòu)筑一個(gè)云上的運(yùn)維平臺(tái),從而最大化的實(shí)現(xiàn)數(shù)據(jù)價(jià)值,為運(yùn)維人員提供一個(gè)統(tǒng)一的運(yùn)維中心,達(dá)到一站式立體化運(yùn)維的目的。綜合立體運(yùn)維定位及典型云應(yīng)用分層,立體運(yùn)維融合了華為云的應(yīng)用運(yùn)維服務(wù)(AOM)、應(yīng)用性能管理服務(wù)(APM),對(duì)虛機(jī)、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)及應(yīng)用等多維度實(shí)時(shí)監(jiān)控,并通過(guò)應(yīng)用與資源告警關(guān)聯(lián)、日志分析、智能閾值、分布式調(diào)用追蹤、手機(jī)APP異常分析等技術(shù),實(shí)現(xiàn)分鐘級(jí)問(wèn)題快速診斷和修復(fù),保障云上應(yīng)用長(zhǎng)穩(wěn)運(yùn)行。

QQ截圖20190710161458.png

AOM側(cè)重于對(duì)云主機(jī)、存儲(chǔ)、網(wǎng)絡(luò)、WEB容器、Docker、Kubernetes等應(yīng)用運(yùn)行環(huán)境及應(yīng)用狀態(tài)、應(yīng)用與資源的關(guān)聯(lián)關(guān)系等內(nèi)容的深入監(jiān)控并進(jìn)行集中統(tǒng)一的可視化管理,其架構(gòu)如下:

QQ截圖20190710161444.png

APM側(cè)重于分布式應(yīng)用性能分析,擁有強(qiáng)大的分析工具,通過(guò)拓?fù)鋱D、調(diào)用鏈、事務(wù)分析可視化地展現(xiàn)應(yīng)用狀態(tài)、調(diào)用過(guò)程、用戶(hù)對(duì)應(yīng)用的各種操作,快速定位問(wèn)題和改善性能瓶頸,其架構(gòu)如下:

QQ截圖20190710161434.png

立體運(yùn)維的特點(diǎn)

立體運(yùn)維一站式完成基礎(chǔ)設(shè)施層、應(yīng)用層及用戶(hù)體驗(yàn)層的監(jiān)控。它具備以下特點(diǎn):

1、 AOM——統(tǒng)一運(yùn)維監(jiān)控管理:資源、應(yīng)用、業(yè)務(wù)一站式監(jiān)控與分析

通過(guò)集群與虛機(jī)、虛機(jī)與應(yīng)用、應(yīng)用與資源統(tǒng)一建模,將集群、虛機(jī)、網(wǎng)絡(luò)、磁盤(pán)、數(shù)據(jù)庫(kù)、應(yīng)用、容器及業(yè)務(wù)等上百種指標(biāo)監(jiān)控起來(lái),并提供各種指標(biāo)智能關(guān)聯(lián)分析,運(yùn)維人員通過(guò)統(tǒng)一的告警入口即可下鉆找到問(wèn)題根因。

QQ截圖20190710161427.png

2、 AOM——日志管理:高性能搜索和業(yè)務(wù)分析,深挖日志價(jià)值

將虛機(jī)上的應(yīng)用、開(kāi)源組件、系統(tǒng)等日志集中采集起來(lái),通過(guò)清洗、實(shí)時(shí)分析、智能聚類(lèi)等處理,實(shí)現(xiàn)了日志的高性能搜索和業(yè)務(wù)分析。同時(shí),支持自定義采集路徑、實(shí)時(shí)刷新、上下文查看、秒級(jí)搜索、日志下載、轉(zhuǎn)儲(chǔ)等常用功能,滿(mǎn)足日常所需。

QQ截圖20190710161419.png

3、 AOM——應(yīng)用&資源關(guān)聯(lián)分析:層層自動(dòng)關(guān)聯(lián),直擊異常

應(yīng)用、服務(wù)、實(shí)例、資源相關(guān)聯(lián),可以直接查看到異常影響范圍。針對(duì)應(yīng)用異常,可以直接查看其指標(biāo),通過(guò)指標(biāo)找到原因。針對(duì)資源異常,可以查看其資源對(duì)象拓?fù)鋱D及告警情況等信息來(lái)定位原因。

QQ截圖20190710161411.png

4、 APM——應(yīng)用拓?fù)浞治觯簯?yīng)用關(guān)系與異常一目了然、故障下鉆

應(yīng)用拓?fù)涫菍?duì)應(yīng)用間調(diào)用關(guān)系和依賴(lài)關(guān)系的可視化展示,包括應(yīng)用狀態(tài)、時(shí)延、錯(cuò)誤、負(fù)載、依賴(lài)關(guān)系等指標(biāo),支持?jǐn)?shù)據(jù)庫(kù)、緩存、消息中間件、NOSQL等各類(lèi)開(kāi)源組件的情況。同時(shí)可以按照時(shí)間、服務(wù)、事務(wù)、top等維度進(jìn)行篩選查看。在應(yīng)用拓?fù)渲校槍?duì)異常也可直接下鉆查看調(diào)用關(guān)系,定位異常根因。

QQ截圖20190710161356.png

5、 APM——調(diào)用鏈追蹤:性能瓶頸與異常原因分鐘識(shí)別

調(diào)用鏈跟蹤、記錄業(yè)務(wù)的調(diào)用過(guò)程,還原業(yè)務(wù)請(qǐng)求在分布式系統(tǒng)中的執(zhí)行軌跡和狀態(tài),可以分鐘識(shí)別異常原因。在業(yè)務(wù)方法被調(diào)用時(shí),可自動(dòng)捕獲該方法的調(diào)用者、詳細(xì)的堆棧以及各類(lèi)參數(shù),幫助開(kāi)發(fā)人員快速鎖定問(wèn)題現(xiàn)場(chǎng)。

QQ截圖20190710161348.png

6、 APM——業(yè)務(wù)會(huì)話(huà)監(jiān)控:監(jiān)控每筆交易的KPI數(shù)據(jù),提升用戶(hù)體驗(yàn)

從運(yùn)營(yíng)視角,了解每個(gè)業(yè)務(wù)的運(yùn)行狀況,包括交易次數(shù)、時(shí)延、錯(cuò)誤率,并通過(guò)調(diào)用鏈找到異常代碼,同時(shí)可以幫助運(yùn)營(yíng)人員了解活動(dòng)期間的交易體驗(yàn)情況。

QQ截圖20190710161342.png

7、 APM——SQL分析:快速分析慢SQL和異常SQL

數(shù)據(jù)庫(kù)SQL語(yǔ)句異常,可能會(huì)引發(fā)業(yè)務(wù)超時(shí)等問(wèn)題。在日常運(yùn)維中,可通過(guò)錯(cuò)誤耗時(shí)、響應(yīng)時(shí)間等關(guān)鍵指標(biāo)對(duì)數(shù)據(jù)庫(kù)進(jìn)行監(jiān)控,定位出那些執(zhí)行耗時(shí)長(zhǎng)、效率低、調(diào)用出錯(cuò)的SQL語(yǔ)句,并對(duì)其進(jìn)行分析和優(yōu)化。

QQ截圖20190710161334.png

8、 AOM、APM——故障智能診斷:基于機(jī)器學(xué)習(xí)算法自動(dòng)檢測(cè)應(yīng)用故障

通過(guò)運(yùn)維數(shù)據(jù),包括百種指標(biāo)監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)自動(dòng)完成故障根因分析。具體原理可分為單維度異常識(shí)別、復(fù)合事件異常識(shí)別、業(yè)務(wù)根因分析。

單維度異常識(shí)別:根據(jù)歷史指標(biāo)數(shù)據(jù)動(dòng)態(tài)生成指標(biāo)基線(xiàn),無(wú)需人工配置告警閾值。

復(fù)合事件異常識(shí)別:多維護(hù)異常指標(biāo)因果關(guān)聯(lián)分析,識(shí)別出根源告警。

業(yè)務(wù)根因分析:提取業(yè)務(wù)正常與異常時(shí)上下文數(shù)據(jù)特征,如資源、參數(shù)、調(diào)用結(jié)構(gòu),通過(guò)聚類(lèi)分析找到問(wèn)題根因。

QQ截圖20190710161328.png

5G時(shí)代,華為云強(qiáng)大可靠的運(yùn)維能力將助力互聯(lián)網(wǎng)企業(yè)上云無(wú)憂(yōu),更能抓住5G紅利,搶先擁抱數(shù)字化和智能化時(shí)代。7月2日~8月31日期間,華為云啟動(dòng)“華為云專(zhuān)蜀月”活動(dòng),重點(diǎn)為四川以及西南地區(qū)的客戶(hù)上云降低門(mén)檻,特別推出了西南節(jié)點(diǎn)ECS S3云主機(jī)還提供6折特惠的活動(dòng)。針對(duì)視頻、游戲、移動(dòng)應(yīng)用APP三大互聯(lián)網(wǎng)應(yīng)用場(chǎng)景的特惠包,包括免費(fèi)視頻加速體驗(yàn)、全球獨(dú)家云手機(jī)優(yōu)先購(gòu)買(mǎi)權(quán)、免費(fèi)高頻云服務(wù)體驗(yàn)等權(quán)利。華為云為新老客戶(hù)、生態(tài)伙伴及開(kāi)發(fā)者設(shè)計(jì)優(yōu)惠政策也誠(chéng)意滿(mǎn)滿(mǎn):對(duì)于老客戶(hù),華為云最高返券可達(dá)50%;對(duì)于新客戶(hù),則有機(jī)會(huì)獲得最高贈(zèng)2萬(wàn)元的測(cè)試券;開(kāi)發(fā)者更可獲得微認(rèn)證限時(shí)五折特惠并加返百元大禮;生態(tài)合作伙伴則享受首單5折的優(yōu)惠。

分享到

zhangnn

相關(guān)推薦