IT基礎(chǔ)設(shè)施中的盲點(diǎn):在虛擬化已成為必選配置之后,容器、微服務(wù)、混合云、多云、云+邊緣等最新趨勢也將進(jìn)一步加劇IT基礎(chǔ)設(shè)施的復(fù)雜度,盲點(diǎn)也自然隨之而生?!靶睦餂]底“是很多客戶在面對復(fù)雜度呈指數(shù)級增長的IT基礎(chǔ)設(shè)施時的共同心態(tài)。與其在半夜三更爬起來處理緊急網(wǎng)絡(luò)故障,不如未雨綢繆,建立一套可以消除盲點(diǎn)的監(jiān)控體系。
各類監(jiān)控工具自然是早已有之,但能適應(yīng)IT基礎(chǔ)設(shè)施最新發(fā)展的現(xiàn)代監(jiān)控體系必須能“整合“進(jìn)基礎(chǔ)設(shè)施本身之中,換句話說,監(jiān)控工具也應(yīng)具有虛擬化或云原生的基因。所有支撐數(shù)字化轉(zhuǎn)型的IT基礎(chǔ)設(shè)施所具備的特點(diǎn),也應(yīng)同樣適用于監(jiān)控方案。唯有如此,監(jiān)控才能伴隨基礎(chǔ)設(shè)施一同發(fā)展,并深入到日益復(fù)雜的基礎(chǔ)設(shè)施的方方面面,才能看到傳統(tǒng)監(jiān)控工具看不到的“盲點(diǎn)”。
在認(rèn)識到基礎(chǔ)設(shè)施復(fù)雜性的同時,也應(yīng)意識到不同組件間的普遍關(guān)聯(lián)性。如果仍將基礎(chǔ)設(shè)施“分門別類”并分別加以監(jiān)控,將只會在不同的部門之間樹立一個個獨(dú)立的“煙筒”,既令監(jiān)控方案與基礎(chǔ)設(shè)施方鑿圓枘,無法發(fā)揮已有監(jiān)控工具的能力,也無法通過統(tǒng)一的數(shù)據(jù)分析納管消除盲點(diǎn)。
擴(kuò)展監(jiān)控的能力:IT基礎(chǔ)設(shè)施在變得日益復(fù)雜的同時帶來了一個簡單粗暴的問題:如此大規(guī)模的數(shù)據(jù)采集和處理監(jiān)控工具能不能扛得住?曾有報道提到Google每周啟動40億個容器,Uber的監(jiān)控系統(tǒng)每秒鐘采集5億條指標(biāo)。這些事件產(chǎn)生的是海量的需要處理的數(shù)據(jù)。即便很多企業(yè)或組織達(dá)不到這種互聯(lián)網(wǎng)巨頭的體量,但物理機(jī)、虛擬機(jī)、容器和網(wǎng)絡(luò)規(guī)模的大幅度增長也是數(shù)字化轉(zhuǎn)型過程中必然可以預(yù)見的事情。當(dāng)量變產(chǎn)生質(zhì)變,之前的工具和手段是否仍然行之有效,或者說,當(dāng)前的監(jiān)控方案為IT基礎(chǔ)設(shè)施的增長預(yù)留了多大的成長空間,自然成為CIO和IT Leader關(guān)心的事情。相應(yīng)的,現(xiàn)代監(jiān)控系統(tǒng)也應(yīng)具備這種伸縮能力以及深度優(yōu)化的數(shù)據(jù)處理性能,才能持續(xù)為數(shù)字化轉(zhuǎn)型保駕護(hù)航。這不僅要求該方案具有極高的技術(shù)含量,同時也需要深厚的產(chǎn)品哲學(xué)和數(shù)據(jù)理念。
成熟的IT運(yùn)維流程:數(shù)字化轉(zhuǎn)型享有的一大優(yōu)勢就是能以敏捷的方式應(yīng)對業(yè)務(wù)和客戶的需求,從而對市場做出快速反應(yīng)。這一方面需要IT基礎(chǔ)設(shè)施提供生產(chǎn)資料保證,另一方面,生產(chǎn)資料能創(chuàng)造多大的生產(chǎn)力,仍然取決于它握在誰的手里。傳統(tǒng)的IT運(yùn)維團(tuán)隊往往以各種形式劃分為獨(dú)立的小團(tuán)隊,團(tuán)隊之間會一般性地存在信息壁壘。這些壁壘導(dǎo)致運(yùn)維流程只能不斷遷就人為的限制,造成效率方面的損失,已不能適應(yīng)數(shù)字化轉(zhuǎn)型之后的IT基礎(chǔ)設(shè)施的發(fā)展。
為了應(yīng)對數(shù)字化轉(zhuǎn)型帶來的挑戰(zhàn),CIO和IT Leader需要考慮為DevOps團(tuán)隊打造更加成熟的流程。一支訓(xùn)練有素的DevOps團(tuán)隊將是提高企業(yè)生產(chǎn)力的最核心要素。高效的團(tuán)隊一定有成熟的流程保證,但流程的制定是建立在信息透明,全局可控的基礎(chǔ)之上。不同職能的個人可以在一個統(tǒng)一的可視化監(jiān)控平臺中交換信息,形成合力,逐步完善運(yùn)維、擴(kuò)容和安全流程,這也應(yīng)是監(jiān)控體系在數(shù)字化轉(zhuǎn)型中提供的能力。當(dāng)企業(yè)或組織的CIO和IT Leader在評估IT基礎(chǔ)設(shè)施中的監(jiān)控方案時,需要著意上述提到的數(shù)字化轉(zhuǎn)型過程中的風(fēng)險以及它們的應(yīng)對方法。