3.1. 方案概述

在該項目建設(shè)中, DeepFlow? 平臺對接范圍包括阿里公有云、VMware、華為公有云、華為私有云、微軟公有云共5個平臺。通過部署DeepFlow? 采集器、控制器和數(shù)據(jù)節(jié)點三大組件,幫助地產(chǎn)科技企業(yè)在混合云環(huán)境中實現(xiàn)了虛擬網(wǎng)絡(luò)流量的統(tǒng)一采集和實時分析,實現(xiàn)對業(yè)務(wù)關(guān)鍵鏈路的全面性能監(jiān)控,并提供虛擬網(wǎng)絡(luò)端到端的路徑診斷。

采集器運行于5朵云的計算節(jié)點,通過從控制器獲取ACL規(guī)則,提供對云環(huán)境中的網(wǎng)包數(shù)據(jù)完備的采集和預(yù)處理能力(如過濾、分發(fā)、Flow生成、Flow截取、脫敏等功能)可精細(xì)地實現(xiàn)對云網(wǎng)絡(luò)流量的采集和分析。

控制器組件以集群模式旁路部署在本地資源池的標(biāo)準(zhǔn)x86服務(wù)器中,提供5朵云的對接和全部采集器的管理以及采集策略的管理。數(shù)據(jù)節(jié)點部署方式和控制器相同,提供豐富的實時分析和回溯取證等功能,并根據(jù)項目規(guī)劃要求,支持橫向擴(kuò)展。

3.2. 部署實施

在項目實施過程中,控制器和數(shù)據(jù)節(jié)點旁路部署在地產(chǎn)科技企業(yè)本地資源池的x86集群,控制器通過對接云平臺實現(xiàn)了虛擬機(jī)遷移感知,從而實現(xiàn)了采集策略的自動化跟隨;同時 DeepFlow? 擁有對自身系統(tǒng)的全面監(jiān)控能力,以確保平臺穩(wěn)定運行且不會對地產(chǎn)科技企業(yè)云環(huán)境造成影響。根據(jù)5朵不同云的技術(shù)差異,采集器組件在不同的云環(huán)境中,采取了如下部署方式:

在基于開源OpenStack云平臺環(huán)境(如華為私有云)中,采集器以用戶態(tài)進(jìn)程的形式安裝在宿主機(jī)上,利用宿主機(jī)操作系統(tǒng)自身內(nèi)核的功能模塊,對其虛擬網(wǎng)卡進(jìn)行流量采集。

在VMware云平臺、微軟Hyper-V虛擬化環(huán)境和其他公有云中,通過在獨立虛擬機(jī)中安裝采集器的方式,借助宿主機(jī)或公有云操作系統(tǒng)自帶的虛擬交換機(jī)功能實現(xiàn)流量的采集。

3.2.1. 云網(wǎng)全景圖

地產(chǎn)科技企業(yè)云平臺對資源上下級的關(guān)聯(lián)展示有所缺失。例如網(wǎng)管平臺只有宿主機(jī)與虛擬機(jī)的信息關(guān)系,而云平臺又只有VPC、子網(wǎng)、虛擬機(jī)信息;當(dāng)宿主機(jī)故障時,無法判斷影響了哪些客戶的哪些資源。借助 DeepFlow? 資源拓?fù)浼饶懿榭促Y源的所有云平臺信息、流量統(tǒng)計信息,又能根據(jù)不同視角來查看資源的關(guān)聯(lián)關(guān)系;例如VPC視角能將VPC關(guān)聯(lián)的虛擬網(wǎng)關(guān)、VPC所包含的子網(wǎng)、虛擬機(jī)、虛擬路由器、虛擬安全組、外網(wǎng)/內(nèi)網(wǎng)IP等全部呈現(xiàn)。

現(xiàn)有的流量統(tǒng)計和管理工具中,基本具備對單資源點的監(jiān)控,但多資源之間的流量走向關(guān)系卻不能直觀地可視化,因此則不能進(jìn)行帶寬資源優(yōu)化,也不能監(jiān)控流量到底流向何方。借助 DeepFlow? 流量拓?fù)淠芰?,云平臺的運營者不僅能從大范圍到小范圍層層深入揭示流量拓?fù)潢P(guān)系,也能窺見資源與資源之間、資源與Internet之間、資源與未知流量之間的關(guān)系。

3.2.2. 云網(wǎng)診斷

云時代東西向流量占比越來越大,虛擬網(wǎng)絡(luò)越來越得到重視,但虛擬網(wǎng)絡(luò)問題的定位還處在蠻荒期,多數(shù)場景下都是一邊人工查看配置信息,一邊找到對應(yīng)設(shè)備,一邊導(dǎo)流量分析的狀態(tài)。云平臺運營者無法準(zhǔn)確知曉業(yè)務(wù)部門提出來的帶寬需求是否合理;也不知道虛擬機(jī)的投放是否符合業(yè)務(wù)需求;不清楚東西向的流量與南北向流量的變化;難以區(qū)分哪些業(yè)務(wù)的流量產(chǎn)生了異常;不能預(yù)判活躍TCP端口是否有變化。

地產(chǎn)科技企業(yè)的5朵云不同程度地遇到了上述問題,要解決上述問題需要先解決東西向流量帶來的巨大壓力。DeepFlow? 依靠精準(zhǔn)的流量預(yù)處理能力,從多資源維度、多租戶視角、多流量場景、任意時間粒度來統(tǒng)計與分析云網(wǎng)流量、包量,針對業(yè)務(wù)畫像梳理出來的業(yè)務(wù)做可視化監(jiān)控。此外,DeepFlow? 提供了豐富的可自定義告警設(shè)置,通過對不同的云資源池、設(shè)定詳細(xì)的網(wǎng)絡(luò)性能監(jiān)控指標(biāo)和告警閾值,從而實現(xiàn)了快速發(fā)現(xiàn)和定位業(yè)務(wù)網(wǎng)絡(luò)異常;結(jié)合支持五元組采集過濾的PCAP下載功能,滿足了故障回溯取證的需求,覆蓋了故障事前預(yù)警和事后分析的全場景。

4. 價值總結(jié)

在不侵?jǐn)_生產(chǎn)網(wǎng)絡(luò)、不影響業(yè)務(wù)連續(xù)性的前提下,DeepFlow? 通過與地產(chǎn)科技企業(yè)多云平臺的對接,在層次復(fù)雜的虛擬網(wǎng)絡(luò)環(huán)境中從服務(wù)和應(yīng)用角度,梳理并監(jiān)控業(yè)務(wù)網(wǎng)絡(luò),通過對網(wǎng)絡(luò)指標(biāo)的異常信息進(jìn)行實時分析,為業(yè)務(wù)在虛擬網(wǎng)絡(luò)中的運行狀態(tài)提供及時的監(jiān)控告警。地產(chǎn)科技企業(yè)通過部署 DeepFlow? 實現(xiàn)了異構(gòu)云資源池虛擬網(wǎng)絡(luò)流量的按需采集、統(tǒng)一管理,解決了多云環(huán)境下虛擬流量的一體化管理和分析,為企業(yè)的業(yè)務(wù)整合、資源打通和基礎(chǔ)設(shè)施建設(shè)打下了堅實的基礎(chǔ)。

分享到

songjy

相關(guān)推薦