故障快照工作流程

故障快照 (What Just Happened, WJH) 是一種全新的智能監(jiān)測(cè)技術(shù),遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的流遙測(cè)(Streaming Telemetry)和帶內(nèi)網(wǎng)絡(luò)遙測(cè) (Inband Network Telemetry) 技術(shù)。傳統(tǒng)的遙測(cè)技術(shù)從網(wǎng)絡(luò)端口計(jì)數(shù)器、統(tǒng)計(jì)數(shù)據(jù)包采樣和逐跳帶內(nèi)網(wǎng)絡(luò)遙測(cè)數(shù)據(jù)中提取數(shù)據(jù),因而會(huì)產(chǎn)生大量的數(shù)據(jù)。這類遙測(cè)數(shù)據(jù)缺乏關(guān)于異常網(wǎng)絡(luò)行為的上下文或可操作詳情,使網(wǎng)絡(luò)管理員不得不采用各種監(jiān)視工具執(zhí)行長(zhǎng)時(shí)間的分析,才可能找出網(wǎng)絡(luò)問(wèn)題的根本原因?;?WJH 事件的遙測(cè)技術(shù)提供直接、可操作的信息,無(wú)需再為排除網(wǎng)絡(luò)故障而進(jìn)行推測(cè)。

故障快照WJH 解決方案利用 Mellanox Spectrum? 和 Spectrum?-2 以太網(wǎng)交換機(jī)芯片內(nèi)置的獨(dú)特硬件功能,以T-比特級(jí)別的速率檢測(cè)數(shù)據(jù)包,速度遠(yuǎn)遠(yuǎn)快于業(yè)界傳統(tǒng)的的基于軟件或固件數(shù)據(jù)包檢測(cè)的解決方案。在基于 Mellanox 的交換機(jī)系統(tǒng)中,WJH 以線速檢測(cè)所有端口上的數(shù)據(jù)包,這是傳統(tǒng)的深度數(shù)據(jù)包檢測(cè)解決方案無(wú)法無(wú)法企及的速度。然后,WJH 會(huì)識(shí)別異常行為,將其整合為簡(jiǎn)潔、具體且可操作的數(shù)據(jù),從而實(shí)現(xiàn)云應(yīng)用程序和關(guān)鍵業(yè)務(wù)操作的快速修復(fù)與恢復(fù)。WJH 現(xiàn)已可用于最新版 Mellanox Onyx?、Cumulus Linux 和 SONiC 網(wǎng)絡(luò)操作系統(tǒng)。Mellanox WJH 技術(shù)支持開(kāi)放以太網(wǎng),可以輕松與 InfluxDB、Grafana、Kibana 等開(kāi)源工具集成,也可以與 Mellanox NEO 和 Cumulus 的 NetQ 等數(shù)據(jù)中心范圍的監(jiān)控解決方案相結(jié)合。

Mellanox Technologies 以太網(wǎng)交換機(jī)事業(yè)部副總裁 Amit Katz 表示:“我們最先進(jìn)的以太網(wǎng)交換機(jī)已經(jīng)在市場(chǎng)上大規(guī)模部署,提供業(yè)界領(lǐng)先的延遲和數(shù)據(jù)包轉(zhuǎn)發(fā)性能。如今,客戶需要一個(gè)更智能的網(wǎng)絡(luò),除了完全無(wú)感知自動(dòng)安裝和配置外,還需要在故障排除時(shí)可以為您清晰展現(xiàn)原始現(xiàn)場(chǎng)。每個(gè)嘗試過(guò)故障快照WJH 的客戶都會(huì)倍感驚訝 — 故障快照WJH 竟能如此迅速地發(fā)現(xiàn)其網(wǎng)絡(luò)中那些從未被人知曉的行為。我們?yōu)樗锌蛻裘赓M(fèi)提供先進(jìn)的 WJH 遙測(cè)技術(shù),而無(wú)需像業(yè)界常見(jiàn)做法,那樣為每個(gè)額外的功能購(gòu)買功能許可證。WJH 是技術(shù)發(fā)展的推動(dòng)者,是實(shí)現(xiàn)自主和自愈網(wǎng)絡(luò)不可或缺的元素?!?/p>

HPE 存儲(chǔ)網(wǎng)絡(luò)研發(fā)總監(jiān) Rupin Mohan 表示:“Hewlett Packard Enterprise 存儲(chǔ)網(wǎng)絡(luò)產(chǎn)品采用Mellanox Spectrum系列交換機(jī)(HPE M-系列)。對(duì)于存儲(chǔ)管理員來(lái)說(shuō),排除網(wǎng)絡(luò)和 SAN 故障始終是一項(xiàng)挑戰(zhàn)。? 借助 故障快照WJH技術(shù),我們解決了這個(gè)問(wèn)題,能在幾分鐘內(nèi)輕松排除嚴(yán)重的網(wǎng)絡(luò)故障。這正是 ESF (Ethernet Storage Fabric)的強(qiáng)大之處,它不再只是單純的以太網(wǎng)交換機(jī)。故障快照WJH 和 智能網(wǎng)絡(luò)部署Smart Fabric Orchestrator (SFO) 的組合增強(qiáng)了 HPE M-系列解決方案,并通過(guò)提供高級(jí)診斷簡(jiǎn)化了 SAN 管理和故障排除,從而幫助業(yè)務(wù)正常運(yùn)行,同時(shí)不會(huì)降低網(wǎng)絡(luò)性能?!?/p>

Cumulus Networks 首席執(zhí)行官 Josh Leslie 表示:“隨著 Web-scale 網(wǎng)絡(luò)成為企業(yè)網(wǎng)絡(luò)的新規(guī)范,復(fù)雜性也隨之而來(lái),對(duì)增強(qiáng)可視性的需求也日益增長(zhǎng)。在提供全網(wǎng)遙測(cè)的 Cumulus NetQ 之上,故障快照WJH 在逐個(gè)交換機(jī)上以線速收集所有端口數(shù)據(jù)包信息??蛻魧⒐收峡煺?WJH 和 Cumulus NetQ 結(jié)合使用,提供故障數(shù)據(jù)包信息和全網(wǎng)遙測(cè)信息,在整個(gè)網(wǎng)絡(luò)Fabric結(jié)構(gòu)中實(shí)現(xiàn)更深入的可視性,可以更好地了解整個(gè)網(wǎng)絡(luò)?!?/p>

Western Digital 數(shù)據(jù)中心系統(tǒng)業(yè)務(wù)部產(chǎn)品管理高級(jí)總監(jiān) Scott Hamilton 表示:“NVMe over Fabrics? 作為下一代可組合/解耦基礎(chǔ)架構(gòu) (CDI) 的基礎(chǔ)— 可在此架構(gòu)中為特定的應(yīng)用程序工作負(fù)載有條理且動(dòng)態(tài)地配置計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)。像 Mellanox 的 故障快照WJH 這樣的工具會(huì)非常有用。在 CDI 中,這些高度可擴(kuò)展的池(包括 OpenFlex? 存儲(chǔ)平臺(tái)),必須可跨網(wǎng)絡(luò)Fabric訪問(wèn),并能隨時(shí)隨地根據(jù)需要提供資源。因此,了解網(wǎng)絡(luò)性能和帶寬瓶頸,并優(yōu)化設(shè)置以實(shí)現(xiàn)最低延遲和最高性能,快速定位故障問(wèn)題,對(duì)于滿足數(shù)據(jù)密集型應(yīng)用和數(shù)據(jù)驅(qū)動(dòng)環(huán)境的需求至關(guān)重要?!?/p>

Excelero 的首席技術(shù)官 Yaniv Romem 解釋到:“Excelero 和 Mellanox 共同致力于幫助以太網(wǎng)存儲(chǔ)矩陣(ESF)客戶充分發(fā)揮其 IT 系統(tǒng)的最大潛能,而全新的 Mellanox 故障快照WJH技術(shù) 讓這一目標(biāo)更易于實(shí)現(xiàn)。我們很高興能在跨任何網(wǎng)絡(luò)共享 NVMe 閃存的 NVMesh 解決方案中,利用 Mellanox 的 故障快照WJH 先進(jìn)可視化功能。借助 故障快照WJH,在解決那些大家熟知的難以重現(xiàn)的異常情況方面,我們節(jié)省了大量時(shí)間,確保了存儲(chǔ)訪問(wèn)始終如一的低延遲?!?/p>

Apstra 的首席營(yíng)銷官兼產(chǎn)品副總裁 Michael Wood 表示:“Apstra 基于意圖的數(shù)據(jù)中心自動(dòng)化提高了應(yīng)用程序的可靠性和可用性,簡(jiǎn)化了部署和運(yùn)營(yíng),顯著降低了企業(yè)和云服務(wù)提供商的成本。Apstra 開(kāi)創(chuàng)了基于意圖的網(wǎng)絡(luò)。單一事實(shí)來(lái)源和實(shí)時(shí)驗(yàn)證加上基于意圖的網(wǎng)絡(luò)分析,可以用來(lái)持續(xù)監(jiān)控、衡量和識(shí)別與原始意圖、設(shè)計(jì)和期望的偏差。Mellanox 故障快照WJH技術(shù)能夠利用硬件加速遙測(cè),該技術(shù)可作為 Apstra 基于意圖的網(wǎng)絡(luò)的一部分,以進(jìn)一步增加跨數(shù)據(jù)中心基礎(chǔ)架構(gòu)收集、處理和分析的信息的數(shù)量、粒度和深度?!?/p>

Dell’Oro Group 的高級(jí)總監(jiān) Sameh Boujelbene 表示:“計(jì)劃外的數(shù)據(jù)中心中斷每年會(huì)造成數(shù)百萬(wàn)美元的收入損失。在當(dāng)今的數(shù)字世界中,穩(wěn)定的網(wǎng)絡(luò)是可靠業(yè)務(wù)運(yùn)營(yíng)的關(guān)鍵,而只有清楚網(wǎng)絡(luò)中正在發(fā)生的情況才能實(shí)現(xiàn)這一目標(biāo)。? 隨著數(shù)據(jù)中心網(wǎng)絡(luò)性能提升和采用Overlay網(wǎng)絡(luò)技術(shù)(如 VXLAN 和 GENEVE)帶來(lái)額外的復(fù)雜性,網(wǎng)絡(luò)確實(shí)需要更先進(jìn)的可視性。? 先進(jìn)的網(wǎng)絡(luò)遙測(cè)技術(shù)是一項(xiàng)新興技術(shù),可以用來(lái)提升數(shù)據(jù)中心的正常運(yùn)行時(shí)間。雖然多年來(lái),所有數(shù)據(jù)中心交換機(jī)均早已采用基礎(chǔ)的遙測(cè)技術(shù),但這種新型的先進(jìn)遙測(cè)技術(shù)現(xiàn)已成為網(wǎng)絡(luò)運(yùn)營(yíng)商關(guān)注的創(chuàng)新領(lǐng)域,而且我們相信故障快照 WJH 將推動(dòng)業(yè)界對(duì) Mellanox 以太網(wǎng)交換機(jī)的需求增長(zhǎng)?!?/p>

Nimbix Inc. 的聯(lián)合創(chuàng)始人兼服務(wù)交付副總裁 Rob Sherrard 表示:“Nimbix 通過(guò)提供專門為這些工作負(fù)載優(yōu)化的云計(jì)算技術(shù),加速了 HPC、人工智能和機(jī)器/深度學(xué)習(xí)應(yīng)用程序。Mellanox 的交換機(jī)是我們一流的云計(jì)算基礎(chǔ)架構(gòu)的一部分,我們很高興使用故障快照WJH技術(shù)來(lái)提高數(shù)據(jù)中心網(wǎng)絡(luò)的利用率,同時(shí)提高整個(gè)網(wǎng)絡(luò)的可視性?!?/p>

Mellanox 將于 5 月 20 日至 23 日在巴塞羅那舉辦的 2019 年 KubeCon 活動(dòng)上展示 故障快照WJH 技術(shù)。歡迎參觀 Mellanox 的 S33 展臺(tái),了解內(nèi)置先進(jìn)網(wǎng)絡(luò)遙測(cè)技術(shù)的 Mellanox 高吞吐量網(wǎng)絡(luò)解決方案的優(yōu)勢(shì)所在。

分享到

崔歡歡

相關(guān)推薦