不間斷電源系統(tǒng)使用的蓄電池

面對數(shù)據(jù)中心成千上萬的蓄電池,通過人工智能自動化的方式進(jìn)行檢測和維護(hù)能極大提升效率。但現(xiàn)實(shí)中,AI在蓄電池故障預(yù)測的落地并不容易。首先,由于日常狀態(tài)UPS中使用的蓄電池通常在浮充狀態(tài)下運(yùn)行,因此監(jiān)控?cái)?shù)據(jù)的信息量遠(yuǎn)不及進(jìn)行放電測試所收集的數(shù)據(jù)。第二,沒有統(tǒng)一的電池更換標(biāo)準(zhǔn),現(xiàn)有的維護(hù)策略依賴于專家知識。第三,電池故障相關(guān)的數(shù)據(jù)量不足,使尋找高質(zhì)量模型的任務(wù)具有挑戰(zhàn)性。

此前行業(yè)關(guān)于用數(shù)據(jù)驅(qū)動電池壽命預(yù)測的研究,也多關(guān)注于電動汽車電池這類可循環(huán)使用的電池,針對UPS類等常態(tài)處于浮充狀態(tài)電池的健康管理,此前未見已有研究。

針對這些問題,騰訊清華聯(lián)合團(tuán)隊(duì)依托于騰訊智維平臺提供的海量數(shù)據(jù)中心運(yùn)營數(shù)據(jù),研究了一種用于UPS中VRLA電池的預(yù)測維護(hù)的新型數(shù)據(jù)驅(qū)動技術(shù)。據(jù)介紹,為了提高數(shù)據(jù)采集和標(biāo)注的效率,團(tuán)隊(duì)首先對電池自然老化和內(nèi)部急劇衰退兩種情況,提出了一種可以自動標(biāo)注電池退化時(shí)間點(diǎn)的算法,分別以電池內(nèi)阻和電壓離群程度進(jìn)行自動標(biāo)注,避免了數(shù)據(jù)標(biāo)注過程中的重復(fù)和繁重的體力勞動。然后,針對蓄電池監(jiān)控?cái)?shù)據(jù)數(shù)據(jù)量大、數(shù)據(jù)維度低的問題,應(yīng)用特征工程技術(shù)對數(shù)據(jù)維度進(jìn)行擴(kuò)展。在完成特征工程后,研究人員分別訓(xùn)練了邏輯回歸、隨機(jī)森林、梯度提升決策樹和人工神經(jīng)網(wǎng)絡(luò)模型,對蓄電池是否發(fā)生故障進(jìn)行預(yù)測。實(shí)驗(yàn)結(jié)果表明,AI模型對故障電池的預(yù)測準(zhǔn)確率為98%,和現(xiàn)有的基于閾值的判斷規(guī)則相比,AI模型平均能夠提前15天預(yù)測電池的故障。

目前上述研究成果已經(jīng)被研究團(tuán)隊(duì)整合形成電池AI診斷服務(wù),并在騰訊自研的數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件平臺——騰訊智維平臺上發(fā)布落地,覆蓋了騰訊自建數(shù)據(jù)中心的數(shù)萬只蓄電池。該服務(wù)能夠方便地集成進(jìn)現(xiàn)有的電池管理服務(wù)中,并能夠自動對采集到的蓄電池電壓、內(nèi)阻和溫度數(shù)據(jù)進(jìn)行分析預(yù)測。

 應(yīng)用數(shù)據(jù)驅(qū)動進(jìn)行UPS蓄電池健康管理流程圖

現(xiàn)場專家工程師對AI故障診斷的效果進(jìn)行了持續(xù)的跟進(jìn)驗(yàn)證,驗(yàn)證結(jié)果表明,相比于原有的電池維護(hù)策略,AI診斷服務(wù)能夠更加準(zhǔn)確地對電池的故障狀態(tài)進(jìn)行提前預(yù)測,同時(shí)還可以檢測出超出專家知識范圍的潛在電池故障,這使得數(shù)據(jù)中心的運(yùn)維工程師能夠?qū)π铍姵氐木S護(hù)更換進(jìn)行更加有針對性地規(guī)劃,有效提高了蓄電池的運(yùn)維效率,進(jìn)一步保障數(shù)據(jù)中心的可靠性。在對騰訊天津數(shù)據(jù)中心3號樓的6880節(jié)電池進(jìn)行現(xiàn)場實(shí)際落地驗(yàn)證發(fā)現(xiàn),電池健康管理服務(wù)可以實(shí)現(xiàn)96.2%的告警準(zhǔn)確率,且告警時(shí)間比實(shí)際故障提前5~30天,大大優(yōu)于傳統(tǒng)的基于經(jīng)驗(yàn)規(guī)則的分析方案。

目前,騰訊團(tuán)隊(duì)正在逐步擴(kuò)大落地范圍,未來將通過智維平臺,實(shí)現(xiàn)對騰訊幾十萬節(jié)電池的業(yè)務(wù)覆蓋。

據(jù)了解,騰訊智維平臺由服務(wù)騰訊內(nèi)部的星云平臺升級而來,是騰訊將近20年數(shù)據(jù)中心運(yùn)營經(jīng)驗(yàn)與智能化、云化技術(shù)相結(jié)合,自研的一款數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件平臺。通過騰訊智維平臺,可以實(shí)現(xiàn)數(shù)據(jù)中心的智能告警、智能巡檢、智能容量分析和透明化的客戶體驗(yàn),為全局把控、精細(xì)化管理、優(yōu)化運(yùn)營成本提供基礎(chǔ),同時(shí)也為技術(shù)專家實(shí)時(shí)、異地處理告警和數(shù)據(jù)中心的無人值守創(chuàng)造可能。它可以幫助客戶360°掌握數(shù)據(jù)中心的運(yùn)行情況,持續(xù)提升運(yùn)營的質(zhì)量與效率,降低成本投入,將數(shù)據(jù)中心的價(jià)值極大化。騰訊智維平臺就像是數(shù)據(jù)中心的“大腦”,為騰訊數(shù)據(jù)中心賦予了精密的感知能力和快速迭代進(jìn)化的能力。

騰訊智維平臺功能簡介

目前,騰訊智維平臺已在騰訊超過80個(gè)大規(guī)模數(shù)據(jù)中心進(jìn)行部署,覆蓋了全球12個(gè)國家和地區(qū),運(yùn)營管理了超過100萬臺服務(wù)器,測點(diǎn)數(shù)量超過600萬個(gè)。同時(shí),騰訊智維也和重慶電信、廣東電信等運(yùn)營商和銀行、證券等各行業(yè)的客戶達(dá)成了合作關(guān)系。據(jù)了解,騰訊智維平臺接入部署后,為重慶電信在能耗優(yōu)化方面提升30%左右,每年節(jié)省電費(fèi)達(dá)百萬元以上。

騰訊聯(lián)合高校攜手推進(jìn)新基建領(lǐng)域技術(shù)創(chuàng)新及應(yīng)用落地

早在2006年,騰訊就圍繞人才培養(yǎng)、聯(lián)合研究和學(xué)術(shù)交流三條主線啟動了騰訊高校合作項(xiàng)?,并先后與清華大學(xué)、哈爾濱工業(yè)大學(xué)、中科院計(jì)算所、北京大學(xué)、華中科技大學(xué)、中國人民大學(xué)、南京大學(xué)、西安交通大學(xué)等多所知名高校成立聯(lián)合實(shí)驗(yàn)室,且與眾多領(lǐng)域?qū)<议_展產(chǎn)學(xué)研合作。

騰訊數(shù)據(jù)中心實(shí)地勘察研討交流

2016年,騰訊IDC平臺部與清華大學(xué)自動化系智網(wǎng)中心團(tuán)隊(duì)的趙千川、賈慶山和夏俐老師建立了數(shù)據(jù)中心自動化運(yùn)維領(lǐng)域的產(chǎn)學(xué)研合作。研究工作以提升數(shù)據(jù)中心運(yùn)營質(zhì)量、降低運(yùn)營成本和提升運(yùn)營效率三個(gè)目標(biāo)為出發(fā)點(diǎn),經(jīng)過雙方多年持續(xù)耕耘,已累積發(fā)表6篇高質(zhì)量學(xué)術(shù)論文,輸出7項(xiàng)發(fā)明專利。

騰訊數(shù)據(jù)中心和高校專業(yè)研究團(tuán)隊(duì)的合作研究,不僅集中在電池健康管理的研究上。在數(shù)據(jù)中心智能告警方面,研究團(tuán)隊(duì)提出了告警預(yù)警多維分析方案,綜合設(shè)備狀態(tài)、設(shè)備工藝,采用多傳感器融合以及專家知識等方法,通過對數(shù)據(jù)中心的告警數(shù)據(jù)的根因分析和關(guān)聯(lián)性分析,對數(shù)據(jù)中心告警風(fēng)暴進(jìn)行收斂,有效減少冗余告警信息,實(shí)現(xiàn)了對數(shù)據(jù)中心設(shè)備的準(zhǔn)確告警和提前預(yù)警,并在海量告警場景中進(jìn)行告警溯源、定位根因,幫助現(xiàn)場工程師快速定位故障,有效提升現(xiàn)場告警的準(zhǔn)確性和響應(yīng)效率。該方案已應(yīng)用于騰訊智維平臺,在近百個(gè)騰訊的數(shù)據(jù)中心中提供實(shí)際支持。

在數(shù)據(jù)中心節(jié)能方面,研究團(tuán)隊(duì)采用AI技術(shù),構(gòu)建了數(shù)據(jù)中心能效預(yù)測模型,實(shí)現(xiàn)對數(shù)據(jù)中心能效的精準(zhǔn)預(yù)測,并提供數(shù)據(jù)中心能效影響因子的解釋性服務(wù),同時(shí)基于能效預(yù)測模型進(jìn)行自動尋優(yōu)的智能分析,輸出節(jié)能優(yōu)化建議。該方案已在騰訊天津數(shù)據(jù)中心4號樓完成第一階段的落地驗(yàn)證,實(shí)現(xiàn)良好的節(jié)能效果,證明AI技術(shù)在數(shù)據(jù)中心節(jié)能方面的應(yīng)用價(jià)值和巨大潛力。

隨著相關(guān)研究的不斷深入,騰訊與清華將有更多研究成果在騰訊智維平臺上落地發(fā)布,推動平臺由自動化向智能化發(fā)展。

如今,數(shù)據(jù)中心智能化已成為其主要的發(fā)展方向,作為所有互聯(lián)網(wǎng)業(yè)務(wù)的基石,數(shù)據(jù)中心正在人工智能技術(shù)的推動下發(fā)生著運(yùn)維管理的大變革。作為世界領(lǐng)先的互聯(lián)網(wǎng)公司,也是全球IaaS市場增長最快的云計(jì)算廠商之一,騰訊全網(wǎng)服務(wù)器總量已經(jīng)超過110萬臺,是中國首家服務(wù)器總量超過百萬的公司,也是全球五家服務(wù)器數(shù)量過百萬的公司之一。在此背景下,騰訊數(shù)據(jù)中心圍繞“降本增效”的核心訴求,不斷整合自身資源與經(jīng)驗(yàn),加速構(gòu)建基礎(chǔ)設(shè)施層的自研技術(shù)體系。

2020年3月4日,在中共中央政治局常務(wù)委員會召開的會議上,決策層強(qiáng)調(diào),要加快推進(jìn)國家規(guī)劃已明確的重大工程和基礎(chǔ)設(shè)施建設(shè),其中5G 網(wǎng)絡(luò)、大數(shù)據(jù)中心、人工智能等新型基礎(chǔ)設(shè)施建設(shè)成為備受關(guān)注的方向。人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力,正在釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的巨大能量,持續(xù)探索人工智能技術(shù)在數(shù)據(jù)中心的應(yīng)用,以人工智能賦能數(shù)據(jù)中心,將極大地推動數(shù)據(jù)中心由自動化向智能化發(fā)展,也將促進(jìn)數(shù)據(jù)中心快速適應(yīng)新的智能化業(yè)務(wù)的需求。

延伸閱讀:

國際自動控制聯(lián)合會(IFAC,International Federation of Automatic Control)成立于1957年,是一個(gè)以國家組織為其成員的國際性學(xué)術(shù)組織,中國是創(chuàng)始國之一。該組織負(fù)責(zé)定期舉行控制方面的國際會議,方便控制領(lǐng)域的學(xué)者和工程師更好地進(jìn)行學(xué)術(shù)交流。由其舉辦的IFAC世界大會(IFAC World Congress),于1960年起每三年召開一次,致力于反映世界范圍內(nèi)控制理論與應(yīng)用發(fā)展的新成果和趨勢,是自動控制領(lǐng)域公認(rèn)的頂級學(xué)術(shù)會議。

分享到

zhangnn

相關(guān)推薦