? ? ? ?構(gòu)建南網(wǎng)云,南網(wǎng)廣東公司先行
南方電網(wǎng)廣東公司隸屬中國南方電網(wǎng)有限責任公司,直接管理廣東全省19個地市供電局,以及電力調(diào)度控制、電網(wǎng)規(guī)劃、信息、通信、基建、物資、科研、教育培訓、綜合能源等多家中心機構(gòu)和直屬單位。
“十三五”信息化規(guī)劃中,南方電網(wǎng)集團提出了通過構(gòu)建“厚云薄端”的“南網(wǎng)云”來推動公司IT架構(gòu)升級,以快速響應多元化業(yè)務發(fā)展的需要。隨著南方電網(wǎng)精益化戰(zhàn)略的深入推進和競爭性業(yè)務的漸次展開,亟需通過“南網(wǎng)云”的建設來提升信息化水平,縮短應用上線周期,快速響應業(yè)務需求和市場變化,支撐業(yè)務創(chuàng)新,同時應對公司集約化帶來的挑戰(zhàn)。為積極遵循南方電網(wǎng)集團提出的“南網(wǎng)云”頂層設計統(tǒng)一技術(shù)指導思想,南方電網(wǎng)廣東公司計劃穩(wěn)步、分階段、有序地推進廣東省內(nèi)的云建設,并首先選擇了清遠基地作為試點之一進行建設。
通過項目試點,搭建南方電網(wǎng)廣東公司清遠基地電力綜合服務智慧行政云,以建設新型的互聯(lián)網(wǎng)模式業(yè)務系統(tǒng)平臺為目標,同時集大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、視頻智能分析、GIS、人工智能、無線通信等新技術(shù)于一體,實現(xiàn)應用子系統(tǒng)的互聯(lián)互通,以及數(shù)據(jù)集成和數(shù)據(jù)建模等大數(shù)據(jù)功能。智慧行政云平臺對業(yè)務管控實現(xiàn)智能聯(lián)動、圖形可視、實時調(diào)控、高效運營等,最終滿足辦公、后勤全面業(yè)務的智慧管理,同時可以根據(jù)未來業(yè)務規(guī)模按需擴展,后續(xù)也可以將清遠基地智慧應用建設成果進一步推廣至全省各地市局。
信息化之路,四大問題需解決
“十三五”期間,在云計算、大數(shù)據(jù)等相關技術(shù)的推動下,各行各業(yè)都在謀求變化,試圖構(gòu)建新的產(chǎn)業(yè)格局,占據(jù)產(chǎn)業(yè)發(fā)展的制高點,對于南方電網(wǎng)廣東公司來說也是如此。但其清遠基地信息化建設面臨著來自地域跨度大、異構(gòu)化管理、利舊觀念等問題,企業(yè)信息化建設面臨巨大挑戰(zhàn):
? ? ??業(yè)務場景多樣化:
清遠基地智慧應用涵蓋食堂、安保、會議、應急倉庫四大功能模塊的智能化系統(tǒng)基礎設施建設,包括人臉識別、車牌識別、門禁、廣播、網(wǎng)絡、Wi-Fi、監(jiān)控、報警、能源管理等多個應用系統(tǒng),主要應用于數(shù)據(jù)中心融合運維、平安城市智能運維、WLAN全生命周期管理等場景。
? ? ??數(shù)據(jù)豐富多樣:
業(yè)務覆蓋視頻類、數(shù)據(jù)類、管理類三大類,其中視頻類業(yè)務為低優(yōu)先級(be)、數(shù)據(jù)類為中優(yōu)先級(af)、管理類業(yè)務為高優(yōu)先級(ef)。因視頻業(yè)務多線程調(diào)用視頻時可能導致流量爆滿,因而需要對視頻流量進行限速。
? ? ??存量復雜:
清遠基地現(xiàn)有環(huán)境存在近百臺異構(gòu)的服務器、網(wǎng)絡和存儲設備,數(shù)據(jù)中心環(huán)境復雜,軟件平臺多樣,業(yè)務種類繁多;現(xiàn)有服務器種類和存儲涵蓋了多個廠商的產(chǎn)品,其種類也非常多;而且服務器的型號和性能也參差不齊;甚至可能出現(xiàn)即將過?;蛱蕴漠a(chǎn)品到當今主流的產(chǎn)品都有的情況。存量設備的存在和不斷增加及變化,容易造成管理人員缺乏對基礎架構(gòu)資源集中管理的情況。
? ? ??運維難度大:
以上這些現(xiàn)狀直接導致了對管理人員的技能需求相對較高,要求他們熟悉各類型的技術(shù)。而實際情況是,管理人員疲于應付日常維護工作,很難及時兼顧其他工作,具體表現(xiàn)在對異構(gòu)設備和系統(tǒng)的性能指標不能有效和集中的進行監(jiān)控,對服務器的補丁維護、軟件部署、備份、容災等方面都不能進行集中的管理,最終造成運維工作做得不夠理想,并且運維成本也很高。
目前信息化建設所存在的短板,諸如業(yè)務需求和問題響應速度慢、CSGII系統(tǒng)架構(gòu)復雜、問題定位難、開發(fā)周期長、系統(tǒng)應用質(zhì)量有待提高、持續(xù)改進能力欠缺、自主可控度不足等問題也需要通過試點項目的建設來嘗試進行緩解和解決。
? ?上云,落地南方電網(wǎng)廣東公司能源云
本項目根據(jù)將云平臺建設為新型業(yè)務系統(tǒng)平臺的目標,同時具備高度的可擴展性和可升級能力,滿足業(yè)務系統(tǒng)的穩(wěn)定運行和業(yè)務升級。結(jié)合IT的信息化建設現(xiàn)狀、用戶需求以及其整體的標準要求,需要對計算、存儲、網(wǎng)絡資源進行較徹底的云化,通過建設云平臺以滿足各方面的要求。針對南方電網(wǎng)廣東公司的具體情況及需求,九州云為其打造了一套基于OpenStack的智慧行政云解決方案,如圖1所示。
圖1 ?基于OpenStack的智慧行政云總體構(gòu)架
? ? ??云資源管理平臺(IaaS)實現(xiàn)對計算資源、存儲資源以及網(wǎng)絡資源的整合,形成統(tǒng)一的邏輯資源池,對外提供計算、存儲及網(wǎng)絡服務,其中計算服務提供裸機、KVM虛擬機、VMware虛擬機3類服務;存儲服務基于集中式存儲、分布式存儲技術(shù)提供塊存儲、對象存儲以及文件存儲3類服務;網(wǎng)絡服務提供網(wǎng)絡、子網(wǎng)、路由器、負載均衡、防火墻等服務。
平臺即服務層(Paas)將各類平臺軟件和應用程序歸類為基礎組件、技術(shù)組件和業(yè)務組件。其中基礎組件提供標準通用服務,包括關系型數(shù)據(jù)庫、大數(shù)據(jù)、數(shù)據(jù)緩存、應用中間件、消息中間件、容器、工作流引擎等,實現(xiàn)彈性計算、彈性擴容、消息通信、數(shù)據(jù)存儲等功能,所有組件已接口服務形式對外提供服務,云平臺需提供服務集成服務實現(xiàn)服務的統(tǒng)一管理,并提供持續(xù)集成和連續(xù)交付服務,為應用提供開發(fā)、運行、部署等方面支撐。(如圖2所示)
圖2 ?平臺即服務層(Paas)平臺架構(gòu)
? ? ??云管理平臺(CMP)主要提供云資源管理、云運維管理、云運營管理和接口管理幾大功能模塊。云管平臺還對交付的資源使用情況進行持續(xù)的計量和計費統(tǒng)計,提供全局、部門、項目等維度的用量統(tǒng)計分析服務,通過內(nèi)置的計費管理、配額管理、計量統(tǒng)計及報表功能,為IT運維、IT管理和IT用戶提供多種類型的統(tǒng)計分析報表,提升IT服務管理的效率和水平。
云管平臺不僅為IT運維管理提供了高效率、自動化的管理手段,還為業(yè)務用戶提供了界面友好的自助服務入口。業(yè)務用戶在服務目錄中選擇所需服務,即可自助完成云資源的申請,經(jīng)流程審批,系統(tǒng)即自動完成所申請的資源的交付,實現(xiàn)了IT服務使用和交付的云化。
作為企業(yè)級運維體系的重要基礎平臺,云管平臺還提供了完備的開發(fā)接口,支持通過REST API和更多類型的基礎資源和第三方運維管理平臺集成,如:應急指揮系統(tǒng)、視頻、食堂、安保、會議、應急倉庫系統(tǒng)等。通過持續(xù)的集成建設,最終形成云環(huán)境下流程驅(qū)動的一體化運維體系,如圖3所示。
圖3 ?云管平臺一體化運維體系
? ? ??通過該項目建設,南方電網(wǎng)廣東公司清遠基地電力綜合服務智慧行政云成為了OpenStack控制平面高可用與高性能的云管理平臺,并實現(xiàn)了多項技術(shù)創(chuàng)新:
(一)平臺高可用
整個OpenStack云平臺的高可用主要依賴控制平面的高可用,設計難點在于如何平衡關鍵服務可靠性與平臺可擴展性之間的矛盾,同時從計算、網(wǎng)絡、存儲等模塊優(yōu)化OpenStack平臺消息機制,經(jīng)過優(yōu)化后,平臺組件間的冗余消息大幅減少,消息轉(zhuǎn)發(fā)效率大幅提升。管理平臺具有高可用機制保證,實現(xiàn)集群部署,采用分布式的架構(gòu),組件具有多活的特點。
(二)深入優(yōu)化計算、存儲以及網(wǎng)絡性能
從KVM、OVS、Ceph等最底層技術(shù)開始源代碼級優(yōu)化,最終提供接近物理硬件能力的計算、存儲和網(wǎng)絡性能,為本項目各個核心業(yè)務系統(tǒng)提供了高性能、可靠的服務平臺。
(三)智能平臺監(jiān)控及告警
一旦物理機、OpenStack服務、或Ceph集群出現(xiàn)異常, Zabbix均能監(jiān)控到并自動報警. 將報警信息以短信、微信的形式發(fā)送到相關運維人員的手機上。通過與九州云的Zabbix監(jiān)控集成,實現(xiàn)現(xiàn)場大屏幕、指示燈,及自動短信發(fā)送。
(四)多租戶管理及隔離
本項目對OpenStack安全是主要從權(quán)限管理和網(wǎng)絡安全管理來控制對云平臺安全的保證。實現(xiàn)對OpenStack各個組件之間的API調(diào)用進行身份識別;通過用戶,租戶或項目(角色控制服務消費者對各個服務資源的訪問權(quán)限。此外,運用OpenStack實現(xiàn)三層分級賬戶權(quán)限管理, 為不同權(quán)限級別的用戶呈現(xiàn)不同的導航界面,支持每個業(yè)務項目組來部署與修改自己的虛機。
? ? ?云平臺提升自主創(chuàng)新,保持市場競爭力
隨著國家電力體制改革,售端市場化競爭態(tài)勢的形成,要求電網(wǎng)企業(yè)信息化能力的快速升級,以此來應對“一主兩翼、國際拓展”產(chǎn)業(yè)布局所帶來的業(yè)務發(fā)展和外部環(huán)境的快速變化。同時電力信息系統(tǒng)由分散部署到統(tǒng)一部署的轉(zhuǎn)變,面臨著海量數(shù)據(jù)的存儲能力和計算能力的瓶頸,以及系統(tǒng)的訪問壓力大等問題?;诖耍Y(jié)合電力系統(tǒng)”分級管理、分層控制、分布處理”的特點,提出一種基于OpenStack且兼容異構(gòu)資源的清遠基地私有云平臺設計方案,進而充分發(fā)揮數(shù)據(jù)的高階業(yè)務價值,服務于電力業(yè)務,提升南方電網(wǎng)廣東公司的自主創(chuàng)新能力,保持市場競爭力。
本次南方電網(wǎng)廣東公司清遠基地電力綜合服務智慧行政云,實現(xiàn)了計算、存儲、網(wǎng)絡資源徹底的云化,并將全部業(yè)務系統(tǒng)遷移到云計算平臺中,在試運行過程中,不僅穩(wěn)定可靠,更大幅提升了運行效率,后續(xù)還將在此基礎上開展運維自動化相關工具的研究,并實現(xiàn)充分與大數(shù)據(jù)平臺、物聯(lián)網(wǎng)平臺等技術(shù)結(jié)合。該OpenStack云平臺將為本項目進一步實現(xiàn)業(yè)務創(chuàng)新提供穩(wěn)定靈活、自主可控的基礎架構(gòu)支撐。
南方電網(wǎng)廣東公司清遠基地電力綜合服務智慧行政云在2019年將依托省公司、東莞局的成功經(jīng)驗,面向全省各地市局、區(qū)局推進改工作,初步預計在未來2~3年內(nèi)完成全省技改建設工作。平臺建設不是對原有系統(tǒng)的顛覆,而是在原技術(shù)體系外用云計算技術(shù)、云服務理念構(gòu)建的技術(shù)創(chuàng)新平臺,與原技術(shù)體系協(xié)同發(fā)展、互為補充,建立傳統(tǒng)應用加云應用架構(gòu)的雙模式IT服務體系,打造核心技術(shù)競爭力,支持業(yè)務創(chuàng)新發(fā)展,保障業(yè)務正常運營。