曾欽杵介紹,自研發(fā)之初,騰訊就作了充分的考量來明確需求邊界,并定義了目前符合騰訊主流業(yè)務(wù)的硬件系統(tǒng)。同時,星星海還系統(tǒng)地考慮了IDC基礎(chǔ)建設(shè)及服務(wù)器硬件成本,能耗成本和運(yùn)維成本。依托自主可控知識產(chǎn)權(quán)、自定義硬件、BMC與BIOS等相關(guān)固件,星星海支持不同供應(yīng)商共同生產(chǎn),拓展了更多關(guān)鍵器件直采的可能性,也能夠滿足數(shù)據(jù)中心對于服務(wù)器可控供應(yīng)、快速交付、精簡成本、可靠質(zhì)量等方面的要求。

在硬件體系統(tǒng)方面,星星海采用可重構(gòu)硬件系統(tǒng)的方式,進(jìn)行模塊化設(shè)計,以滿足服務(wù)器設(shè)計多樣化的需求,提升運(yùn)營效率。統(tǒng)一的騰訊自研型服務(wù)器整機(jī)底座,能夠兼容多種硬件平臺,支持多代服務(wù)器產(chǎn)品,減少數(shù)據(jù)中心配件種類,有效降低運(yùn)營成本,提升運(yùn)營效率。在整機(jī)底座的基礎(chǔ)上,通過可重構(gòu)性模塊組合,星星??梢愿采w絕大多數(shù)業(yè)務(wù)應(yīng)用場景。

在運(yùn)維方面,星星海實現(xiàn)免工具快速維護(hù),能夠大幅度提升運(yùn)維效率,降低風(fēng)險。在環(huán)境測試方面,騰訊云根據(jù)數(shù)據(jù)中心需求,強(qiáng)化相關(guān)測試標(biāo)準(zhǔn),充分保證產(chǎn)品質(zhì)量。截至目前,星星海的DOA(到貨即損率)是零。

在系統(tǒng)散熱方面,星星海通過精細(xì)化的仿真,針對CPU、DIMM、OCP、M.2/U.2等關(guān)鍵部件優(yōu)化散熱布局,精細(xì)風(fēng)道管理。目前,星星海的系統(tǒng)風(fēng)冷方案,可直接支持平臺全系統(tǒng)的CPU。同時,騰訊云還將繼續(xù)研究前沿散熱技術(shù),不止于追求散熱器以及風(fēng)扇的最優(yōu)化。

在能耗優(yōu)化及硬件防護(hù)方面,星星海針對主流的業(yè)務(wù)應(yīng)用場景及系統(tǒng)級的能耗狀況,優(yōu)化特定系統(tǒng)部件的能耗效率,并對高功耗的模塊進(jìn)行分區(qū)域電流監(jiān)控。以PSU為例,根據(jù)系統(tǒng)在主流業(yè)務(wù)的應(yīng)用場景,確定系統(tǒng)功耗范圍,與PSU廠商合作,進(jìn)一步提高PSU部件在該范圍的轉(zhuǎn)化效率,從而降低整體系統(tǒng)在數(shù)據(jù)中心的能耗。針對主板進(jìn)行HSC電源設(shè)計,提供遠(yuǎn)程AC cycle能力,簡化運(yùn)維操作,提升運(yùn)維效率。

在故障收集方面,星星海實現(xiàn)多維度覆蓋故障診斷,能夠全面提升運(yùn)維能力。從Boot階段到runtime階段,能夠全維度收集所有故障信息,并遠(yuǎn)程進(jìn)行精準(zhǔn)定位與數(shù)據(jù)分析。

此外,在服務(wù)器大規(guī)模的設(shè)計測試與生產(chǎn)驗收上,定義統(tǒng)一的質(zhì)量測試方法與質(zhì)量驗收標(biāo)準(zhǔn),充分保證服務(wù)器大規(guī)模上線的質(zhì)量和交付能力。

據(jù)介紹,星星海將在今年正式應(yīng)用于騰訊云及騰訊自有各業(yè)務(wù)場景。未來,騰訊還將會進(jìn)一步拓展自主研發(fā)的范圍,為客戶提供更加安全高效的云服務(wù),滿足政務(wù)、金融、工業(yè)、電信、醫(yī)療等各領(lǐng)域企業(yè)的云上需求。

分享到

songjy

相關(guān)推薦