宋繼強以英特爾的“看家本領”CPU舉例,實際上至強處理器作為標準的標量運算處理器內部也加入了異構計算。英特爾不僅加入了專門的深度學習加速器件,同時擁有可擴展的一些配置,另外AVX-512專門針對矢量運算進行加速,可以針對深度學習用的不同架構。

通過以上各種特性,通用服務器性能已經提升了46%,而專門針對AI訓練和加速,已經提升了74%,這比市面上其他廠商的CPU或者是GPU相對應的能力提升強勁。

這僅僅是CPU層面的異構計算,除此之外,GPU層面英特爾也有Xe架構的獨立GPU, ASIC層面上擁有Habana、Movidius等,還有強大的FPGA、eAISC產品線等。

除了傳統(tǒng)的加速器,英特爾還研究了遠遠領先現(xiàn)如今架構的計算形式。英特爾神經擬態(tài)計算Loihi芯片是一個存算一體的架構,并且非常容易擴展。Loihi芯片Die內包含128個小核,每個核里面模擬1024個神經元的計算結構,可以模仿13萬個神經元,每個神經元又有1000個突觸連接。不止如此,這樣的芯片還可以繼續(xù)連接起來,做到768個芯片連接起來,做到接近1億神經元的系統(tǒng)。

與傳統(tǒng)深度學習加速器相比,Loihi沒有任何的浮點運算,這是因為人腦中也是沒有乘加器的,所以其學習和訓練方法走的是另一種方法。Loihi基于SNN,擁有極低的功耗,同時設計之初就是異步設計,只有工作部分是耗電的,不工作的區(qū)域是休息的,得益于此在電效率上是現(xiàn)在的深度學習加速芯片的1000倍。值得一提的是,這種架構模式的加速器也是可以用在異構計算之中的。

從異構計算到超異構計算

那么,英特爾這幾年開始一直談及的“超異構計算究竟是什么”,憑什么英特爾多加一個“超”字?根據(jù)宋繼強的解釋,顧名思義超異構計算是“下一個等級”的異構計算,相比傳統(tǒng)的異構計算還要再加上更強大的封裝互連能力和軟件能力。

1、超異構計算的封裝互連能力

宋繼強為記者表示,實際上異構封裝是一個更小型的系統(tǒng),將不同的計算能力整合在一起。由不同的Die整合起來的,所以能夠利用不同架構芯片,在處理不同的數(shù)據(jù)、不同的任務的時候有獨特的性能和功耗優(yōu)勢。

談及英特爾的封裝技術,宋繼強表示,英特爾在2.5D上擁有EMIB封裝技術,該技術已有諸如AIB的產業(yè)標準推出。EMIB可以形象地比喻成,在一個平面上,將兩個平房間的下水通連通起來。在3D上擁有Foveros封裝技術,該技術可以在計算Die和計算Die間建立互連,而不只是傳統(tǒng)的計算Die和Memory Die間互連。Foveros可以形象地比喻成,在三維空間上蓋高樓。與此同時,兩項技術還可以相結合為Co-EMIB技術。

另外,2020年8月英特爾還宣布了Hybrid Bonding技術,能夠進一步縮小封裝時裸片之間的凸點間距和功耗,這些技術英特爾已經在一些產品上使用了。這樣的封裝技術可以讓很多新的芯片很好地進行互連,而且英特爾最新架構的類腦芯片也可以和傳統(tǒng)的CPU、GPU互相組合。

除了已經在用的封裝技術,英特爾在持續(xù)研究變革未來的創(chuàng)新集成光電技術,持續(xù)光互連的變革性能力。

宋繼強表示,計算能力提升后,不同處理器的計算能力隨之提升,這就需要更多的數(shù)據(jù)交互,跨處理器之間,甚至是跨服務器節(jié)點間的數(shù)據(jù)交互。當數(shù)據(jù)交互繼續(xù)增加時,I/O將會成為瓶頸,這個瓶頸將體現(xiàn)在尺寸和功耗上,更多的電給了I/O,而計算能力會越來越少。

他表示,英特爾認為光是替代銅的非常好的互連的介質,但是光本身擁有器件較大、光電間轉換困難、轉換效率不高的問題。因此英特爾為了解決這種問題會將光器件與電器件緊密封裝在一起,讓二者靠近,減少兩端轉換損耗;其次制作出收發(fā)器,以更小的模式放到服務器內。

英特爾研究院將很多光處理過程的幾個模塊做成非常小的模塊,可以將光產生、光放大、光檢測、光調制和CMOS光處理器件整合到一個芯片中,也就是說集成的光電可以大幅度縮小整個系統(tǒng)的尺寸和功耗。

英特爾在硅光子上深耕多年,不僅為客戶提供超過400萬個100G的硅光子產品,還研究出業(yè)界首個封裝光學以太交換機。

2、超異構計算的軟件能力

異構計算還要構建軟件能力,之前行業(yè)普遍忽略了軟件層的重要性。軟件方面上進一步支持AI也是一個很大的課題,軟件優(yōu)化與否在同一個硬件上可以達到百倍的性能差異。尤其是在跨不同單元間同步的問題上,軟件優(yōu)化能夠大幅度提升性能。

實際上,反映在編程人員上的問題便是,CPU、GPU、FPGA等不同芯片的開發(fā)模式和語言均不同,這種情況下同時發(fā)揮多種XPU的性能上就成了一個難題。

英特爾的一體化平臺oneAPI就是要創(chuàng)造讓編程人員很輕松的,以一套API去使用未來想要的功能性的目標。對軟件開發(fā)者來說,可以只學Python或是C++,最終程序都可以享受到異構集成的各種優(yōu)勢,并且如果未來硬件升級替代,軟件不需要非常多的改動。

宋繼強強調,英特爾在oneAPI中投入很大,自從去年推出了Gold版本后,得到非常好的市場反響。另外,現(xiàn)在oneAPI整個社區(qū)硬件支持當中,早已不只是英特爾的硬件,友商的CPU、GPU、ASIC都是可用的,這是對整個社區(qū)的貢獻。

關于AI不得不談及的問題

對于推動AI創(chuàng)新上,宋繼強認為垂直整合是驅動未來產業(yè)規(guī)?;瘮U展的重要發(fā)力點。他對記者解答,垂直整合是真正可以讓AI將算法創(chuàng)新、硬件落實到實處,行成迭代滾動放大效應的必經之路。

垂直整合瞄準一些可以規(guī)?;?,軟硬件結合可以創(chuàng)造更大價值的領域,用應用去拉動多種AI技術的垂直整合。

垂直整合向來比單獨一個技術創(chuàng)新難得多,首先要能夠接觸到這么多種資源、數(shù)據(jù)和實際應用場景,其次也要有跨層的 專家參與在其中。但無論多么困難,AI創(chuàng)新要真正規(guī)?;l(fā)展一定要嚴肅認真地進行垂直整合。

在此方面,Mobileye作為英特爾收購的一個子公司,就把AI能力,通過軟件、硬件、傳感器整合起來形成很好的方案,開創(chuàng)非常獨特的出行即服務的體系。 對于AI的落地問題上,宋繼強認為,英特爾有一些機制可以去幫助企業(yè)更好的落地。

“比如說“AI百佳創(chuàng)業(yè)激勵計劃”,我們的生態(tài)發(fā)展部門就創(chuàng)建了這樣一個平臺,可以幫助他們加速,在中間把他們連接起來,在市場層面進行推動。所以AI落地是一個大問題?!?/p>

AI的可信和安全逐漸大面積討論下,AI治理也成為了熱點話題。宋繼強認為,對英特爾而言,作為通用技術方案提供商,SGX、同態(tài)加密、聯(lián)邦學習硬件加速這種技術就可以幫助一些客戶。

全棧實力推動AI發(fā)展

總結來說,英特爾釋放AI潛力是通過自身全棧實力推進的,包括硬件層面、前沿計算層面、軟件層面和生態(tài)構建層面四個方面的。

在硬件層面,英特爾以內置AI加速的至強可擴展處理器為基礎,提供全面的XPU芯片平臺。

在前沿計算層面,英特爾持續(xù)投資和發(fā)展量子計算、神經擬態(tài)計算等面向未來的計算創(chuàng)新,探索驅動AI持續(xù)發(fā)展的新架構。

在軟件層面,英特爾提供經過全面優(yōu)化的軟件,包括OpenVINO、oneAPI、Analytics Zoo、Tensor Flow、BigDL等,涵蓋庫、框架以及工具與解決方案等多個層面,用以加速并簡化從云到端的范圍內人工智能技術的開發(fā)與部署。

在生態(tài)構建層面,英特爾與中國產、學、研廣泛合作,協(xié)同開展前沿研究、聯(lián)手促進人才培養(yǎng)、共同打造開放生態(tài)。

分享到

songjy

相關推薦