“每美元性能”指標(biāo)
MLPerf被稱為比較基準(zhǔn),實際上進行直接比較可能很復(fù)雜。從相對簡單的硅片到有著昂貴存儲的復(fù)雜堆棧式芯片,如今的處理器和系統(tǒng)架構(gòu)可謂千差萬別。從“每美元性能”角度來看,往往最能夠說明問題。
Graphcore的IPU-POD16是一個5U的系統(tǒng),標(biāo)價149,995美元。如前所述,它由4個IPU-M2000加速器以及行業(yè)標(biāo)準(zhǔn)主機服務(wù)器構(gòu)成。每個IPU-M2000由4個IPU處理器構(gòu)成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個6U機盒,標(biāo)價約為300,000美元(基于市場情報和公布的經(jīng)銷商定價),有8個DGX A100芯片。IPU-POD16的價格是它的一半。在這個系統(tǒng)中,IPU-M2000的價格和一個DGX A100 80GB的價格是一樣的,或者在更細(xì)的層次上,一個IPU的價格是它的四分之一。
在MLPerf比較分析中,Graphcore采用了嚴(yán)格監(jiān)管的封閉分區(qū)的結(jié)果,并針對系統(tǒng)價格對其進行了歸一化。對于ResNet-50和BERT,很明顯Graphcore系統(tǒng)提供了比NVIDIA產(chǎn)品更好的每美元性能。在IPU-POD16上進行ResNet-50訓(xùn)練的情況下,Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上,Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統(tǒng)的經(jīng)濟性可以更好地幫助客戶實現(xiàn)其AI計算目標(biāo),同時,由于IPU專為AI構(gòu)建的架構(gòu)特點,Graphcore系統(tǒng)還可以解鎖下一代模型和技術(shù)。