每GHz的性能不等于CPU產(chǎn)品的性能,但能體現(xiàn)CPU核心的設(shè)計(jì)水平。有了高超的CPU設(shè)計(jì)能力,即便使用較為落后的工藝來(lái)生產(chǎn),也能保證CPU產(chǎn)品具有較高的性能水平。而每GHz性能低下的CPU核心,則必須依靠先進(jìn)工藝全力提高CPU頻率,不符合國(guó)內(nèi)現(xiàn)在的實(shí)際情況。如果一款CPU每GHz的性能只有龍芯3A6000的三分之一,那么就需要三倍的頻率才能與龍芯3A6000抗衡,不但超出了當(dāng)前的工藝極限,功耗和發(fā)熱量也會(huì)提高到3倍以上。
龍芯3A6000依托境內(nèi)的可控工藝,主要通過(guò)設(shè)計(jì)能力實(shí)現(xiàn)了性能大幅度提升,CPU核心的設(shè)計(jì)一舉達(dá)到了世界先進(jìn)水平。我國(guó)在上世紀(jì)80年代初由于經(jīng)濟(jì)和工業(yè)水平無(wú)法支撐高端半導(dǎo)體技術(shù)發(fā)展,被迫放棄了自主設(shè)計(jì)微處理器。我國(guó)與美國(guó)在CPU設(shè)計(jì)能力方面的差距實(shí)際已經(jīng)累積了五十年,龍芯經(jīng)過(guò)二十多年的不懈努力,彌合了這長(zhǎng)達(dá)半個(gè)世紀(jì)的差距。
這次我用來(lái)與龍芯3A6000進(jìn)行性能對(duì)比的CPU共有八款,其中五款是國(guó)產(chǎn)CPU,兩款是Intel的產(chǎn)品,一款是AMD的產(chǎn)品。
國(guó)產(chǎn)CPU中,龍芯3A5000是龍芯上一代的桌面產(chǎn)品,海光C86-3250是8核16線程,核心數(shù)量是3A6000的兩倍。兆芯KX-U6780A和飛騰D2000也是8個(gè)核心但沒有超線程,鯤鵬920是國(guó)內(nèi)目前唯一使用7nm工藝的桌面和服務(wù)器CPU產(chǎn)品。兆芯、飛騰、華為自2019年之后就沒有推出性能更強(qiáng)的桌面CPU,所以只能用它們4年前的產(chǎn)品參與對(duì)比。
兩款I(lǐng)ntel的CPU分別是10代酷睿i3-10100F和13代酷睿i3-13100F,它們和3A6000一樣是4核8線程,但它們的主頻比3A6000高得不是一星半點(diǎn)。i3聽起來(lái)好像很低端,但10代i3的規(guī)格其實(shí)和7代酷睿i7一樣,更高端的型號(hào)主要是集成了更多的核心。10代酷睿CPU因?yàn)镮PC有小幅度提升,再加上工藝進(jìn)步,所以它的實(shí)際性能比7代i7還高一些。最后一款是AMD R5-5600G,核心是Zen 3代,6核12線程。
兩款I(lǐng)ntel的CPU我都沒有裝進(jìn)機(jī)箱,AMD的CPU用的開放式機(jī)箱。因?yàn)樗蠧PU都是使用的普通風(fēng)冷散熱器,Intel和AMD的CPU發(fā)熱量又比較高,裝進(jìn)普通機(jī)箱會(huì)因?yàn)榉e熱而影響性能發(fā)揮。
幾款CPU支持的內(nèi)存頻率也不一樣,凡是使用2666內(nèi)存的,都是因?yàn)镃PU或主板只能支持到2666,上不到3200。內(nèi)存都是雙通道,在測(cè)試單核性能時(shí)內(nèi)存不是瓶頸,2666和3200的差異幾乎不影響測(cè)試成績(jī),不過(guò)在測(cè)試多核性能的時(shí)候,3200的內(nèi)存要比2666多一些優(yōu)勢(shì)。但這一點(diǎn)優(yōu)勢(shì)又很容易因?yàn)镃PU高溫降頻而損失殆盡,不過(guò)龍芯3A6000是固定頻率2.5GHz,倒是沒有散熱器壓不住溫度的焦慮。
對(duì)于尚未正式發(fā)布的龍芯3A6000,目前只有龍芯自己的Loongnix系統(tǒng)才能較好地發(fā)揮它的性能,因此這次測(cè)試3A6000是使用Loongnix系統(tǒng),其它CPU使用UOS系統(tǒng),編譯器都是系統(tǒng)自帶的GCC8.3版本。
UOS系統(tǒng)的龍芯版本實(shí)際上是使用的Loongnix的內(nèi)核和基礎(chǔ)組件,只不過(guò)UOS的優(yōu)化更新會(huì)落后于Loongnix一段時(shí)間,所以3A6000當(dāng)前在Loongnix上的性能表現(xiàn),在幾個(gè)月之后就能在UOS龍芯版系統(tǒng)上重現(xiàn)。
為了能準(zhǔn)確地定位龍芯3A6000核心設(shè)計(jì)的水平,我對(duì)i3-10100F、i3-13100F和R5-5600G除了進(jìn)行通常狀態(tài)下的測(cè)試之外,還把它們鎖定到了與3A6000相同的頻率再次進(jìn)行了測(cè)試,以便于對(duì)比它們?cè)?.5GHz時(shí)與3A6000的性能差異。
龍芯中科提供的測(cè)試機(jī)是有歸還時(shí)限的,因此開始時(shí)我本來(lái)不打算測(cè)試SPEC CPU 2006,而是想測(cè)試國(guó)內(nèi)CPU廠商很少提及的SPEC CPU 2017。不過(guò)一些網(wǎng)友知道我拿到了龍芯3A6000測(cè)試機(jī)之后,強(qiáng)烈要求我測(cè)試SPEC CPU 2006。因此我中斷了對(duì)SPEC CPU 2017的測(cè)試,先把SPEC CPU 2006跑了一遍。在與其它的國(guó)產(chǎn)CPU對(duì)比時(shí),SPEC CPU 2006的測(cè)試成績(jī)也更有意義。
SPEC CPU 2006是一款比較專業(yè)的CPU性能評(píng)估工具,它的代碼沒有針對(duì)特定平臺(tái)優(yōu)化,由測(cè)試者自行編譯運(yùn)行,因此適合用于跨平臺(tái)對(duì)比CPU性能。但I(xiàn)CC和AOCC等編譯器為了在SPEC CPU測(cè)試中跑出高分,會(huì)犧牲計(jì)算精度換取運(yùn)行速度,因此大家一般更加認(rèn)可使用GCC、LLVM、MSVC等編譯器測(cè)試得到的成績(jī)。
SPEC CPU 2006測(cè)試的是CPU運(yùn)行常規(guī)應(yīng)用軟件時(shí)的通用性能,包含了12個(gè)整數(shù)性能測(cè)試項(xiàng)目,和17個(gè)浮點(diǎn)性能測(cè)試項(xiàng)目,每個(gè)子項(xiàng)目都單獨(dú)評(píng)分,然后把各個(gè)子項(xiàng)的測(cè)試成績(jī)進(jìn)行幾何平均得出總分。
SPEC CPU 2006分為單任務(wù)測(cè)試和多任務(wù)測(cè)試,但是單任務(wù)測(cè)試的時(shí)候,有部分測(cè)試項(xiàng)目可以通過(guò)編譯器的自動(dòng)并行化支持把計(jì)算任務(wù)自動(dòng)分配到多個(gè)核心上并行執(zhí)行。因此凡是開啟了自動(dòng)并行化的測(cè)試結(jié)果,都不能代表CPU的單核性能。對(duì)于桌面電腦的CPU,最為重要的是整數(shù)通用性能,特別是單核的整數(shù)通用性能。因?yàn)閱魏苏麛?shù)性能最能體現(xiàn)桌面應(yīng)用程序的運(yùn)行效率。
在3A6000流片之后,龍芯中科公開過(guò)兩次SPEC CPU 2006測(cè)試成績(jī)。第一次單核整數(shù)和浮點(diǎn)得分分別是40和55,第二次是在加強(qiáng)了GCC編譯器對(duì)自主指令集Loongarch的優(yōu)化之后,由工信部旗下賽西實(shí)驗(yàn)室測(cè)試的成績(jī),單核整數(shù)和浮點(diǎn)成績(jī)分別是43.1和54.6。
上圖中提到了“編譯器‘補(bǔ)課’”,學(xué)霸從來(lái)不會(huì)承認(rèn)自己補(bǔ)課,把補(bǔ)課掛在嘴邊的都是差生。龍芯自主設(shè)計(jì)的LoongArch指令集才誕生兩三年,龍芯的工程師雖然已經(jīng)給GCC等常用編譯器添加了對(duì)LoongArch指令集的支持,但優(yōu)化的程度還與x86和ARM相差甚遠(yuǎn)。因此龍芯要通過(guò)“補(bǔ)課”,使GCC編譯器對(duì)LoongArch指令集的優(yōu)化追上x86和ARM的水平。
龍芯提供的測(cè)試機(jī)硬盤中有已經(jīng)編譯好的SPEC CPU 2006測(cè)試環(huán)境,直接運(yùn)行就能得到測(cè)試成績(jī)。但因?yàn)辇埿狙a(bǔ)課完成的最新版本的GCC編譯器還沒有到發(fā)布階段,沒有提供最新版本的編譯器,所以我如果要自己配置編譯參數(shù)來(lái)測(cè)試SPEC CPU 2006,就只能使用系統(tǒng)中現(xiàn)有的老版本編譯器。因此我暫時(shí)只嘗試復(fù)現(xiàn)龍芯第一次公布的實(shí)測(cè)成績(jī),等3A6000正式上市銷售了,操作系統(tǒng)和編譯器應(yīng)該也完成了升級(jí)更新,那時(shí)我再去嘗試復(fù)現(xiàn)更高的43.1的單核整數(shù)成績(jī)。
我用自己的硬盤重新安裝了Loongnix系統(tǒng),并自行配置參數(shù)測(cè)試了SPEC CPU 2006,單核整數(shù)性能測(cè)試的結(jié)果還不錯(cuò),達(dá)到了40.1分,與龍芯公布的編譯器“補(bǔ)課”完成前的40分相符。直接運(yùn)行測(cè)試機(jī)中提供的SPEC CPU 2006,得分42.9,與公布的43.1相符。
與編譯器“補(bǔ)課”完成后的測(cè)試成績(jī)相比,新編譯器對(duì)12個(gè)測(cè)試項(xiàng)目的9個(gè)項(xiàng)目有提升。這說(shuō)明龍芯絕不是像ICC和AOCC編譯器那樣為了跑分而優(yōu)化,因?yàn)榫幾g器如果是針對(duì)跑分優(yōu)化,往往只能把某一個(gè)子項(xiàng)目的成績(jī)提到極限,而其它項(xiàng)目的成績(jī)基本不變。
就像下面這款至強(qiáng)CPU的測(cè)試成績(jī),使用了ICC編譯器和收費(fèi)的跑分專用優(yōu)化庫(kù),在測(cè)試報(bào)告的條形圖上,只有一個(gè)項(xiàng)目一支獨(dú)秀,其它項(xiàng)目都被擠壓成了薄薄的一片兒。幸好總分是通過(guò)幾何平均來(lái)計(jì)算,如果是算術(shù)平均的算法,Intel的測(cè)試成績(jī)將無(wú)人能敵。除了Intel和AMD之外,國(guó)產(chǎn)x86廠商也有這樣跑分的,在宣傳的時(shí)候又刻意回避測(cè)試環(huán)境和子項(xiàng)成績(jī),讓人看不出貓膩。我也是在吃了虧上了當(dāng)之后,才有了自己測(cè)試國(guó)產(chǎn)CPU并把結(jié)果公之于眾的想法,能少幾個(gè)人上當(dāng)總是好的。
ICC和AOCC的超強(qiáng)優(yōu)化原理其實(shí)很簡(jiǎn)單,就是犧牲計(jì)算精度提高計(jì)算速度。但是這種優(yōu)化會(huì)使編譯器出現(xiàn)預(yù)料之外的行為,會(huì)把不該優(yōu)化的也優(yōu)化了,等于是犧牲了全局的計(jì)算精度和兼容性。沒有任何商業(yè)版的操作系統(tǒng)和應(yīng)用軟件使用ICC和AOCC,就是因?yàn)楹茈y保證程序運(yùn)行時(shí)的正確性。在必須保持計(jì)算精度的時(shí)候,ICC和AOCC卻又表現(xiàn)不出明顯的優(yōu)勢(shì)。而龍芯的編譯器不可能像ICC和AOCC那樣顧頭不顧腚,因?yàn)辇埿倦娔X上所有操作系統(tǒng)和應(yīng)用軟件,都是直接或間接地使用龍芯的編譯器,所以龍芯的編譯器絕對(duì)要保證正確性。
龍芯新版編譯器測(cè)出的成績(jī)中,編號(hào)462的子項(xiàng)目看起來(lái)很像是使用GCC自動(dòng)并行化參數(shù)結(jié)果,但我在測(cè)試時(shí)觀察了CPU的占用情況,確定整個(gè)測(cè)試過(guò)程中只有一個(gè)核心滿負(fù)載,其它核心的占用率都低于1%。說(shuō)明成績(jī)提升是來(lái)自于編譯器“補(bǔ)課”,也說(shuō)明龍芯3A6000的向量指令運(yùn)行效率很高,只是當(dāng)前版本的編譯器還不能釋放它的性能。何況就算把462這一項(xiàng)成績(jī)換成我的測(cè)試結(jié)果,幾何平均后總分也仍然接近42分,完全不影響關(guān)于性能水平的結(jié)論。后面的Linpack測(cè)試也能證明龍芯3A6000的向量計(jì)算能力很強(qiáng),并且當(dāng)編譯器能夠完整地支持“龍架構(gòu)”的向量指令之后,3A6000會(huì)更強(qiáng)。
我對(duì)龍芯的GCC編譯器仍然使用“補(bǔ)課”這個(gè)詞,是因?yàn)樵趚86版的GCC面前不敢說(shuō)“優(yōu)化”。在GCC編譯器和Linux中,積累了Intel和AMD以及眾多其它開發(fā)者對(duì)x86指令集幾十年的優(yōu)化成果,龍芯的龍架構(gòu)在基礎(chǔ)軟件優(yōu)化方面,能夠在兩三年內(nèi)補(bǔ)上差距就已經(jīng)很厲害了。等龍芯發(fā)布新版操作系統(tǒng)和編譯器之后,無(wú)論測(cè)試成績(jī)還是應(yīng)用軟件的實(shí)際體驗(yàn),都一定會(huì)有相應(yīng)的提升。
為了探索龍芯3A6000的性能水平,我在申請(qǐng)到測(cè)試機(jī)之前,就已經(jīng)開始了漫長(zhǎng)的測(cè)試過(guò)程。下面這張圖中,三款進(jìn)口CPU從1.0GHz到4.0GHz的測(cè)試成績(jī)不是通過(guò)換算得到的,而是我把它們鎖定頻率后一點(diǎn)一點(diǎn)實(shí)測(cè)出來(lái)的。從1.0GHz到4.0GHz,每隔500MHz就運(yùn)行一次SPEC CPU 2006,然后得到了它們的單核整數(shù)和浮點(diǎn)成績(jī)與CPU頻率的對(duì)應(yīng)關(guān)系。通過(guò)下方的圖表可以確定兩點(diǎn)規(guī)律:
一、當(dāng)CPU的頻率相同的時(shí)候,三款CPU的性能各不相同。早先AMD被Intel打壓得瀕臨崩潰,然后又反過(guò)來(lái)壓了Intel一頭,之后Intel掏出壓箱底的技術(shù)儲(chǔ)備又保住了市場(chǎng)地位。導(dǎo)致這一切變化的主要因素,就是它們每GHz的性能交替性地出現(xiàn)了重大提升??傆懈鞣N原因使CPU不能運(yùn)行在較高的頻率,但只要每GHz的性能足夠強(qiáng), 那么在低頻率下也仍然能保障不錯(cuò)的性能,并且只要滿足了達(dá)到高頻率的條件,就能獲得更高的性能,這就是高性能CPU核心設(shè)計(jì)中強(qiáng)調(diào)每GHz性能的原因。
二、當(dāng)內(nèi)存性能固定的時(shí)候,CPU的性能與頻率不是等比例地提升,每GHz的性能總是隨著頻率升高而降低。CPU頻率翻倍時(shí)功率也一定翻倍,但性能卻不能翻倍。因此在低頻率下實(shí)現(xiàn)的高性能更有價(jià)值,而實(shí)現(xiàn)低頻高能的唯一途徑就是提高每GHz的性能。
我在測(cè)試這三款CPU性能的過(guò)程中,就發(fā)現(xiàn)10代i3在設(shè)置了固定4.0GHz的頻率后,測(cè)試過(guò)程中會(huì)因?yàn)闇囟冗^(guò)高而降頻。我為了避免頻率波動(dòng)而臨時(shí)換成了比CPU還貴的水冷散熱器,但除此之外的其它測(cè)試都仍然使用原來(lái)的散熱器。因?yàn)槲艺J(rèn)為在極度優(yōu)化的條件下測(cè)出的成績(jī),對(duì)于占了絕大多數(shù)的普通家庭和辦公電腦用戶沒有意義。DIY和超頻玩家有另外的性能評(píng)價(jià)標(biāo)準(zhǔn),我在常規(guī)環(huán)境下的測(cè)試也不會(huì)干擾他們的判斷。
所有CPU都是使用SPEC CPU 2006的base模式進(jìn)行測(cè)試,編譯器都是系統(tǒng)自帶的GCC8.3版本。不使用第三方使用優(yōu)化庫(kù),也沒有開啟自動(dòng)并行化,測(cè)出的成績(jī)能真實(shí)反映CPU在用戶的系統(tǒng)和軟件環(huán)境中能達(dá)到的性能水平。
3A5000和3A6000的頻率都是固定的2.5GHz,只要把它們的測(cè)試成績(jī)標(biāo)注在2.5GHz的坐標(biāo)軸上,就既能看到三款進(jìn)口CPU與它們?cè)谙嗤l率時(shí)的性能對(duì)比,也能看到它們與這三款進(jìn)口CPU的性能差距。
13代酷睿i3-13100F在2.5GHz時(shí)的成績(jī)剛好40分,我測(cè)得3A6000的40.1分比它更高一點(diǎn),但13代酷睿工藝比10代酷睿先進(jìn),單核最高頻率可以比較容易地長(zhǎng)時(shí)間穩(wěn)定在4.4GHz,因此3A6000與i3-13100F實(shí)際的性能差距還比較大。
下圖是各款CPU的單核整數(shù)成績(jī)對(duì)比,3A6000是使用的官方成績(jī),其它的CPU都是我自己測(cè)試的結(jié)果。其中Intel和AMD的CPU包括了自動(dòng)控制頻率和固定2.5GHz時(shí)的成績(jī),便于與2.5GHz的龍芯3A6000對(duì)比相同頻率時(shí)的性能。
3A6000使用與3A5000相同的生產(chǎn)工藝,在頻率不變的條件下把單核性能提高了60%,這完全是來(lái)自于CPU核心設(shè)計(jì)的提升。提高每GHz的性能和提高CPU頻率都能達(dá)到提高性能的目的,兩種方式各有各的困難。提高頻率必須把CPU電路的布局布線與生產(chǎn)工藝緊密結(jié)合,需要反復(fù)多次流片尋找短板加以改進(jìn),一點(diǎn)一點(diǎn)地推高頻率,資金消耗非常大。如果更換了工藝或者對(duì)CPU核心設(shè)計(jì)有重大修改,又必須重復(fù)提高頻率的過(guò)程。
提高每GHz的性能更加困難,考驗(yàn)的是核心技術(shù)積累和創(chuàng)新的能力,Intel把每GHz的性能提高到現(xiàn)在的程度用了四十多年,AMD曾經(jīng)因?yàn)樵O(shè)計(jì)能力進(jìn)入瓶頸,每GHz性能多年沒有提升而幾乎倒閉。提高每GHz的性能和提高頻率不是二選一,但龍芯目前的路線是優(yōu)先提高每GHz的性能,暫時(shí)不苛求高頻率。大概是因?yàn)橐試?guó)內(nèi)當(dāng)前的工藝水平很難達(dá)到與Intel一樣的頻率,在每GHz的性能超越Intel之前盲目提高頻率就只是浪費(fèi)資源,把有限的資金用于研發(fā)更多的核心技術(shù)才更有意義。
龍芯自主研發(fā)的核心技術(shù)涵蓋了CPU和主板必需的各種功能模塊,還包括了自主研發(fā)的GPU。龍芯GPU LG100已經(jīng)集成在了龍芯的橋片7A2000中,LG200將會(huì)集成到下一款桌面CPU 3B6000中。單看對(duì)現(xiàn)代桌面計(jì)算機(jī)所需的核心功能模塊的積累,能在先進(jìn)性和完備性兩個(gè)方面同時(shí)超過(guò)龍芯的可能只有Intel和AMD。
龍芯3A6000無(wú)論是43.1還是40.1的得分,都超過(guò)了i3-13100F和R5-5600G在2.5GHz時(shí)的成績(jī)。假如國(guó)內(nèi)的芯片生產(chǎn)工藝跟得上,并且龍芯也有足夠的資金與代工廠反復(fù)磨合提高主頻,那么3A6000的對(duì)手就不止是10代酷睿i3了,至少能再提高一個(gè)段位。
10代酷睿i3-10100F在2.5Ghz時(shí)的測(cè)試成績(jī)僅30.8,比龍芯3A6000低了不少。自動(dòng)控制頻率時(shí)成績(jī)是42.5,與龍芯3A6000持平。i3-10100F測(cè)試過(guò)程中頻率有波動(dòng),平均頻率大約3.6GHz,與它的基礎(chǔ)頻率一樣。10代酷睿i3的最高型號(hào)是i3-10105(F),基礎(chǔ)頻率和睿頻都只比i3-10100F高0.1GHz,性能基本沒有區(qū)別。
測(cè)試3A6000整數(shù)通用性能的目標(biāo)已經(jīng)達(dá)成,不過(guò)我測(cè)試浮點(diǎn)通用性能的成績(jī)暫時(shí)沒有達(dá)到55分,目前只有51.7分。我覺得我現(xiàn)在使用的GCC編譯器,版本可能比龍芯第一次公布3A6000實(shí)測(cè)成績(jī)時(shí)用的編譯器更老,要不然不會(huì)出現(xiàn)這樣的差距。因?yàn)檫€要留下時(shí)間測(cè)試SPEC CPU 2017和其它項(xiàng)目,所以我不會(huì)花太多時(shí)間來(lái)嘗試調(diào)整編譯參數(shù),還是等龍芯更新編譯器吧!
無(wú)論是51.7還是54.6,都與13代酷睿在2.5GHz時(shí)的成績(jī)差距不大,而且要比AMD R5-5600G的Zen 3代核心好一些。因?yàn)?A6000的整數(shù)通用性能也比相同頻率下的R5-5600G更高,所以可以確定3A6000的LA664核心在同頻率下的性能超過(guò)了AMD的Zen 3代核心,也應(yīng)該超過(guò)了Zen 4代核心。龍芯3A6000的性能雖然只與10代酷睿i3相當(dāng),但CPU核心的邏輯設(shè)計(jì)水平已經(jīng)是世界一流的水準(zhǔn)。
10代酷睿i3-10100F在4.0GHz時(shí),單核浮點(diǎn)通用成績(jī)也才56.1分,而通常情況下i3-10100F保持不了4.0GHz的頻率,實(shí)測(cè)只有51.3分,我測(cè)得3A6000的51.7分要比它高一些。因此龍芯3A6000在浮點(diǎn)通用性能方面也已經(jīng)追平了10代酷睿i3。13代酷睿相對(duì)10代酷睿同頻率的浮點(diǎn)通用性能提升幅度高達(dá)60%,但3A6000相對(duì)于3A5000則實(shí)現(xiàn)了幾乎翻倍的提升,說(shuō)明龍芯雖然絕對(duì)性能與Intel相比還有差距,但進(jìn)步的速度比Intel更快。
與國(guó)內(nèi)的其它CPU對(duì)比的話,3A6000就令所有的國(guó)產(chǎn)CPU都望塵莫及了。最差的兆芯和飛騰單核浮點(diǎn)通用性能甚至只有3A6000的四分之一。
通過(guò)單核性能測(cè)試已經(jīng)再次證明龍芯官方公布的成績(jī)是靠譜的,因此對(duì)于多核并行性能,就直接用官方的測(cè)試成績(jī)來(lái)與我測(cè)試的其它CPU作個(gè)對(duì)比。
通過(guò)下方的條形圖,可以明顯地看到3A6000的多核并行性能也與i3-10100F是相同水平。測(cè)試i3-10100F多核并行性能時(shí)與測(cè)試單核時(shí)的散熱條件一致,如果把它裝進(jìn)機(jī)箱,測(cè)試成績(jī)就會(huì)大幅度下降。當(dāng)然,如果加強(qiáng)散熱也可以帶來(lái)5%左右的性能提升,不過(guò)不影響3A6000與i3-10100F性能基本相等的結(jié)論。由于Intel和AMD的CPU性能發(fā)揮極度依賴于散熱,因此對(duì)于蓋得嚴(yán)嚴(yán)實(shí)實(shí)的家用和辦公電腦,3A6000的多核并行性能甚至能與10代i5拼一拼。
Intel和AMD的CPU非常有趣,因?yàn)樾阅苁遣淮_定的,主頻和睿頻只能決定CPU性能的上限,而管不了CPU性能的下限,所以極大地增強(qiáng)了用戶探索CPU性能極限的趣味性。有網(wǎng)友提供了10代i5筆記本的測(cè)試成績(jī),也是4核8線程,但多核并行成績(jī)只有桌面i3的一半,也就是也只有3A6000的一半,甚至低于3A5000的水平。當(dāng)然如果是游戲筆記本,性能就不會(huì)降這么多,但商務(wù)筆記本就很難說(shuō)了。
在多核并行的對(duì)比中,國(guó)產(chǎn)CPU中只有海光C86 3250的成績(jī)超過(guò)了龍芯3A6000,因?yàn)楹9釩86 3250是8核16線程,而龍芯3A6000是4核8線程。等龍芯8核的3B6000推出,那么能接得住就只有Intel和AMD。與海光3250同樣有8個(gè)物理核心的兆芯KX-U6780A和飛騰D2000,多核性能則只有龍芯3A6000的一半。
因?yàn)槎嗪瞬⑿袝r(shí)的損耗會(huì)隨著核心數(shù)量增加而增加,所以部分國(guó)產(chǎn)CPU廠商在單核性能還很低的時(shí)候,不想著提高單核性能,反而毫無(wú)節(jié)制地碓砌核心數(shù)量,就令人難以理解。
比如飛騰64核的S2500,多核并行的測(cè)試成績(jī)只有龍芯3A6000的3倍多一點(diǎn),是64核的性能只有4核的3倍多。還有基于阿里平頭哥C910核心的RISC-V架構(gòu)的某款64核CPU,單核性能比飛騰的CPU更低,64核并行的成績(jī)只有300分,也就是不到3A6000的兩倍,這比“i3默秒全”還要夸張啊朋友們。
在實(shí)際應(yīng)用中,一個(gè)40分的核心,無(wú)論是單任務(wù)還是多任務(wù)并行,運(yùn)行效率都遠(yuǎn)遠(yuǎn)高于四個(gè)10分的核心。連軟件工程師都明白的事兒,難道CPU工程師們不明白嗎?這些低性能的多核CPU,核心堆得越多就越是耐人尋味。
前面說(shuō)過(guò)龍芯3A6000的向量指令運(yùn)行效率很高,那么現(xiàn)在就來(lái)測(cè)一下比較考驗(yàn)向量計(jì)算性能的Linpack。
Linpack也是一種常用的性能測(cè)試程序,它通過(guò)計(jì)算雙精度線性方程組的求解來(lái)測(cè)試計(jì)算機(jī)的運(yùn)算能力,Linpack的測(cè)試成績(jī)代表的是計(jì)算機(jī)最基本的計(jì)算性能?;A(chǔ)的Linpack版本只能測(cè)試CPU的性能,超級(jí)計(jì)算機(jī)使用Linpack來(lái)測(cè)試時(shí),會(huì)針對(duì)異構(gòu)運(yùn)算部件修改測(cè)試程序,超算500強(qiáng)的排名依據(jù)就是Linpack的測(cè)試成績(jī)。
現(xiàn)代編譯器都會(huì)自動(dòng)使用CPU的向量指令來(lái)優(yōu)化計(jì)算速度,因此Linpack對(duì)于普通的CPU就特別考驗(yàn)編譯器的能力。
想讓測(cè)試結(jié)果接近CPU的理論峰值非常困難,因此我偷個(gè)懶,直接使用openbenchmarking網(wǎng)站上的Phoronix Test Suite測(cè)試套件來(lái)測(cè)試,這樣所有的CPU都是使用相同的源代碼,由測(cè)試套件自動(dòng)配置編譯和測(cè)試參數(shù),每一款CPU的測(cè)試成績(jī)都無(wú)法達(dá)到最高,也就相對(duì)公平了。
Phoronix Test Suite測(cè)試套件中的HPL-Linpack是多線程測(cè)試,CPU所有核心都會(huì)全速運(yùn)行。因?yàn)槭鞘褂猛ㄓ玫木幾g配置,所以就比較考驗(yàn)編譯器自動(dòng)向量?jī)?yōu)化的能力,在這方面當(dāng)前版本的龍芯編譯器是比較吃虧的。不過(guò)龍芯3A6000的測(cè)試成績(jī)看起來(lái)還是相當(dāng)不錯(cuò),遠(yuǎn)超10代i3,低于13代i3。測(cè)試時(shí)沒有鎖定頻率,也都是所有核心并行,各款CPU能跑多高就跑多高。
必須再次強(qiáng)調(diào)這個(gè)成績(jī)是使用的Phoronix Test Suite測(cè)試套件自動(dòng)編譯并自動(dòng)配置測(cè)試參數(shù),測(cè)試成績(jī)與CPU能達(dá)到的最高水平差距很大。i3-13100F在浮點(diǎn)通用性能測(cè)試中比i3-10100F只高了60%,但在Linpack測(cè)試中提高了80%。龍芯3A6000則與之相反,在浮點(diǎn)通用性能測(cè)試中比3A5000高一倍,但在Linpack測(cè)試中只高了28%。出現(xiàn)這樣的情況,幾乎可以肯定是編譯器過(guò)于陳舊導(dǎo)致的。因?yàn)?A5000的測(cè)試成績(jī)已經(jīng)比10代i3更高,那么3A6000就應(yīng)該比13代i3更高才對(duì),我非常期待龍芯對(duì)編譯器的后續(xù)更新能帶來(lái)驚喜!
SPEC CPU 2017是比SPEC CPU 2006更新的版本,測(cè)試的項(xiàng)目經(jīng)過(guò)調(diào)整,既刪除了被ICC、AOCC等編譯器通過(guò)降低計(jì)算精度提高測(cè)試成績(jī)的項(xiàng)目,又增加了更多的針對(duì)現(xiàn)代CPU向量指令的性能考察。在SPEC CPU 2017上,編譯器自動(dòng)使用向量指令優(yōu)化程序性能的能力會(huì)對(duì)測(cè)試成績(jī)?cè)斐筛蟮挠绊?,而我?dāng)前使用的GCC版本對(duì)龍芯向量指令的支持還不夠完善,龍芯在測(cè)試中是會(huì)比較吃虧的,不過(guò)沒關(guān)系,反正也不會(huì)有很大的差距。
SPEC CPU 2017也分為單任務(wù)和多任務(wù)測(cè)試,單任務(wù)測(cè)試也仍然支持自動(dòng)并行化,不過(guò)2017版的測(cè)試報(bào)告中會(huì)明確標(biāo)注自動(dòng)并行化時(shí)的線程數(shù)量。只有不開啟自動(dòng)并行化的單任務(wù)測(cè)試成績(jī)才能代表CPU的單核性能。大家在通過(guò)SPEC CPU的測(cè)試成績(jī)來(lái)對(duì)比CPU性能的時(shí)候,一定要注意測(cè)試報(bào)告中注明的編譯器類型、是否開啟了自動(dòng)并行化、是否使用了第三方優(yōu)化庫(kù)等重要信息。
SPEC CPU 2017的測(cè)試項(xiàng)目不但和2006版有區(qū)別,而且多任務(wù)和單任務(wù)的測(cè)試項(xiàng)目也有區(qū)別,它們的成績(jī)不存在比例關(guān)系,能確定的只是綜合性能越強(qiáng)的CPU測(cè)試成績(jī)就一定越好。
我測(cè)試了單任務(wù)單線程和多任務(wù)的全CPU性能,先來(lái)看單任務(wù)單線程的整數(shù)和浮點(diǎn)測(cè)試成績(jī)。在當(dāng)前的系統(tǒng)和編譯器環(huán)境下,我測(cè)試SPEC CPU 2006時(shí)得到的單核整數(shù)成績(jī)比10代i3稍低一些,但浮點(diǎn)成績(jī)又稍高一些。SPEC CPU 2017的測(cè)試結(jié)果也差不多,3A6000整數(shù)得分5.02,比10代酷睿i3-10100F低了一點(diǎn),但差距不到10%。浮點(diǎn)成績(jī)是5.87,非常巧合地與i3-10100F成績(jī)一樣。
通過(guò)3A6000與i3-10100F以及2.5GHz時(shí)的i3-13100F的子項(xiàng)成績(jī)對(duì)比,可以發(fā)現(xiàn)3A6000有小部分的測(cè)試項(xiàng)目與它們有較大的差距,大部分的測(cè)試項(xiàng)目水平相當(dāng),綜合評(píng)分比較接近。3A6000單核性能與10代酷睿i3基本一樣的結(jié)論仍然成立,隨著系統(tǒng)和編譯器的逐漸完善,3A6000無(wú)論測(cè)試成績(jī)還是實(shí)際性能表現(xiàn)也都會(huì)再上一個(gè)臺(tái)階。
與13代i3-13100F在2.5GHz時(shí)的成績(jī)相比,3A6000的整數(shù)成績(jī)要低3%,但整數(shù)和浮點(diǎn)成績(jī)都超過(guò)了R5-5600G在2.5GHz時(shí)的得分。這與SPEC CPU 2006的測(cè)試情況一樣,再次證明3A6000的核心設(shè)計(jì)水平比AMD Zen 3代還強(qiáng)一些,可能和Zen 4代基本一致。只是可惜因?yàn)镃PU頻率的差距,3A6000的單核性能只是與10代i3是相同水平,跟13代i3相比還有較大的差距。
在多任務(wù)測(cè)試中,3A6000與3-10100F的成績(jī)差距超過(guò)了10%,還在可接受的范圍內(nèi)。因?yàn)槲沂褂玫氖沁€沒有完成“補(bǔ)課”的編譯器,所以不能很好地發(fā)揮3A6000的向量指令性能。盡管3A6000相對(duì)于3A5000的成績(jī)提升幅度也仍然超過(guò)60~70%,但我認(rèn)為它的表現(xiàn)應(yīng)該能夠更好一些,對(duì)SPEC CPU 2017的測(cè)試結(jié)果不是很令人滿意。
國(guó)產(chǎn)CPU的測(cè)試情況和SPEC CPU 2006相同,沒有任何一款能接近3A6000的單核性能,龍芯自己的3A5000也不行。海光C86 3250依靠多一倍的核心數(shù)量,多核成績(jī)比龍芯3A6000高50%,而兆芯和飛騰的8核CPU,多核成績(jī)?nèi)匀贿h(yuǎn)遠(yuǎn)低于4個(gè)核心的龍芯3A6000。
龍芯3A6000確實(shí)開啟了國(guó)產(chǎn)CPU的新時(shí)代,使用境內(nèi)的相對(duì)落后的工藝,主要依靠設(shè)計(jì)能力達(dá)到了市場(chǎng)主流CPU的性能水平。龍芯6000系列的下一款桌面CPU是3B6000,預(yù)計(jì)單核性能再提高20%,并改用8核的設(shè)計(jì)方案。我估計(jì)3B6000無(wú)論是單核性能還是多核性能都應(yīng)該能接近或者追平Intel酷睿11代i7的水平。
UnixBench不是CPU測(cè)試工具,它測(cè)試的是最小整機(jī)系統(tǒng)的綜合性能。最小整機(jī)系統(tǒng)就是由CPU、主板、內(nèi)存、硬盤、操作系統(tǒng)構(gòu)成的可以啟動(dòng)的完整系統(tǒng)。
UnixBench主要是測(cè)試一臺(tái)電腦處理日常事務(wù)的效率,包括文本處理、浮點(diǎn)函數(shù)、文件讀寫、進(jìn)程創(chuàng)建、管道通信、腳本執(zhí)行等等,這些都是應(yīng)用軟件和操作系統(tǒng)常用的功能。雖然這些功能都是由操作系統(tǒng)提供,但因?yàn)樗泄δ艿膱?zhí)行都與CPU有關(guān),所以它的測(cè)試成績(jī)也與CPU性能有直接關(guān)系。
不過(guò)操作系統(tǒng)如果對(duì)創(chuàng)建進(jìn)程、管道通信等等功能進(jìn)行優(yōu)化,也能提高測(cè)試成績(jī),因此UnixBench是既測(cè)試CPU也測(cè)試操作系統(tǒng),內(nèi)存和硬盤性能也占了一定的比重。在不同的系統(tǒng)中,UnixBench測(cè)試成績(jī)的差異會(huì)比SPEC CPU的測(cè)試差異大一些。
因?yàn)閁nixBench不是單純測(cè)試CPU的計(jì)算能力,而是體現(xiàn)電腦的綜合性能,所以多核并行的效率比較低,單核性能越高的就越有優(yōu)勢(shì),更符合各種應(yīng)用軟件的實(shí)際情況??傮w上看,UnixBench的測(cè)試成績(jī)代表的是電腦執(zhí)行日常任務(wù)的性能表現(xiàn)。
3A6000的UnixBench測(cè)試成績(jī)也相當(dāng)不錯(cuò),單任務(wù)成績(jī)比10代i3-10100F高一些,多任務(wù)成績(jī)要低一些。3A6000多任務(wù)成績(jī)比i3-10100F低不是CPU的原因,應(yīng)該是受到了操作系統(tǒng)的影響,x86版本的UOS系統(tǒng)對(duì)多任務(wù)并行的優(yōu)化可能要比Loongnix更好一些。但隨著龍芯對(duì)操作系統(tǒng)的優(yōu)化和升級(jí),以后UnixBench的測(cè)試成績(jī)也自然地會(huì)隨之提高。
把13代i3-13100F和AMD R5-5600G鎖定在2.5GHz后,R5-5600G因?yàn)橛?個(gè)物理核心,所以多任務(wù)成績(jī)略高于3A6000,其它的成績(jī)都比龍芯3A6000低。UnixBench的測(cè)試成績(jī)又一次說(shuō)明了龍芯3A6000電腦的綜合性能與10代酷睿i3是相同水平,也略微超過(guò)了2.5Ghz時(shí)的13代酷睿i3和AMD Zen 3代。
國(guó)產(chǎn)CPU中只有海光C86-3250憑借8核16線程,以兩倍的核心數(shù)量規(guī)格在多任務(wù)測(cè)試中勝過(guò)了龍芯3A6000。兆芯和飛騰的兩款8核CPU單任務(wù)成績(jī)很低,3A6000是它們的2.5倍以上,它們8任務(wù)并行的成績(jī)只是與4核的龍芯3A5000及鯤鵬920接近,大約是3A6000的一半。
內(nèi)存頻率和通道數(shù)量并不等價(jià)于內(nèi)存訪問(wèn)速度,訪存速度也取決于內(nèi)存控制器的性能,內(nèi)存控制器和內(nèi)存總是快的等慢的,誰(shuí)慢聽誰(shuí)的。內(nèi)存控制器是CPU中一個(gè)重要的組成部分,對(duì)于CPU的各種功能部件龍芯都一直堅(jiān)持自主設(shè)計(jì)。
目前似乎還沒有哪款CPU的內(nèi)存訪問(wèn)速率能達(dá)到理論帶寬,比如DDR4-3200雙通道的理論帶寬上限超過(guò)50GB每秒,但即使13代酷睿的實(shí)際訪存速率也只能達(dá)到43GB每秒左右。
Linux下測(cè)試內(nèi)存訪問(wèn)速率通常是使用Stream測(cè)試軟件,它也是以源碼方式提供,根據(jù)編譯參數(shù)不同而得到支持單線程和多線程測(cè)試的兩種版本。通過(guò)設(shè)置運(yùn)行時(shí)的參數(shù),還可以讓Stream支持各種線程數(shù)量,比如在8個(gè)核心的CPU上測(cè)試4個(gè)線程的內(nèi)存訪問(wèn)速率。
內(nèi)存訪問(wèn)速率除了受限于內(nèi)存控制器和內(nèi)存的性能之外,還與應(yīng)用程序有密切關(guān)系。沒有任何正常的軟件會(huì)只讀寫內(nèi)存而不干點(diǎn)別的事情,像Stream這種內(nèi)存的帶寬測(cè)試軟件也是如此,Stream是在模擬普通應(yīng)用軟件訪問(wèn)內(nèi)存的方式——在循環(huán)中讀寫數(shù)組。因此Stream測(cè)試得到的內(nèi)存訪問(wèn)速率,就能代表普通應(yīng)用軟件訪問(wèn)內(nèi)存的速率。
龍芯3A6000重新設(shè)計(jì)了內(nèi)存控制器,內(nèi)存訪問(wèn)效率相對(duì)于3A5000有飛躍式的進(jìn)步。下面的圖表展示了在使用Steram軟件默認(rèn)的編譯參數(shù)時(shí),對(duì)3A6000和兩款I(lǐng)ntel CPU的測(cè)試結(jié)果。因?yàn)?0代i3搭配H系列主板時(shí)最高只能支持到DDR4-2666內(nèi)存,所以我借了一塊Z490主板測(cè)試了它使用DDR4-3200內(nèi)存時(shí)的訪問(wèn)速率。
我分別進(jìn)行了單線程、4線程、全核心的內(nèi)存訪問(wèn)速率測(cè)試。測(cè)試成績(jī)的單位是兆字節(jié)每秒,每一個(gè)子項(xiàng)的測(cè)試細(xì)節(jié)不必深究,反正是越快越好。從測(cè)試結(jié)果來(lái)看,3A6000的內(nèi)存控制器水平比10代酷睿高,比13代酷睿差,峰值接近42GB每秒,說(shuō)明龍芯自主設(shè)計(jì)的內(nèi)存控制器也達(dá)到了主流水平。
3A6000的內(nèi)存控制器相對(duì)13代酷睿來(lái)說(shuō)還需要繼續(xù)完善,除了訪存速度不如13代酷睿之外,最明顯的問(wèn)題是4線程的訪存速度居然比8線程更快。不過(guò)因?yàn)辇埿臼堑谝淮螌?shí)現(xiàn)超線程的設(shè)計(jì),出現(xiàn)這樣的現(xiàn)象我覺得可以理解。要是與其它的國(guó)產(chǎn)CPU對(duì)比,即使龍芯3A6000較差的那一組成績(jī)也是最優(yōu)秀的,是遙遙領(lǐng)先、一騎絕塵的存在。
通過(guò)對(duì)各款CPU訪存性能的測(cè)試,可以發(fā)現(xiàn)因?yàn)閮?nèi)存控制器的效率不同,即使內(nèi)存的規(guī)格相同,訪存速度也會(huì)有幾倍的差距。當(dāng)前國(guó)產(chǎn)CPU中只有龍芯3A6000能比較完美地發(fā)揮DDR4內(nèi)存的性能,包括3A5000在內(nèi)的其它國(guó)產(chǎn)CPU的內(nèi)存訪問(wèn)效率都難以令人滿意。
能買到的內(nèi)存控制器IP性能都不高,就像高性能的CPU核心一樣屬于非賣品。目前國(guó)產(chǎn)CPU中只有龍芯通過(guò)不斷的自主迭代升級(jí),使DDR4內(nèi)存控制器的效率能與Intel和AMD相提并論。在DDR4的賽道上,龍芯3A6000已經(jīng)終結(jié)了國(guó)產(chǎn)CPU之間的比賽。
一些國(guó)產(chǎn)CPU廠商已經(jīng)在準(zhǔn)備升級(jí)到DDR5內(nèi)存了,但龍芯要到下一代7000系列才支持DDR5內(nèi)存。一是因?yàn)閲?guó)內(nèi)短期內(nèi)不會(huì)有自主的DDR5內(nèi)存,二是因?yàn)辇埿具€沒有把DDR4內(nèi)存的性能發(fā)揮到極限。如果僅僅為了利于宣傳而兼容DDR5的內(nèi)存規(guī)范,但卻體現(xiàn)不出DDR5的內(nèi)存性能,那么除了徒增成本,就沒有任何的實(shí)際意義。
龍芯3A6000在基礎(chǔ)性能測(cè)試中,部分超過(guò)了10代酷睿i3,也有部分還有10%左右的差距。主要是因?yàn)樽钚掳姹镜牟僮飨到y(tǒng)和編譯器還沒有發(fā)布,目前版本的優(yōu)化水平相對(duì)于x86還有一些距離。以后隨著操作系統(tǒng)和編譯器的優(yōu)化逐漸到位,這一點(diǎn)差距也一定能被補(bǔ)上。
盡管在相同頻率的時(shí)候,龍芯3A6000的單核性能追平了Intel 酷睿13代,但由于工藝落后,以及資金投入不足,龍芯3A6000的主頻較低,實(shí)際性能僅相當(dāng)于酷睿10代i3。
工藝和主頻在短期內(nèi)不會(huì)有明顯的改善,龍芯的下一代CPU產(chǎn)品仍然以提高每GHz的性能為主,將與Intel長(zhǎng)期保持低頻打高頻的局面。美國(guó)對(duì)我國(guó)的自主CPU不會(huì)放松工藝限制,但對(duì)我國(guó)的引進(jìn)技術(shù)CPU倒有可能網(wǎng)開一面。因此自主CPU只能依靠境內(nèi)相對(duì)落后的工藝制程與進(jìn)口產(chǎn)品展開競(jìng)爭(zhēng),也就必須繼續(xù)強(qiáng)化CPU設(shè)計(jì)能力,通過(guò)提升每GHz的性能抹平工藝差距引起的性能差距。
完全自主的龍芯3A6000每GHz的性能追平了13代酷睿,也使通過(guò)引進(jìn)技術(shù)發(fā)展國(guó)產(chǎn)CPU的路線遭遇了最嚴(yán)重的危機(jī)。因?yàn)橐蕾囈M(jìn)技術(shù)的CPU企業(yè)普遍缺少改進(jìn)CPU核心設(shè)計(jì)的能力和動(dòng)力,長(zhǎng)期以來(lái)都是依靠更先進(jìn)的工藝提升主頻以及堆砌更多的核心來(lái)提高CPU性能。現(xiàn)在它們即使能獲得使用先進(jìn)工藝的特別許可,但買不到能與13代酷睿匹敵的CPU核心設(shè)計(jì)也是瞎子點(diǎn)燈。
美國(guó)一方面禁止向中國(guó)出售高性能的計(jì)算產(chǎn)品,禁止中國(guó)企業(yè)使用先進(jìn)的芯片生產(chǎn)工藝,另一方面又有限度地向中國(guó)企業(yè)出售CPU架構(gòu)授權(quán)、IP核授權(quán)、專利授權(quán),幫助中國(guó)CPU企業(yè)在美國(guó)可控的程度下成長(zhǎng),事實(shí)證明美國(guó)的策略沒有實(shí)現(xiàn)它希望的結(jié)果。
因?yàn)樵诩夹g(shù)方面依賴美國(guó)的中國(guó)CPU企業(yè),成長(zhǎng)速度受到了美國(guó)限制,所以給國(guó)內(nèi)自主CPU留下了生存空間,無(wú)法完美地遏制自主CPU崛起。美國(guó)如果想要補(bǔ)救,那么就需要向中國(guó)企業(yè)出售IPC高于13代酷睿的CPU核心,但這樣就與限制中國(guó)發(fā)展高性能CPU的政策產(chǎn)生了矛盾,實(shí)際上美國(guó)幾年前就已經(jīng)不再向中國(guó)企業(yè)提供更先進(jìn)的CPU核心及架構(gòu)授權(quán),轉(zhuǎn)而一心一意地以更直接的手段打擊和限制中國(guó)自主CPU的發(fā)展。
但是龍芯未雨綢繆早當(dāng)先,居安思危謀長(zhǎng)遠(yuǎn),主動(dòng)拋棄了與美國(guó)有牽連的MIPS指令集,所有CPU產(chǎn)品都已經(jīng)基于自主指令集龍架構(gòu)(LoongArch)重新設(shè)計(jì)。龍芯的CPU生產(chǎn)也使用境內(nèi)可控的工藝,甚至建立了全面使用國(guó)產(chǎn)設(shè)備的芯片封裝測(cè)試廠。龍芯也一直在追求EDA工具的國(guó)產(chǎn)化,與國(guó)內(nèi)的EDA軟件企業(yè)進(jìn)行了深入合作。
龍芯已經(jīng)把防御能力點(diǎn)滿,美國(guó)之前對(duì)龍芯實(shí)施的制裁,甚至都沒有激起一丁點(diǎn)波瀾。龍芯仍然按照既定的時(shí)間表穩(wěn)健地發(fā)展,3A6000也如期地展現(xiàn)在大家眼前,然后年底量產(chǎn)、發(fā)布、銷售,節(jié)奏一點(diǎn)兒都沒亂。
龍芯規(guī)劃的后續(xù)產(chǎn)品中,不止有單核性能更高的且集成了8個(gè)核心的3B6000,還有分別集成了16個(gè)和32個(gè)核心的3C6000和3D6000,這些產(chǎn)品都計(jì)劃在明年發(fā)布。3C6000和3D6000的CPU核心與3A6000相同,并針對(duì)服務(wù)器CPU核心數(shù)量多的特點(diǎn),改進(jìn)了多核及多路互聯(lián)的效率,使CPU并行效率進(jìn)一步提升。
在新的核心設(shè)計(jì)通過(guò)3B6000得到驗(yàn)證之后,就會(huì)推出32個(gè)和64個(gè)核心的3D7000和3E7000。6000和7000系列的服務(wù)器CPU完全具有與Intel高端的同類產(chǎn)品競(jìng)爭(zhēng)的實(shí)力。無(wú)論是對(duì)比單核性能還是對(duì)比多核性能,都是相同的性能水平。
龍芯3A6000的誕生,標(biāo)志著龍芯已經(jīng)從被動(dòng)防御轉(zhuǎn)為了防守反擊的階段。龍芯二十年如一日?qǐng)?jiān)持自主設(shè)計(jì),才能有現(xiàn)今的成就。只有腳踏實(shí)地、實(shí)事求是、自強(qiáng)自立才能真正與國(guó)際接軌,成為支撐世界信息技術(shù)發(fā)展的擎天巨柱。