中文字幕亚洲综合久久综合,欧美性xxxx禁忌

　　每GHz的性能不等于CPU產(chǎn)品的性能，但能體現(xiàn)CPU核心的設(shè)計(jì)水平。有了高超的CPU設(shè)計(jì)能力，即便使用較為落后的工藝來(lái)生產(chǎn)，也能保證CPU產(chǎn)品具有較高的性能水平。而每GHz性能低下的CPU核心，則必須依靠先進(jìn)工藝全力提高CPU頻率，不符合國(guó)內(nèi)現(xiàn)在的實(shí)際情況。如果一款CPU每GHz的性能只有龍芯3A6000的三分之一，那么就需要三倍的頻率才能與龍芯3A6000抗衡，不但超出了當(dāng)前的工藝極限，功耗和發(fā)熱量也會(huì)提高到3倍以上。

　　龍芯3A6000依托境內(nèi)的可控工藝，主要通過(guò)設(shè)計(jì)能力實(shí)現(xiàn)了性能大幅度提升，CPU核心的設(shè)計(jì)一舉達(dá)到了世界先進(jìn)水平。我國(guó)在上世紀(jì)80年代初由于經(jīng)濟(jì)和工業(yè)水平無(wú)法支撐高端半導(dǎo)體技術(shù)發(fā)展，被迫放棄了自主設(shè)計(jì)微處理器。我國(guó)與美國(guó)在CPU設(shè)計(jì)能力方面的差距實(shí)際已經(jīng)累積了五十年，龍芯經(jīng)過(guò)二十多年的不懈努力，彌合了這長(zhǎng)達(dá)半個(gè)世紀(jì)的差距。

測(cè)試環(huán)境和性能對(duì)照組

　　這次我用來(lái)與龍芯3A6000進(jìn)行性能對(duì)比的CPU共有八款，其中五款是國(guó)產(chǎn)CPU，兩款是Intel的產(chǎn)品，一款是AMD的產(chǎn)品。

　　國(guó)產(chǎn)CPU中，龍芯3A5000是龍芯上一代的桌面產(chǎn)品，海光C86-3250是8核16線程，核心數(shù)量是3A6000的兩倍。兆芯KX-U6780A和飛騰D2000也是8個(gè)核心但沒(méi)有超線程，鯤鵬920是國(guó)內(nèi)目前唯一使用7nm工藝的桌面和服務(wù)器CPU產(chǎn)品。兆芯、飛騰、華為自2019年之后就沒(méi)有推出性能更強(qiáng)的桌面CPU，所以只能用它們4年前的產(chǎn)品參與對(duì)比。

　　兩款I(lǐng)ntel的CPU分別是10代酷睿i3-10100F和13代酷睿i3-13100F，它們和3A6000一樣是4核8線程，但它們的主頻比3A6000高得不是一星半點(diǎn)。i3聽(tīng)起來(lái)好像很低端，但10代i3的規(guī)格其實(shí)和7代酷睿i7一樣，更高端的型號(hào)主要是集成了更多的核心。10代酷睿CPU因?yàn)镮PC有小幅度提升，再加上工藝進(jìn)步，所以它的實(shí)際性能比7代i7還高一些。最后一款是AMD R5-5600G，核心是Zen 3代，6核12線程。

　　兩款I(lǐng)ntel的CPU我都沒(méi)有裝進(jìn)機(jī)箱，AMD的CPU用的開(kāi)放式機(jī)箱。因?yàn)樗蠧PU都是使用的普通風(fēng)冷散熱器，Intel和AMD的CPU發(fā)熱量又比較高，裝進(jìn)普通機(jī)箱會(huì)因?yàn)榉e熱而影響性能發(fā)揮。

　　幾款CPU支持的內(nèi)存頻率也不一樣，凡是使用2666內(nèi)存的，都是因?yàn)镃PU或主板只能支持到2666，上不到3200。內(nèi)存都是雙通道，在測(cè)試單核性能時(shí)內(nèi)存不是瓶頸，2666和3200的差異幾乎不影響測(cè)試成績(jī)，不過(guò)在測(cè)試多核性能的時(shí)候，3200的內(nèi)存要比2666多一些優(yōu)勢(shì)。但這一點(diǎn)優(yōu)勢(shì)又很容易因?yàn)镃PU高溫降頻而損失殆盡，不過(guò)龍芯3A6000是固定頻率2.5GHz，倒是沒(méi)有散熱器壓不住溫度的焦慮。

　　對(duì)于尚未正式發(fā)布的龍芯3A6000，目前只有龍芯自己的Loongnix系統(tǒng)才能較好地發(fā)揮它的性能，因此這次測(cè)試3A6000是使用Loongnix系統(tǒng)，其它CPU使用UOS系統(tǒng)，編譯器都是系統(tǒng)自帶的GCC8.3版本。

　　UOS系統(tǒng)的龍芯版本實(shí)際上是使用的Loongnix的內(nèi)核和基礎(chǔ)組件，只不過(guò)UOS的優(yōu)化更新會(huì)落后于Loongnix一段時(shí)間，所以3A6000當(dāng)前在Loongnix上的性能表現(xiàn)，在幾個(gè)月之后就能在UOS龍芯版系統(tǒng)上重現(xiàn)。

　　為了能準(zhǔn)確地定位龍芯3A6000核心設(shè)計(jì)的水平，我對(duì)i3-10100F、i3-13100F和R5-5600G除了進(jìn)行通常狀態(tài)下的測(cè)試之外，還把它們鎖定到了與3A6000相同的頻率再次進(jìn)行了測(cè)試，以便于對(duì)比它們?cè)?.5GHz時(shí)與3A6000的性能差異。

CPU性能測(cè)試——SPEC CPU2006

　　龍芯中科提供的測(cè)試機(jī)是有歸還時(shí)限的，因此開(kāi)始時(shí)我本來(lái)不打算測(cè)試SPEC CPU 2006，而是想測(cè)試國(guó)內(nèi)CPU廠商很少提及的SPEC CPU 2017。不過(guò)一些網(wǎng)友知道我拿到了龍芯3A6000測(cè)試機(jī)之后，強(qiáng)烈要求我測(cè)試SPEC CPU 2006。因此我中斷了對(duì)SPEC CPU 2017的測(cè)試，先把SPEC CPU 2006跑了一遍。在與其它的國(guó)產(chǎn)CPU對(duì)比時(shí)，SPEC CPU 2006的測(cè)試成績(jī)也更有意義。

　　SPEC CPU 2006是一款比較專業(yè)的CPU性能評(píng)估工具，它的代碼沒(méi)有針對(duì)特定平臺(tái)優(yōu)化，由測(cè)試者自行編譯運(yùn)行，因此適合用于跨平臺(tái)對(duì)比CPU性能。但I(xiàn)CC和AOCC等編譯器為了在SPEC CPU測(cè)試中跑出高分，會(huì)犧牲計(jì)算精度換取運(yùn)行速度，因此大家一般更加認(rèn)可使用GCC、LLVM、MSVC等編譯器測(cè)試得到的成績(jī)。

　　SPEC CPU 2006測(cè)試的是CPU運(yùn)行常規(guī)應(yīng)用軟件時(shí)的通用性能，包含了12個(gè)整數(shù)性能測(cè)試項(xiàng)目，和17個(gè)浮點(diǎn)性能測(cè)試項(xiàng)目，每個(gè)子項(xiàng)目都單獨(dú)評(píng)分，然后把各個(gè)子項(xiàng)的測(cè)試成績(jī)進(jìn)行幾何平均得出總分。

　　SPEC CPU 2006分為單任務(wù)測(cè)試和多任務(wù)測(cè)試，但是單任務(wù)測(cè)試的時(shí)候，有部分測(cè)試項(xiàng)目可以通過(guò)編譯器的自動(dòng)并行化支持把計(jì)算任務(wù)自動(dòng)分配到多個(gè)核心上并行執(zhí)行。因此凡是開(kāi)啟了自動(dòng)并行化的測(cè)試結(jié)果，都不能代表CPU的單核性能。對(duì)于桌面電腦的CPU，最為重要的是整數(shù)通用性能，特別是單核的整數(shù)通用性能。因?yàn)閱魏苏麛?shù)性能最能體現(xiàn)桌面應(yīng)用程序的運(yùn)行效率。

　　在3A6000流片之后，龍芯中科公開(kāi)過(guò)兩次SPEC CPU 2006測(cè)試成績(jī)。第一次單核整數(shù)和浮點(diǎn)得分分別是40和55，第二次是在加強(qiáng)了GCC編譯器對(duì)自主指令集Loongarch的優(yōu)化之后，由工信部旗下賽西實(shí)驗(yàn)室測(cè)試的成績(jī)，單核整數(shù)和浮點(diǎn)成績(jī)分別是43.1和54.6。

　　上圖中提到了“編譯器‘補(bǔ)課’”，學(xué)霸從來(lái)不會(huì)承認(rèn)自己補(bǔ)課，把補(bǔ)課掛在嘴邊的都是差生。龍芯自主設(shè)計(jì)的LoongArch指令集才誕生兩三年，龍芯的工程師雖然已經(jīng)給GCC等常用編譯器添加了對(duì)LoongArch指令集的支持，但優(yōu)化的程度還與x86和ARM相差甚遠(yuǎn)。因此龍芯要通過(guò)“補(bǔ)課”，使GCC編譯器對(duì)LoongArch指令集的優(yōu)化追上x(chóng)86和ARM的水平。

　　龍芯提供的測(cè)試機(jī)硬盤中有已經(jīng)編譯好的SPEC CPU 2006測(cè)試環(huán)境，直接運(yùn)行就能得到測(cè)試成績(jī)。但因?yàn)辇埿狙a(bǔ)課完成的最新版本的GCC編譯器還沒(méi)有到發(fā)布階段，沒(méi)有提供最新版本的編譯器，所以我如果要自己配置編譯參數(shù)來(lái)測(cè)試SPEC CPU 2006，就只能使用系統(tǒng)中現(xiàn)有的老版本編譯器。因此我暫時(shí)只嘗試復(fù)現(xiàn)龍芯第一次公布的實(shí)測(cè)成績(jī)，等3A6000正式上市銷售了，操作系統(tǒng)和編譯器應(yīng)該也完成了升級(jí)更新，那時(shí)我再去嘗試復(fù)現(xiàn)更高的43.1的單核整數(shù)成績(jī)。

　　我用自己的硬盤重新安裝了Loongnix系統(tǒng)，并自行配置參數(shù)測(cè)試了SPEC CPU 2006，單核整數(shù)性能測(cè)試的結(jié)果還不錯(cuò)，達(dá)到了40.1分，與龍芯公布的編譯器“補(bǔ)課”完成前的40分相符。直接運(yùn)行測(cè)試機(jī)中提供的SPEC CPU 2006，得分42.9，與公布的43.1相符。

　　與編譯器“補(bǔ)課”完成后的測(cè)試成績(jī)相比，新編譯器對(duì)12個(gè)測(cè)試項(xiàng)目的9個(gè)項(xiàng)目有提升。這說(shuō)明龍芯絕不是像ICC和AOCC編譯器那樣為了跑分而優(yōu)化，因?yàn)榫幾g器如果是針對(duì)跑分優(yōu)化，往往只能把某一個(gè)子項(xiàng)目的成績(jī)提到極限，而其它項(xiàng)目的成績(jī)基本不變。

　　就像下面這款至強(qiáng)CPU的測(cè)試成績(jī)，使用了ICC編譯器和收費(fèi)的跑分專用優(yōu)化庫(kù)，在測(cè)試報(bào)告的條形圖上，只有一個(gè)項(xiàng)目一支獨(dú)秀，其它項(xiàng)目都被擠壓成了薄薄的一片兒。幸好總分是通過(guò)幾何平均來(lái)計(jì)算，如果是算術(shù)平均的算法，Intel的測(cè)試成績(jī)將無(wú)人能敵。除了Intel和AMD之外，國(guó)產(chǎn)x86廠商也有這樣跑分的，在宣傳的時(shí)候又刻意回避測(cè)試環(huán)境和子項(xiàng)成績(jī)，讓人看不出貓膩。我也是在吃了虧上了當(dāng)之后，才有了自己測(cè)試國(guó)產(chǎn)CPU并把結(jié)果公之于眾的想法，能少幾個(gè)人上當(dāng)總是好的。

　　ICC和AOCC的超強(qiáng)優(yōu)化原理其實(shí)很簡(jiǎn)單，就是犧牲計(jì)算精度提高計(jì)算速度。但是這種優(yōu)化會(huì)使編譯器出現(xiàn)預(yù)料之外的行為，會(huì)把不該優(yōu)化的也優(yōu)化了，等于是犧牲了全局的計(jì)算精度和兼容性。沒(méi)有任何商業(yè)版的操作系統(tǒng)和應(yīng)用軟件使用ICC和AOCC，就是因?yàn)楹茈y保證程序運(yùn)行時(shí)的正確性。在必須保持計(jì)算精度的時(shí)候，ICC和AOCC卻又表現(xiàn)不出明顯的優(yōu)勢(shì)。而龍芯的編譯器不可能像ICC和AOCC那樣顧頭不顧腚，因?yàn)辇埿倦娔X上所有操作系統(tǒng)和應(yīng)用軟件，都是直接或間接地使用龍芯的編譯器，所以龍芯的編譯器絕對(duì)要保證正確性。

　　龍芯新版編譯器測(cè)出的成績(jī)中，編號(hào)462的子項(xiàng)目看起來(lái)很像是使用GCC自動(dòng)并行化參數(shù)結(jié)果，但我在測(cè)試時(shí)觀察了CPU的占用情況，確定整個(gè)測(cè)試過(guò)程中只有一個(gè)核心滿負(fù)載，其它核心的占用率都低于1%。說(shuō)明成績(jī)提升是來(lái)自于編譯器“補(bǔ)課”，也說(shuō)明龍芯3A6000的向量指令運(yùn)行效率很高，只是當(dāng)前版本的編譯器還不能釋放它的性能。何況就算把462這一項(xiàng)成績(jī)換成我的測(cè)試結(jié)果，幾何平均后總分也仍然接近42分，完全不影響關(guān)于性能水平的結(jié)論。后面的Linpack測(cè)試也能證明龍芯3A6000的向量計(jì)算能力很強(qiáng)，并且當(dāng)編譯器能夠完整地支持“龍架構(gòu)”的向量指令之后，3A6000會(huì)更強(qiáng)。

　　我對(duì)龍芯的GCC編譯器仍然使用“補(bǔ)課”這個(gè)詞，是因?yàn)樵趚86版的GCC面前不敢說(shuō)“優(yōu)化”。在GCC編譯器和Linux中，積累了Intel和AMD以及眾多其它開(kāi)發(fā)者對(duì)x86指令集幾十年的優(yōu)化成果，龍芯的龍架構(gòu)在基礎(chǔ)軟件優(yōu)化方面，能夠在兩三年內(nèi)補(bǔ)上差距就已經(jīng)很厲害了。等龍芯發(fā)布新版操作系統(tǒng)和編譯器之后，無(wú)論測(cè)試成績(jī)還是應(yīng)用軟件的實(shí)際體驗(yàn)，都一定會(huì)有相應(yīng)的提升。

　　為了探索龍芯3A6000的性能水平，我在申請(qǐng)到測(cè)試機(jī)之前，就已經(jīng)開(kāi)始了漫長(zhǎng)的測(cè)試過(guò)程。下面這張圖中，三款進(jìn)口CPU從1.0GHz到4.0GHz的測(cè)試成績(jī)不是通過(guò)換算得到的，而是我把它們鎖定頻率后一點(diǎn)一點(diǎn)實(shí)測(cè)出來(lái)的。從1.0GHz到4.0GHz，每隔500MHz就運(yùn)行一次SPEC CPU 2006，然后得到了它們的單核整數(shù)和浮點(diǎn)成績(jī)與CPU頻率的對(duì)應(yīng)關(guān)系。通過(guò)下方的圖表可以確定兩點(diǎn)規(guī)律：

　　一、當(dāng)CPU的頻率相同的時(shí)候，三款CPU的性能各不相同。早先AMD被Intel打壓得瀕臨崩潰，然后又反過(guò)來(lái)壓了Intel一頭，之后Intel掏出壓箱底的技術(shù)儲(chǔ)備又保住了市場(chǎng)地位。導(dǎo)致這一切變化的主要因素，就是它們每GHz的性能交替性地出現(xiàn)了重大提升?？傆懈鞣N原因使CPU不能運(yùn)行在較高的頻率，但只要每GHz的性能足夠強(qiáng)，那么在低頻率下也仍然能保障不錯(cuò)的性能，并且只要滿足了達(dá)到高頻率的條件，就能獲得更高的性能，這就是高性能CPU核心設(shè)計(jì)中強(qiáng)調(diào)每GHz性能的原因。

　　二、當(dāng)內(nèi)存性能固定的時(shí)候，CPU的性能與頻率不是等比例地提升，每GHz的性能總是隨著頻率升高而降低。CPU頻率翻倍時(shí)功率也一定翻倍，但性能卻不能翻倍。因此在低頻率下實(shí)現(xiàn)的高性能更有價(jià)值，而實(shí)現(xiàn)低頻高能的唯一途徑就是提高每GHz的性能。

　　我在測(cè)試這三款CPU性能的過(guò)程中，就發(fā)現(xiàn)10代i3在設(shè)置了固定4.0GHz的頻率后，測(cè)試過(guò)程中會(huì)因?yàn)闇囟冗^(guò)高而降頻。我為了避免頻率波動(dòng)而臨時(shí)換成了比CPU還貴的水冷散熱器，但除此之外的其它測(cè)試都仍然使用原來(lái)的散熱器。因?yàn)槲艺J(rèn)為在極度優(yōu)化的條件下測(cè)出的成績(jī)，對(duì)于占了絕大多數(shù)的普通家庭和辦公電腦用戶沒(méi)有意義。DIY和超頻玩家有另外的性能評(píng)價(jià)標(biāo)準(zhǔn)，我在常規(guī)環(huán)境下的測(cè)試也不會(huì)干擾他們的判斷。

　　所有CPU都是使用SPEC CPU 2006的base模式進(jìn)行測(cè)試，編譯器都是系統(tǒng)自帶的GCC8.3版本。不使用第三方使用優(yōu)化庫(kù)，也沒(méi)有開(kāi)啟自動(dòng)并行化，測(cè)出的成績(jī)能真實(shí)反映CPU在用戶的系統(tǒng)和軟件環(huán)境中能達(dá)到的性能水平。

　　3A5000和3A6000的頻率都是固定的2.5GHz，只要把它們的測(cè)試成績(jī)標(biāo)注在2.5GHz的坐標(biāo)軸上，就既能看到三款進(jìn)口CPU與它們?cè)谙嗤l率時(shí)的性能對(duì)比，也能看到它們與這三款進(jìn)口CPU的性能差距。

　　13代酷睿i3-13100F在2.5GHz時(shí)的成績(jī)剛好40分，我測(cè)得3A6000的40.1分比它更高一點(diǎn)，但13代酷睿工藝比10代酷睿先進(jìn)，單核最高頻率可以比較容易地長(zhǎng)時(shí)間穩(wěn)定在4.4GHz，因此3A6000與i3-13100F實(shí)際的性能差距還比較大。

　　下圖是各款CPU的單核整數(shù)成績(jī)對(duì)比，3A6000是使用的官方成績(jī)，其它的CPU都是我自己測(cè)試的結(jié)果。其中Intel和AMD的CPU包括了自動(dòng)控制頻率和固定2.5GHz時(shí)的成績(jī)，便于與2.5GHz的龍芯3A6000對(duì)比相同頻率時(shí)的性能。

　　3A6000使用與3A5000相同的生產(chǎn)工藝，在頻率不變的條件下把單核性能提高了60%，這完全是來(lái)自于CPU核心設(shè)計(jì)的提升。提高每GHz的性能和提高CPU頻率都能達(dá)到提高性能的目的，兩種方式各有各的困難。提高頻率必須把CPU電路的布局布線與生產(chǎn)工藝緊密結(jié)合，需要反復(fù)多次流片尋找短板加以改進(jìn)，一點(diǎn)一點(diǎn)地推高頻率，資金消耗非常大。如果更換了工藝或者對(duì)CPU核心設(shè)計(jì)有重大修改，又必須重復(fù)提高頻率的過(guò)程。

　　提高每GHz的性能更加困難，考驗(yàn)的是核心技術(shù)積累和創(chuàng)新的能力，Intel把每GHz的性能提高到現(xiàn)在的程度用了四十多年，AMD曾經(jīng)因?yàn)樵O(shè)計(jì)能力進(jìn)入瓶頸，每GHz性能多年沒(méi)有提升而幾乎倒閉。提高每GHz的性能和提高頻率不是二選一，但龍芯目前的路線是優(yōu)先提高每GHz的性能，暫時(shí)不苛求高頻率。大概是因?yàn)橐試?guó)內(nèi)當(dāng)前的工藝水平很難達(dá)到與Intel一樣的頻率，在每GHz的性能超越Intel之前盲目提高頻率就只是浪費(fèi)資源，把有限的資金用于研發(fā)更多的核心技術(shù)才更有意義。

　　龍芯自主研發(fā)的核心技術(shù)涵蓋了CPU和主板必需的各種功能模塊，還包括了自主研發(fā)的GPU。龍芯GPU LG100已經(jīng)集成在了龍芯的橋片7A2000中，LG200將會(huì)集成到下一款桌面CPU 3B6000中。單看對(duì)現(xiàn)代桌面計(jì)算機(jī)所需的核心功能模塊的積累，能在先進(jìn)性和完備性兩個(gè)方面同時(shí)超過(guò)龍芯的可能只有Intel和AMD。

　　龍芯3A6000無(wú)論是43.1還是40.1的得分，都超過(guò)了i3-13100F和R5-5600G在2.5GHz時(shí)的成績(jī)。假如國(guó)內(nèi)的芯片生產(chǎn)工藝跟得上，并且龍芯也有足夠的資金與代工廠反復(fù)磨合提高主頻，那么3A6000的對(duì)手就不止是10代酷睿i3了，至少能再提高一個(gè)段位。

　　10代酷睿i3-10100F在2.5Ghz時(shí)的測(cè)試成績(jī)僅30.8，比龍芯3A6000低了不少。自動(dòng)控制頻率時(shí)成績(jī)是42.5，與龍芯3A6000持平。i3-10100F測(cè)試過(guò)程中頻率有波動(dòng)，平均頻率大約3.6GHz，與它的基礎(chǔ)頻率一樣。10代酷睿i3的最高型號(hào)是i3-10105(F)，基礎(chǔ)頻率和睿頻都只比i3-10100F高0.1GHz，性能基本沒(méi)有區(qū)別。

　　測(cè)試3A6000整數(shù)通用性能的目標(biāo)已經(jīng)達(dá)成，不過(guò)我測(cè)試浮點(diǎn)通用性能的成績(jī)暫時(shí)沒(méi)有達(dá)到55分，目前只有51.7分。我覺(jué)得我現(xiàn)在使用的GCC編譯器，版本可能比龍芯第一次公布3A6000實(shí)測(cè)成績(jī)時(shí)用的編譯器更老，要不然不會(huì)出現(xiàn)這樣的差距。因?yàn)檫€要留下時(shí)間測(cè)試SPEC CPU 2017和其它項(xiàng)目，所以我不會(huì)花太多時(shí)間來(lái)嘗試調(diào)整編譯參數(shù)，還是等龍芯更新編譯器吧！

　　無(wú)論是51.7還是54.6，都與13代酷睿在2.5GHz時(shí)的成績(jī)差距不大，而且要比AMD R5-5600G的Zen 3代核心好一些。因?yàn)?A6000的整數(shù)通用性能也比相同頻率下的R5-5600G更高，所以可以確定3A6000的LA664核心在同頻率下的性能超過(guò)了AMD的Zen 3代核心，也應(yīng)該超過(guò)了Zen 4代核心。龍芯3A6000的性能雖然只與10代酷睿i3相當(dāng)，但CPU核心的邏輯設(shè)計(jì)水平已經(jīng)是世界一流的水準(zhǔn)。

　　10代酷睿i3-10100F在4.0GHz時(shí)，單核浮點(diǎn)通用成績(jī)也才56.1分，而通常情況下i3-10100F保持不了4.0GHz的頻率，實(shí)測(cè)只有51.3分，我測(cè)得3A6000的51.7分要比它高一些。因此龍芯3A6000在浮點(diǎn)通用性能方面也已經(jīng)追平了10代酷睿i3。13代酷睿相對(duì)10代酷睿同頻率的浮點(diǎn)通用性能提升幅度高達(dá)60%，但3A6000相對(duì)于3A5000則實(shí)現(xiàn)了幾乎翻倍的提升，說(shuō)明龍芯雖然絕對(duì)性能與Intel相比還有差距，但進(jìn)步的速度比Intel更快。

　　與國(guó)內(nèi)的其它CPU對(duì)比的話，3A6000就令所有的國(guó)產(chǎn)CPU都望塵莫及了。最差的兆芯和飛騰單核浮點(diǎn)通用性能甚至只有3A6000的四分之一。

　　通過(guò)單核性能測(cè)試已經(jīng)再次證明龍芯官方公布的成績(jī)是靠譜的，因此對(duì)于多核并行性能，就直接用官方的測(cè)試成績(jī)來(lái)與我測(cè)試的其它CPU作個(gè)對(duì)比。

　　通過(guò)下方的條形圖，可以明顯地看到3A6000的多核并行性能也與i3-10100F是相同水平。測(cè)試i3-10100F多核并行性能時(shí)與測(cè)試單核時(shí)的散熱條件一致，如果把它裝進(jìn)機(jī)箱，測(cè)試成績(jī)就會(huì)大幅度下降。當(dāng)然，如果加強(qiáng)散熱也可以帶來(lái)5%左右的性能提升，不過(guò)不影響3A6000與i3-10100F性能基本相等的結(jié)論。由于Intel和AMD的CPU性能發(fā)揮極度依賴于散熱，因此對(duì)于蓋得嚴(yán)嚴(yán)實(shí)實(shí)的家用和辦公電腦，3A6000的多核并行性能甚至能與10代i5拼一拼。

　　Intel和AMD的CPU非常有趣，因?yàn)樾阅苁遣淮_定的，主頻和睿頻只能決定CPU性能的上限，而管不了CPU性能的下限，所以極大地增強(qiáng)了用戶探索CPU性能極限的趣味性。有網(wǎng)友提供了10代i5筆記本的測(cè)試成績(jī)，也是4核8線程，但多核并行成績(jī)只有桌面i3的一半，也就是也只有3A6000的一半，甚至低于3A5000的水平。當(dāng)然如果是游戲筆記本，性能就不會(huì)降這么多，但商務(wù)筆記本就很難說(shuō)了。

　　在多核并行的對(duì)比中，國(guó)產(chǎn)CPU中只有海光C86 3250的成績(jī)超過(guò)了龍芯3A6000，因?yàn)楹９釩86 3250是8核16線程，而龍芯3A6000是4核8線程。等龍芯8核的3B6000推出，那么能接得住就只有Intel和AMD。與海光3250同樣有8個(gè)物理核心的兆芯KX-U6780A和飛騰D2000，多核性能則只有龍芯3A6000的一半。

　　因?yàn)槎嗪瞬⑿袝r(shí)的損耗會(huì)隨著核心數(shù)量增加而增加，所以部分國(guó)產(chǎn)CPU廠商在單核性能還很低的時(shí)候，不想著提高單核性能，反而毫無(wú)節(jié)制地碓砌核心數(shù)量，就令人難以理解。

　　比如飛騰64核的S2500，多核并行的測(cè)試成績(jī)只有龍芯3A6000的3倍多一點(diǎn)，是64核的性能只有4核的3倍多。還有基于阿里平頭哥C910核心的RISC-V架構(gòu)的某款64核CPU，單核性能比飛騰的CPU更低，64核并行的成績(jī)只有300分，也就是不到3A6000的兩倍，這比“i3默秒全”還要夸張啊朋友們。

　　在實(shí)際應(yīng)用中，一個(gè)40分的核心，無(wú)論是單任務(wù)還是多任務(wù)并行，運(yùn)行效率都遠(yuǎn)遠(yuǎn)高于四個(gè)10分的核心。連軟件工程師都明白的事兒，難道CPU工程師們不明白嗎？這些低性能的多核CPU，核心堆得越多就越是耐人尋味。

浮點(diǎn)運(yùn)算性能測(cè)試——Linpack

　　前面說(shuō)過(guò)龍芯3A6000的向量指令運(yùn)行效率很高，那么現(xiàn)在就來(lái)測(cè)一下比較考驗(yàn)向量計(jì)算性能的Linpack。

　　Linpack也是一種常用的性能測(cè)試程序，它通過(guò)計(jì)算雙精度線性方程組的求解來(lái)測(cè)試計(jì)算機(jī)的運(yùn)算能力，Linpack的測(cè)試成績(jī)代表的是計(jì)算機(jī)最基本的計(jì)算性能?；A(chǔ)的Linpack版本只能測(cè)試CPU的性能，超級(jí)計(jì)算機(jī)使用Linpack來(lái)測(cè)試時(shí)，會(huì)針對(duì)異構(gòu)運(yùn)算部件修改測(cè)試程序，超算500強(qiáng)的排名依據(jù)就是Linpack的測(cè)試成績(jī)。

　　現(xiàn)代編譯器都會(huì)自動(dòng)使用CPU的向量指令來(lái)優(yōu)化計(jì)算速度，因此Linpack對(duì)于普通的CPU就特別考驗(yàn)編譯器的能力。

　　想讓測(cè)試結(jié)果接近CPU的理論峰值非常困難，因此我偷個(gè)懶，直接使用openbenchmarking網(wǎng)站上的Phoronix Test Suite測(cè)試套件來(lái)測(cè)試，這樣所有的CPU都是使用相同的源代碼，由測(cè)試套件自動(dòng)配置編譯和測(cè)試參數(shù)，每一款CPU的測(cè)試成績(jī)都無(wú)法達(dá)到最高，也就相對(duì)公平了。

　　Phoronix Test Suite測(cè)試套件中的HPL-Linpack是多線程測(cè)試，CPU所有核心都會(huì)全速運(yùn)行。因?yàn)槭鞘褂猛ㄓ玫木幾g配置，所以就比較考驗(yàn)編譯器自動(dòng)向量?jī)?yōu)化的能力，在這方面當(dāng)前版本的龍芯編譯器是比較吃虧的。不過(guò)龍芯3A6000的測(cè)試成績(jī)看起來(lái)還是相當(dāng)不錯(cuò)，遠(yuǎn)超10代i3，低于13代i3。測(cè)試時(shí)沒(méi)有鎖定頻率，也都是所有核心并行，各款CPU能跑多高就跑多高。

　　必須再次強(qiáng)調(diào)這個(gè)成績(jī)是使用的Phoronix Test Suite測(cè)試套件自動(dòng)編譯并自動(dòng)配置測(cè)試參數(shù)，測(cè)試成績(jī)與CPU能達(dá)到的最高水平差距很大。i3-13100F在浮點(diǎn)通用性能測(cè)試中比i3-10100F只高了60%，但在Linpack測(cè)試中提高了80%。龍芯3A6000則與之相反，在浮點(diǎn)通用性能測(cè)試中比3A5000高一倍，但在Linpack測(cè)試中只高了28%。出現(xiàn)這樣的情況，幾乎可以肯定是編譯器過(guò)于陳舊導(dǎo)致的。因?yàn)?A5000的測(cè)試成績(jī)已經(jīng)比10代i3更高，那么3A6000就應(yīng)該比13代i3更高才對(duì)，我非常期待龍芯對(duì)編譯器的后續(xù)更新能帶來(lái)驚喜！

CPU性能測(cè)試——SPEC CPU 2017

　　SPEC CPU 2017是比SPEC CPU 2006更新的版本，測(cè)試的項(xiàng)目經(jīng)過(guò)調(diào)整，既刪除了被ICC、AOCC等編譯器通過(guò)降低計(jì)算精度提高測(cè)試成績(jī)的項(xiàng)目，又增加了更多的針對(duì)現(xiàn)代CPU向量指令的性能考察。在SPEC CPU 2017上，編譯器自動(dòng)使用向量指令優(yōu)化程序性能的能力會(huì)對(duì)測(cè)試成績(jī)?cè)斐筛蟮挠绊?，而我?dāng)前使用的GCC版本對(duì)龍芯向量指令的支持還不夠完善，龍芯在測(cè)試中是會(huì)比較吃虧的，不過(guò)沒(méi)關(guān)系，反正也不會(huì)有很大的差距。

　　SPEC CPU 2017也分為單任務(wù)和多任務(wù)測(cè)試，單任務(wù)測(cè)試也仍然支持自動(dòng)并行化，不過(guò)2017版的測(cè)試報(bào)告中會(huì)明確標(biāo)注自動(dòng)并行化時(shí)的線程數(shù)量。只有不開(kāi)啟自動(dòng)并行化的單任務(wù)測(cè)試成績(jī)才能代表CPU的單核性能。大家在通過(guò)SPEC CPU的測(cè)試成績(jī)來(lái)對(duì)比CPU性能的時(shí)候，一定要注意測(cè)試報(bào)告中注明的編譯器類型、是否開(kāi)啟了自動(dòng)并行化、是否使用了第三方優(yōu)化庫(kù)等重要信息。

　　SPEC CPU 2017的測(cè)試項(xiàng)目不但和2006版有區(qū)別，而且多任務(wù)和單任務(wù)的測(cè)試項(xiàng)目也有區(qū)別，它們的成績(jī)不存在比例關(guān)系，能確定的只是綜合性能越強(qiáng)的CPU測(cè)試成績(jī)就一定越好。

　　我測(cè)試了單任務(wù)單線程和多任務(wù)的全CPU性能，先來(lái)看單任務(wù)單線程的整數(shù)和浮點(diǎn)測(cè)試成績(jī)。在當(dāng)前的系統(tǒng)和編譯器環(huán)境下，我測(cè)試SPEC CPU 2006時(shí)得到的單核整數(shù)成績(jī)比10代i3稍低一些，但浮點(diǎn)成績(jī)又稍高一些。SPEC CPU 2017的測(cè)試結(jié)果也差不多，3A6000整數(shù)得分5.02，比10代酷睿i3-10100F低了一點(diǎn)，但差距不到10%。浮點(diǎn)成績(jī)是5.87，非常巧合地與i3-10100F成績(jī)一樣。

　　通過(guò)3A6000與i3-10100F以及2.5GHz時(shí)的i3-13100F的子項(xiàng)成績(jī)對(duì)比，可以發(fā)現(xiàn)3A6000有小部分的測(cè)試項(xiàng)目與它們有較大的差距，大部分的測(cè)試項(xiàng)目水平相當(dāng)，綜合評(píng)分比較接近。3A6000單核性能與10代酷睿i3基本一樣的結(jié)論仍然成立，隨著系統(tǒng)和編譯器的逐漸完善，3A6000無(wú)論測(cè)試成績(jī)還是實(shí)際性能表現(xiàn)也都會(huì)再上一個(gè)臺(tái)階。

　　與13代i3-13100F在2.5GHz時(shí)的成績(jī)相比，3A6000的整數(shù)成績(jī)要低3%，但整數(shù)和浮點(diǎn)成績(jī)都超過(guò)了R5-5600G在2.5GHz時(shí)的得分。這與SPEC CPU 2006的測(cè)試情況一樣，再次證明3A6000的核心設(shè)計(jì)水平比AMD Zen 3代還強(qiáng)一些，可能和Zen 4代基本一致。只是可惜因?yàn)镃PU頻率的差距，3A6000的單核性能只是與10代i3是相同水平，跟13代i3相比還有較大的差距。

　　在多任務(wù)測(cè)試中，3A6000與3-10100F的成績(jī)差距超過(guò)了10%，還在可接受的范圍內(nèi)。因?yàn)槲沂褂玫氖沁€沒(méi)有完成“補(bǔ)課”的編譯器，所以不能很好地發(fā)揮3A6000的向量指令性能。盡管3A6000相對(duì)于3A5000的成績(jī)提升幅度也仍然超過(guò)60~70%，但我認(rèn)為它的表現(xiàn)應(yīng)該能夠更好一些，對(duì)SPEC CPU 2017的測(cè)試結(jié)果不是很令人滿意。

　　國(guó)產(chǎn)CPU的測(cè)試情況和SPEC CPU 2006相同，沒(méi)有任何一款能接近3A6000的單核性能，龍芯自己的3A5000也不行。海光C86 3250依靠多一倍的核心數(shù)量，多核成績(jī)比龍芯3A6000高50%，而兆芯和飛騰的8核CPU，多核成績(jī)?nèi)匀贿h(yuǎn)遠(yuǎn)低于4個(gè)核心的龍芯3A6000。

　　龍芯3A6000確實(shí)開(kāi)啟了國(guó)產(chǎn)CPU的新時(shí)代，使用境內(nèi)的相對(duì)落后的工藝，主要依靠設(shè)計(jì)能力達(dá)到了市場(chǎng)主流CPU的性能水平。龍芯6000系列的下一款桌面CPU是3B6000，預(yù)計(jì)單核性能再提高20%，并改用8核的設(shè)計(jì)方案。我估計(jì)3B6000無(wú)論是單核性能還是多核性能都應(yīng)該能接近或者追平Intel酷睿11代i7的水平。

整機(jī)系統(tǒng)綜合性能測(cè)試——UnixBench

　　UnixBench不是CPU測(cè)試工具，它測(cè)試的是最小整機(jī)系統(tǒng)的綜合性能。最小整機(jī)系統(tǒng)就是由CPU、主板、內(nèi)存、硬盤、操作系統(tǒng)構(gòu)成的可以啟動(dòng)的完整系統(tǒng)。

　　UnixBench主要是測(cè)試一臺(tái)電腦處理日常事務(wù)的效率，包括文本處理、浮點(diǎn)函數(shù)、文件讀寫、進(jìn)程創(chuàng)建、管道通信、腳本執(zhí)行等等，這些都是應(yīng)用軟件和操作系統(tǒng)常用的功能。雖然這些功能都是由操作系統(tǒng)提供，但因?yàn)樗泄δ艿膱?zhí)行都與CPU有關(guān)，所以它的測(cè)試成績(jī)也與CPU性能有直接關(guān)系。

　　不過(guò)操作系統(tǒng)如果對(duì)創(chuàng)建進(jìn)程、管道通信等等功能進(jìn)行優(yōu)化，也能提高測(cè)試成績(jī)，因此UnixBench是既測(cè)試CPU也測(cè)試操作系統(tǒng)，內(nèi)存和硬盤性能也占了一定的比重。在不同的系統(tǒng)中，UnixBench測(cè)試成績(jī)的差異會(huì)比SPEC CPU的測(cè)試差異大一些。

　　因?yàn)閁nixBench不是單純測(cè)試CPU的計(jì)算能力，而是體現(xiàn)電腦的綜合性能，所以多核并行的效率比較低，單核性能越高的就越有優(yōu)勢(shì)，更符合各種應(yīng)用軟件的實(shí)際情況。總體上看，UnixBench的測(cè)試成績(jī)代表的是電腦執(zhí)行日常任務(wù)的性能表現(xiàn)。

　　3A6000的UnixBench測(cè)試成績(jī)也相當(dāng)不錯(cuò)，單任務(wù)成績(jī)比10代i3-10100F高一些，多任務(wù)成績(jī)要低一些。3A6000多任務(wù)成績(jī)比i3-10100F低不是CPU的原因，應(yīng)該是受到了操作系統(tǒng)的影響，x86版本的UOS系統(tǒng)對(duì)多任務(wù)并行的優(yōu)化可能要比Loongnix更好一些。但隨著龍芯對(duì)操作系統(tǒng)的優(yōu)化和升級(jí)，以后UnixBench的測(cè)試成績(jī)也自然地會(huì)隨之提高。

　　把13代i3-13100F和AMD R5-5600G鎖定在2.5GHz后，R5-5600G因?yàn)橛?個(gè)物理核心，所以多任務(wù)成績(jī)略高于3A6000，其它的成績(jī)都比龍芯3A6000低。UnixBench的測(cè)試成績(jī)又一次說(shuō)明了龍芯3A6000電腦的綜合性能與10代酷睿i3是相同水平，也略微超過(guò)了2.5Ghz時(shí)的13代酷睿i3和AMD Zen 3代。

　　國(guó)產(chǎn)CPU中只有海光C86-3250憑借8核16線程，以兩倍的核心數(shù)量規(guī)格在多任務(wù)測(cè)試中勝過(guò)了龍芯3A6000。兆芯和飛騰的兩款8核CPU單任務(wù)成績(jī)很低，3A6000是它們的2.5倍以上，它們8任務(wù)并行的成績(jī)只是與4核的龍芯3A5000及鯤鵬920接近，大約是3A6000的一半。

內(nèi)存訪問(wèn)帶寬測(cè)試——STREAM

　　內(nèi)存頻率和通道數(shù)量并不等價(jià)于內(nèi)存訪問(wèn)速度，訪存速度也取決于內(nèi)存控制器的性能，內(nèi)存控制器和內(nèi)存總是快的等慢的，誰(shuí)慢聽(tīng)誰(shuí)的。內(nèi)存控制器是CPU中一個(gè)重要的組成部分，對(duì)于CPU的各種功能部件龍芯都一直堅(jiān)持自主設(shè)計(jì)。

　　目前似乎還沒(méi)有哪款CPU的內(nèi)存訪問(wèn)速率能達(dá)到理論帶寬，比如DDR4-3200雙通道的理論帶寬上限超過(guò)50GB每秒，但即使13代酷睿的實(shí)際訪存速率也只能達(dá)到43GB每秒左右。

　　Linux下測(cè)試內(nèi)存訪問(wèn)速率通常是使用Stream測(cè)試軟件，它也是以源碼方式提供，根據(jù)編譯參數(shù)不同而得到支持單線程和多線程測(cè)試的兩種版本。通過(guò)設(shè)置運(yùn)行時(shí)的參數(shù)，還可以讓Stream支持各種線程數(shù)量，比如在8個(gè)核心的CPU上測(cè)試4個(gè)線程的內(nèi)存訪問(wèn)速率。

　　內(nèi)存訪問(wèn)速率除了受限于內(nèi)存控制器和內(nèi)存的性能之外，還與應(yīng)用程序有密切關(guān)系。沒(méi)有任何正常的軟件會(huì)只讀寫內(nèi)存而不干點(diǎn)別的事情，像Stream這種內(nèi)存的帶寬測(cè)試軟件也是如此，Stream是在模擬普通應(yīng)用軟件訪問(wèn)內(nèi)存的方式——在循環(huán)中讀寫數(shù)組。因此Stream測(cè)試得到的內(nèi)存訪問(wèn)速率，就能代表普通應(yīng)用軟件訪問(wèn)內(nèi)存的速率。

　　龍芯3A6000重新設(shè)計(jì)了內(nèi)存控制器，內(nèi)存訪問(wèn)效率相對(duì)于3A5000有飛躍式的進(jìn)步。下面的圖表展示了在使用Steram軟件默認(rèn)的編譯參數(shù)時(shí)，對(duì)3A6000和兩款I(lǐng)ntel CPU的測(cè)試結(jié)果。因?yàn)?0代i3搭配H系列主板時(shí)最高只能支持到DDR4-2666內(nèi)存，所以我借了一塊Z490主板測(cè)試了它使用DDR4-3200內(nèi)存時(shí)的訪問(wèn)速率。

　　我分別進(jìn)行了單線程、4線程、全核心的內(nèi)存訪問(wèn)速率測(cè)試。測(cè)試成績(jī)的單位是兆字節(jié)每秒，每一個(gè)子項(xiàng)的測(cè)試細(xì)節(jié)不必深究，反正是越快越好。從測(cè)試結(jié)果來(lái)看，3A6000的內(nèi)存控制器水平比10代酷睿高，比13代酷睿差，峰值接近42GB每秒，說(shuō)明龍芯自主設(shè)計(jì)的內(nèi)存控制器也達(dá)到了主流水平。

　　3A6000的內(nèi)存控制器相對(duì)13代酷睿來(lái)說(shuō)還需要繼續(xù)完善，除了訪存速度不如13代酷睿之外，最明顯的問(wèn)題是4線程的訪存速度居然比8線程更快。不過(guò)因?yàn)辇埿臼堑谝淮螌?shí)現(xiàn)超線程的設(shè)計(jì)，出現(xiàn)這樣的現(xiàn)象我覺(jué)得可以理解。要是與其它的國(guó)產(chǎn)CPU對(duì)比，即使龍芯3A6000較差的那一組成績(jī)也是最優(yōu)秀的，是遙遙領(lǐng)先、一騎絕塵的存在。

　　通過(guò)對(duì)各款CPU訪存性能的測(cè)試，可以發(fā)現(xiàn)因?yàn)閮?nèi)存控制器的效率不同，即使內(nèi)存的規(guī)格相同，訪存速度也會(huì)有幾倍的差距。當(dāng)前國(guó)產(chǎn)CPU中只有龍芯3A6000能比較完美地發(fā)揮DDR4內(nèi)存的性能，包括3A5000在內(nèi)的其它國(guó)產(chǎn)CPU的內(nèi)存訪問(wèn)效率都難以令人滿意。

　　能買到的內(nèi)存控制器IP性能都不高，就像高性能的CPU核心一樣屬于非賣品。目前國(guó)產(chǎn)CPU中只有龍芯通過(guò)不斷的自主迭代升級(jí)，使DDR4內(nèi)存控制器的效率能與Intel和AMD相提并論。在DDR4的賽道上，龍芯3A6000已經(jīng)終結(jié)了國(guó)產(chǎn)CPU之間的比賽。

　　一些國(guó)產(chǎn)CPU廠商已經(jīng)在準(zhǔn)備升級(jí)到DDR5內(nèi)存了，但龍芯要到下一代7000系列才支持DDR5內(nèi)存。一是因?yàn)閲?guó)內(nèi)短期內(nèi)不會(huì)有自主的DDR5內(nèi)存，二是因?yàn)辇埿具€沒(méi)有把DDR4內(nèi)存的性能發(fā)揮到極限。如果僅僅為了利于宣傳而兼容DDR5的內(nèi)存規(guī)范，但卻體現(xiàn)不出DDR5的內(nèi)存性能，那么除了徒增成本，就沒(méi)有任何的實(shí)際意義。

總結(jié)

　　龍芯3A6000在基礎(chǔ)性能測(cè)試中，部分超過(guò)了10代酷睿i3，也有部分還有10%左右的差距。主要是因?yàn)樽钚掳姹镜牟僮飨到y(tǒng)和編譯器還沒(méi)有發(fā)布，目前版本的優(yōu)化水平相對(duì)于x86還有一些距離。以后隨著操作系統(tǒng)和編譯器的優(yōu)化逐漸到位，這一點(diǎn)差距也一定能被補(bǔ)上。

　　盡管在相同頻率的時(shí)候，龍芯3A6000的單核性能追平了Intel 酷睿13代，但由于工藝落后，以及資金投入不足，龍芯3A6000的主頻較低，實(shí)際性能僅相當(dāng)于酷睿10代i3。

　　工藝和主頻在短期內(nèi)不會(huì)有明顯的改善，龍芯的下一代CPU產(chǎn)品仍然以提高每GHz的性能為主，將與Intel長(zhǎng)期保持低頻打高頻的局面。美國(guó)對(duì)我國(guó)的自主CPU不會(huì)放松工藝限制，但對(duì)我國(guó)的引進(jìn)技術(shù)CPU倒有可能網(wǎng)開(kāi)一面。因此自主CPU只能依靠境內(nèi)相對(duì)落后的工藝制程與進(jìn)口產(chǎn)品展開(kāi)競(jìng)爭(zhēng)，也就必須繼續(xù)強(qiáng)化CPU設(shè)計(jì)能力，通過(guò)提升每GHz的性能抹平工藝差距引起的性能差距。

　　完全自主的龍芯3A6000每GHz的性能追平了13代酷睿，也使通過(guò)引進(jìn)技術(shù)發(fā)展國(guó)產(chǎn)CPU的路線遭遇了最嚴(yán)重的危機(jī)。因?yàn)橐蕾囈M(jìn)技術(shù)的CPU企業(yè)普遍缺少改進(jìn)CPU核心設(shè)計(jì)的能力和動(dòng)力，長(zhǎng)期以來(lái)都是依靠更先進(jìn)的工藝提升主頻以及堆砌更多的核心來(lái)提高CPU性能?，F(xiàn)在它們即使能獲得使用先進(jìn)工藝的特別許可，但買不到能與13代酷睿匹敵的CPU核心設(shè)計(jì)也是瞎子點(diǎn)燈。

　　美國(guó)一方面禁止向中國(guó)出售高性能的計(jì)算產(chǎn)品，禁止中國(guó)企業(yè)使用先進(jìn)的芯片生產(chǎn)工藝，另一方面又有限度地向中國(guó)企業(yè)出售CPU架構(gòu)授權(quán)、IP核授權(quán)、專利授權(quán)，幫助中國(guó)CPU企業(yè)在美國(guó)可控的程度下成長(zhǎng)，事實(shí)證明美國(guó)的策略沒(méi)有實(shí)現(xiàn)它希望的結(jié)果。

　　因?yàn)樵诩夹g(shù)方面依賴美國(guó)的中國(guó)CPU企業(yè)，成長(zhǎng)速度受到了美國(guó)限制，所以給國(guó)內(nèi)自主CPU留下了生存空間，無(wú)法完美地遏制自主CPU崛起。美國(guó)如果想要補(bǔ)救，那么就需要向中國(guó)企業(yè)出售IPC高于13代酷睿的CPU核心，但這樣就與限制中國(guó)發(fā)展高性能CPU的政策產(chǎn)生了矛盾，實(shí)際上美國(guó)幾年前就已經(jīng)不再向中國(guó)企業(yè)提供更先進(jìn)的CPU核心及架構(gòu)授權(quán)，轉(zhuǎn)而一心一意地以更直接的手段打擊和限制中國(guó)自主CPU的發(fā)展。

　　但是龍芯未雨綢繆早當(dāng)先，居安思危謀長(zhǎng)遠(yuǎn)，主動(dòng)拋棄了與美國(guó)有牽連的MIPS指令集，所有CPU產(chǎn)品都已經(jīng)基于自主指令集龍架構(gòu)（LoongArch）重新設(shè)計(jì)。龍芯的CPU生產(chǎn)也使用境內(nèi)可控的工藝，甚至建立了全面使用國(guó)產(chǎn)設(shè)備的芯片封裝測(cè)試廠。龍芯也一直在追求EDA工具的國(guó)產(chǎn)化，與國(guó)內(nèi)的EDA軟件企業(yè)進(jìn)行了深入合作。

　　龍芯已經(jīng)把防御能力點(diǎn)滿，美國(guó)之前對(duì)龍芯實(shí)施的制裁，甚至都沒(méi)有激起一丁點(diǎn)波瀾。龍芯仍然按照既定的時(shí)間表穩(wěn)健地發(fā)展，3A6000也如期地展現(xiàn)在大家眼前，然后年底量產(chǎn)、發(fā)布、銷售，節(jié)奏一點(diǎn)兒都沒(méi)亂。

　　龍芯規(guī)劃的后續(xù)產(chǎn)品中，不止有單核性能更高的且集成了8個(gè)核心的3B6000，還有分別集成了16個(gè)和32個(gè)核心的3C6000和3D6000，這些產(chǎn)品都計(jì)劃在明年發(fā)布。3C6000和3D6000的CPU核心與3A6000相同，并針對(duì)服務(wù)器CPU核心數(shù)量多的特點(diǎn)，改進(jìn)了多核及多路互聯(lián)的效率，使CPU并行效率進(jìn)一步提升。

　　在新的核心設(shè)計(jì)通過(guò)3B6000得到驗(yàn)證之后，就會(huì)推出32個(gè)和64個(gè)核心的3D7000和3E7000。6000和7000系列的服務(wù)器CPU完全具有與Intel高端的同類產(chǎn)品競(jìng)爭(zhēng)的實(shí)力。無(wú)論是對(duì)比單核性能還是對(duì)比多核性能，都是相同的性能水平。

　　龍芯3A6000的誕生，標(biāo)志著龍芯已經(jīng)從被動(dòng)防御轉(zhuǎn)為了防守反擊的階段。龍芯二十年如一日?qǐng)?jiān)持自主設(shè)計(jì)，才能有現(xiàn)今的成就。只有腳踏實(shí)地、實(shí)事求是、自強(qiáng)自立才能真正與國(guó)際接軌，成為支撐世界信息技術(shù)發(fā)展的擎天巨柱。

分享到

龍芯龍芯3A6000

測(cè)試環(huán)境和性能對(duì)照組

CPU性能測(cè)試——SPEC CPU2006

浮點(diǎn)運(yùn)算性能測(cè)試——Linpack

CPU性能測(cè)試——SPEC CPU 2017

整機(jī)系統(tǒng)綜合性能測(cè)試——UnixBench

內(nèi)存訪問(wèn)帶寬測(cè)試——STREAM

總結(jié)

zhupb

相關(guān)推薦

近期文章

熱門標(biāo)簽