今天,我們將為您開啟一場(chǎng)半導(dǎo)體芯片市場(chǎng)的深度探索之旅。從CPU、GPU到AI芯片,我們將全面剖析整體市場(chǎng)的風(fēng)云變幻;從英特爾、AMD、英偉達(dá)到高通,我們將細(xì)致解讀重點(diǎn)企業(yè)的輝煌與挑戰(zhàn)。
此外,我們還將目光投向未來(lái),為您揭示國(guó)產(chǎn)算力崛起、異構(gòu)計(jì)算興起、不同架構(gòu)芯片市場(chǎng)格局的演變,以及各大企業(yè)在2024年的產(chǎn)品迭代新動(dòng)向。
文字編輯| 宋雨涵
1
整體市場(chǎng)情況
CPU市場(chǎng)
根據(jù)Jon Peddie Research公司的報(bào)告,2024年第三季度全球CPU出貨量實(shí)現(xiàn)了顯著增長(zhǎng),與第二季度相比增長(zhǎng)了12%,同比增長(zhǎng)了7.8%。這一增長(zhǎng)趨勢(shì)在客戶端CPU市場(chǎng)和服務(wù)器CPU市場(chǎng)均有所體現(xiàn)。特別是中國(guó)市場(chǎng)的強(qiáng)勁表現(xiàn),推動(dòng)了PC CPU出貨量的大幅增長(zhǎng)。具體來(lái)看,2024年第三季度PC CPU市場(chǎng)的整體增長(zhǎng)率達(dá)到了12.2%,總出貨量從第二季度的約6000萬(wàn)臺(tái)上升至約7000萬(wàn)臺(tái)。在細(xì)分市場(chǎng)方面,筆記本電腦CPU的份額從第二季度的24%上升至30%,而臺(tái)式機(jī)CPU的份額則保持在約70%。
GPU市場(chǎng)
Jon Peddie Research發(fā)布的GPU市場(chǎng)報(bào)告顯示,2024年全球GPU市場(chǎng)的規(guī)模將超過(guò)985億美元。AI和高效能運(yùn)算(HPC)GPU的年銷售量雖然只有數(shù)百萬(wàn)個(gè),但由于其高昂的售價(jià),為英偉達(dá)和AMD等廠商帶來(lái)了可觀的收入。特別是在2024年上半年,英偉達(dá)銷售了價(jià)值近420億美元的AI和HPC GPU,全年其運(yùn)算GPU的銷售額可能超過(guò)900億美元。此外,Yole的預(yù)測(cè)顯示,從2023年到2029年,GPU市場(chǎng)的復(fù)合年增長(zhǎng)率為25%,顯著高于CPU的5%和APU的8%。
AI芯片市場(chǎng)
Gartner預(yù)測(cè),2024年全球AI芯片市場(chǎng)規(guī)模將增加33%,達(dá)到713億美元,2025年有望進(jìn)一步增長(zhǎng)29%,達(dá)到920億美元。AI芯片需求的暴漲,使得先進(jìn)封裝產(chǎn)能成為AI芯片出貨的瓶頸之一。臺(tái)積電、日月光、安靠等廠商均表示先進(jìn)封裝產(chǎn)能緊張,相關(guān)訂單需求旺盛。英偉達(dá)、AMD等公司在AI芯片市場(chǎng)表現(xiàn)出色,特別是英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)受益于AI需求的增長(zhǎng),實(shí)現(xiàn)了爆發(fā)式增長(zhǎng)。
2
英偉達(dá)與AMD:半導(dǎo)體領(lǐng)域的‘雙雄爭(zhēng)霸’
英偉達(dá)核心芯片技術(shù)
Blackwell架構(gòu)
晶體管數(shù)量:Blackwell架構(gòu)的GPU擁有高達(dá)2080億個(gè)晶體管,確保了芯片具有極高的計(jì)算能力和復(fù)雜性。
制程工藝:采用臺(tái)積電4納米(4nm)工藝制造,提高了芯片的集成度,降低了功耗和發(fā)熱量,實(shí)現(xiàn)了更高的能效比。
內(nèi)存配置:配備192GB的HBM3E顯存,提供高達(dá)8TB/s的帶寬,極大地提升了芯片的數(shù)據(jù)處理能力和效率。
計(jì)算能力:?jiǎn)涡酒珹I性能高達(dá)20 PetaFLOPS(每秒20萬(wàn)億次浮點(diǎn)運(yùn)算),比上代產(chǎn)品顯著提升了算力。
通信能力:支持10TB/s的片間互聯(lián),使得多個(gè)GPU能夠高效地協(xié)同工作,共同處理大型任務(wù)。第五代NVLink技術(shù)為每個(gè)GPU提供了1.8TB/s的雙向吞吐量,確保了最復(fù)雜的大型語(yǔ)言模型(LLM)之間多達(dá)576個(gè)GPU之間的無(wú)縫高速通信。
多芯片封裝(MCM)設(shè)計(jì)
Blackwell是英偉達(dá)首個(gè)采用MCM設(shè)計(jì)的GPU,集成了兩個(gè)GPU在一個(gè)芯片上,增強(qiáng)了并行處理能力和計(jì)算密度。
計(jì)算引擎
第二代Transformer引擎:結(jié)合了Blackwell Tensor Core技術(shù)和TensorRT-LLM以及NeMo Megatron框架中的英偉達(dá)先進(jìn)動(dòng)態(tài)范圍管理算法,支持4位浮點(diǎn)AI推理,提供了雙倍的算力和更大的模型支持。
微張量擴(kuò)展與動(dòng)態(tài)范圍管理:通過(guò)微張量擴(kuò)展和集成到TensorRT-LLM及NeMo Megatron框架的先進(jìn)動(dòng)態(tài)范圍管理算法,Blackwell GPU在保持高精度的同時(shí),實(shí)現(xiàn)了性能和模型大小的顯著提升。
AMD核心芯片技術(shù)
在Hot Chips 2024大會(huì)上,AMD展示了其最新一代的處理器架構(gòu)Zen 5。Zen 5是AMD一系列Zen架構(gòu)的最新成員,旨在提高核心性能、能效和靈活性:
其設(shè)計(jì)目標(biāo)是優(yōu)化分支預(yù)測(cè)器、提高指令解碼效率,以及增強(qiáng)整數(shù)和浮點(diǎn)運(yùn)算單元。與Zen 4相比,Zen 5進(jìn)一步優(yōu)化了緩存層次結(jié)構(gòu),包括更大的L1數(shù)據(jù)緩存和更高效的負(fù)載使用特性。而且Zen 5在性能上有所提高,在相同性能下的功耗更低。在游戲性能、實(shí)時(shí)計(jì)算和圖形處理方面具有優(yōu)勢(shì),有望在高性能計(jì)算領(lǐng)域占據(jù)一席之地。
Zen 5c核心:AMD還推出了Zen 5c核心,專門針對(duì)低功耗應(yīng)用場(chǎng)景進(jìn)行了優(yōu)化。Zen 5c核心具有更低的緩存和時(shí)鐘頻率,進(jìn)一步增強(qiáng)了能效表現(xiàn)。
在聯(lián)想Tech World上,英特爾和AMD宣布組建x86生態(tài)系統(tǒng)咨詢小組。英特爾CEO帕特·基辛格表示,x86正在蓬勃發(fā)展,作為幾十年來(lái)計(jì)算基礎(chǔ)的X86架構(gòu)即將經(jīng)歷一個(gè)定制化、擴(kuò)大化和可拓展化的時(shí)期,這正是人工智能帶來(lái)的機(jī)遇。AMD董事長(zhǎng)兼CEO蘇姿豐發(fā)言稱,AMD和英特爾聯(lián)合所有創(chuàng)始成員建立x86生態(tài)系統(tǒng)咨詢小組,將加速計(jì)算能力的發(fā)展
相關(guān)文章鏈接
【深度觀察】跨世紀(jì)聯(lián)手!英特爾終于坐不住了,與AMD攜手成立x86生態(tài)系統(tǒng)顧問(wèn)小組,對(duì)ARM進(jìn)行“圍剿”
3
英特爾最新芯片技術(shù)
IEEE國(guó)際電子器件會(huì)議
在2024年IEEE國(guó)際電子器件會(huì)議(IEDM 2024)上,英特爾展示了其在芯片封裝和互連技術(shù)方面的多項(xiàng)重大突破:
先進(jìn)封裝技術(shù):英特爾介紹了一種名為選擇性層轉(zhuǎn)移(Selective Layer Transfer,SLT)的先進(jìn)封裝解決方案。這項(xiàng)技術(shù)通過(guò)異構(gòu)集成的方式,使芯片間的封裝吞吐量提升高達(dá)100倍。SLT技術(shù)的基本原理是采用晶圓到晶圓連接的方式,顯著提高了生產(chǎn)效率,并允許更高密度的集成。
互連技術(shù):英特爾展示了創(chuàng)新的減成法釕互連技術(shù)(Subtractive Ruthenium Interconnect),這一技術(shù)通過(guò)減少線間電容來(lái)提升芯片互連性能,可以在間距小于或等于25nm的情況下實(shí)現(xiàn)高達(dá)25%的電容降低。
英特爾按下AI PC加速鍵
作為移動(dòng)PC的新主角,英特爾酷睿Ultra 200V系列處理器擁有極具突破性的x86能效,在圖形性能、應(yīng)用兼容性、安全性和AI計(jì)算能力上都有卓越表現(xiàn),CPU、NPU和GPU的整體平臺(tái)AI算力高達(dá)120 TOPS,并且實(shí)現(xiàn)近20小時(shí)的離電續(xù)航,遠(yuǎn)超傳統(tǒng)的筆記本電腦。
相關(guān)文章鏈接
【深度觀察】英特爾AI PC生態(tài)大會(huì):攜50位伙伴、30臺(tái)機(jī)型、28個(gè)應(yīng)用,按下AI PC加速鍵
4
專注PE端的高通
高通旗下的驍龍8 Gen4手機(jī)處理器在2024年備受矚目:
核心架構(gòu):驍龍8 Gen4首次采用高通自研的Oryon核心,相比ARM架構(gòu)具有更大的自主性和后續(xù)優(yōu)化上的輕松性。
工藝技術(shù):驍龍8 Gen4首次采用臺(tái)積電的3nm工藝技術(shù),標(biāo)志著安卓智能手機(jī)正式跨入3nm技術(shù)時(shí)代。
性能表現(xiàn):驍龍8 Gen4的CPU目標(biāo)頻率達(dá)到4.26GHz,跑分?jǐn)?shù)據(jù)超過(guò)天璣9400。在3DMark Wild Life壓力測(cè)試中,高通驍龍8 Gen4的跑分成績(jī)比對(duì)手蘋果M2高出了10%左右。
國(guó)產(chǎn)半導(dǎo)體的最新進(jìn)展
壁仞科技:
壁仞科技發(fā)布了首款通用GPU芯片BR100,該芯片創(chuàng)下了全球算力紀(jì)錄,16位浮點(diǎn)算力達(dá)到1000T以上,8位定點(diǎn)算力達(dá)到2000T以上,單芯片峰值算力達(dá)到PFLOPS級(jí)別。
BR100采用了壁仞科技自主原創(chuàng)的壁立仞架構(gòu),以數(shù)據(jù)流為中心,對(duì)數(shù)據(jù)流進(jìn)行深度優(yōu)化,解決了數(shù)據(jù)搬移的瓶頸和并行度不足的問(wèn)題。BR100還采用了Chiplet設(shè)計(jì)理念,突破了光罩尺寸對(duì)單芯片面積的限制,集成了更多的算力和通用性邏輯。
寒武紀(jì):
寒武紀(jì)已推出的產(chǎn)品體系覆蓋了云端、邊緣端的智能芯片及其加速卡、訓(xùn)練整機(jī)、處理器IP及軟件,可滿足云、邊、端不同規(guī)模的人工智能計(jì)算需求。
以思元370芯片為例,該芯片基于7nm制程工藝,是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個(gè)晶體管,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代產(chǎn)品思元270算力的2倍。
思元370還是國(guó)內(nèi)第一款公開發(fā)布支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達(dá)GDDR6的1.5倍。
搭載MLU-Link?多芯互聯(lián)技術(shù),在分布式訓(xùn)練或推理任務(wù)中為多顆思元370芯片提供高效協(xié)同能力。
全新升級(jí)的寒武紀(jì)基礎(chǔ)軟件平臺(tái),新增推理加速引擎MagicMind,實(shí)現(xiàn)訓(xùn)推一體,大幅提升了開發(fā)部署的效率,降低用戶的學(xué)習(xí)成本、開發(fā)成本和運(yùn)營(yíng)成本。
海光信息:
海光信息成功研發(fā)出更符合本土需求的高安全、高性能、高通用的C86開放架構(gòu)體系和產(chǎn)品,實(shí)現(xiàn)了從引進(jìn)到自主創(chuàng)新的華麗轉(zhuǎn)身。海光CPU具有優(yōu)異的系統(tǒng)架構(gòu)、高可靠性和高安全性、豐富的軟硬件生態(tài)等優(yōu)勢(shì)。其CPU產(chǎn)品線包括面向不同應(yīng)用場(chǎng)景的3000系列、5000系列和7000系列。
海光DCU深算系列是目前國(guó)內(nèi)唯一能支持全精度浮點(diǎn)數(shù)據(jù)計(jì)算能力的加速芯片,性能可對(duì)標(biāo)國(guó)際主流產(chǎn)品。在強(qiáng)大的通用計(jì)算性能基礎(chǔ)上,海光DCU打造出自主開放的完整軟件棧,包括DTK(DCU Toolkit)、開發(fā)工具鏈、模型倉(cāng)庫(kù)等,完全兼容CUDA等環(huán)境和生態(tài)。
海光信息在CPU內(nèi)部集成了安全處理器(PSP)和密碼協(xié)處理器(CCP),同時(shí)還采用了密碼指令集加速、密鑰管理和HCT等技術(shù),提升了設(shè)備的安全性。
此外龍芯中科的產(chǎn)品體系:包括龍芯1號(hào)、龍芯2號(hào)、龍芯3號(hào)等處理器及配套芯片,以及基礎(chǔ)軟硬件解決方案。還進(jìn)行了自主AI芯片研發(fā):在面向推理的AI芯片研發(fā)方面取得了一定進(jìn)展,探索CPU+GPGPU的解決方案在人工智能領(lǐng)域的應(yīng)用。
龍芯中科:
龍芯中科是中國(guó)自主設(shè)計(jì)芯片的重要企業(yè),其在GPU和AI推理加速領(lǐng)域持續(xù)創(chuàng)新。龍芯中科即將迎來(lái)其新一代GPU——9A1000的流片。該GPU的設(shè)計(jì)初衷是為了與龍芯的CPU形成良好的配合,并降低系統(tǒng)整體成本。作為入門級(jí)顯卡,其性能對(duì)標(biāo)AMD的RX 550,特別適合那些對(duì)顯卡需求相對(duì)較低的應(yīng)用場(chǎng)景,如基礎(chǔ)的圖形處理和輕量級(jí)的AI推理。
9A1000的開發(fā)利用了更先進(jìn)的工藝技術(shù),預(yù)計(jì)在性能和成本上都將優(yōu)于市場(chǎng)上同類的產(chǎn)品。隨著未來(lái)9A2000和9A3000的研發(fā),龍芯中科的GPU產(chǎn)品線將逐步擴(kuò)張,使其在細(xì)分市場(chǎng)上具備更強(qiáng)的競(jìng)爭(zhēng)力。
結(jié)語(yǔ)
半導(dǎo)體芯片市場(chǎng)近年來(lái)迎來(lái)了飛速發(fā)展的浪潮,尤其是在CPU、GPU以及AI芯片等前沿領(lǐng)域,取得了令人矚目的成就。各大企業(yè)競(jìng)相加大研發(fā)投入,不斷推陳出新,一系列創(chuàng)新產(chǎn)品如雨后春筍般涌現(xiàn)。展望未來(lái),隨著國(guó)產(chǎn)算力水平的持續(xù)提升、異構(gòu)計(jì)算技術(shù)的廣泛普及,以及不同架構(gòu)芯片市場(chǎng)格局的不斷演變,半導(dǎo)體芯片市場(chǎng)無(wú)疑將開啟更為廣闊的發(fā)展新天地。與此同時(shí),各大企業(yè)也將持續(xù)加大產(chǎn)品迭代和技術(shù)創(chuàng)新的步伐,以更加昂揚(yáng)的姿態(tài)應(yīng)對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),精準(zhǔn)滿足市場(chǎng)的多元化需求,共創(chuàng)半導(dǎo)體芯片行業(yè)的輝煌未來(lái)。