◆64位元處理器
◆多核心設(shè)計(jì)
◆采用90nmSOI“絕緣硅”工藝
◆靈活的并行和分布式計(jì)算結(jié)構(gòu)
◆支持網(wǎng)格運(yùn)算
◆可同時(shí)執(zhí)行多個(gè)作業(yè)系統(tǒng)
◆大幅提升的輸入輸出接口傳輸帶寬
◆強(qiáng)大的硬件化安全系統(tǒng)
一、深入了解Cell
1.Cell核心設(shè)計(jì)
Cell是以IBM研發(fā)的64位元Power微處理器為核心,結(jié)合8個(gè)獨(dú)立的浮點(diǎn)數(shù)運(yùn)算單元所構(gòu)成的多核心處理器。它共有9個(gè)CPU內(nèi)核,一個(gè)Power架構(gòu)RISC型64位CPU內(nèi)核“PPE”和8個(gè)浮點(diǎn)處理用的32位8路SIMD型CPU內(nèi)核“SPE”(Synergistic Processing Element)。
Power微處理器內(nèi)核是Cell處理器的大腦,是運(yùn)行設(shè)備的主操作系統(tǒng),并為8個(gè)“協(xié)處理器”分配任務(wù)。(不過Cell本身的結(jié)構(gòu)是極具變通性的,可根據(jù)具體需求增加、減少協(xié)處理器內(nèi)核)。
(圖01)
圖為Cell的核心電路分布。從圖中可清晰地看到Cell的9個(gè)內(nèi)核和L2 Cache。BEI(Element Interconnect Bus)總線是Cell的數(shù)據(jù)總線。圖中的FlexIO將在下文介紹。
Cell的基本構(gòu)成單元PPE可同時(shí)執(zhí)行2個(gè)線程的SMT架構(gòu)(類似于Intel的HT超線程技術(shù)),配備32kB的一級(jí)緩存(16kB指令緩存和16kB數(shù)據(jù)緩存)以及512kB的二級(jí)緩存。協(xié)處理核心SPE可同時(shí)執(zhí)行2條指令超標(biāo)量,并配備有128位×128個(gè)的通用寄存器。1個(gè)SPE的最大單精度浮點(diǎn)運(yùn)算速度為32G FLOPS。8個(gè)SPE合計(jì)為256G FLOPS。9個(gè)核心同步時(shí)鐘運(yùn)行。
ISSCC的Tom Halfhill工程師分析認(rèn)為,在芯片設(shè)計(jì)方面,Intel雖即將推出雙核心芯片,但Cell已在這方面早就走在英特爾之前。目前多核心芯片通行的做法是將單一的計(jì)算任務(wù)分配成幾個(gè)處理單元進(jìn)行,而Cell由于使用了Multiple Core技術(shù),處理單元“軟件內(nèi)核”可執(zhí)行完全獨(dú)立的任務(wù),因此能以一個(gè)晶片完成需要多個(gè)晶片才能完成的任務(wù)。
Cell處理器將集成2.34億個(gè)晶體管,大小為221平方毫米,采用90nmSOI工藝生產(chǎn)。專業(yè)人士預(yù)計(jì),隨著IBM公司在今年晚些時(shí)候推出65nm工藝,Cell處理器將轉(zhuǎn)而采用這一工藝。
(圖02)
圖為Cell處理器,左側(cè)為未封裝的Cell核心,中間是一顆封裝完畢的Cell處理器,右側(cè)為Cell背面,封裝的引腳數(shù)為1236個(gè)。這是個(gè)破記錄的數(shù)字,從這里也可看出Cell核心的復(fù)雜性。
Cell的8個(gè)SPE工作方式與普通的多核心處理器不同,各SPE分別在獨(dú)立的地址空間中運(yùn)行。因此,每個(gè)SPE備有256kB的名為“Local Store”的內(nèi)存。由于Local Store算作SPE的內(nèi)存,所以不需進(jìn)行類似SMP的緩存一致性(Cache Coherency)控制。連接各內(nèi)核的片上總線(OnChip Bus)采用環(huán)形,各個(gè)SPE之間的最大數(shù)據(jù)傳輸帶寬高達(dá)192GB/s。
Cell的多核心技術(shù)使得線程分配、資源管理等方面的程序模式具有了多種多樣的發(fā)展可能性。Cell的主性能處理內(nèi)核可處理雙線程,其余每個(gè)協(xié)處理器可處理一個(gè)線程,這樣Cell處理器總共可同時(shí)處理10個(gè)線程,怎樣最佳應(yīng)用處理器資源是今后軟件工程師的一個(gè)重要研究課題。
Cell結(jié)構(gòu)根本上依賴兩大概念:“Apulet” ,由數(shù)據(jù)對(duì)象及必需的執(zhí)行代碼組成的包(Bundle);“處理元素(Processing Element)”,能在任何時(shí)間執(zhí)行Apulet的控制及流處理資源分層包(Bundle)。
Apulet在系統(tǒng)的處理元素中完全便攜,因此任務(wù)能通過將一個(gè)等待Apulet賦給一個(gè)可用的處理元素來動(dòng)態(tài)執(zhí)行,通過添加處理元素可實(shí)現(xiàn)擴(kuò)展。而在最高層級(jí),這種架構(gòu)看上去像一個(gè)單元池(Pool of Cells)。系統(tǒng)中的所有單元都是一個(gè)明顯的同位體(Peer)。根據(jù)談及Cell設(shè)計(jì)的其中一篇論文透露,單一芯片執(zhí)行單一的處理元素。
2.Cell與網(wǎng)格運(yùn)算
《福布斯》雜志預(yù)測(cè),信息技術(shù)的下一波大浪潮將在2004~2005年度出現(xiàn),并造就2005~2020年共15年的黃金時(shí)代。到2020年,由此產(chǎn)生的互聯(lián)網(wǎng)將成長(zhǎng)為一個(gè)20萬億美元產(chǎn)值的大工業(yè)。這一波的本質(zhì)特征,就是萬維網(wǎng)WWW(World Wide Web)升華為網(wǎng)格GGG(Great Global Grid)。
網(wǎng)格運(yùn)算是伴隨著互聯(lián)網(wǎng)迅速發(fā)展起來的專門針對(duì)復(fù)雜科學(xué)計(jì)算的新型計(jì)算模式。它把分散在不同地理位置的計(jì)算機(jī)組織成一個(gè)“虛擬超級(jí)計(jì)算機(jī)”,其中每臺(tái)參與運(yùn)算的計(jì)算機(jī)就是一個(gè)“節(jié)點(diǎn)”,整個(gè)運(yùn)算網(wǎng)絡(luò)就是網(wǎng)格。
(圖03)
其實(shí)Cell在最初的內(nèi)核設(shè)計(jì)時(shí)就預(yù)料到了網(wǎng)格運(yùn)算,并及時(shí)地在Cell中加入了網(wǎng)格零件。IBM公司的員工吉姆說,這種多內(nèi)核設(shè)計(jì)給予了軟件設(shè)計(jì)人員巨大的靈活性,使他們能在Cell處理器上運(yùn)行多個(gè)操作系統(tǒng),并體驗(yàn)網(wǎng)格計(jì)算。他表示,Cell處理器在設(shè)計(jì)之初就考慮到了聯(lián)網(wǎng)的需求。
Cell處理器支持網(wǎng)格運(yùn)算,它還可在網(wǎng)絡(luò)中漫游,可執(zhí)行類似于網(wǎng)格計(jì)算的功能。一個(gè)以Cell為核心的計(jì)算機(jī)可借用網(wǎng)絡(luò)中閑置的其他平臺(tái)的計(jì)算資源。獨(dú)具匠心的架構(gòu)可使網(wǎng)格計(jì)算無所不在。如果在網(wǎng)絡(luò)中連入幾臺(tái)這樣的平臺(tái),整個(gè)網(wǎng)絡(luò)都可執(zhí)行同一項(xiàng)任務(wù)。當(dāng)年的萬維網(wǎng)改變了我們的生活,在它的標(biāo)準(zhǔn)上升華的網(wǎng)格,又將成為下一波浪潮的主線。支持網(wǎng)格運(yùn)算是一個(gè)明智的選擇,現(xiàn)在Cell正抓住這一時(shí)機(jī),大力發(fā)展自己。
3.Cell的運(yùn)算速度
先說說Cell的頻率。首款Cell處理器的運(yùn)行速度將超過4GHz,在2005年2月8日于美國(guó)舊金山舉行的ISSCC 2005上,發(fā)布Cell的4公司提前在會(huì)場(chǎng)的賓館內(nèi)舉行了一次記者招待會(huì),并進(jìn)行了4GHz運(yùn)行演示。來自設(shè)計(jì)合作伙伴的報(bào)告稱,未來產(chǎn)品的頻率將定為4.6GHz。目前采用90nm工藝的Pentium 4處理器的最高速度才為3.8GHz。
運(yùn)算速度是一款處理器最有價(jià)值的技術(shù)數(shù)據(jù),Cell的額定運(yùn)算速度為每秒2500億次浮點(diǎn)數(shù)運(yùn)算(256G FLOPS),PS2游戲主機(jī)采用了EE(Emotion Engine)處理器(速度為6.2G FLOPS),Cell的速度是EE的40倍以上。甚至單顆Cell處理器的運(yùn)算速度,就足與跟90年代中期最強(qiáng)悍的超級(jí)電腦相比,或說是目前NVIDIA最強(qiáng)的3D顯示芯片的6倍。
(圖04,EE處理器)
用Cell搭建的電腦工作站試作機(jī)已進(jìn)入實(shí)際運(yùn)轉(zhuǎn)階段,這也是Cell處理器首次實(shí)際應(yīng)用。根據(jù)測(cè)試,該工作站可在1個(gè)機(jī)柜(所使用的Cell處理器芯片數(shù)目為64個(gè))規(guī)模下,達(dá)成每秒16兆次(16T FLOPS)的浮點(diǎn)數(shù)運(yùn)算能力,相當(dāng)于單顆PS2微處理器EE(Emotion Engine,每秒62億次浮點(diǎn)數(shù)運(yùn)算)的2580倍之多。
4.功耗及散熱
據(jù)ISSCC的論文介紹,電源電壓為+1.1V、頻率4GHz的1個(gè)SPE因晶體管的開關(guān)動(dòng)作所消耗的為4W。再加上漏電電流和時(shí)鐘信號(hào)傳送的耗電,實(shí)際耗電應(yīng)在8W左右。電源電壓調(diào)至+1.2V以2GHz工作時(shí),開關(guān)動(dòng)作的耗電為2W,漏電電流引起的耗電為1.7W,時(shí)鐘信號(hào)傳送的耗電為1.3W,共計(jì)5W。8個(gè)SPE同時(shí)以2GHz工作時(shí),推算值為40W。
同時(shí),論文中顯示Cell將采用1.3V的核心電壓,工作溫度為85℃,使用氣冷方式運(yùn)行。IBM研究員表示,首批采用Cell處理器的設(shè)備的尺寸不會(huì)比游戲機(jī)更小,因?yàn)榈谝粋€(gè)版本的Cell處理器的發(fā)熱量很高,需使用散熱風(fēng)扇。
5.Cell生產(chǎn)
Cell處理器采用的柵長(zhǎng)46nm的晶體管應(yīng)用了SOI(Silicon On Insulator,絕緣體上外延硅)技術(shù)和應(yīng)變硅技術(shù)。目前Cell進(jìn)入最后的研發(fā)階段,生產(chǎn)技術(shù)已成熟,Cell芯片將會(huì)在2005年第一季度中旬推出。IBM位于紐約的East Fishkill 300mm晶圓工廠將會(huì)在2005年下半年小批量生產(chǎn)Cell芯片,而SONY在2006年將會(huì)在日本長(zhǎng)崎的“Fab2”工廠采用尖端65nm技術(shù)進(jìn)行生產(chǎn)。SONY公司還提到,打算將Cell商業(yè)化,今后推出更多基于Cell的產(chǎn)品。這可能意味著SCE會(huì)在下一代娛樂便攜機(jī)型中也采用Cell核心。
(圖05)
(圖06,試制Cell芯片的300mm晶圓,每個(gè)Cell的旁邊均設(shè)計(jì)有測(cè)試電路)
Cell使用定制電路設(shè)計(jì)的方法來提高總體性能,同時(shí)還支持精確的處理器時(shí)鐘控制功能,以節(jié)省電耗。Cell也使用了冗余電路布線來提高良品率,降低成本。綜上所述,Cell將在2006年正式量產(chǎn)鋪貨。
6.硬件化安全系統(tǒng)
Cell還采用了一系列芯片上的安全措施,主要是為了阻止對(duì)于版權(quán)內(nèi)容未經(jīng)授權(quán)的拷貝。通常類似任務(wù)都是由軟件來完成的,而Cell卻通過芯片的獨(dú)特設(shè)計(jì)將內(nèi)容按安全單元來分配存儲(chǔ)。這種安全存儲(chǔ)方式只允許經(jīng)過授權(quán)的訪問,可實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)的智能保護(hù)。這種以硬件的方式保護(hù)版權(quán)還是第一次見到,相信它能被SCE的PS3所采用。
二、Cell與PS3
提到Cell就不得不提PS3。PS3是SCE用于代替PS2的游戲主機(jī),它將使用Cell作為中央處理器,Rambus的XDR DRAM為內(nèi)存,顯示芯片為NVIDIA全新打造的GeForce6+α(預(yù)測(cè)命名)。關(guān)于Cell的第一輪新聞和抄做就是PS3引起的,所以從PS3的硬件規(guī)格可看出Cell的周邊設(shè)備搭配。
(圖07)
1.Rambus的XDR DRAM技術(shù)
Rambus的XDR DRAM內(nèi)存是PS3硬件“三大塊”中唯一成熟的技術(shù)。Rambus XDR DRAM是eXtreme Data Rate DRA(極限數(shù)據(jù)率動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)的縮寫。它是目前最高性能的內(nèi)存子系統(tǒng)解決方案。它通過獨(dú)立使用地址線、數(shù)據(jù)線和控制線來提高內(nèi)存的傳輸性能。由于XDR DRAM可同時(shí)傳輸8路數(shù)據(jù),所以500MHz的XDR DRAM等效頻率為500MHz×8=4.0GHz,其16bit單通道帶寬為4.0GHz×16bit/8=8.0GB/s,這樣的帶寬的確很驚人,短時(shí)間內(nèi)DDRⅡ都無法超越。正因?yàn)槿绱?,SCE決定采用Rambus的XDR DRAM作為PS3的內(nèi)存。
三星已宣布該公司在2005年開始生產(chǎn)XDR DRAM,首批開始量產(chǎn)的XDR DRAM是容量為256Mbit的規(guī)格。這次三星生產(chǎn)的也是4.0GHz的XDR DRAM,帶寬為8.0GB/s,是PS2所采用的雙通道PC800 Rambus DRAM(3.2GB/s)的2.5倍。由IBM采用Cell處理器技術(shù)設(shè)計(jì)的高端電腦工作站和服務(wù)器已使用XDR DRAM,NVIDIA今后的顯卡也將會(huì)采用XDR DRAM的設(shè)計(jì)工藝。
(圖08,PS2的Rambus內(nèi)存)
此外,Rambus還為SCE提供了輸入輸出接口的串行總線FlexIO和內(nèi)存接口總線XDR。XDR存儲(chǔ)界面可在3.2GHz的頻率下傳輸30GB/s數(shù)據(jù),而頻率為6.4GHz的FlexIO最大數(shù)據(jù)傳輸量為72GB/s。為配合Rambus的高速內(nèi)存,Cell具有2.5MB的嵌于芯片上的緩存,同時(shí)服務(wù)于9個(gè)核心,可通過XDR和FlexIO技術(shù)每秒向外部?jī)?nèi)存調(diào)用或輸出大量數(shù)據(jù)。這在業(yè)內(nèi)是前所未有的超高速數(shù)據(jù)傳輸能力。
2.GeForce6+α顯示芯片
GeForce6+α是NVIDIA特別為PS3設(shè)計(jì)的特殊產(chǎn)品,就如同當(dāng)初NVIDIA針對(duì)XBOX設(shè)計(jì)的“NV2A”芯片一樣。GeForce6+α是筆者的預(yù)測(cè)命名,因?yàn)镹VIDIA并未公布PS3顯示芯片的技術(shù)細(xì)節(jié)。但可肯定的是,該芯片的規(guī)格、性能是界于NV40與NV50之間的。
GeForce6+α顯示芯片將使用NVIDIA在當(dāng)前的NV40芯片上采用的技術(shù)及許多為下一代NV50芯片開發(fā)的技術(shù)。而且GPU中除了采用該公司桌面芯片的線路外,與Microsoft DirectX或OpenGL無關(guān),并將使用SONY自己的API用于該控制臺(tái)。自然地,GeForce6+α顯示芯片將支持Rambus開發(fā)的XDR DRAM內(nèi)存作為顯存。
Cell+內(nèi)存總線XDR+XDR DRAM+“GeForce6+α”+FlexIO總線,有著如此強(qiáng)大的硬件規(guī)格,PS3很可能成為下一代游戲主機(jī)的霸主。
三、Cell的應(yīng)用與展望
一款技術(shù)含量高的產(chǎn)品,如果沒有應(yīng)用前景或沒有市場(chǎng),那它就一文不值。Cell也是如此,雖然技術(shù)先進(jìn),但要想成為未來處理器的統(tǒng)領(lǐng),必須有廣闊的應(yīng)用范圍。
Cell采用靈活的架構(gòu)設(shè)計(jì),使得它相對(duì)于傳統(tǒng)處理器提供了一種突破性的解決方案。Cell處理器的另一個(gè)優(yōu)勢(shì)是同時(shí)支持多重操作系統(tǒng),正是基于此,Cell可同時(shí)運(yùn)行PC/WS操作系統(tǒng)及實(shí)時(shí)CE/Game操作系統(tǒng)。Cell的強(qiáng)兼容性可用于更廣泛的應(yīng)用,從家用小型數(shù)字CE系統(tǒng)到用于播放電影的其他娛樂應(yīng)用,直到超級(jí)計(jì)算機(jī)等大規(guī)模科學(xué)應(yīng)用等。
(圖09)
(圖10)
來自Cell的應(yīng)用前景展望
◆來自IBM、索尼集團(tuán)和東芝公司的一個(gè)工程師小組正在為Cell的設(shè)計(jì)和實(shí)施開展合作,該產(chǎn)品有望提供巨大的浮點(diǎn)處理功能、大量數(shù)據(jù)帶寬及類似于超級(jí)計(jì)算機(jī)的可擴(kuò)展性能。
◆IBM為Cell規(guī)劃的第一種計(jì)算應(yīng)用是其與SCEI共同開發(fā)、基于Cell處理器的工作站。
◆SCE希望推出其裝有Cell的新一代電腦娛樂系統(tǒng)(PS3),以實(shí)現(xiàn)電腦娛樂體驗(yàn)的革命性變化。
◆索尼公司和東芝公司希望于2006年推出裝有Cell處理器的寬帶內(nèi)容及高清晰電視(HDTV)系統(tǒng)。
◆IBM高級(jí)副總裁John E.Kelly III博士講道,“現(xiàn)在,我們披露的只是該技術(shù)的冰山一角,我們認(rèn)為它可使創(chuàng)新的Cell處理器成為新一代計(jì)算和娛樂產(chǎn)品的首要開放平臺(tái)?!?BR> ◆基于Cell(簡(jiǎn)化核心)的掌上移動(dòng)產(chǎn)品,也是IBM和SONY考慮的重點(diǎn),這類產(chǎn)品目前正在飛速前進(jìn),將來很有發(fā)展前途。
◆繼Cell發(fā)布后,IBM成立Power架構(gòu)促進(jìn)團(tuán)體。該團(tuán)體的成員包括索尼、美國(guó)Novell、Linux發(fā)行套件供應(yīng)商美國(guó)Red Hat、中國(guó)上海貝嶺等15家各環(huán)節(jié)企業(yè)。
看來合作各方還是對(duì)Cell充滿信心的。綜上所述,Cell是一款具有跨時(shí)代意義的處理器,它結(jié)合了64位運(yùn)算、多核心等前衛(wèi)的芯片技術(shù),加上強(qiáng)大的性能和對(duì)網(wǎng)格運(yùn)算的支持,Cell將能適應(yīng)未來的運(yùn)算環(huán)境和要求。
以Xeon、Itanium和Opteron為代表的CISC(復(fù)雜指令集計(jì)算機(jī))結(jié)構(gòu)處理器快達(dá)到性能極限了,為達(dá)到更高性能,其核心設(shè)計(jì)已非常復(fù)雜。造成這種困難的部分原因在于處理器設(shè)計(jì)者、操作系統(tǒng)供應(yīng)商和應(yīng)用程序開發(fā)者結(jié)成了一個(gè)不合理的聯(lián)盟。IBM的Power架構(gòu)及其促進(jìn)團(tuán)體(Power.org),在這方面做得已相當(dāng)完善,并逐步擴(kuò)大著自己的影響力。
2006年是Cell大規(guī)模登陸市場(chǎng)的時(shí)間,屆時(shí)IBM、SONY、SCE與Toshiba將借助Cell與Intel、AMD的雙核心處理器正面沖突,IBM有可能借助Cell在處理器市場(chǎng)與Intel一決高下,多媒體娛樂和數(shù)碼產(chǎn)品領(lǐng)域的爭(zhēng)斗也將更加激烈、精彩。