MIC架構(gòu)三個(gè)方面的特點(diǎn):交付性能、計(jì)算密度、可編程性
MIC的高度并行計(jì)算能力是如何實(shí)現(xiàn)的?何萬青博士介紹道,在至強(qiáng)上使用OpenIP的循環(huán)進(jìn)行運(yùn)算時(shí),增加了一個(gè)制導(dǎo)語句(如下圖藍(lán)色部分所 示),將循環(huán)分配到各個(gè)核上去,讓每個(gè)核進(jìn)行線程的運(yùn)算。由于MIC并不是一個(gè)非常復(fù)雜的處理器合成的,需要一些支撐軟件來實(shí)現(xiàn)應(yīng)用的運(yùn)行,只需要把應(yīng)用 載到MIC上去運(yùn)算,就可以實(shí)現(xiàn)了。
Sandy Bridge:讓HPC應(yīng)用性能提升50%
Sandy Bridge將于今年年底發(fā)布亮產(chǎn),最主要的是AVX擴(kuò)展向量,理論上可以把浮點(diǎn)能力提高將近一倍。同時(shí)集成了PCIe(PCI Express),以往PCIe是接在南橋上,一共只有46個(gè)lane,現(xiàn)在每個(gè)Socket都有46 個(gè)Lane,I/O帶寬將大大提升。每個(gè)Socket之間原來只有一個(gè)QPI,現(xiàn)在有兩條QPI,可以只要,擴(kuò)展成經(jīng)濟(jì)型的四路平臺(tái)。對(duì)于一些內(nèi)存容量要 求較高,而又不希望太昂貴的情況下,可以使用這種EP的四路平臺(tái)。
Intel內(nèi)部測試表明,跟至強(qiáng)5600相比,應(yīng)用的速度平均提升了50%左右,比如分子動(dòng)力學(xué)提升了65%。
E7:Shared Memory編程模式
有一些應(yīng)用不適合在Cluster上運(yùn)行,而是適合小機(jī)的Shared Memory編程模式。但是,自從Nahalem 7500出現(xiàn)之后,為用戶提供了更經(jīng)濟(jì)的解決方案。“很多應(yīng)用也開始選擇了E7的平臺(tái),如基因序列拼接、油藏模擬等等”,何萬青介紹道。