點(diǎn)擊觀看全國高性能計算機(jī)學(xué)術(shù)年會

在下午的分論壇中,江南計算技術(shù)研究所的陳淑平先生為大家演講了《Infiniband網(wǎng)絡(luò)中A ll_to_A ll通信性能優(yōu)化》的報告,詳細(xì)介紹了All_to_All的操作,Infiniband擁塞,現(xiàn)有算法的性能,以及優(yōu)化算法。

江南技術(shù)研究所陳淑平

陳淑平表示,A ll_to_A ll操作,是一種重要的集合操作,在理想狀態(tài)下,A ll_to_A ll操作中每個進(jìn)程的帶寬等于網(wǎng)卡的鏈路寬帶。但實際上,各個進(jìn)程在同時發(fā)送數(shù)據(jù)時會相互競爭通信路徑,從而使網(wǎng)絡(luò)中產(chǎn)生擁塞,導(dǎo)致進(jìn)程的帶寬明顯低于鏈路帶寬。

Infinband網(wǎng)絡(luò)簡介

陳淑平介紹說,Infinband中的擁塞問題主要是基于信用的鏈路傳輸控制機(jī)制以及容易形成擁塞樹,導(dǎo)致A ll_to_A ll的性能嚴(yán)重下降。使擁塞避免的方法有維護(hù)一個發(fā)送窗口,每個進(jìn)程為每個QP都維護(hù)了一個計數(shù)器,該計數(shù)器記錄了未完成請求的個數(shù)。設(shè)發(fā)送窗口大小為window,進(jìn)程個數(shù)為N,則發(fā)送窗口中平均每個QP有window/(N-1)個發(fā)送請求。

在分論壇的會中,陳淑平還談到,如果控制每條小熙的發(fā)射速率恒為Bandwidth/M,那么每條鏈路的最大負(fù)載都不會超過鏈路的傳輸能力,網(wǎng)絡(luò)中就不會產(chǎn)生擁塞,從而獲得最大的帶寬利用率。

在大會的最后,陳淑平先生總結(jié)到,新算法的原理是根據(jù)網(wǎng)絡(luò)擁塞程度動態(tài)調(diào)度消息的發(fā)送新算法的性能。在發(fā)送大消息時,該算法相比現(xiàn)有的算法,帶寬利用率可以提高10%以上,最多可以提高20%,在虛擬機(jī)環(huán)境下,性能優(yōu)于原有算法。

分享到

zhangcun

相關(guān)推薦