圖 1:Comnet程序的復(fù)雜性
當(dāng)你試圖向外擴(kuò)展那些Comet解決方案時(shí),情況變得更糟糕,模擬基于HTTP的雙向通信容易出錯(cuò),即使最終用戶感覺某些東西看起來象是一個(gè)實(shí)時(shí)Web應(yīng)用程序,但這種"實(shí)時(shí)"體驗(yàn)的代價(jià)都是非常高昂的,需要付出更多的延遲等待時(shí)間,不必要的網(wǎng)絡(luò)流量和對(duì)CPU性能的拖累。
HTML 5 Web Socket—拯救
HTML 5 Web Socket定義在HTML 5規(guī)范的通信章節(jié),它代表Web通信的下一個(gè)演變:通過一個(gè)單一的Socket實(shí)現(xiàn)一個(gè)全雙工,雙向通信的信道。HTML 5 Web Socket提供了一個(gè)真正的標(biāo)準(zhǔn),你可以使用它構(gòu)建可擴(kuò)展的實(shí)時(shí)Web應(yīng)用程序。此外,由于它提供了一個(gè)瀏覽器自帶的套接字,消除了Comet解決方案的許多問題,Web Socket顯著降低了系統(tǒng)開銷和復(fù)雜性。
為了建立一個(gè)Web Socket連接,客戶端和服務(wù)器在初始握手期間要從HTTP協(xié)議升級(jí)到WebSocket協(xié)議,如下面的例子:
例1:WebSocket握手(瀏覽器請(qǐng)求,服務(wù)器響應(yīng))
建立好連接后,WebSocket數(shù)據(jù)幀就可以在客戶端和服務(wù)器之間以全雙工模式傳輸,在同一時(shí)間任何方向,可以全雙工發(fā)送文本和二進(jìn)制幀,最小的幀只有2個(gè)字節(jié)。在文本幀中,每一幀始于0x00直接,止于0xFF字節(jié),數(shù)據(jù)使用UTF-8編碼。WebSocket文本幀使用終結(jié)器,而二進(jìn)制幀使用一個(gè)長度前綴。
注意:雖然WebSocket協(xié)議已經(jīng)可以支持多種客戶端,但不能將原始數(shù)據(jù)傳遞給JavaScript,因?yàn)镴avaScript不支持字節(jié)類型,因此,如果客戶端是JavaScript,二進(jìn)制數(shù)據(jù)會(huì)被忽略,但可以傳遞給支持字節(jié)類型的客戶端。
Comet和HTML 5 Web Socket之間的對(duì)決
人們最關(guān)注的是HTML 5 Web Socket如何減少不必要的網(wǎng)絡(luò)流量和延遲,我們比較一個(gè)輪詢應(yīng)用程序和Web Socket應(yīng)用程序就知道了。
對(duì)于輪詢的例子,我創(chuàng)建了一個(gè)簡單的Web應(yīng)用程序,一個(gè)網(wǎng)頁使用傳統(tǒng)的發(fā)布/訂閱模式從RabbitMQ消息代理請(qǐng)求實(shí)時(shí)的股票數(shù)據(jù),它是通過輪詢一個(gè)托管在Web服務(wù)器上的Java Servlet實(shí)現(xiàn)的,RabbitMQ消息代理從一個(gè)虛構(gòu)的,不斷更新價(jià)格的股票價(jià)格源接收數(shù)據(jù),網(wǎng)頁連接并訂閱一個(gè)特定的股票頻道(消息代理上的一個(gè)主題),使用XMLHttpRequest每秒更新一次進(jìn)行輪詢。當(dāng)收到更新時(shí),執(zhí)行一些計(jì)算,然后將股票數(shù)據(jù)顯示在圖2所示的表中。
圖 2:一個(gè)JavaScript股票行情應(yīng)用程序
注意:后端的股票源每秒實(shí)際上產(chǎn)生了大量的股票價(jià)格更新,因此使用每秒一次輪詢的方式比使用長輪詢方式更好,長輪詢會(huì)產(chǎn)生許多連續(xù)的輪詢,輪詢會(huì)更有效地阻止傳入更新。
這一切看起來還不錯(cuò),但仔細(xì)觀察,你就會(huì)發(fā)現(xiàn)這種應(yīng)用程序存在嚴(yán)重的問題,例如,使用Firefox的Firebug插件(允許你調(diào)試網(wǎng)頁和監(jiān)控頁面加載和腳本執(zhí)行時(shí)間),你可以看到每秒都有一個(gè)GET請(qǐng)求砸向服務(wù)器。打開Live HTTP Headers(另一個(gè)Firefox 插件,顯示實(shí)時(shí)的HTTP消息頭流量)揭示每個(gè)請(qǐng)求關(guān)聯(lián)的消息頭開銷數(shù)量是相當(dāng)驚人的。下面兩個(gè)例子顯示了一個(gè)請(qǐng)求和響應(yīng)的HTTP消息頭數(shù)據(jù)。
例2:HTTP請(qǐng)求頭
例3:HTTP響應(yīng)頭
HTTP請(qǐng)求和響應(yīng)頭信息開銷總共包括871字節(jié),而且還不包括任何數(shù)據(jù),當(dāng)然,這只是一個(gè)例子,你的消息頭數(shù)據(jù)完全可能低于871字節(jié),但我也看到過消息頭數(shù)據(jù)超過2000字節(jié)的情況。在這個(gè)例子中,股票主題消息數(shù)據(jù)大約只有20個(gè)字符。
當(dāng)你把這樣的程序大規(guī)模部署給用戶時(shí)會(huì)怎么樣?我們使用三個(gè)不同的用例觀察一下該輪詢應(yīng)用程序關(guān)聯(lián)的HTTP請(qǐng)求和響應(yīng)頭數(shù)據(jù)需要的網(wǎng)絡(luò)吞吐量。
用例A:1000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871×1000)=871000字節(jié)=6968000比特/秒(6.6Mbps)
用例B:10000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871×10000)=8710000字節(jié)=69680000比特/秒(66Mbps)
用例C:100000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871×100000)=87100000字節(jié)=696800000比特/秒(665Mbps)
這是一個(gè)不必要的巨大的網(wǎng)絡(luò)吞吐量,這時(shí)我們可以使用HTML 5 Web Socket,我使用HTML 5 Web Socket重構(gòu)了應(yīng)用程序,給網(wǎng)頁添加了一個(gè)事件處理程序,同步監(jiān)聽來自消息代理的股票更新消息。每個(gè)消息都是一個(gè)Web Socket幀,開銷只有2個(gè)字節(jié)(而不是871字節(jié)),再來看看對(duì)網(wǎng)絡(luò)吞吐量的影響。
用例A:1000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2×1000)=2000字節(jié)=16000比特/秒(0.015Mbps)
用例B:10000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2×10000)=20000字節(jié)=160000比特/秒(0.153Mbps)
用例C:100000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2×100000)=200000字節(jié)=1600000比特/秒(1.526Mbps)
正如你在圖3中可以看到的,與輪詢解決方案相比,HTML 5 Web Socket減少了不必要的網(wǎng)絡(luò)流量。
圖 3:比較輪詢和WebSocket應(yīng)用程序之間的網(wǎng)絡(luò)吞吐量
延遲減少怎么樣呢?看看圖4便知,圖中上半部分顯示了半雙工輪詢方案的延遲,這里我們假設(shè)消息從服務(wù)器傳輸?shù)綖g覽器需要50毫秒,輪詢方式引入許多額外的延遲,因?yàn)楫?dāng)響應(yīng)完成時(shí),一個(gè)新的請(qǐng)求已經(jīng)發(fā)送到服務(wù)器了,這個(gè)新請(qǐng)求又需要50毫秒,在此期間服務(wù)器不能發(fā)送任何消息給瀏覽器,導(dǎo)致額外的服務(wù)器內(nèi)存消耗。
圖4下半部分顯示了Web Socket方式產(chǎn)生的延遲,一旦連接升級(jí)到Web Socket,消息的傳輸會(huì)更及時(shí),從服務(wù)器傳輸?shù)綖g覽器仍然需要50毫秒,但Web Socket連接保持打開,之后就再也不用向服務(wù)器發(fā)送請(qǐng)求了。
圖 4:輪詢和Web Socket應(yīng)用程序之間的延遲對(duì)比
HTML5 Web Socket和Kaazing WebSocket網(wǎng)關(guān)
目前,只有Google的Chrome瀏覽器原生支持HTML 5 Web Socket,但其它瀏覽器也將提供支持,若要解決這個(gè)限制,Kaazing Web Socket網(wǎng)關(guān)為所有舊瀏覽器(IE 5.5+,F(xiàn)irefox 1.5+,Safari 3.0+和Opera 9.5+)提供了一個(gè)完整的Web Socket仿真,因此你現(xiàn)在就可以使用HTML 5 Web Socket API。
Web Socket很了不起,但在你的瀏覽器中有一個(gè)全雙工套接字連接后可以做什么呢?為了充分利用HTML 5 Web Socket的全部功能,Kaazing為二進(jìn)制通信提供了一個(gè)ByteSocket庫,為諸如Stomp、AMQP、XMPP、IRC等協(xié)議提供了更高級(jí)的庫,它們都是建立在Web Socket之上的。
例如,如果你為Stomp或AMQP協(xié)議使用了一個(gè)更高級(jí)的庫,這時(shí)你可以直接與后端消息代理如RabbitMQ進(jìn)行通信,通過直接連接服務(wù),不再需要額外的應(yīng)用程序服務(wù)邏輯將這些雙向,全雙工TCP后端協(xié)議轉(zhuǎn)換成非雙向,半雙工HTTP連接,因?yàn)闉g覽器本身就可以理解這些協(xié)議。
圖5 :Kaazing Web Socket網(wǎng)關(guān)擴(kuò)展基于TCP的消息,并具有更好的性能
總結(jié)
HTML 5 Web Socket在實(shí)時(shí)Web應(yīng)用擴(kuò)展性方面朝前邁出了一大步,正如你在本文中所看到的,HTML 5 Web Socket可以提供5000:1或 – 根據(jù)HTTP消息頭大小 – 1000:1的比例減少不必要的HTTP頭流量和3:1的比例減少通信延遲,這不是一個(gè)漸進(jìn)式的改進(jìn),而是一次革命性的飛躍。
Kaazing Web Socket網(wǎng)關(guān)讓HTML 5 Web Socket代碼能夠在所有瀏覽器中運(yùn)行,同時(shí)提供額外的協(xié)議庫允許你充分利用HTML 5 Web Socket提供的全雙工套接字連接功能,直接與后端服務(wù)進(jìn)行通信。