捕獲的URL訪問(wèn)報(bào)文
分析上述報(bào)文可以看出當(dāng)主機(jī)訪問(wèn)網(wǎng)站時(shí),首先會(huì)發(fā)送一個(gè)HTTP請(qǐng)求報(bào)文,該報(bào)文指明了應(yīng)用層協(xié)議為HTTP,操作方法為GET,URL字段內(nèi)容(路徑及文件名)為“/view/1321789.htm”,HOST字段內(nèi)容為“baike.baidu.com”。當(dāng)一個(gè)http報(bào)文經(jīng)過(guò)上網(wǎng)行為管理設(shè)備時(shí),設(shè)備可以識(shí)別出上述信息,并進(jìn)一步檢查報(bào)文中的HOST和URL字段內(nèi)容,如果HOST或URL字段內(nèi)容中有字符串與URL過(guò)濾規(guī)則中定義的過(guò)濾關(guān)鍵字相匹配,那么該報(bào)文將會(huì)被丟棄,用戶電腦與該網(wǎng)站服務(wù)器的連接斷開(kāi),從而無(wú)法打開(kāi)該網(wǎng)頁(yè)。
實(shí)用案例
案例一:為什么已經(jīng)設(shè)置了過(guò)濾“http://www.163.com”網(wǎng)址關(guān)鍵字,網(wǎng)易主頁(yè)卻還是能打開(kāi)?
上面已經(jīng)說(shuō)過(guò)上網(wǎng)行為管理設(shè)備在進(jìn)行URL過(guò)濾時(shí)檢查的是HTTP報(bào)文中HOST和URL字段的內(nèi)容,從上述抓包信息分析可知“http://”字符串并不會(huì)出現(xiàn)在這兩個(gè)字段中。因此,設(shè)備無(wú)法在訪問(wèn)網(wǎng)易網(wǎng)站的HTTP報(bào)文的HOST及RUL字段中匹配到“http://www.163.com”這個(gè)字符串,正確的過(guò)濾關(guān)鍵字應(yīng)該為“www.163.com”。
案例二:我想過(guò)濾網(wǎng)易郵箱,但不想過(guò)濾網(wǎng)易主頁(yè)和其他網(wǎng)易子鏈接,如何設(shè)置?
由于網(wǎng)易郵箱的HOST字段為mail.163.com,設(shè)置過(guò)濾關(guān)鍵字為“mail.163.com”即可以達(dá)到效果。而訪問(wèn)網(wǎng)易主頁(yè)時(shí)HTTP報(bào)文中的HOST字段為www.163.com不會(huì)匹配過(guò)濾規(guī)則定義的“mail.163.com”關(guān)鍵字,因此訪問(wèn)網(wǎng)易主頁(yè)不會(huì)被過(guò)濾。
案例三:我想過(guò)濾所有與網(wǎng)易有關(guān)的網(wǎng)頁(yè),并已經(jīng)設(shè)置了“www.163.com”過(guò)濾關(guān)鍵字,為什么只有網(wǎng)易主頁(yè)打不開(kāi),網(wǎng)易郵箱和網(wǎng)易新聞卻還能打開(kāi)?
很顯然由上述兩案例我們已經(jīng)知道“www.163.com”是網(wǎng)易主頁(yè)的HOST字段內(nèi)容。而網(wǎng)易郵箱是“mail.163.com”,網(wǎng)易新聞是“news.163.com”,因此無(wú)法完全匹配“www.163.com”過(guò)濾關(guān)鍵字,也就達(dá)不到過(guò)濾它們的效果。想達(dá)到這個(gè)效果其實(shí)很簡(jiǎn)單,設(shè)置關(guān)鍵字為“163.com”即可。因?yàn)榕c網(wǎng)易有關(guān)的網(wǎng)頁(yè)其HOST字段都會(huì)包含“163.com”字符。