我們首先從S1號(hào)嫌疑人撰寫的E1號(hào)電子郵件中獨(dú)立提取活動(dòng)模式參數(shù)。盡管現(xiàn)在的活動(dòng)模式參數(shù)中包含了S1號(hào)嫌疑人的寫作風(fēng)格,但利用所有的活躍模式為其建立字紋也是不恰當(dāng)?shù)?,原因在于,S2號(hào)嫌疑人和S3號(hào)嫌疑人也可能與S1號(hào)嫌疑人具有某些相同的寫作模式。

因此,問(wèn)題的關(guān)鍵就變成了篩選出共同的活動(dòng)模式,并分離出可以用于從其它嫌疑人的寫作風(fēng)格中區(qū)分出來(lái)的獨(dú)特模式。這些獨(dú)特模式就構(gòu)成了嫌疑人的字紋。

在這里,我想與廣大讀者一起分享從兩位教授文章中發(fā)現(xiàn)的有趣內(nèi)容:

活動(dòng)模式挖掘已經(jīng)在基因測(cè)序、消費(fèi)者購(gòu)買習(xí)慣分析、安全入侵研究和很多其它模式的識(shí)別應(yīng)用中被證明屬于成功的數(shù)據(jù)挖掘技術(shù)。但據(jù)我們所知,這是第一篇介紹利用活動(dòng)模式概念確認(rèn)撰寫者身份參數(shù)內(nèi)容的論文。

理論檢驗(yàn)

為了對(duì)技術(shù)的準(zhǔn)確性進(jìn)行測(cè)試,研究人員選擇了一個(gè)包含158名撰寫者的20萬(wàn)封實(shí)際電子郵件的數(shù)據(jù)庫(kù)作為樣本。在針對(duì)10封不同主題的電子郵件進(jìn)行測(cè)試后。研究人員發(fā)現(xiàn)準(zhǔn)確程度可以達(dá)到80%到90%。

馮教授聲稱,“我們的技術(shù)是設(shè)計(jì)用來(lái)為法庭提供可靠證據(jù)支持的。為了保證證據(jù)被采納,調(diào)查人員需要解釋如何得出相關(guān)結(jié)論。而我們的模式就可以支持他們進(jìn)行相應(yīng)的處理。”

下面就是為什么該模式可以在法庭上使用的專業(yè)原因:

l 可以用于確認(rèn)嫌疑人的字紋。

l 可以用于確認(rèn)惡意電子郵件的作者。

l 能夠提供證據(jù)支持確認(rèn)撰寫者的結(jié)論。

最后的思考

從一開始,研究團(tuán)隊(duì)關(guān)注的就是如何向法庭提供有效的證據(jù)表明犯罪分子就是匿名者。我想他們的努力方向是正確的。

在這里,要非常感謝由本杰明·馮、穆拉德·德巴比、法克哈恩得·伊克巴爾和拉奇德·哈吉迪組成的研究團(tuán)隊(duì),幫助我理解了這么復(fù)雜的問(wèn)題。

分享到

zhenggaofeng

相關(guān)推薦