點擊產(chǎn)看中國大數(shù)據(jù)創(chuàng)新峰會
在下午的分論壇中,Websense網(wǎng)絡安全技術研發(fā)中國區(qū)技術總監(jiān)陳綱先生為大家坐了《大數(shù)據(jù)時代下的數(shù)據(jù)安全管理》的主題演講。在會中,他講道:
我們會覆蓋在大數(shù)據(jù)相關的價值體現(xiàn)以后的相關數(shù)據(jù)安全文化,這應該說是我們前段時間在跟一些企業(yè)老總聊的時候非常重要的一個話題。后續(xù)的結果應該如何保護?如何防止在各個行業(yè)之間、各個部門之間甚至相關的重要崗位之間的交互使用過程中防止泄露,這是很多老總們得到大數(shù)據(jù)價值后容易思考的問題。
在各式各樣的類型中我們會看到各式各樣的信息,包括他的交易習慣、關注點是什么,隨著這些結果出來以后,無疑可以幫助我們的企業(yè)經(jīng)營決策,在這個過程中,越來越的主管就會開始想象,我的分析結果如果給我相關的合作伙伴里又會帶來怎么樣的商業(yè)價值?或者說給我企業(yè)本身的競爭會帶來什么樣的影響?這真的是我們特別擔心的問題。
在大數(shù)據(jù)的高價值分析結果體現(xiàn)的時候,我們不得不關注數(shù)據(jù)安全的管理項目,當我們呈現(xiàn)大量數(shù)據(jù)的時候,誠心出大量有價值的報表、成果、預測的模型的時候我們?nèi)绾巫龊帽Wo?當看到大數(shù)據(jù)的時候很多人都覺得它非常龐大,我們很難在非常短的時間內(nèi)把所有的數(shù)據(jù)保護起來,然而大數(shù)據(jù)本身也會給大家?guī)硪粋€疑惑,就是大數(shù)據(jù)是不是都有價值值得讓我們?nèi)勘Wo。
更多的用戶會側(cè)重于把熱點營銷的分析數(shù)據(jù)進行重點的保護,簡單說就是化整為零,我們對原數(shù)據(jù)的看待和分析結果的看待是分開看的,圍繞重點分析、重點業(yè)務在一些特別重要的城市、特別重要的崗位得到的一些價值體現(xiàn),它的分析成果是真正值得我們有效監(jiān)管、有效保護和有效分析的,那么由此而來我們會發(fā)現(xiàn)我們保護的重點會從大的面上直接跳到企業(yè)現(xiàn)階段對他的商業(yè)價值最重要的核心數(shù)據(jù)上,這就真正幫我們體現(xiàn)出能夠在大數(shù)據(jù)中間抓住最核心的信息。
這里不能不談到一個概念就是數(shù)據(jù)泄露的防護,這個概念在國內(nèi)外都已經(jīng)非?;鹆耍谶^去的2年內(nèi),Websense和中國,尤其是金融行業(yè)很多客戶都有大量的合作,現(xiàn)如今很多互聯(lián)網(wǎng)公司是大數(shù)據(jù)的代表,開始不斷涌現(xiàn)出新的與數(shù)據(jù)保護相關的想法。
我們一直講這些大數(shù)據(jù)體現(xiàn)價值的時候需要不斷的深入挖掘,不斷的分析從而得到我們想要的信息,然而在這里數(shù)據(jù)泄露防護上同樣有著相似的做法,就是如何在海量的數(shù)據(jù)中快速定位出那些高價值數(shù)據(jù),這里面離不開深層內(nèi)容分析的技術,從而幫助我們對多種數(shù)據(jù)存在的形態(tài)進行分析。對一個企業(yè)來講,你不得不看我如何對這些高價值數(shù)據(jù)進行有效的識別和檢測,就像我們每天處理的數(shù)據(jù)、訪問的數(shù)據(jù)、編輯的數(shù)據(jù),或者是網(wǎng)絡中傳輸?shù)南嚓P信息,甚至包括我們從用戶端收集上來的信息,這些交互信息你如何快速定位出來?這里我們有三個簡單的方式讓大家快速理解。
第一,描述,描述通常會對大數(shù)據(jù)的很多源數(shù)據(jù)進行有效判斷,利用運營商特別關注通話的詳單,對于很多互聯(lián)網(wǎng)公司會在意用戶的交互數(shù)據(jù),這樣的信息量非常巨大,單條的記錄根本體現(xiàn)不出它的價值在這樣的情況下我們會通過描述的方式告訴系統(tǒng)什么是此類數(shù)據(jù),從而快速定位到它。
第二,登記,可以幫助我們把企業(yè)里最重要的信息錄入進去,這里不得不談到,很多高價值的報表、財務分析的結果甚至大數(shù)據(jù)的輸出可以利用類似登記的方式讓系統(tǒng)了解它相應的衍生產(chǎn)品是什么樣的。
第三,學習,很多時候我們都說這個數(shù)據(jù)應該怎么保護或者應該如何識別,這是人用自己的經(jīng)驗判斷的,那有沒有更好的方法呢?你不妨把這個信息交給數(shù)據(jù)保護系統(tǒng),讓它自己學習去判斷這些數(shù)據(jù)的共同性是什么,從而使它可以更簡單的對它進行判斷。
數(shù)據(jù)描述,大量的交易數(shù)據(jù)、通話詳單甚至傳統(tǒng)行業(yè)會用到的地理坐標,這些信息大批量出現(xiàn)的時候我們可以利用數(shù)據(jù)描述的方式告訴它什么樣的情況下被稱 為是交易記錄,以這樣的描述方式讓我們以很自然的方式得到這個信息,從而讓系統(tǒng)知道當這樣的信息大范圍傳輸?shù)臅r候值得我們關注。
同樣可以看 到數(shù)據(jù)登記的方法,我們叫它做指紋,你所留下來的不是指紋的圖,而是它們之間的不同特點,在數(shù)據(jù)登記如果用指紋方式學習的時候,概念很類似,當我們在大數(shù) 據(jù)整個群集中不斷提煉結果的時候,分析成果、樣式、報表甚至整個數(shù)據(jù)挖掘的設計是如何來完成整個過程的設計文檔,你都可以利用類似登記的方式讓它有效地了 解到這類數(shù)據(jù)的特點是什么,我的典型客戶行為是什么樣的,往往很多類似的結果最后的輸出會又回到這樣的數(shù)據(jù)系統(tǒng),或者回到某些特定的業(yè)務系統(tǒng),或者回到非 結構化的文檔上,在這樣的情況下利用類似數(shù)據(jù)登記的方式讓我們對這些摘要信息進行有效的學習,他就會很清楚的知道有人拷貝了這段設計內(nèi)容,這些東西都是來 自于某一個分析成果的某個部分,幫助我們訓練定位到這方面的某些問題。當然,不僅如此,它同樣可以對企業(yè)自己認為自己價值最大的信息進行保護。
其 實剛才百度也談到,對于互聯(lián)網(wǎng)公司最大的價值是他的人,現(xiàn)在越來越多的公司跟Websense合作的人都說,我所保護的數(shù)據(jù)甚至包括人員信息、我員工的資 料都是重點,我們曾經(jīng)在08年做過一個項目,當時制造業(yè)的項目甚至說,我有一些重點的國家項目,他的整個項目組的人員資料都是非常、非常重要的,不能隨便 泄露出去。
機器學習,我們不斷的希望機器能夠取代人在某方面做更多的事情,學習也是一種,你不妨交給機器讓它知道相關成果的特點是什么,在 這里我們經(jīng)常會講到很多企業(yè)都會有類似于生產(chǎn)的月報、周報、季報等,很多財務數(shù)據(jù)也會通過這樣的數(shù)據(jù)得到自己的分析,這張報表除了整個表格的形式以外,幾 乎沒有的數(shù)字之間是有關聯(lián)關系的,這就不得不使我們要看看有什么樣的方式對這類信息進行有效的監(jiān)管,機器學習可以由它來進行相似度的檢測,包括會議紀要, 在這樣一些相關的會議紀要的時候,我們給系統(tǒng),系統(tǒng)學習完之后就會知道這種格式呈現(xiàn)的時候就是會議紀要,甚至可以知道這是高層的會議紀要,從而幫助我們更 準確地對這些類似的分析報告進行有效的監(jiān)管。
OCR,語音識別現(xiàn)在已經(jīng)火熱到無法阻擋的地步,然而ORC技術開始讓人慢慢有點被人忘掉了,很多年以前大家都會看到說我們有很好的方式可以把印刷 的方式變成文字,很高興我們現(xiàn)在把它應用到泄露信息防護到,因為很多內(nèi)部資料的外發(fā)往往是截圖、拍照,面對這樣的狀態(tài)的時候我們?nèi)绾芜M行保護?之所以會發(fā) 生這樣的狀況很重要的因素是因為,圖這個東西很少有技術會分析,Websense的數(shù)據(jù)安全當進行企業(yè)數(shù)據(jù)保護的時候,真的會看報表里的文字是什么,當它 符合一定的價值的時候,會根據(jù)數(shù)據(jù)安全的要求進行匹配,挑出某些圖片里的信息是否有問題,尤其在郵件的通道上的泄露,類似的ORC可以非常有效地幫助我們 發(fā)現(xiàn)這個問題。
點滴泄露,這個詞來源于什么?我們有一個客戶跟我們說,我們有的客服天天在處理一些信息,每時每刻都在把這些信息向外發(fā)送,我如何知道它的惡意是什 么?包括一些木馬,然而你無法發(fā)現(xiàn),因為他每次的量太少,于是有人說你能不能幫我檢測一段時間內(nèi)發(fā)生的少量但是多次的泄露場景,這樣就可以有效的發(fā)現(xiàn)一些 惡意的行為。
當我們不斷關注數(shù)據(jù)中心、關注數(shù)據(jù)存儲的核心區(qū)域的時候,我們不得不看到數(shù)據(jù)最終的交互點在哪里。從數(shù)據(jù)泄露途徑每年的統(tǒng)計、分析來講,無論是四大 所做的分析還是其它行業(yè)分析機構得到的統(tǒng)計,我們都會看到網(wǎng)絡、終端最終都是最容易導致數(shù)據(jù)泄露的邊緣區(qū)域,于是我們想到可不可以在企業(yè)的網(wǎng)絡通道上,尤 其是業(yè)務最需要用到的通訊渠道,利用Web、郵件,甚至我們的加密通道傳輸,看看這里面有沒有敏感信息的泄露,這都是我們講的從你的網(wǎng)絡覆蓋面應該如何看 待的問題,當然最重要的是我們?nèi)绾伟堰@些問題捕獲到、防止它離開你的企業(yè),這才能真正幫助我們解決相應的問題。
很多人每天都在處理你的數(shù)據(jù),無論是客服人員還是數(shù)據(jù)分析人員,又或者很多企業(yè)的高管,他們都在接觸這些數(shù)據(jù),這樣一些數(shù)據(jù)出現(xiàn)和使用的過程中,如 何從終端層面防止它的泄露?防止它成為你泄露的渠道?這些問題都是很多企業(yè)在做出呈現(xiàn)以后不知道如何保護的,這恰恰是Websense不斷希望能夠給我們 客戶帶來新的思考點,讓我們?nèi)ジ玫乜创@些問題,看如何進行相關的保護。
在大數(shù)據(jù)數(shù)據(jù)中間我們不斷談數(shù)據(jù)挖掘,說從相應的問題里如何發(fā)現(xiàn)最具價值的信息,從數(shù)據(jù)泄露防護的角度上講也是一樣,你的泄露事件的管理同樣無異于 一種深度的信息挖掘,那如何在這中間挑到你感興趣的?我們不妨給客戶呈現(xiàn)出更具價值的統(tǒng)計報表,例如基于地理位置,經(jīng)常聽到人談到說我們有很多用戶的信息 會通過采集地理位置、地理信息來得到信息,數(shù)據(jù)泄露也是一樣,如果我們能夠呈現(xiàn)出你的機密數(shù)據(jù)曾經(jīng)被送到互聯(lián)網(wǎng)上或者整個企業(yè)外部某個國家特定的服務器上 的時候,企業(yè)高管可以看看我們公司在這個地區(qū)有沒有相應的業(yè)務,沒有的話那數(shù)據(jù)怎么去那里了?這可以幫助他發(fā)現(xiàn)有些數(shù)據(jù)的泄露是不是我們企業(yè)所擔心的。通 過這樣的方式可以快速地讓我們定位出我們感興趣的泄露問題,從而幫助企業(yè)的經(jīng)營決策決定是否應對此類行為進行有效的阻擋和限制。
工作流,這是現(xiàn)在越來越多的企業(yè)關注的,很多企業(yè)都在談到這個狀況,一個企業(yè)在如何應用這些技術的同時把流程做好,數(shù)據(jù)防護也是如此,要真正讓這樣 的技術跟你的企業(yè)日常運維結合在一起,這才是最重要的。我們發(fā)現(xiàn)這樣的工作流可以使得我們所有的工作人員不需要每天面對我的計算機,我甚至只需要通過郵件 的方式對相應的泄露場景、泄露事件進行有效的處理,無論是審批釋放、反饋領導或者別的,我都可以這樣做。
面對泄露的威脅,很多企業(yè)都想到,我們最需要擔心的往往是黑客的行為,或者是很多惡意的行為,然而在很多企業(yè)根據(jù)真正自己敏感數(shù)據(jù)外發(fā)進行羅列的時候,你會發(fā)現(xiàn)很多偶發(fā)事件占了企業(yè)70%的比例,原因就是很多員工是無意識的把這些信息泄露出去了。
就 比如說云,很多人會把工作的內(nèi)容上傳到云里,但他并沒有意識說這些信息有沒有技術共享,包括我們?nèi)ヒ患一ヂ?lián)網(wǎng)公司,他們的CIO親自跟我說,他現(xiàn)在很擔 心,原因是微博竟然成為一個公司內(nèi)部運用的平臺,機器出問題了他們會直接在微博上發(fā)出去,這是很不可思議的。我們這個系統(tǒng)就可以很好的監(jiān)管,當你要往外發(fā) 的時候,你就可以警告他這樣的信息是不能往外發(fā)的,包括惡意的一些行為,無論是黑客進來以后做一些竊取的動作還是企業(yè)內(nèi)部做的一些數(shù)字的便利,可能都會存 在這樣的問題。這里恰恰是類似通過數(shù)據(jù)泄露防護的方式幫助我們?yōu)槠髽I(yè)高管們提供敏感數(shù)據(jù)的可視性,讓你知道你的分析成果到底傳到了什么地方去,從而可以更 好地幫助我們在這方面進行有效的控制。
Websense其實是一家上市公司,美國的一家上市公司,他做的很多方案越來越多的都是針對企業(yè)的敏感數(shù)據(jù)和企業(yè)的核心數(shù)據(jù)所展開 Websense專門設計了Trito的統(tǒng)一安全平臺,圍繞企業(yè)經(jīng)常發(fā)現(xiàn)的各種安全問題,在郵件、敏感數(shù)據(jù)等方面進行有效的統(tǒng)一內(nèi)容分析,幫助我們發(fā)現(xiàn)他 相應的問題。通過整合的一種分析技術,幫助我們把它濃縮為ACE這樣的分析引擎,對一些客戶的數(shù)據(jù)使用行為進行判斷,從而有效地進行阻擋。
Websense在北京的安全實驗室可以很好地為大家提供這方面的技術支撐,我們希望給客戶帶來的是希望在大數(shù)據(jù)的時代下,當你們獲得他的高價值信息的同時,要注意如何在你的Web、郵件、敏感信息進行有效的防范,甚至你應該把安全方案逐步擴展到云以及移動終端上。
?