早在1980年,未來學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書中將大數(shù)據(jù)稱為“第三次浪潮的華彩樂章”。從2009年起,“大數(shù)據(jù)”逐漸成為人們爭相討論的詞匯之一。如今,無論在自然科學(xué)還是在社會科學(xué)的研究項目中都能看到大數(shù)據(jù)的身影。何謂大數(shù)據(jù)?大數(shù)據(jù)將怎樣造福人類社會?記者帶著這些問題采訪了相關(guān)專家。
定義尚無定論
記者發(fā)現(xiàn),目前學(xué)界對大數(shù)據(jù)的定義說法不一。有學(xué)者認(rèn)為大數(shù)據(jù)的定義應(yīng)根據(jù)使用者的不同而變化。IBM首席科學(xué)家杰夫·喬納斯認(rèn)為,大數(shù)據(jù)是龐大的且能夠做出更好預(yù)測的數(shù)據(jù)。美國高德納咨詢公司(Gartner)認(rèn)為,大數(shù)據(jù)是需要處理才能具有更強(qiáng)決策力、洞察力和流程優(yōu)化力的海量、多樣化信息資產(chǎn)。維基百科則將大數(shù)據(jù)解釋為資料量規(guī)模巨大,無法在合理時間內(nèi)利用主流軟件工具進(jìn)行管理、處理等操作的,助力企業(yè)經(jīng)營決策的數(shù)據(jù)。
學(xué)者將大數(shù)據(jù)的特點歸納為以下四點:第一,數(shù)據(jù)規(guī)模巨大。大型數(shù)據(jù)集規(guī)模一般為TB級別,而大數(shù)據(jù)則從TB躍升至PB。第二,數(shù)據(jù)類型繁多。大數(shù)據(jù)不再是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),而是包括網(wǎng)絡(luò)日志、視頻、圖片和地理位置信息等多種形式的非結(jié)構(gòu)化信息。第三,價值密度低。以視頻為例,不間斷監(jiān)控的可用數(shù)據(jù)僅有一兩秒。第四,處理速度快。大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)有別于傳統(tǒng)技術(shù),處理速度非常快。
為什么人們對大數(shù)據(jù)如此關(guān)注?牛津大學(xué)互聯(lián)網(wǎng)研究院教授維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?觟nberger)和《經(jīng)濟(jì)學(xué)人》雜志數(shù)據(jù)編輯肯尼思·庫克耶(Kenneth Cukier)在其合著的暢銷書《大數(shù)據(jù)時代:生活、工作與思維的大變革》中給出了答案。他們認(rèn)為,大數(shù)據(jù)時代,分析的信息量更多,在處理個別現(xiàn)象的數(shù)據(jù)時不用依賴隨機(jī)采樣,另外,大數(shù)據(jù)的出現(xiàn)讓人們轉(zhuǎn)而追求精確度,改變了人們的生活、工作和思維方式,開啟了一次重大的時代轉(zhuǎn)型。其中最關(guān)鍵的是,大數(shù)據(jù)的出現(xiàn)讓人們放棄了對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系,人們只需知道“是什么”,而不用知道“為什么”。這顛覆了千百年來人類的思維模式,對人類的認(rèn)知方式和交流方式提出了新挑戰(zhàn)。
大數(shù)據(jù)為學(xué)界提供新思維
大數(shù)據(jù)所蘊含的巨大社會、經(jīng)濟(jì)和科研價值是其受到廣泛關(guān)注的根本原因。2012年3月,奧馬巴政府公布了“大數(shù)據(jù)研發(fā)計劃”(Big Data Research and Development Initiative)。該計劃將獲資2億多美元,旨在提高人們從海量和復(fù)雜數(shù)據(jù)中獲取知識的能力,加速美國在科學(xué)與工程領(lǐng)域前進(jìn)的步伐,增強(qiáng)國家安全,轉(zhuǎn)變現(xiàn)有教學(xué)和學(xué)習(xí)方式。該計劃也是美國繼1993年宣布“信息高速公路計劃”后的又一次重大科技發(fā)展部署。有學(xué)者稱,這是大數(shù)據(jù)從商業(yè)和學(xué)術(shù)上升到國家戰(zhàn)略的分水嶺,也意味著大數(shù)據(jù)在經(jīng)濟(jì)社會的各個層面開始受到重視。此外,美國國家科學(xué)基金會還將針對大數(shù)據(jù)召集各個學(xué)科領(lǐng)域的研究人員,共同探討如何利用大數(shù)據(jù)轉(zhuǎn)變教育和學(xué)習(xí)模式,研究新的人才培養(yǎng)方法。
對學(xué)界而言,大數(shù)據(jù)最大的影響在于其提供了新的研究思維和方法。倫敦大學(xué)學(xué)院數(shù)字人文中心主任梅麗莎·特拉絲(Melissa M. Terras)告訴記者,大數(shù)據(jù)能幫助人文社科學(xué)者解決懸而未決的難題,研究長時期內(nèi)不同語言的變化,分析大量文本信息。
邁爾-舍恩伯格和庫克耶也在采訪中表示,大數(shù)據(jù)無處不在,不僅能提高經(jīng)濟(jì)效率,改善健康醫(yī)療水平,還能提高教育質(zhì)量,預(yù)測社會變化,但最關(guān)鍵的還是對數(shù)據(jù)本身的探索和人類利用它的方法。
大數(shù)據(jù)能造福社會
5月30日,英國衛(wèi)報刊登文章《大數(shù)據(jù)如何造福社會?》(How Can Big Data be Used for Social Good?)稱,隨著大數(shù)據(jù)時代的到來,分析數(shù)據(jù)的技術(shù)和工具更加多樣化和專業(yè)化,社會企業(yè)家和活動家要抓住當(dāng)前的“數(shù)據(jù)機(jī)遇”為社會造福。目前人們開始利用大數(shù)據(jù)進(jìn)行日常天氣預(yù)測、機(jī)票價格預(yù)測,而商家則利用大數(shù)據(jù)實時監(jiān)控銷售記錄,制定有效的營銷策略,為客戶提供準(zhǔn)確的資料,從而提升競爭力,擴(kuò)大獲利渠道。
一些研究者和作家認(rèn)為,分析與公共衛(wèi)生和人道主義救援相關(guān)的數(shù)據(jù)能有效幫助社會企業(yè)家和活動家解決全球貧困、疾病、生態(tài)災(zāi)害、戰(zhàn)爭和饑荒等問題。此外,科學(xué)家和公民社會組織發(fā)起相關(guān)項目,組織工作坊協(xié)助世界銀行等世界組織識別和分析多個數(shù)據(jù)集,從而支持政府治理、打擊腐敗等公共行為或通過搜集社會媒體和其他網(wǎng)站上的特定信息,幫助金融機(jī)構(gòu)提高服務(wù)質(zhì)量。
然而,邁爾-舍恩伯格和庫克耶在接受采訪時稱,他們并不是大數(shù)據(jù)的盲目推崇者,而是大數(shù)據(jù)的信息傳播者。他們沒有刻意回避大數(shù)據(jù)的缺點,稱大數(shù)據(jù)容易引發(fā)隱私問題,且人們很容易在利用大數(shù)據(jù)的過程中忽略其局限性。斯坦福大學(xué)慈善和公民社會中心訪問學(xué)者露西·伯恩霍爾茲(Lucy Bernholz)表示,分析社會變化數(shù)據(jù)還需要設(shè)立一些客觀標(biāo)準(zhǔn),這樣才能使大數(shù)據(jù)在不妨礙公民個人隱私的前提下更有利于思維創(chuàng)新和社會開放。