噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

程學旗:大數(shù)據(jù)的再認識

程學旗 發(fā)表于:14年02月14日 14:21 [來稿] DOIT.com.cn

  • 分享:
[導(dǎo)讀]大數(shù)據(jù)是一個寬泛的概念,見仁見智。因此,在大數(shù)據(jù)概念滿天飛的時候,我們既要抓住時機,挖掘價值,還要思考本質(zhì),不在混亂的時候迷失方向。

程學旗先生是中科院計算所副總工、研究員、博士生導(dǎo)師、網(wǎng)絡(luò)科學與技術(shù)重點實驗室主任。本次程學旗帶來了中國大數(shù)據(jù)生態(tài)系統(tǒng)的基礎(chǔ)問題方面的內(nèi)容分享。大數(shù)據(jù)的發(fā)展越來越快,但是對于大數(shù)據(jù)的認知大都還停留在最初的階段——大數(shù)據(jù)是一類資源、一類工具,其實“大數(shù)據(jù)”更多的體現(xiàn)的是一個認知和思維,是一種戰(zhàn)略、認知和文化。

一年多來,通過組織中國大數(shù)據(jù)技術(shù)大會、CCF大數(shù)據(jù)學術(shù)會議以及各類大大小小的應(yīng)用峰會與學術(shù)論壇,結(jié)合我們科學院網(wǎng)絡(luò)數(shù)據(jù)科學與技術(shù)重點實驗室所承擔的與大數(shù)據(jù)相關(guān)的重大基礎(chǔ)課題研究以及與情報分析、互聯(lián)網(wǎng)數(shù)據(jù)分析相關(guān)的應(yīng)用開發(fā)實踐,我談?wù)勛约旱囊恍┧伎肌?/p>

今天引導(dǎo)性討論的內(nèi)容可以包括三大塊,包括:對大數(shù)據(jù)的再認識、引擎平臺系統(tǒng)支撐下的大數(shù)據(jù)分析技術(shù)、建立大數(shù)據(jù)產(chǎn)學研生態(tài)環(huán)境的基礎(chǔ)性問題思考。

1、關(guān)于大數(shù)據(jù)的再認識

大數(shù)據(jù)是一個寬泛的概念,見仁見智。關(guān)于大數(shù)據(jù)的概念,當前比較普遍使用的定義都與維基百科中的描述類似:“大數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊”。而這類定義的一個明顯的局限是僅僅從大數(shù)據(jù)的計算機處理視角給出的關(guān)于大數(shù)據(jù)的一個特點描述。

我們知道,對一門學科的認識,往往是從分類開始的。就像達爾文提出進化論,原始的動機就是將從全世界觀察到的動物和植物進行劃分,形成體系。在分類體系上進行提煉,最終形成了一個全新的世界觀和認識論。我們現(xiàn)在所關(guān)注的網(wǎng)絡(luò)大數(shù)據(jù)、金融大數(shù)據(jù)、科學大數(shù)據(jù)等相關(guān)領(lǐng)域的問題,正像歐洲文藝復(fù)興開始的的時候那樣,從不同領(lǐng)域觀察現(xiàn)象,挖掘價值,而最終我們可能能夠發(fā)現(xiàn)本質(zhì),形成全新的“數(shù)據(jù)認識論”,從而產(chǎn)生本質(zhì)性的價值效應(yīng)。

我個人認為,“大數(shù)據(jù)”更多的體現(xiàn)的是一個認知和思維,它與錢學森先生提倡的“大成智慧學”的要義非常接近。錢老將“大成智慧”翻譯成“WisdominCyberspace”,強調(diào)“必集大成,才能得智慧”。大數(shù)據(jù)從內(nèi)涵來看的四個V的特性,體現(xiàn)出來的是大量的“零金碎玉”,相互之間還有關(guān)聯(lián)性和作用力,但是局部看都非常零散、價值不明顯。所以有了數(shù)據(jù),不等于就有價值、出智慧,出智慧的關(guān)鍵在“集”。大數(shù)據(jù)中包括的全部事實、經(jīng)驗、信息都是“集”的對象和內(nèi)容。采集到的原始數(shù)據(jù)往往是些沒有什么邏輯,不一定能直接用現(xiàn)在掌握的科學技術(shù)解釋,需要集成融合各個側(cè)面的數(shù)據(jù),才能挖掘出前人未知的大價值。每一種數(shù)據(jù)來源都有一定的局限性和片面性,事物的本質(zhì)和規(guī)律隱藏在各種原始數(shù)據(jù)的相互關(guān)聯(lián)之中。只有融合、集成各方面的原始數(shù)據(jù),才能反映事物的全貌。開展大數(shù)據(jù)研究和應(yīng)用,因此,大數(shù)據(jù)不僅僅是一類資源、一類工具,而是一種戰(zhàn)略、認知和文化,要大力推廣和樹立“數(shù)據(jù)方法論”、“數(shù)據(jù)價值觀”。

當然,我們既要抬頭看路,更要腳踏實地。因此,在大數(shù)據(jù)概念滿天飛的時候,我們既要抓住時機,挖掘價值,還要思考本質(zhì),不在混亂的時候迷失方向!

從業(yè)界來看,當前大數(shù)據(jù)系統(tǒng)有三個明顯的特點與我們2013年底發(fā)布的十大趨勢相關(guān)!

【1】大數(shù)據(jù)的高效深度分析需要專用化的系統(tǒng)

在應(yīng)用數(shù)據(jù)快速增長的背景下,為了降低成本獲得更好的能效,大數(shù)據(jù)系統(tǒng)需要逐漸擺脫傳統(tǒng)的通用技術(shù)體系,趨向?qū)S没募軜?gòu)和處理技術(shù)。這方面,國內(nèi)百度、阿里巴巴和騰訊三大互聯(lián)網(wǎng)巨頭做出了嘗試并取得了很好的效果。眾所周知,百度的大數(shù)據(jù)典型應(yīng)用是中文搜索,阿里巴巴的大數(shù)據(jù)典型應(yīng)用是基于交易日志分析的數(shù)據(jù)服務(wù),騰訊的大數(shù)據(jù)典型應(yīng)用是圖片數(shù)據(jù)存儲和基于用戶行為的廣告實時推薦。百度去年底成立專門的大數(shù)據(jù)部門,旨在深度挖掘大數(shù)據(jù)的價值。阿里巴巴已將不同業(yè)務(wù)部門的大數(shù)據(jù)技術(shù)整合在一起為數(shù)據(jù)產(chǎn)品提供統(tǒng)一的服務(wù)。騰訊的數(shù)據(jù)平臺部正在將全公司的數(shù)據(jù)納入統(tǒng)一管理平臺。阿里巴巴在技術(shù)上與開源社區(qū)結(jié)合得最為緊密;騰訊大數(shù)據(jù)目前正在向開源技術(shù)靠攏;百度在技術(shù)層面偏好自行研發(fā),包括軟硬件定制化方案也是最先投入實用。技術(shù)上,他們的共同之處是,不再依賴傳統(tǒng)的IOE,而基于開源系統(tǒng)(如Hadoop等)開發(fā)面向典型應(yīng)用的大規(guī)模、高通量、低成本、強擴展的專用化系統(tǒng)。

【2】大數(shù)據(jù)處理架構(gòu)多樣化模式并存

當前,克隆了Google的GFS和MapReduce的ApacheHadoop自2008年以來逐漸被互聯(lián)網(wǎng)企業(yè)所廣泛接納,并成為大數(shù)據(jù)處理領(lǐng)域的事實標準。但2013年出現(xiàn)的Spark作為一匹黑馬終結(jié)了這一神話,大數(shù)據(jù)技術(shù)不再一家獨大。由于應(yīng)用不同導(dǎo)致Hadoop一套軟件系統(tǒng)不可能滿足所有需求,在全面兼容Hadoop的基礎(chǔ)上,Spark通過更多的利用內(nèi)存處理大幅提高系統(tǒng)性能。此外,Scribe、Flume、Kafka、Storm、Drill、Impala、TEZ/Stinger、Presto、Spark/Shark等的出現(xiàn)并不是取代Hadoop,而是擴大了大數(shù)據(jù)技術(shù)的生態(tài)環(huán)境,促使生態(tài)環(huán)境向良性化和完整化發(fā)展。今后在非易失存儲層面、網(wǎng)絡(luò)通信層面、易失存儲層面和計算框架層面還會出現(xiàn)更多、更好和更專用化的軟件系統(tǒng)。

【3】實時計算逐步受到業(yè)界關(guān)注

Google于2010年推出了Dremel,引領(lǐng)業(yè)界向?qū)崟r計算邁進。實時計算是針對MapReduce這種批量計算的性能問題提出的,可分為流式計算和交互式分析計算兩種模式。在大數(shù)據(jù)背景下,流式計算源于服務(wù)器日志的實時采集,如Facebook開源的Scribe是分布式日志收集系統(tǒng),ApacheFlume是類似的系統(tǒng)。ApacheKafka是高吞吐率的分布式消息系統(tǒng),特點是高通量和容錯。Storm是容錯的分布式實時計算系統(tǒng),可以可靠的處理流式數(shù)據(jù)并進行實時處理,單機性能可達到百萬記錄每秒。Storm可集成ApacheKafka作為其隊列系統(tǒng)。作為批量計算的補充,交互式分析計算的目標是將PB級數(shù)據(jù)的處理時間縮短到秒級。ApacheDrill是開源的Dremel實現(xiàn),雖已有應(yīng)用但尚不成熟。由Cloudera主導(dǎo)的Impala也參照Dremel實現(xiàn),同時還參考了MPP的設(shè)計思想,目前已經(jīng)接近實用階段。Hortonworks主導(dǎo)開發(fā)了TEZ/Stinger,TEZ是運行在YARN(Hadoop2.0的資源管理框架)上的DAG計算框架,而Stinger是下一代的Hive。2013年底,由Facebook開源的Presto分布式SQL查詢引擎可對250PB以上的數(shù)據(jù)進行交互式分析,比Hive的性能高出10倍。類似的Shark是Spark上的SQL執(zhí)行引擎,得益于Shark的列存儲和Spark的內(nèi)存處理等特性,Shark號稱可以比Hive的性能提高100倍。

2、系統(tǒng)支撐下的大數(shù)據(jù)分析技術(shù)

【1】內(nèi)容分析與深度學習

要挖掘大數(shù)據(jù)的大價值必然要對大數(shù)據(jù)進行內(nèi)容上的分析與計算。這其中一個核心問題是如何來對數(shù)據(jù)的進行有效表達、解釋和學習,無論是對圖像、聲音還是文本數(shù)據(jù)。傳統(tǒng)的研究也有很多數(shù)據(jù)表達的模型和方法,但通常都是較為簡單或者淺層的模型,不能獲得好的學習效果。大數(shù)據(jù)的出現(xiàn)提供了使用更加復(fù)雜的模型來更有效地學習數(shù)據(jù)表征、解釋數(shù)據(jù)的機會,深度學習就是這樣一個研究領(lǐng)域,它已經(jīng)在計算機視覺、語音識別等應(yīng)用取得了成功。在國際上,微軟將RBM和DBN引入語音識別中,使得錯誤率相對減低30%;Google的深度學習系統(tǒng)(DistBelief)在獲取數(shù)百萬YouTube視頻數(shù)據(jù)后,能夠精準地識別出這些視頻的關(guān)鍵元素貓。在國內(nèi),2011年科大訊飛首次將DNN技術(shù)運用到語音云平臺,并提供給開發(fā)者使用,并在訊飛語音輸入法和訊飛口訊等產(chǎn)品中得到應(yīng)用。百度成立了IDL(深度學習研究院),專門研究深度學習算法,目前已有超過8項深度學習技術(shù)在百度產(chǎn)品上線。深度學習對百度影響深遠,在語音識別、OCR識別、人臉識別、圖像搜索等應(yīng)用上取得了突出效果。此外,國內(nèi)其它公司如搜狗、云知聲等紛紛開始在產(chǎn)品中使用深度學習技術(shù)。

【2】知識計算

基于大數(shù)據(jù)的知識計算是大數(shù)據(jù)分析的基礎(chǔ)。當前,基于開放網(wǎng)絡(luò)大數(shù)據(jù)構(gòu)建知識庫是國內(nèi)外工業(yè)界開發(fā)和學術(shù)界研究的一個熱點。世界各國各個組織建立的知識庫多達50余種,相關(guān)的應(yīng)用系統(tǒng)更是達到了上百種。其中,有代表性的知識庫或應(yīng)用系統(tǒng)有KnowItAll,TextRunner,NELL,Probase,atori,PROSPERA,SOFIE以及一些基于維基百科等在線百科知識構(gòu)建的知識庫DBpedia,YAGO,Omega,WikiTaxonomy。除此之外,一些著名的商業(yè)網(wǎng)站、公司和政府也發(fā)布了類似的知識搜索和計算平臺,如Evi公司的TrueKnowledge知識搜索平臺美國官方政府網(wǎng)站Data.gov,Wolfram的知識計算平臺wolframalpha,Google的知識圖譜(Knowledgegraph),Facebook推出的類似的實體搜索服務(wù)graphsearch等。在國內(nèi),中文知識圖譜的構(gòu)建與知識計算也有大量的研究和開發(fā)工作。代表性工作有中科院計算所的基于OpenKN(開放知識網(wǎng)絡(luò))的“人立方、事立方、知立方”系統(tǒng),中科院數(shù)學院陸汝鈐院士提出的知件(Knowware),上海交通大學構(gòu)建的中文知識圖譜平臺zhishi.me,百度推出的中文知識圖譜搜索,搜狗推出的知立方平臺,復(fù)旦大學GDM實驗室推出的中文知識圖譜展示平臺等。

【3】在線社會計算

社會媒體計算是大數(shù)據(jù)分析的典型應(yīng)用之一。以Facebook、Twitter、新浪微博等為代表的社會媒體正深刻改變著人們傳播信息和獲取信息的方式,人和人之間結(jié)成的關(guān)系網(wǎng)絡(luò)承載著網(wǎng)絡(luò)信息的傳播,人的互聯(lián)成為信息互聯(lián)的載體和信息傳播的媒介,社會媒體的強交互性、時效性等特點使其在信息的產(chǎn)生、消費和傳播過程中發(fā)揮著越來越重要的作用,成為一類重要信息載體。正因如此,當前社會媒體計算無論在學術(shù)圈和工業(yè)界都備受重視,大家關(guān)注的問題包括有對社交網(wǎng)絡(luò)的分析、網(wǎng)絡(luò)信息傳播的內(nèi)在機理以及社會媒體中的信息檢索與挖掘(包括用戶搜索、用戶關(guān)系挖掘、話題發(fā)現(xiàn)、情感分析等)。在這些面向社會媒體計算的研究中,面對的社交網(wǎng)絡(luò)是一個異常龐大、關(guān)系異質(zhì)、結(jié)構(gòu)多尺度和動態(tài)演化的網(wǎng)絡(luò),通常有億級的節(jié)點,幾十億條連邊,對它的分析、建模和計算不僅需要提出適配這樣的復(fù)雜網(wǎng)絡(luò)的關(guān)系抽象、結(jié)構(gòu)建模和演化計算方法,更關(guān)鍵的也是更基礎(chǔ)的是需要支持這樣大規(guī)模網(wǎng)絡(luò)結(jié)構(gòu)的圖數(shù)據(jù)存儲和管理結(jié)構(gòu),以及高性能的圖計算系統(tǒng)結(jié)構(gòu)和算法,這也催生了當前很多圖數(shù)據(jù)庫和圖計算平臺的產(chǎn)生(如neo4j,GraphLab等)

【4】可視化成為大數(shù)據(jù)分析的熱點

大數(shù)據(jù)引領(lǐng)著新一波的技術(shù)革命,對大數(shù)據(jù)查詢和分析的實用性和實效性對于人們能否及時獲得決策信息非常重要,決定著大數(shù)據(jù)應(yīng)用的成敗。越來越多的企業(yè)在直面紛繁的海量數(shù)據(jù)沖擊時面露難色。一個原因是因為數(shù)據(jù)容量巨大,類型多樣,數(shù)據(jù)分析工具面臨性能瓶頸。另一原因在于,數(shù)據(jù)分析工具通常僅為IT部門熟練使用,缺少簡單易用、讓業(yè)務(wù)人員也能輕松上手實現(xiàn)自助自主分析即時獲取商業(yè)洞察的工具。因此,數(shù)據(jù)可視化技術(shù)正逐步成為大數(shù)據(jù)時代的顯學。對大數(shù)據(jù)進行分析以后,為了方便用戶理解也需要有效的可視化技術(shù),這其中交互式的展示和超大圖的動態(tài)化展示值得重點關(guān)注。如果一個機構(gòu)嘗試邁向大數(shù)據(jù)模式,那么一定要有相當分量的數(shù)據(jù)可視化投入。

總結(jié):系統(tǒng)支撐下的大數(shù)據(jù)分析技術(shù),從學界的關(guān)注點以及業(yè)界的突破點來看,當前可以總結(jié)為四個特點:“深度學習提高精度”、“知識驅(qū)動提高深度”、“社會計算與仿社會計算促進認知”、“可視化與分析算法互為因果”。當然,數(shù)據(jù)分析技術(shù)解決的問題還是如何有效的挖掘和利用數(shù)據(jù)價值。

3、關(guān)于中國大數(shù)據(jù)生態(tài)系統(tǒng)的基礎(chǔ)問題思考

【1】建立良性生態(tài)環(huán)境的目標

針對國家安全、社會經(jīng)濟等領(lǐng)域的數(shù)據(jù)化生存與競爭的需求,我們需要切實解決網(wǎng)絡(luò)化數(shù)據(jù)社會與現(xiàn)實社會缺乏有機融合、互動以及協(xié)調(diào)機制的難題,形成大數(shù)據(jù)感知、管理、分析與應(yīng)用服務(wù)的新一代信息技術(shù)架構(gòu)和良性增益的閉環(huán)生態(tài)系統(tǒng),達到大幅度提高數(shù)據(jù)消費指數(shù)、數(shù)據(jù)安全指數(shù),降低數(shù)據(jù)能耗指數(shù)等目標。我們認為,建立良性的大數(shù)據(jù)生態(tài)系統(tǒng)是有效應(yīng)對大數(shù)據(jù)挑戰(zhàn)關(guān)鍵問題,需要科技界、產(chǎn)業(yè)界以及政府部門在國家政策的引導(dǎo)下共同努力,通過轉(zhuǎn)變認識、消除壁壘、建立平臺,突破技術(shù)瓶頸等途徑,建立可持續(xù)、和諧的大數(shù)據(jù)生態(tài)系統(tǒng)。

【2】評價先行,提出考量大數(shù)據(jù)生態(tài)的三大指數(shù),包括數(shù)據(jù)消費指數(shù)、數(shù)據(jù)能效指數(shù)、數(shù)據(jù)安全指數(shù)。

1)數(shù)據(jù)消費指數(shù):

數(shù)據(jù)消費指數(shù)是指使用或者消費的數(shù)據(jù)占產(chǎn)生的數(shù)據(jù)的比例,旨在衡量數(shù)據(jù)消費的能力。當前由大數(shù)據(jù)引發(fā)的新產(chǎn)品、新服務(wù)、新業(yè)態(tài)大量涌現(xiàn),不斷激發(fā)新的消費需求,成為日益活躍的消費熱點。然而,數(shù)據(jù)消費指數(shù)受到多方面發(fā)展狀態(tài)的制約,包括數(shù)據(jù)開放和互通程度、大數(shù)據(jù)分析技術(shù)、智能訪問終端的普及、數(shù)據(jù)服務(wù)基礎(chǔ)設(shè)施的建設(shè)、數(shù)據(jù)服務(wù)新興產(chǎn)業(yè)的發(fā)展等等。當前大數(shù)據(jù)消費指數(shù)低,美國NSA聲稱只是掃描1.6%的全球網(wǎng)絡(luò)流量(約29.21PB),分析其中0.025%的數(shù)據(jù)來支持其分析和決策。我國數(shù)據(jù)消費面臨基礎(chǔ)設(shè)施支撐能力有待提升、產(chǎn)品和服務(wù)創(chuàng)新能力弱、市場準入門檻高、行業(yè)壁壘嚴重、機制不適應(yīng)等問題,亟需采取措施予以解決。

2)數(shù)據(jù)能效指數(shù):

數(shù)據(jù)能效指數(shù)是指大數(shù)據(jù)處理中的價值能耗比例,是衡量大數(shù)據(jù)價值獲取的綠色指數(shù)。當前面對大數(shù)據(jù),通常采取基于數(shù)據(jù)中心的粗放式的分析處理和價值提煉方式,導(dǎo)致數(shù)據(jù)能效低下。一方面,由于缺乏適應(yīng)大數(shù)據(jù)的計算模式,往往采取集中式全量處理方式,導(dǎo)致數(shù)據(jù)處理效率低,獲取單位價值所需的數(shù)據(jù)規(guī)模非常龐大,形成了大數(shù)據(jù)價值密度低的現(xiàn)象;另一方面,為了適應(yīng)大數(shù)據(jù)爆炸式的增長,數(shù)據(jù)中心存儲系統(tǒng)的容量、擴展能力、傳輸瓶頸等方面面臨巨大挑戰(zhàn),直接結(jié)果就是數(shù)據(jù)中心的能耗越來越大。有關(guān)調(diào)查顯示在過去5年全球數(shù)據(jù)中心的能耗增長率是56%,我國對數(shù)據(jù)中心流量處理能力的需求增長更快,數(shù)據(jù)中心能耗的問題就更加突出。目前國內(nèi)數(shù)據(jù)中心的PUE平均值基本都在2.5以上,與歐美地區(qū)的PUE(能源使用效率)普遍值1.8以下還存在著較大的差距。且目前其全球的數(shù)據(jù)中心50%是完全用自然冷卻的,前十大數(shù)據(jù)中心的PUE都在1.2以下。因此數(shù)據(jù)能效指數(shù)是在大數(shù)據(jù)發(fā)展中必須面對的,關(guān)乎國家能源消耗的重要指數(shù)。

3)數(shù)據(jù)安全指數(shù):

數(shù)據(jù)安全指數(shù)包括了數(shù)據(jù)從創(chuàng)建、傳輸、存儲到分析的全生命周期的安全指標,旨在衡量數(shù)據(jù)安全、隱私保護等方面的能力。數(shù)據(jù)安全是一個囊括個人,企業(yè)和國家的全方位的大數(shù)據(jù)安全體系。從個人層面,大數(shù)據(jù)對于隱私將是一個重大挑戰(zhàn),哈佛大學近期的一項研究顯示,只要知道一個人的年齡、性別和郵編,從公開的數(shù)據(jù)庫中便可識別出該人87%的身份。對于企業(yè),數(shù)據(jù)作為一種資產(chǎn),其安全保護問題十分重要,隨著大數(shù)據(jù)的不斷增加,對數(shù)據(jù)存儲的物理安全性要求會越來越高,從而對數(shù)據(jù)的多副本與容災(zāi)機制提出更高的要求。而在國家層面,來自外部的威脅在大數(shù)據(jù)時代顯然比以往更加突出和危險。舉世矚目的“維基解密”和“棱鏡”事件生動昭示著大數(shù)據(jù)的嚴酷挑戰(zhàn)。“維基解密”幾次泄露美國軍事外交等機密,規(guī)模之大,影響之廣,震驚全球。“棱鏡”事件向全世界曝光出網(wǎng)絡(luò)空間國家與個人,國家與國家之間的安全對抗。因此評估數(shù)據(jù)安全指數(shù),有利于推動大數(shù)據(jù)安全體系的完善,提升國家、社會和個人的信息安全。

1.如何建立支撐數(shù)據(jù)密集型科學發(fā)現(xiàn)新范式的基礎(chǔ)設(shè)施:這包括了建立一系列通用的工具,以支撐從數(shù)據(jù)采集、驗證到管理、分析和長期保存等整個流程,支持跨工具、跨項目、跨領(lǐng)域的數(shù)據(jù)共享與整合,將是支持數(shù)據(jù)密集型科學發(fā)現(xiàn)的基礎(chǔ)問題。

2.如何建立數(shù)據(jù)全生命周期的計算模型:研究以數(shù)據(jù)為中心的新型計算架構(gòu),將計算推送到數(shù)據(jù)從獲取、存儲、處理、交換到服務(wù)的全生命周期的各個部分,研究數(shù)據(jù)全生命周期中不同計算之間的關(guān)聯(lián)、互動和共享機制,在提高數(shù)據(jù)消費能力的同時有效降低數(shù)據(jù)計算能耗,形成數(shù)據(jù)安全體系,這是大數(shù)據(jù)計算的關(guān)鍵問題。

3.如何完成數(shù)據(jù)資產(chǎn)化和形成數(shù)據(jù)資產(chǎn)流轉(zhuǎn)體系:亟需建立數(shù)據(jù)資產(chǎn)化的基本標準,讓不同機構(gòu)、不同領(lǐng)域的數(shù)據(jù)形成規(guī)范化資產(chǎn);建立數(shù)據(jù)資產(chǎn)訪問、連接和共享機制,搭建數(shù)據(jù)資產(chǎn)交易平臺,形成數(shù)據(jù)流轉(zhuǎn)的層次化體系結(jié)構(gòu);研究數(shù)據(jù)資產(chǎn)的所有權(quán)、使用權(quán)以及價值評估體系,通過市場化模式保障數(shù)據(jù)資產(chǎn)流轉(zhuǎn)的可行性。

原文:程學旗:“大數(shù)據(jù)”相關(guān)產(chǎn)學研實踐后的思考與小結(jié)

[責任編輯:邵海宏]
IT邵年
近日,王石在接受記者采訪的時候談到了互聯(lián)網(wǎng),也談到了大數(shù)據(jù)對傳統(tǒng)行業(yè)的顛覆。
官方微信
weixin
精彩專題更多
存儲風云榜”是由DOIT傳媒主辦的年度大型活動。回顧2014年,存儲作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動信息產(chǎn)業(yè)發(fā)展的核心動力,存儲產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟的概念順勢而為的提出。
華為OceanStor V3系列存儲系統(tǒng)是面向企業(yè)級應(yīng)用的新一代統(tǒng)一存儲產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計算等各種應(yīng)用下的數(shù)據(jù)存儲需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會
 

公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.