中國移動通信研究院的孫少陵

照例,以下附上演講全文,這里有更多細(xì)節(jié):

主持人:接下來的報告原本由中國通信研究院黃曉慶院長做報告,但是他由于有緊急的事情委托孫少陵所長做這個報告,題目是大數(shù)據(jù)實時處理技術(shù)發(fā)展趨勢及中國移動實踐和展望。有請孫少陵所長。

孫少陵:各位領(lǐng)導(dǎo)各位來賓非常高興有這樣一個機會跟業(yè)界的專家,包括國外和國內(nèi)的分享一下我們中國移動在大數(shù)據(jù)這方面的一些觀點,以及我們中國移動的一些實踐。這次本來黃曉慶非常想親自來跟大家互動,但是由于公司有一個很緊急的決策會,他也是讓我在這里向大家表示一個歉意。中國移動是全球最大的一個運營商,這里我們其實很關(guān)注整個互聯(lián)網(wǎng)在移動方面的發(fā)展。當(dāng)然從目前來看全世界范圍里面IT發(fā)展最熱門三個詞,第一個就是移動互聯(lián)網(wǎng)、第二云計算,第三個大數(shù)據(jù)。我們看一下移動互聯(lián)網(wǎng)目前的發(fā)展趨勢?正好比較巧昨天是工信部正式向中國移動、中國聯(lián)通、中國電信三家發(fā)布了4G的牌照,也意味著中國正式啟動了4G無線寬帶的時代。全球移動互聯(lián)網(wǎng)用戶數(shù)的增長,應(yīng)該說非常快,比固定互聯(lián)網(wǎng)增速高三倍。

第二我們看一下流量增長的情況,移動互聯(lián)網(wǎng)流量增長的速度也是非??欤?012年底移動互聯(lián)網(wǎng)流量占比超過整個互聯(lián)網(wǎng)13%。實際上再看一個數(shù)字這個比較有意思對我們公司影響也比較大,在現(xiàn)代手機端移動通信里面現(xiàn)在出現(xiàn)了一個二八的分布,原來傳統(tǒng)概念上手機首先打電話發(fā)短信的,但是實際上現(xiàn)在用戶使用移動互聯(lián)網(wǎng)上網(wǎng)的業(yè)務(wù)和傳統(tǒng)的通信業(yè)務(wù),也就是我們打電話和發(fā)短信這個時間比變成了八比二的關(guān)系,移動使用移動通信使用我們手機最主要工作實際上在使用互聯(lián)網(wǎng)而不是傳統(tǒng)的通信業(yè)務(wù)。這個對于運營商來講我們直接帶來的影響就是說傳統(tǒng)上的話,我們通信業(yè)務(wù)是帶來我們價值的一個最大的部分,現(xiàn)在我們變成主要提供流量的一個運營商。從提供流量和從提供話音短信的價值來看這個我們做了一個測算,也就是說移動通信網(wǎng)它的話音投入產(chǎn)出比大概是流量數(shù)據(jù)投入產(chǎn)出比的5到6倍,所以對移動運營商來說直接的挑戰(zhàn),就是我用什么樣方式,彌補我原來在電話和短信上流失的價值。我覺得不管是云計算還是大數(shù)據(jù)還是移動互聯(lián)網(wǎng)某種意義上來說給移動運營商都帶來了一個機遇,如何抓住這個機遇運營商還需要有很多事情要做。

4G和我們所說的物聯(lián)網(wǎng)其實這兩個東西對整個我們移動通信的數(shù)據(jù),它的這種增長帶來了非常大的促進作用,首先就是說移動通信4G的帶寬基本上可以達到50到100兆,其實不久將來我們諸位在任何地方使用手機,使用移動網(wǎng)絡(luò)的感覺就跟你在家里使用wifi是一樣的。所以說移動通信帶寬迅速放大實際上給整個流量的增長帶來了很大的推動作用。

第二就是說M2M,物聯(lián)網(wǎng)這個東西這個概念,某種意義來說把社會信息化觸角可以延伸到任何一個角落。某種意義來說通信主體更多是人,現(xiàn)在很多東西包括我們平時在生產(chǎn)過程當(dāng)中使用的一些裝備,包括我們監(jiān)測交通、監(jiān)測天氣等等這樣的話都是有M2M的設(shè)備不斷的采集各種各樣的信息。這里也有一個預(yù)測數(shù)據(jù)就是說到2014年的時候M2M它的這種設(shè)備就是這種物聯(lián)網(wǎng)的終端設(shè)備跟智能終端的設(shè)備基本上數(shù)量持平,某種意義上來說我們談大數(shù)據(jù),其實這兩個趨勢為大數(shù)據(jù)帶來的一些變化值得大家去關(guān)注。

談到大數(shù)據(jù)實際上我覺得大部分公司首先想到互聯(lián)網(wǎng)公司,實際上互聯(lián)網(wǎng)公司實質(zhì)上就是數(shù)據(jù)公司。像百度在前兩天我在另外一個會上他們給我一個數(shù)據(jù),就是說它的數(shù)據(jù)量現(xiàn)在大概有一千個PB的規(guī)模,每天處理幾十個PB,互聯(lián)網(wǎng)公司在數(shù)據(jù)利用上面走得很快,它真正通過數(shù)據(jù)的利用產(chǎn)生價值,顛覆了很多傳統(tǒng)產(chǎn)業(yè),某種意義上不是和傳統(tǒng)行業(yè)在既有商業(yè)模式下競爭,通過對數(shù)據(jù)的把握,數(shù)據(jù)的挖掘通過變通的方式獲取價值。我們對互聯(lián)網(wǎng)的數(shù)據(jù)關(guān)注比較多。我們有時候忽略運營商和網(wǎng)絡(luò)公司真正在冰山下面藏有巨大的數(shù)據(jù)資源。像程學(xué)旗老師發(fā)布的今年幾大趨勢,其實大家第一大關(guān)注是網(wǎng)絡(luò)趨勢,整個業(yè)界正在意識到這一點,我們網(wǎng)絡(luò)里面有什么樣的數(shù)據(jù)?對于一個運營商來說我們有什么網(wǎng)絡(luò)?我們有傳輸網(wǎng)絡(luò),有有線和無線的接入網(wǎng)絡(luò),我們叫四網(wǎng)協(xié)同,中國移動WIFI的數(shù)量全國三四百萬的水平,wifi每天傳輸非常多的數(shù)據(jù),這些數(shù)據(jù)是不是有價值,確實我們值得研究值得挖掘,這些數(shù)據(jù)對我們網(wǎng)絡(luò)優(yōu)化,業(yè)務(wù)創(chuàng)新,精準(zhǔn)營銷,還有一些決策支持做出一些工作。

電信運營商我們傳統(tǒng)提供管道的,正是因為所有的數(shù)據(jù)流經(jīng)管道,實際上我們具有很大數(shù)據(jù)挖掘潛在的能力。對目前來說運營商數(shù)據(jù)來商業(yè)利用主要有三個大方面。一、改善用戶體驗。二、助力市場決策。三、優(yōu)化網(wǎng)絡(luò)質(zhì)量。用戶體驗運營商要向互聯(lián)網(wǎng)學(xué)習(xí),運營商都在提供增值業(yè)務(wù),就是互聯(lián)網(wǎng)業(yè)務(wù),中國移動有飛信有音樂還有139郵箱等等,我們在傳統(tǒng)的產(chǎn)品設(shè)計和系統(tǒng)的優(yōu)化UI交互式的優(yōu)化方面,其實我們還用一些比較傳統(tǒng)的手段,比如說找客戶做市場調(diào)研之類的?;ヂ?lián)網(wǎng)公司我發(fā)現(xiàn)他們很少做這個事情,用戶每天對你的訪問,對你數(shù)據(jù)里的數(shù)據(jù)能發(fā)掘社會很多的特征,挖掘出他的消費取向,這個為你產(chǎn)品設(shè)計帶來最真實第一手的資料。這一點運營商也在變化,我們通過對于數(shù)據(jù)的分析,統(tǒng)計、分析、挖掘來進行我們業(yè)務(wù)推薦,客服,建立知識庫為整個我們產(chǎn)品的創(chuàng)新去提供一些支撐。

第二比較大的方面就是市場的這種營銷的一個支撐。我們運營商有幾類數(shù)據(jù),比如說用戶帳號,現(xiàn)在基本上手機都是實名制,實際上用戶在運營商登記的帳號信息有你年齡性別等等是比較真實最基礎(chǔ)的數(shù)據(jù)。第二協(xié)議類型,這里說協(xié)議類型就是指套餐,你使用什么業(yè)務(wù),你是使用流量高的還是話音高的,你使用每月消費量多少,其實這里面可以體現(xiàn)出很多東西,比如說你消費能力,一個月消費10塊錢和一個月消費一千塊錢的用戶,消費能力肯定不一樣,這種消費能力延伸開了可以幫助你做其他方面業(yè)務(wù)營銷的支撐。還有業(yè)務(wù)類型,比如說這個用戶選擇中國移動的游戲類或者說閱讀類,音樂類,其實這里都代表他個人一些興趣愛好,他的一些特點和取向。

第四個訪問的URL,用戶經(jīng)常看什么網(wǎng)站?比如說經(jīng)??大w育類的網(wǎng)站,這里我們就會發(fā)現(xiàn)這個用戶可能對體育類的產(chǎn)品和相關(guān)服務(wù)會有興趣。還有終端信息,因為我們實際上在網(wǎng)絡(luò)上可以通過各種渠道獲取用戶在使用什么樣的終端。這個終端信息一方面來說對我們自己做業(yè)務(wù)來說非常重要,因為每個終端的能力不一樣,每個終端的特征不一樣,就是每個終端適合使用的業(yè)務(wù)不一樣。第二我們中國移動也有自己的終端公司,什么樣終端好賣?用戶喜歡終端什么樣的功能?什么樣的特征?對我們自己使用開發(fā)終端也有價值。還有上行下行的流量,通過這些數(shù)據(jù)首先我們可以分析流量,就是說我所有的業(yè)務(wù)在所有網(wǎng)絡(luò)當(dāng)中流量流向變化情況,這里面也許蘊藏一些某種信息。比如說什么地方發(fā)生了一個比較大的事件。舉個例子前一段時間四川的地震,我們四川那邊電話局立馬附和飛速的往上漲,流量流向可以通過這個發(fā)現(xiàn)。用戶行為的分析,他偏好,移動通信有位置信息,地理信息,手機號碼是你注冊地,我既知道你到底常駐在什么地方,我又知道你經(jīng)常漫游在什么地方,所以這方面數(shù)據(jù)非常有意思。第三就是流量一些清帳單的查詢,用戶對我流量消費非常關(guān)注,他希望有詳細(xì)的上網(wǎng)記錄可以查詢之類的,這個為了提供用戶透明消費支持我們做一些這方面工作。

第三個比較大的方面是優(yōu)化網(wǎng)絡(luò)質(zhì)量,運營商我們一直強調(diào)我們服務(wù)是電信級,全年我們故障率我們可靠性在五個九,五個九是電信級的標(biāo)準(zhǔn),意味著一旦這個系統(tǒng)發(fā)生故障在幾十分鐘的水平就是線網(wǎng)的重大故障,這個重大故障就要升級到主管單位進行報告。對中國移動來說我們李銳總說過一句話質(zhì)量就是生命線,我們實時發(fā)現(xiàn)我們網(wǎng)絡(luò)故障解決我們網(wǎng)絡(luò)故障是我們很重要的工作。中國移動很大一部分比重員工在做線網(wǎng)的監(jiān)控,線網(wǎng)監(jiān)控一方面比較耗人,第二目前網(wǎng)絡(luò)結(jié)構(gòu)越來越復(fù)雜,層次越來越多,一旦發(fā)生故障到底出在什么地方很難查找。大規(guī)模的數(shù)據(jù)挖掘其實我們可以幫助我們做網(wǎng)絡(luò)的故障定位和故障排查。我IP網(wǎng)我無線網(wǎng)送上來大量的日志數(shù)據(jù),這個日志數(shù)據(jù)通過我們模型建立做分析確實對網(wǎng)絡(luò)運營成本有比較大的降低。在運營商的實踐過程當(dāng)中也就是今天我們要講的主題,我們對數(shù)據(jù)挖掘,數(shù)據(jù)處理,數(shù)據(jù)分析的實時性我們感覺需求越來越迫切。這里頭實際上咱們談大數(shù)據(jù)的概念經(jīng)常說幾個V,我們不想老生常談幾個V的問題,根據(jù)數(shù)據(jù)量,數(shù)據(jù)動態(tài)我們總結(jié)出來什么叫實時處理,數(shù)據(jù)的實時處理實時分析到底我們想關(guān)注什么特點?在這我們對實時處理有個廣義的定義。

第一個實時這種流式數(shù)據(jù)的處理,數(shù)據(jù)有動態(tài)產(chǎn)生的特征,這是大數(shù)據(jù)的特點。這種數(shù)據(jù)動態(tài)產(chǎn)生我不能等到批量產(chǎn)生批量處理,我很多數(shù)據(jù)稍縱即逝跟位置和時間關(guān)聯(lián)性非常強,我必須及時處理,來了數(shù)據(jù)處理,處理完馬上送上去,也許我馬上使用,流式處理在解決這樣的問題。

第二對于海量數(shù)據(jù)的快速處理。要實現(xiàn)這種交互式。我們現(xiàn)在有些省公司實際上做整個公司的生產(chǎn)分析的時候不再依賴大家下去花好幾天時間整一個報告把數(shù)據(jù)報上來,而是說它有一套系統(tǒng),這個系統(tǒng)里面你可以看到當(dāng)月所有生產(chǎn)的數(shù)據(jù),KPI數(shù)據(jù),他的收入,用戶增量,流失量可以上篡下取挖掘到我每個小區(qū)帶來多少收入,每個地市、縣區(qū)、每個基站帶來多少收入,流量是多少。這個需要一個快速海量處理。對于大量的IO操作限制了對于交互式的快速反應(yīng)?,F(xiàn)在圖計算更多是通過消息而不是通過IO的文件方式做數(shù)據(jù)處理。像內(nèi)存式的計算結(jié)合很多新的系統(tǒng),像SLD、CSIO這些東西,可以在這方面做很大提升。

我們內(nèi)部把云計算和大數(shù)據(jù)放在一塊說的,在中國移動我們傳統(tǒng)體系架構(gòu)里面,我們很大程度上依賴于昂貴商用的硬件和商用的軟件,我們現(xiàn)在交易數(shù)據(jù)庫還有分析型的數(shù)據(jù)庫大量使用甲骨文、DB2等商業(yè)數(shù)據(jù)庫。使用小型機服務(wù)器,像EMC昂貴盤陣的系統(tǒng)。這種架構(gòu)實際上存在幾個問題,第一個在結(jié)構(gòu)化處理能力方面是不足的,在非結(jié)構(gòu)化處理方面不足,第二系統(tǒng)成本非常高,中國移動小機的數(shù)量有可能PC數(shù)量還高。第三硬件平臺的兼容性很差,惠普的硬件跟IBM的系統(tǒng),像甲骨文的Spark的平臺,沒有辦法做無縫的跨平臺。第四個擴展性,傳統(tǒng)的系統(tǒng)都是屬于TB級系統(tǒng),支持PB級分析交易能力是有限的。所謂云計算中國移動認(rèn)為你要把這種商用的硬件盡量用消費級的產(chǎn)品,就是說我們像X86、還有RM等等這樣一些PC服務(wù)器用它代替,把整個系統(tǒng)的架構(gòu)改成橫向擴展的方式。整個系統(tǒng)上來說我覺得像links開源的系統(tǒng)會使用,會支持上萬級PB數(shù)據(jù)的交互和分析。

在Hadoop正式發(fā)布06年9月份之后半年時間我們啟動了相關(guān)研發(fā)工作,在國內(nèi)介入Hadoop比較早,后面我們也在不斷的進行跟蹤,也參與每年在美國的Hadoop會議,同時我們在Hadoop社區(qū)這種開源社區(qū)目前積極提交提案。的確就是說人員有限,所以在這方面實際上我們提的比較早,但是比很多互聯(lián)網(wǎng)的公司等等我覺得確實現(xiàn)在我們應(yīng)該說研究上還有一定的差距。為了支持云計算和大數(shù)據(jù)的研究和開發(fā),目前我們實驗室里把這個系統(tǒng)應(yīng)該擴到一千多個節(jié)點,我們從2009年開始基本上我們保持一千多個節(jié)點服務(wù)器來真正做這種大數(shù)據(jù)的實際海量和性能這方面的一些考驗。

中國移動實際上大云產(chǎn)品,融合了云計算和大數(shù)據(jù)兩方面的工作,大數(shù)據(jù)方面我們關(guān)注不僅是說分析型的產(chǎn)品同時關(guān)注交易型的產(chǎn)品。我們分析型產(chǎn)品目前主要基于Hadoop,在Hadoop這塊我們目前結(jié)合自己需求做中國移動的分支BCHadoop,我們現(xiàn)在把BCHadoop也做了一個開源,在今年CCF的創(chuàng)業(yè)大賽上,我們中國移動出的這兩道題基本上在中國移動BCHadoop上去進行實現(xiàn)。這方面其實我們在Hadoop基礎(chǔ)之上做了CKOO支持這方面加強,做了一個數(shù)據(jù)倉庫,同時我們也做了一個數(shù)據(jù)挖掘系統(tǒng),我們BCPDM起步比HAMA要走,應(yīng)該說它和HAMA特征上各有優(yōu)勢,HAMA在推薦算法比較強,我們PDM主要基于中國移動自己經(jīng)營需求做了分類規(guī)則分類等等的方法,在社區(qū)文本挖掘都做了相關(guān)算法和工具,在搜索引擎這些我們做了一些工作。

在交易類的產(chǎn)品目前我們在內(nèi)存的數(shù)據(jù)庫上,內(nèi)存的KIH還有流式計算,還有分布式的交易數(shù)據(jù)庫等這部分我們都在開發(fā),也在線網(wǎng)做了試點,這方面我們借鑒像淘寶等等互聯(lián)網(wǎng)公司的經(jīng)驗。我們昨天在中國移動互聯(lián)網(wǎng)國際研討會說我們正式發(fā)布了大云2.5版本,當(dāng)時江西公司做了一個應(yīng)用案例的分享。他們用了大云我們RDM并行分布式交易數(shù)據(jù)庫如何解決我們線網(wǎng)綜合查詢和終端的精準(zhǔn)消息存儲的支持。

運營上在大數(shù)據(jù)的使用上面我們都會做一些什么樣的工作?第一個在網(wǎng)絡(luò)優(yōu)化方面,前面也說了一些,在移動互聯(lián)網(wǎng),或者說寬待移動通信的時代,我們現(xiàn)在很重要的一個線網(wǎng)的需求,就是說你隨時要把握線網(wǎng)流量和流向的變化。比如說我們現(xiàn)在2G網(wǎng)絡(luò)是承載我們目前最主要的這種數(shù)據(jù)流量,但是2G網(wǎng)絡(luò)實際上肯定是說它這種數(shù)據(jù)承載的能力比較差是窄帶通信的系統(tǒng),同時造價很昂貴,現(xiàn)在主要承載我們話音的業(yè)務(wù)。所以說我們整個系統(tǒng)規(guī)劃、系統(tǒng)維護怎么平衡我四張網(wǎng)絡(luò),LTE、wifi等網(wǎng)絡(luò),怎么把網(wǎng)絡(luò)引到成本最低,價值最高的網(wǎng)絡(luò)上,實現(xiàn)我們綜合價值的最大化。這個要求我們實時對全網(wǎng)百萬個以上的基站和幾百萬的AP進行快速的監(jiān)控,我要監(jiān)控每天的變化,有些基站變成熱點基站,流量壓力非常大,采取擴容或者采取網(wǎng)絡(luò)參數(shù)調(diào)整的方式,把流量做一些引導(dǎo)。其實目前我們通常使用的方式把整個一個城域去劃成方格,然后定期采集和分析。這里需要工作我首先數(shù)據(jù)采集要快,這需要用到流計算的技術(shù),這里面有一個細(xì)節(jié),可能搞移動專家比較清楚,為了保護用戶安全性和隱私性,實際上我們在用戶不管是通話還是數(shù)據(jù)建立過程當(dāng)中,我沒有一直使用用戶SIM卡里面的EMC,我們定期分配一個PMC是一個臨時的ID,記錄你通話某一時段的動作。我這個跟用戶或者跟終端不是整個一一對應(yīng),過了一段時間網(wǎng)絡(luò)重新分配這個就變了。為什么我要及時處理,實時處理,流式計算必須保證在整個沒有變化的過程當(dāng)中,你要把EMC記錄下來,這個EMC對應(yīng)電話號碼,后續(xù)我處理就會精細(xì)到每個用戶,像數(shù)據(jù)采集數(shù)據(jù)合成我們需要一些數(shù)據(jù)庫。剛才專家們提到一些內(nèi)存,還有高性能分布式計算的技術(shù)要把網(wǎng)絡(luò)的擁塞情況和這種狀況盡快形成報告,報給我們運行維護部門。這個主要是我們網(wǎng)絡(luò)方面的應(yīng)用。

第二精準(zhǔn)營銷方面,實際上隨著現(xiàn)在在移動通信和移動互聯(lián)網(wǎng),現(xiàn)在確實市場競爭很激烈的?,F(xiàn)在移動運營商,像中國移動提出來一個微營銷,微營銷就是要關(guān)注你每一個用戶的特點。我營銷動作要根據(jù)每一個不同用戶進行差異化。我們基礎(chǔ)必須有一個大數(shù)據(jù),對用戶進行精確的畫像,對線網(wǎng)發(fā)生動作及時采集快速反映。這里舉幾個案例,像位置類的業(yè)務(wù),我們運營商經(jīng)常有時候會在某一些營業(yè)廳有特定終端的優(yōu)惠套餐,這樣回饋用戶的營銷活動。比如說有一個用戶移動到離營業(yè)廳比較近的小區(qū),從我們市場部門希望給用戶推送一個消息,告訴你說我營業(yè)廳正在做某一個業(yè)務(wù)的推薦。當(dāng)然做這個事情的前提你不能沒事去給用戶推送這些消息,因為現(xiàn)在大家對垃圾短信很反感,所以你怎么知道這個用戶對你終端和套餐感興趣,這需要有后臺處理和挖掘的工作。比如說這個用戶目前使用終端類型是什么?過往幾年使用的終端是什么?某種意義上可以透露這個用戶是不是特定某一個品牌的忠實粉絲。還有最近這個用戶是不是在網(wǎng)上游覽跟這個特定手機相關(guān)的網(wǎng)站,所有這些東西其實有可能讓我們了解這個用戶會不會對三星和蘋果的手機感興趣。同時它要發(fā)現(xiàn)這個用戶經(jīng)過我的小區(qū)在很好時機把這個消息推送下去,他要走到別的地方這個消息最佳時機就失去了,這是實時分析實時采取動作一個典型的案例。

還有一個案例比如說像有一些用戶他經(jīng)常出差去某一個地方,我們有兩城一家的套餐,你定這個套餐整個漫游費長途費沒有了,對這些用戶你要有識別。這個用戶經(jīng)常到某一個城市,他在機場開機你可以推送一個消息告訴他說這個套餐可以為你省錢。我們還有很多目前新的業(yè)務(wù),比如說中國移動去年推出的靈犀,實際上是用戶人機對話的系統(tǒng),某種意義上有點像自動化的客服系統(tǒng),這個系統(tǒng)用了云識別,實際上后臺有一個比較大的數(shù)據(jù)庫,這個需要我們把很多知識結(jié)構(gòu)化,然后在后臺能夠快速為用戶提出的問題找到相關(guān)的答案。

還有物聯(lián)網(wǎng),物聯(lián)網(wǎng)剛才我們說了它實際上每天都在送大量的信息,這些信息我怎么快速的處理,快速的形成這個動作。比如說我們在無錫那邊做過太湖藍藻的監(jiān)測物聯(lián)網(wǎng)應(yīng)用,它需要對數(shù)據(jù)實時的采集實時的處理。中國移動在國內(nèi)國外開源和標(biāo)準(zhǔn)化方面做了很多工作,就是跟Hadoop相關(guān)主要我們現(xiàn)在建立了一個開源社區(qū)。最主要原因是什么?運營商在使用Hadoop的時候往往有它自己的一些特點。這些需求如果要通過主線滿足的話周期很長的,所以我們希望有些東西我們自己根據(jù)我們需求先去實現(xiàn)。我們開源社區(qū)目前主要參與單位是中國移動一些合作伙伴,華為、亞聯(lián)等等這樣一些公司。我們首先把一些線網(wǎng)急需的需求在我們自己分支里面實現(xiàn),同時我們推動主線逐漸的把它默植進去。

最后我們對大數(shù)據(jù)的展望,其實大數(shù)據(jù)的未來是機器智能,也就是說目前我們機器更多是解放了我們手和腳,未來怎么樣讓它更多幫我們思想,這件事情是我們認(rèn)為真正大數(shù)據(jù)未來發(fā)展終極的目標(biāo)?,F(xiàn)在像谷歌等等他們在dpling做了很多公司,像人機交互、語音識別也是大數(shù)據(jù)廣義的范疇,通過機器來學(xué)習(xí)知識,把數(shù)據(jù)形成知識,知識變成智能,真正給我們社會信息化做出推動的作用。以上是我們這邊分享的一些觀點,不成熟還是希望跟大家探討批評指教。

分享到

yangjin

相關(guān)推薦