圖 微軟亞太研發(fā)集團(tuán)首席技術(shù)官 孫博凱(Prakash)
兩個(gè)月后,在北京舉辦的TechEd 2012 微軟技術(shù)大會(huì)上,微軟亞太研發(fā)集團(tuán)首席技術(shù)官孫博凱(Prakash)詳細(xì)介紹了微軟的大數(shù)據(jù)解決方案,其可以快速從數(shù)據(jù)庫中抽取三個(gè)類型的數(shù)據(jù):結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)(視頻、地圖、圖片等)和流式數(shù)據(jù)(各種傳感器、自媒體如微博等來源的數(shù)據(jù)),并在此基礎(chǔ)上幫助數(shù)據(jù)實(shí)現(xiàn)統(tǒng)一的管理與分析。在他看來,對(duì)于大數(shù)據(jù)應(yīng)用而言,一個(gè)重要的方向就是:打通SQL-MapReduce之間,不同數(shù)據(jù)倉庫,不同來源數(shù)據(jù)流動(dòng)的通路,讓數(shù)據(jù),尤其是結(jié)構(gòu)化數(shù)據(jù)以外的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),可以在各類數(shù)據(jù)庫和數(shù)據(jù)倉庫上統(tǒng)一,真正為數(shù)據(jù)分析師、運(yùn)營團(tuán)隊(duì)、管理層等數(shù)據(jù)使用者服務(wù),實(shí)現(xiàn)真正透明的底層技術(shù),指導(dǎo)營銷方向,進(jìn)行決策支持。
支持Hadoop,發(fā)布HDInsight,只是微軟的第一個(gè)動(dòng)作。大數(shù)據(jù),注定是一個(gè)浩大的工程。
大數(shù)據(jù):管理、豐富與洞察
在此工程中,孫博凱認(rèn)為有三個(gè)必要步驟:即數(shù)據(jù)的管理、豐富和洞察。為了加深理解,孫博凱利用美國汽油和汽車銷售車型之間的對(duì)應(yīng)關(guān)系來舉例。“美國油價(jià)比中國油價(jià)波動(dòng)大很多。油價(jià)持續(xù)走高時(shí),節(jié)能型車型如混合動(dòng)力車銷售就高,油價(jià)降低時(shí),高耗油車型如SUV就暢銷。從不同的曲線中,汽車廠商通過不同數(shù)據(jù)量化銷售狀況,獲得洞察力,提前作出生產(chǎn)安排,競爭中占據(jù)更多優(yōu)勢。”
圖片說明
不過,要實(shí)現(xiàn)大數(shù)據(jù)的普及,需要眾多企業(yè)的合力來完成。事實(shí)上,IT產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)上各方力量從來沒有像現(xiàn)在這樣重視相互的合作關(guān)系,也從未如此緊密合作過。正如孫博凱對(duì)CSDN所表示的:“微軟日益開放。作為公有云平臺(tái),Azure更加擁抱開源。很多開源技術(shù)如PHP、MySQL、WordPress都可以在Windows Azure上運(yùn)行。Hadoop方面,我們已經(jīng)和Hortonworks通力合作,而對(duì)于一些初創(chuàng)企業(yè),尤其是在工具設(shè)計(jì)及垂直行業(yè)解決方案的企業(yè),微軟也希望他們可以成為Windows Azure平臺(tái)的伙伴。不止如此,Windows Azure平臺(tái)還有支持Mobile Services、Media Services等服務(wù),如Streaming to iOS,IE瀏覽器以外也提供著更多其他瀏覽器的自由選擇。另一方面,微軟的技術(shù)也已經(jīng)回饋開源社區(qū),ODBC Liver和Entity Framework(LINQ)。相信以后,還會(huì)有越來越多的開源技術(shù)出現(xiàn)在微軟的Azure平臺(tái)上。”