小公司如何應(yīng)對大數(shù)據(jù)

1. 拓展傳統(tǒng)的商業(yè)智能(BI)領(lǐng)域。以前針對大數(shù)據(jù)量的統(tǒng)計(jì)、關(guān)聯(lián)分析、趨勢預(yù)測由抽樣變成全量分析、將數(shù)據(jù)回流到各種報(bào)表。

2. 業(yè)務(wù)流程改。對各種數(shù)據(jù)進(jìn)行聚合分析,用來做業(yè)務(wù)流程改進(jìn)和考核的依據(jù)。

3. 數(shù)據(jù)商品和商業(yè)應(yīng)用。通過對已有數(shù)據(jù)或數(shù)據(jù)處理能力進(jìn)行服務(wù)化或產(chǎn)品化包裝,形成數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)。

其中,我們在互聯(lián)網(wǎng)行業(yè)最常見的就是通過已有的數(shù)據(jù)來形成數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù),最典型的應(yīng)用場景就是“個性化推薦”,但這并非是人人都可以染指的概念——我們知道,行業(yè)內(nèi)依靠四個特征界定“大數(shù)據(jù)”:

第一,Volume,體量巨大,PB級別;

第二,Variety,數(shù)據(jù)類型繁多;

第三,Veracity,價值密度低;

第四,Velocity,處理速度快。簡而言之,需要從不同維度抓取海量數(shù)據(jù)并將其快速轉(zhuǎn)變?yōu)橛行虻目捎眯畔ⅰ?/p>

實(shí)際上,在中國互聯(lián)網(wǎng),完全具備以上四點(diǎn)特征也只有騰訊、阿里巴巴、百度等較大型公司,對于一般公司而言,根本就不可能擁有PB級別的數(shù)據(jù),也無法支撐高昂的數(shù)據(jù)存儲成本,而且大數(shù)據(jù)方面的技術(shù)人才十分稀缺。最近就有不少創(chuàng)業(yè)團(tuán)隊(duì)告訴我他們產(chǎn)品的愿景,很多想法都十分新穎,但迫于數(shù)據(jù)處理能力,只好選擇 “慢慢來”或者將產(chǎn)品功能閹割。那么,這類公司該如何在“大數(shù)據(jù)”浪潮中崛起呢?

我首先想到的就是利用第三方的數(shù)據(jù)處理服務(wù)平臺,這是一項(xiàng)在海外已經(jīng)比較成熟的業(yè)務(wù),從字面不難理解,這些公司為那些沒有大數(shù)據(jù)和大數(shù)據(jù)處理能力的公司提供“數(shù)據(jù)”或“服務(wù)”。

服務(wù)可以分為兩大類:基礎(chǔ)服務(wù)和個性化服務(wù)。

基礎(chǔ)服務(wù)即幫助公司解決數(shù)據(jù)存儲、框架搭建和管理等大數(shù)據(jù)處理的基礎(chǔ)能力,這類公司的代表有Hadoop(分布式軟件框架)管理軟件與服務(wù)提供商Cloudera、非關(guān)系型數(shù)據(jù)庫MongoDB開發(fā)商 10gen等。

另一類則直接幫助企業(yè)直接打造個性化解決方案,我認(rèn)為這類公司更適合大部分從整體上就缺乏數(shù)據(jù)能力的中國的小型互聯(lián)網(wǎng)公司和希望互聯(lián)網(wǎng)化的傳統(tǒng)企業(yè),譬如幫助電商提供個性化網(wǎng)上購物體驗(yàn)的RichRelevance、個性化和數(shù)字市場營銷優(yōu)化服務(wù)提供商Baynote、為廣告商提供數(shù)據(jù)和分析的 eXelate,以及數(shù)據(jù)拍賣平臺BlueKai等。在國內(nèi),也有一些不錯的平臺開始涌現(xiàn),例如個性化推薦引擎服務(wù)商百分點(diǎn)。利用這些第三方的服務(wù)和數(shù)據(jù),可以讓小公司的產(chǎn)品也兼具優(yōu)秀的個性化能力,融入大數(shù)據(jù)時代。

但我認(rèn)為,還有另一種應(yīng)對大數(shù)據(jù)浪潮的做法——逆勢而為。我并不認(rèn)為大數(shù)據(jù)是解決個性化的唯一方案,同是它還帶有相當(dāng)強(qiáng)的局限性——基于數(shù)據(jù)意為著用數(shù)據(jù)建立模型,從某種意義上說,它也像是一個牢籠:設(shè)想一下,如果你所有的信息全部來自個性化推薦,那么你很可能錯失那些你從未接觸過的全新領(lǐng)域,而這些開放的、全新的信息不正是互聯(lián)網(wǎng)最迷人之處么?

事實(shí)上,已經(jīng)有些產(chǎn)品這么做了,唐茶計(jì)劃的李如一就曾表示,不會受數(shù)據(jù)干擾去決定出售/推薦哪一本電子書,而是完全基于他們的個人對內(nèi)容的判斷,還有進(jìn)來比較受關(guān)注的電臺Fuzz,完全由人工DJ來推送音樂。反過來想,如果同一類型的產(chǎn)品都具有精準(zhǔn)的大數(shù)據(jù)處理能力,那么它們?yōu)橛脩籼峁┑膬?nèi)容也很可能是千篇一律的,而這些逆勢而為的產(chǎn)品,反而更像是真正的“個性化”服務(wù)。

分享到

zhaohang

相關(guān)推薦