李大學(xué)

本報(bào)記者 施建 深圳報(bào)道

電商平臺(tái)由于承載大量用戶數(shù)據(jù)和交互行為,往往是云計(jì)算和大數(shù)據(jù)的重度用戶,諸如國(guó)外的亞馬遜和國(guó)內(nèi)的阿里巴巴都在這方面不吝投入。

京東自然也不例外。在京東創(chuàng)始人、CEO劉強(qiáng)東屢屢提及的“倒三角”戰(zhàn)略中,財(cái)務(wù)、物流和技術(shù)三大核心系統(tǒng)就是其中的重要內(nèi)容。

不過(guò),在京東的自建物流能力以及由此帶來(lái)的用戶體驗(yàn)在消費(fèi)者中留下深刻印象的同時(shí),居于幕后的技術(shù)體系,并不容易直接讓用戶感知。對(duì)此,京東自身過(guò)往亦著墨不多。

“京東技術(shù)體系的特點(diǎn)就是涵蓋電商全流程、全價(jià)值鏈,這是與很多廠商不一樣的地方。”11月27日,京東集團(tuán)副總裁李大學(xué)在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,除了部分財(cái)務(wù)系統(tǒng)之外,京東從前端的交易系統(tǒng)到供應(yīng)鏈,到倉(cāng)儲(chǔ)、配送、客服以及售后等的技術(shù)支撐體系,全部由自己研發(fā),“這樣全流程數(shù)據(jù)的積累,也是京東大數(shù)據(jù)區(qū)別于其他廠商的地方”。

李大學(xué)對(duì)記者表示,其2008年剛加入京東時(shí),技術(shù)團(tuán)隊(duì)僅有30多人,現(xiàn)在短短幾年已經(jīng)發(fā)展到4000多人的隊(duì)伍,其中負(fù)責(zé)大數(shù)據(jù)部分的團(tuán)隊(duì)有300多人。

“基于大數(shù)據(jù)對(duì)客戶情緒的判斷,京東甚至可以把不同情緒的客戶自動(dòng)接入到擅長(zhǎng)處理相對(duì)應(yīng)情緒的客服。”李大學(xué)說(shuō)。

要把大數(shù)據(jù)玩小

《21世紀(jì)》:外界對(duì)京東物流的覆蓋、速度和服務(wù)印象比較深刻,相對(duì)而言對(duì)京東技術(shù)板塊了解不多。是不愿意說(shuō),還是沒(méi)什么可說(shuō)?

李大學(xué):京東送貨速度快,給用戶很好的體驗(yàn),再加上正品,買(mǎi)東西放心,沒(méi)假貨,發(fā)展速度特別快。

至于技術(shù),我們確實(shí)說(shuō)得不多,這和老劉(劉強(qiáng)東)的習(xí)慣有關(guān)系,我們?cè)敢庾鲆粋€(gè)務(wù)實(shí)的企業(yè)。我們的技術(shù)人員也更愿意用事實(shí)和結(jié)果來(lái)說(shuō)話。

其實(shí)物流,背后也是技術(shù)。我們雙11前上線的亞洲一號(hào),處理量很厲害,里面很多自動(dòng)化設(shè)備的流程就是靠技術(shù)系統(tǒng)實(shí)現(xiàn),包括揀貨的路徑、貨品暫存區(qū)域等,通過(guò)大數(shù)據(jù)的使用可以大大提升庫(kù)房的效率。這就是技術(shù)。今天我們談大數(shù)據(jù),其實(shí)京東在大數(shù)據(jù)方面有很多目標(biāo)和戰(zhàn)略,我認(rèn)為其中不少在業(yè)界是比較超前的。

《21世紀(jì)》:京東的整個(gè)技術(shù)架構(gòu)是怎樣的?大數(shù)據(jù)在其中處于什么位置?

李大學(xué):現(xiàn)在京東技術(shù)團(tuán)隊(duì)4000多人,大概有300多人在負(fù)責(zé)整個(gè)大數(shù)據(jù)的平臺(tái),以及大數(shù)據(jù)的一些創(chuàng)新。

從技術(shù)架構(gòu)來(lái)看,最底層是基礎(chǔ)設(shè)施,就像電信運(yùn)營(yíng)商要鋪光纖一樣,我們也要網(wǎng)絡(luò)和服務(wù)器,機(jī)柜和機(jī)架等。這些基礎(chǔ)的設(shè)施我們會(huì)用云的方式給它管理起來(lái)。

再往上的話,就是我們的數(shù)據(jù)層,解決數(shù)據(jù)的存儲(chǔ)、運(yùn)輸、加密,以及加工處理、挖掘。大數(shù)據(jù)的工作就在這一層。

再上面我們叫API層,就是應(yīng)用接口層。我們把功能、數(shù)據(jù)、接口等全部抽象成API,大家可以公用。一個(gè)團(tuán)隊(duì)可以共享很多知識(shí)產(chǎn)權(quán),而且相互之間接口變簡(jiǎn)單了。比如說(shuō)有三個(gè)部門(mén),你的功能我要,我的功能你想調(diào),怎么辦?我們做一個(gè)API層,大家都可以寫(xiě)都可以調(diào)。

第四層才是應(yīng)用層,就是與用戶交互的界面層了,有時(shí)候是APP程序,有時(shí)候是網(wǎng)站,他都是應(yīng)用。

《21世紀(jì)》:京東的數(shù)據(jù)有什么特征?

李大學(xué):講大數(shù)據(jù)大家都知道四個(gè)V。其實(shí),京東的數(shù)據(jù)最大特征還不是四個(gè)V,而是我們數(shù)據(jù)的價(jià)值鏈特別長(zhǎng)。

你到我網(wǎng)站上來(lái)看了什么東西,停留多長(zhǎng)時(shí)間,看沒(méi)看評(píng)論,有沒(méi)有把他加入購(gòu)物車,加入購(gòu)物車買(mǎi)沒(méi)買(mǎi),每天看了幾次,乃至買(mǎi)了以后的行為全部都有。然后下了訂單到庫(kù)房、配送的過(guò)程都有,數(shù)據(jù)鏈最完整。如果你有售后問(wèn)題和返修問(wèn)題,我也有數(shù)據(jù)。不像一些友商,就是一個(gè)網(wǎng)站,一個(gè)點(diǎn)擊流。

京東為什么敢做白條業(yè)務(wù)?因?yàn)槲覀冇行畔?。所以京東數(shù)據(jù)的特征,就是一個(gè)“全”字。很多人談大數(shù)據(jù),一上來(lái)強(qiáng)調(diào)數(shù)據(jù)量大,其實(shí)我不認(rèn)為量大是一個(gè)問(wèn)題。

我有一個(gè)觀點(diǎn),其實(shí)要把大數(shù)據(jù)玩小,不要整天強(qiáng)調(diào)大數(shù)據(jù),但是根本落不了地。就像小時(shí)候?qū)懽魑模灰獙?xiě)長(zhǎng)篇大論,而是要從小處著手,以小見(jiàn)大。

傳統(tǒng)的大數(shù)據(jù)組織都是按照主題來(lái),商品、訂單、物流、廣告都是不同的主題。這樣是有缺陷的。我的理念是數(shù)據(jù)要按照用戶來(lái)。每一個(gè)用戶到京東,我都給你開(kāi)一個(gè)數(shù)據(jù)銀行,圍繞著用戶來(lái)存儲(chǔ)、處理。

當(dāng)然以用戶為中心,看起來(lái)小,其實(shí)也很大,就是要做到完整。如果這個(gè)過(guò)程完成了,用戶體驗(yàn)還可以優(yōu)化,技術(shù)架構(gòu)還可以有一個(gè)升級(jí),這是我們最近在研究的東西。當(dāng)然,現(xiàn)在還沒(méi)有正式形成成果,只是做一些研究,但是這是方向。

京東大數(shù)據(jù)的五個(gè)價(jià)值

《21世紀(jì)》:大數(shù)據(jù)對(duì)京東具體帶來(lái)了什么價(jià)值?

李大學(xué):大數(shù)據(jù)最核心的還是用戶畫(huà)像。這一點(diǎn)做好以后,我們對(duì)用戶更了解,接下來(lái)就可以做一系列工作,比如圍繞著用戶進(jìn)行精準(zhǔn)營(yíng)銷,然后圍繞網(wǎng)站和APP可以做千人千面,讓用戶轉(zhuǎn)化率更高。目前千人千面在移動(dòng)端已經(jīng)上線,網(wǎng)站在測(cè)試后也將上線。

有了用戶畫(huà)像技術(shù)還可以對(duì)用戶分群,我們就知道哪個(gè)人群可以賺錢(qián),發(fā)優(yōu)惠券的時(shí)候就更有針對(duì)性。

第二個(gè)層面的大數(shù)據(jù)應(yīng)用是預(yù)測(cè)。對(duì)銷量的預(yù)測(cè)決定我們定多少貨,從而提高庫(kù)存管理能力和資金周轉(zhuǎn)能力。再比如,對(duì)用戶的行為也可以預(yù)測(cè),算出你下一個(gè)點(diǎn)擊是什么。

第三個(gè)我們比較重視的應(yīng)用,就是圍繞著商品的價(jià)格彈性,進(jìn)行采銷互動(dòng)。盲目的降價(jià)不一定帶來(lái)銷量,以前讓我銷售額增長(zhǎng)就降毛利,讓我毛利增長(zhǎng)銷售額就不增長(zhǎng)。大數(shù)據(jù)告訴你兩個(gè)都可以增長(zhǎng),通過(guò)采銷互動(dòng)可以模擬給你看,毛利有多少,銷售額漲了多少,沒(méi)有采購(gòu)之前給你模擬出來(lái)。

第四個(gè)方面,大數(shù)據(jù)應(yīng)用就是在運(yùn)營(yíng)的其他環(huán)節(jié)里面,去提高效率,去降成本。比如說(shuō)庫(kù)房里優(yōu)化檢貨的路徑,貨架上的擺貨邏輯。還有我們的配送網(wǎng)絡(luò),一個(gè)配送站或自提點(diǎn)該不該開(kāi),怎么開(kāi),怎么覆蓋用戶,全國(guó)的配送網(wǎng)絡(luò)怎么優(yōu)化,全部可以大數(shù)據(jù)算出來(lái)。電商里面成本效率這件事情,沒(méi)有大數(shù)據(jù)做不到的。

第五個(gè)就是大數(shù)據(jù)影響我們的決策。通過(guò)大數(shù)據(jù)來(lái)判斷品類怎么去拓展,未來(lái)的機(jī)會(huì)點(diǎn)在哪,公司是否要做戰(zhàn)略調(diào)整等。領(lǐng)導(dǎo)腦子里面想的東西要經(jīng)過(guò)大數(shù)據(jù)驗(yàn)證,到底是不是這回事。

京東的決策過(guò)程已經(jīng)漸漸成為用數(shù)據(jù)說(shuō)話。

《21世紀(jì)》:京東的大數(shù)據(jù)能力,形成了哪些具體的產(chǎn)品?

李大學(xué):產(chǎn)品有很多,可以說(shuō)涵括電商的全價(jià)值鏈。我具體講一個(gè)。大家都知道京東有一個(gè)JDPhone計(jì)劃。京東通過(guò)這個(gè)計(jì)劃與很多手機(jī)廠商合作,通過(guò)大數(shù)據(jù)來(lái)決定下一代產(chǎn)品的方向。這背后所涉及的就是我們的一個(gè)大數(shù)據(jù)產(chǎn)品——慧眼。

傳統(tǒng)的制造商要做一款手機(jī),先去做用戶調(diào)研,然后閉門(mén)造車在家里設(shè)計(jì),設(shè)計(jì)完了生產(chǎn)一堆庫(kù)存,把庫(kù)存發(fā)到各個(gè)零售渠道。我們認(rèn)為大數(shù)據(jù)時(shí)代,這個(gè)模式要變。我們和手機(jī)廠商合作,把京東的大數(shù)據(jù)開(kāi)放給他們,手機(jī)廠商就可以以此為參考,決定他們的產(chǎn)品定位、配置和設(shè)計(jì)。努比亞和榮耀通過(guò)這個(gè)計(jì)劃發(fā)展得都很好。

這里面的關(guān)鍵是長(zhǎng)期的數(shù)據(jù)積累,如果沒(méi)有這個(gè)數(shù)據(jù)積累,大數(shù)據(jù)技術(shù)再牛也沒(méi)用。

大數(shù)據(jù)開(kāi)放考慮API模式

《21世紀(jì)》:京東現(xiàn)在的大數(shù)據(jù)平臺(tái)也是基于Hadoop,那么發(fā)展的過(guò)程中是否存在從集中式到分布式變化的過(guò)程,或者說(shuō)“去IOE”的過(guò)程?

李大學(xué):大數(shù)據(jù)平臺(tái)非常復(fù)雜,Hadoop本身解決的是分布式大數(shù)據(jù)存儲(chǔ),在這上面還要有實(shí)時(shí)計(jì)算的技術(shù)、分布式的挖掘系統(tǒng)。當(dāng)然這里面還有安全。

所以企業(yè)沒(méi)到一定的規(guī)模,沒(méi)有一定的研發(fā)投入很難管理大數(shù)據(jù)平臺(tái)。僅僅抓一個(gè)Hadoop容易,但是要把他玩轉(zhuǎn)比較難了。你可能幾百臺(tái)Hadoop容易管,像我們上萬(wàn)臺(tái)的Hadoop集群,就必須有二次開(kāi)發(fā)能力。

京東也在想,未來(lái)這些技術(shù),怎么為業(yè)界所用,把它開(kāi)放給行業(yè)去用,這是我們未來(lái)想去做的,我們希望2015年能在這方面有更多探討。

至于你說(shuō)的“去IOE”,這個(gè)過(guò)程并不明顯。京東從中關(guān)村起家,最初服務(wù)器就是DIY,自己來(lái)定義規(guī)格。而且我們即將宣布和IT產(chǎn)業(yè)核心企業(yè)的合作,讓更多電商和互聯(lián)網(wǎng)行業(yè)的伙伴分享京東在這方面的成果。基于我們對(duì)電商的這種理解,現(xiàn)在市場(chǎng)上的服務(wù)器存在很大的浪費(fèi),表現(xiàn)在內(nèi)存和CPU不匹配。

《21世紀(jì)》:京東包括大數(shù)據(jù)在內(nèi)的技術(shù)系統(tǒng)幾乎采取自研的模式,這是否與社會(huì)分工理論相悖?

李大學(xué):其實(shí)我們也跟業(yè)界不斷做交流,我們研發(fā)團(tuán)隊(duì)有一句話,“請(qǐng)進(jìn)來(lái),走出去”。我們的技術(shù)開(kāi)放日,報(bào)名的人人滿為患。

但是對(duì)于京東這樣規(guī)模的公司來(lái)說(shuō),我們基本上找不到服務(wù)商能解決自己的大數(shù)據(jù)問(wèn)題?;ヂ?lián)網(wǎng)行業(yè)有個(gè)規(guī)律,叫冪律分布。放在電商行業(yè)也一樣,“高個(gè)子”就那幾家,市場(chǎng)上的電商解決方案提供商,只能也只會(huì)為“矮個(gè)子”服務(wù),因?yàn)檫@部分企業(yè)數(shù)量大,有規(guī)模效應(yīng),而為高個(gè)子服務(wù)它掙不了多少錢(qián)。因此,京東這樣的企業(yè)只能自己發(fā)展,自己摸索。市面上服務(wù)商的產(chǎn)品和技術(shù),也沒(méi)有機(jī)會(huì)在京東這種級(jí)別的平臺(tái)上進(jìn)行驗(yàn)證和演化。

沒(méi)人能為京東提供解決方案,市場(chǎng)上的成熟解決方案也解決不了京東的問(wèn)題。但是反過(guò)來(lái)京東技術(shù)可以為他們所用,高個(gè)子都能用,矮個(gè)子用就沒(méi)有什么問(wèn)題,無(wú)非剪短一點(diǎn)。

《21世紀(jì)》:那么,京東在開(kāi)放自己的大數(shù)據(jù)能力方面有什么具體想法?

李大學(xué):應(yīng)該說(shuō)開(kāi)放的話,我們目前還處在一個(gè)初級(jí)階段,未來(lái)還要深化。我的考慮是“數(shù)據(jù)API化”,你要數(shù)據(jù)可以調(diào),調(diào)了就可以用,而不用管后臺(tái)的模型。

目前業(yè)界在這方面的所謂對(duì)外開(kāi)放,主要還是開(kāi)放計(jì)算能力和存儲(chǔ)能力,屬于基礎(chǔ)設(shè)施層面。我認(rèn)為應(yīng)該再往上走一個(gè)層次,在應(yīng)用層和商業(yè)層去做,而不是在底層拼價(jià)格。

京東明年5月會(huì)落成一個(gè)非常大的數(shù)據(jù)中心,在萬(wàn)事俱備的時(shí)候,我們會(huì)公布具體的商業(yè)策略。

分享到

redsenlin

相關(guān)推薦