三級研發(fā)組織

在大數(shù)據(jù)研發(fā)方面,京東在整體上分為三級研發(fā)組織。最上面是大數(shù)據(jù)實驗室,與清華大學建立了緊密的聯(lián)系,合作進行大數(shù)據(jù)的研究。實驗室由科學家?guī)ш牎?/p>

在實驗室之下是第二級組織,是大數(shù)據(jù)平臺研發(fā)部門,該部門有數(shù)百人;還有一個100多人的團隊,專門進行京東的搜索以及個性化推介的研發(fā)。這兩個團隊在平臺及引擎層面提供技術(shù)支撐。

第三級組織在應用層面。京東有很多研發(fā)事業(yè)部,比如采購、倉儲、物流研發(fā)事業(yè)部,這些研發(fā)事業(yè)部也都擁有自己的大數(shù)據(jù)創(chuàng)新研發(fā)團隊。他們會基于大數(shù)據(jù)實驗室的算法、模型,以及大數(shù)據(jù)平臺、引擎研發(fā)組織的成果,結(jié)合應用層業(yè)務,開展研發(fā)工作。比如著名的“供應商數(shù)據(jù)羅盤”,就是大數(shù)據(jù)創(chuàng)新組研發(fā)出來的業(yè)務層面的產(chǎn)品。

京東的促銷人員、倉儲管理人員等等,會專門使用應用層研發(fā)出來的大數(shù)據(jù)分析工具,分析業(yè)務的發(fā)展情況,指導業(yè)務的發(fā)展。

在此基礎(chǔ)上,京東設(shè)立了一個技術(shù)委員會,由三級研發(fā)組織中的關(guān)鍵的高級人才組成,這個組織是虛實結(jié)合的。通過技術(shù)委員會這個虛擬組織,把三級研發(fā)結(jié)合在一起,這樣大數(shù)據(jù)研發(fā)才可以真正靠組織的力量落地。

大數(shù)據(jù)人才

京東大數(shù)據(jù)實驗室有兩類人才,一類是數(shù)據(jù)科學家,專門在技術(shù)模型、數(shù)據(jù)模型等方面進行研究;還有一類是算法工程師,專門進行計算算法、搜索算法、關(guān)聯(lián)算法等方面的工作,他們會大量應用京東的數(shù)據(jù)來構(gòu)建算法模型。

在平臺研發(fā)、引擎研發(fā)層面,一方面是大數(shù)據(jù)平臺研發(fā)工程師,另一方面是數(shù)據(jù)處理研發(fā)工程師,進行數(shù)據(jù)清洗、轉(zhuǎn)化,進行多維化的切分等等。在數(shù)量上,數(shù)據(jù)處理研發(fā)工程師相對多一些。

在應用層面,有商業(yè)模型建模工程師,還有就是數(shù)據(jù)分析師,他們通過算法、模型,把結(jié)果分析出來并進行呈現(xiàn),就像一份報表,能看出來存在的問題或是商機。數(shù)據(jù)分析師能夠指導和引領(lǐng)業(yè)務,這是IT價值非常重要的一部分。

當前,商業(yè)模型建模工程師在京東比較搶手,更不用說傳統(tǒng)企業(yè)?,F(xiàn)在,大量的傳統(tǒng)企業(yè)在信息化方面已經(jīng)走過了10年甚至20年的時間,積累了大量的數(shù)據(jù),這些數(shù)據(jù)都保存在企業(yè)內(nèi)部,但是企業(yè)對這些數(shù)據(jù)無能為力,看到這些數(shù)據(jù)不知道能干什么。原因就是企業(yè)的IT團隊缺少商業(yè)模型建模工程師。

京東大腦

“京東大腦”是京東的大數(shù)據(jù)平臺,提供給各業(yè)務方使用,在京東整個研發(fā)體系當中相當于“大腦”的角色。

京東在基礎(chǔ)層面商品,型號,用戶,供應商等主數(shù)據(jù),以及交易數(shù)據(jù),就是用戶的訂單、支付情況。

還有一類很重要的數(shù)據(jù)就是流量數(shù)據(jù)。傳統(tǒng)企業(yè)在實施和使用ERP的時候很少見,但對于電子商務非常關(guān)鍵,這一類數(shù)據(jù),企業(yè)務必要注意收集。

流量數(shù)據(jù)包括消費者從哪里進入到京東的主網(wǎng)站,然后接下來怎么一步步點擊,在哪里停留,在哪里有疑惑等等。在這個過程中,點擊數(shù)據(jù),時間流數(shù)據(jù)都是非關(guān)系型數(shù)據(jù),由于電子商務無法看到每一個人,所以這種非關(guān)系型數(shù)據(jù)記錄了消費者的行為習慣,非常具有價值。

在基礎(chǔ)數(shù)據(jù)層之上,京東建立了一些知識層,首先有小區(qū)畫像,到底有哪些特征,居住哪些人;還有用戶的畫像,用戶畫像就是針對一類人群,或者某一個人,具有什么樣的行為特征;還有商品畫像,供應商畫像。

與此相關(guān)的有一個比較專業(yè)的詞,叫“打標簽”,就是給數(shù)據(jù)打標簽,這是現(xiàn)在做精準搜索和精準推介的一個非常關(guān)鍵的詞語。京東很多算法能夠跑起來,產(chǎn)生效果,與畫像打標簽不無關(guān)系。

在這之上是服務層,提供預測的API、引擎、算法、多維報表,京東會提供相應的產(chǎn)品、工具包括引擎,作為服務,供上層做創(chuàng)新應用而調(diào)用。

在京東大腦整個戰(zhàn)略里面,還有一個衍生的戰(zhàn)略,就是“京東萬象”,是一個綜合數(shù)據(jù)開放平臺。該平臺已經(jīng)擁有了全社會特征的樣本數(shù)據(jù),但是這些數(shù)據(jù)仍然不足以支撐相關(guān)的分析,所以京東通過開放平臺,把整個社會的大數(shù)據(jù)聯(lián)通在一起。這些數(shù)據(jù)涉及金融、電商、運營商、生活服務。

京東大數(shù)據(jù)平臺及其應用

京東是如何構(gòu)建自己的大數(shù)據(jù)平臺?在這方面,京東并沒有原創(chuàng)的技術(shù),使用了業(yè)界開源平臺。其服務器數(shù)量達數(shù)千臺,業(yè)務系統(tǒng)亦達數(shù)千個。日均數(shù)據(jù)吞吐量在PB量級。關(guān)于應用,包括但不限于以下內(nèi)容。

用戶畫像。由于消費者到底怎么想,到底想購買什么,到底購買了什么,對什么商品還比較猶豫,等等,這些行為圍繞著該消費者就會產(chǎn)生一個完整的數(shù)據(jù),京東會根據(jù)這些數(shù)據(jù)進行用戶畫像,進行個性化的推薦。據(jù)估計,京東有1/3的購物行為來自于推介購物。

用戶畫像還可以進行精準營銷。比如,很多消費者曾收到過京東的EDM郵件,這些促銷郵件并不是群發(fā)的,而是基于促銷需要,根據(jù)目標客戶群體進行的促銷郵件推送。

智能客服。當消費者第一次使用智能客服的時候,可能感覺冷冰冰的,而當跟他對話很多的時候,消費者會發(fā)現(xiàn),客服他對到底想問什么問題越來越清晰了,這后面其實有些用戶的數(shù)據(jù),用戶的畫像在支撐。當前,京東數(shù)千名人工客服人員仍然滿足不了巨量的電話咨詢需求,而智能客服就提供了網(wǎng)上的咨詢通道。

供應商數(shù)據(jù)羅盤。有一些創(chuàng)新是關(guān)于采購的,現(xiàn)在京東有一個服務叫“供應商數(shù)據(jù)羅盤”,專門指導供應商如何進貨、生產(chǎn)、制定節(jié)奏。京東也有很多的采購人員,往往決定向哪個供應商采購,采購什么產(chǎn)品,什么時間采購。當前,京東已經(jīng)是全品類運營的平臺,生活中用到的很多東西都可以在京東上買到,采購人員根本沒有辦法進行決策,因為型號,供應商,品類太多。

因此,京東大量的采購決策,都是數(shù)據(jù)在驅(qū)動,而不是靠經(jīng)驗判斷。在這里面,通過輔助工具,可以預測產(chǎn)品的銷售情況,進行自動補貨。什么時候向供應商補貨,庫存是不是有滯銷、擠壓,如何選品,如何定價,這里面都有數(shù)據(jù)的支撐。

搜索推介。現(xiàn)在整個京東網(wǎng)站分了好幾個層面,在列表層面、搜索層面、單品頁,京東會向消費者推薦具有關(guān)聯(lián)度的商品。從數(shù)據(jù)的角度,就是在各個層面都有不同推薦的算法。尤其在移動購物方面,由于手機的屏幕限制,哪種商品放在第一位,哪種放在第二位,都有講究,目的就是個性化的購物。

搜索定價。這個功能,會基于當前的銷售情況、購買情況、訂單情況、收藏情況,做一個價格的浮動。但是這種價格不是拍腦袋,而是有數(shù)據(jù)支撐的。比如京東的一個旅游產(chǎn)品,應用了搜索定價之后,機票的訂單翻了一倍。

交易風控。很多人都知道京東白條與虛擬應用卡。給消費者多少額度,其實是通過很多數(shù)據(jù)來支撐的。由于消費者有很多的交易數(shù)據(jù)、點擊流的數(shù)據(jù)等大量的用戶行為,這些數(shù)據(jù)匯集到基礎(chǔ)數(shù)據(jù)庫,再基于“京東萬象”共享的個人信用數(shù)據(jù),匯集成完整的數(shù)據(jù)進行判別并授信。這是京東虛擬信用卡、京東白條的風險控制規(guī)則。

分享到

zhoub

相關(guān)推薦