商業(yè)價值 發(fā)表于:14年07月17日 14:00 [轉(zhuǎn)載] DOIT.com.cn
2008年的一天,阿里巴巴集團(下稱“阿里”)開了一次內(nèi)部會議。在這次當時看來很平常的會議上,明確了兩個議題:一,阿里是一家數(shù)據(jù)公司;二,阿里要把“計算”變成一種像水和電一樣的公共品。當時在中國還沒有人談“大數(shù)據(jù)”的概念;更沒有人想到云計算會和一家互聯(lián)網(wǎng)公司未來發(fā)展如此緊密。
1999年阿里成立之初,創(chuàng)始人“十八羅漢”中就不乏技術基因。公開資料顯示,創(chuàng)始人之一吳泳銘1996年畢業(yè)于浙江工業(yè)大學計算機系,后成為支付寶的技術總監(jiān)。盛一飛有多年用戶體驗設計經(jīng)驗。周悅虹,java架構師,技術精湛,傳言是一名極客。
隨著淘寶網(wǎng)的成立,2003年阿里開始與IBM合作,解決用戶、商品和消費信息分散的問題。當時的阿里已經(jīng)從十幾個人的小公司延展出很多新業(yè)務,技術系統(tǒng)也變得龐大復雜。到了2007年,阿里在IT上的投入之大,一度成為IBM、Oracle等國外IT廠商在中國的標桿用戶。當年,阿里首席數(shù)據(jù)庫管理員馮春培甚至受到了Oracle公司亞太區(qū)高級副總裁Brian Mitchell親切接待,并被授予甲骨文全球第100個ACE(Oracle ACE 是指那些通過撰寫書籍、文章或博客,分享Oracle經(jīng)驗的技術專家)。
但實際上,這種甜蜜的合作關系并沒有持續(xù)太久。
2008年前后,阿里業(yè)務高速發(fā)展使已有的IT設備使用到達瓶頸。根據(jù)時任支付寶數(shù)據(jù)庫架構師、現(xiàn)丁香園CTO馮大輝的描述:“在阿里的IT架構中,淘寶和支付寶等擁有大量IBM小型機和Oracle數(shù)據(jù)庫,以及EMC、戴爾存儲設備。用戶激增與用戶產(chǎn)生的數(shù)據(jù)越來越多,每年早上8:00?9:30之間CPU(中央處理器)要保持98%的使用率。”IBM小型機價格從幾十萬到高達百萬級人民幣,與Oracle簽訂的數(shù)據(jù)庫軟件費用達數(shù)千萬,加之一大筆軟硬件支付和一大筆維護費,阿里的技術發(fā)展進入一個壓力很大的時期。
緊迫之中,阿里在尋找一名技術高管,要為龐大復雜的業(yè)務搭建起全新的技術架構,建立全球頂尖IT團隊。在2008年的這次內(nèi)部會議上,阿里確定了“數(shù)據(jù)”和“云計算”兩個重要的新戰(zhàn)略。
時任阿里巴巴首席架構師的王堅成為接受這個挑戰(zhàn)的不二人選。
“去IOE”念頭萌生
加入阿里巴巴之前,王堅任微軟亞洲研究院常務副院長;再之前,他是浙江大學心理學系教授、系主任。加盟阿里后,王堅馬上著手第一個重要工作——籌劃集團全年的IT預算。他反復琢磨,發(fā)現(xiàn)一個重要問題:即便追加巨額IT投資,阿里購買的軟硬件也未必能滿足其業(yè)務的高速增長。
“雙十一”大促對IT計算資源要求龐大,很難預測業(yè)務爆發(fā)點所需要的計算資源峰值。但過了高峰期,IT資源空下來,又會造成浪費。這些實實在在的難題是為阿里提供軟硬件服務的廠商從沒遇到過的,IBM、Oracle和他們的客戶都不能為阿里IT提供任何可供借鑒的經(jīng)驗。其次,整個IT就像是一個黑箱子,一旦出現(xiàn)技術故障后,阿里的技術團隊要打電話給廠商等待事故處理,而且高端存儲設備的性能數(shù)據(jù)都是由廠商掌控,阿里自己的技術團隊并沒有太大的控制權。技術維護變成極其繁瑣的工作,支撐業(yè)務的效率大大下降。
而在地球的另一端,Google和Amazon是和阿里業(yè)務相近,并值得學習的兩個好榜樣——Google是世界上少有的能擁有大規(guī)模分布式架構技術的互聯(lián)網(wǎng)公司,Amazon是第一個將自己云計算技術對外提供服務,實現(xiàn)營收的公司。
在一次預算討論中,阿里巴巴集團負責技術保障的副總裁劉振飛和阿里技術保障部DBA負責人周寶方偶然提到:“阿里應該嘗試用PC技術替代小型機技術。”一聽這句話,王堅一下子激動起來:“既然已經(jīng)思考了這個問題,為什么我們不鄭重寫下來?明確阿里再也不購買小型機。”
“去IOE”(在IT設備中去除IBM小機、Oracle數(shù)據(jù)庫及EMC存儲)由此得名。
在2009年到2013年整個“去IOE”的過程中,阿里技術發(fā)展策略逐漸從“商業(yè)軟件”、“開源軟件”發(fā)展到自主技術和云計算構成的綜合技術服務能力。便宜的Commodity PC替換掉過去昂貴的硬件設備,淘寶、支付寶等重要業(yè)務將舊的“IOE”集中式架構轉(zhuǎn)變?yōu)榉植蓟軜,這種架構是把IT后臺遷移到云計算平臺上的基礎工作。
在“去IOE”過程中,阿里技術團隊也完成了一次成熟的轉(zhuǎn)型,這為阿里向外提供云服務打下了基礎。王堅來阿里之前,阿里各業(yè)務技術后臺是獨立運營的,他將阿里運維團隊、平臺技術部、大淘寶運維團隊、云計算運維團隊等整合到一起,成立了集團統(tǒng)一的IT技術保障部。阿里旗下子業(yè)務模式差別巨大,IT工具和價值理念也完全不同,所以統(tǒng)一團隊經(jīng)歷了很大的技術挑戰(zhàn)和組織挑戰(zhàn)。這項工作實際為后期阿里云向外提供服務打下了很好的基礎,阿里后期推出的“聚石塔”、 “聚寶盆”業(yè)務,與這支在“去IOE”過程中鍛煉出的隊伍密不可分。
除了團隊,技術人員也面臨著個人轉(zhuǎn)型。王堅曾多次說:“‘去IOE’最難的就在于人。每一次的技術轉(zhuǎn)換,我們都是在革自己的命。如果沒有同事們當時敢于嘗試的勇氣,阿里的技術難題都可能扛不過去。”曾有一位技藝精湛、對業(yè)務非常熟悉的淘寶數(shù)據(jù)庫管理員,在“去IOE”過程中,他從Oracle數(shù)據(jù)庫技術,轉(zhuǎn)到MySQL數(shù)據(jù)庫,最后去研發(fā)阿里自有技術OceanBase數(shù)據(jù)庫。
技術的重新選擇讓阿里最有價值的一批技術人才,隨時要面對熟練的技術突然沒有用的情況。曾參與IBM小機下線的技術人員樓方鑫曾說過這樣一段話:“去掉一兩個系統(tǒng)的IOE不是最難的,也不能代表成功;通過‘去IOE’提升和鍛煉團隊的能力,協(xié)調(diào)好運維和開發(fā)團隊間的工作才是關鍵。”