不僅如此,他還是同事眼里的“江湖百曉生”,通曉各種前沿技術(shù),堪稱數(shù)據(jù)庫領(lǐng)域“百科全書”。
他就是我們今天大咖訪談錄的主角
逗比的“老中醫(yī)”
? ? ? 楊繁:騰訊T4數(shù)據(jù)庫專家,2006年加入騰訊,從事搜索、文件存儲、大數(shù)據(jù)、云計(jì)算等多方面的開發(fā)工作;2015年開始負(fù)責(zé)騰訊云數(shù)據(jù)庫產(chǎn)品開發(fā),今年是他在騰訊的第12個年頭。
目前,騰訊云數(shù)據(jù)庫的性能指標(biāo)已經(jīng)超過100萬QPS,對內(nèi)部承載了QQ、微信、QQ空間等重要產(chǎn)品線,對外則服務(wù)于眾多金融、政府機(jī)構(gòu),其中不乏類似微眾銀行、摩拜這樣的大型互聯(lián)網(wǎng)企業(yè)。
騰訊云數(shù)據(jù)庫產(chǎn)品家族已覆蓋世界上主流的關(guān)系型、鍵值型、文檔型、搜索型、時序型、列式數(shù)據(jù)庫。加上新近推出的CTSDB、CynosDB和即將發(fā)布的智能DBA,目前共有16個子產(chǎn)品和3款數(shù)據(jù)庫工具,提供全行業(yè)解決方案。
? ? ? 數(shù)據(jù)庫先行,一次“不可能完成的任務(wù)”
伴隨規(guī)模的擴(kuò)大、業(yè)務(wù)的轉(zhuǎn)型,企業(yè)對云服務(wù)的需求也在逐漸變化,更合適的云服務(wù),對企業(yè)的發(fā)展起到了重要的作用。在這過程中,不可避免的會發(fā)生云計(jì)算的遷移。
“遷移必須數(shù)據(jù)庫先行,如果數(shù)據(jù)庫遷移不過來,企業(yè)的業(yè)務(wù)是無法正常運(yùn)行的?!痹趯TL中,楊繁講述了曾經(jīng)是互聯(lián)網(wǎng)史上數(shù)據(jù)庫最大數(shù)據(jù)量的遷移案例—某電商企業(yè)的騰訊云數(shù)據(jù)庫遷移之旅,他表示:“在對方眼中,這個大遷移對當(dāng)時的云計(jì)算提供商來說:是一項(xiàng)不可能完成的任務(wù)。”
首先是該家企業(yè)數(shù)據(jù)庫DBA(數(shù)據(jù)庫管理員)人員非常有限,而與之對應(yīng)的則是復(fù)雜的系統(tǒng)架構(gòu),龐大的數(shù)據(jù)量和高數(shù)據(jù)吞吐,楊繁介紹,2017年5月份,對方的數(shù)據(jù)量級已經(jīng)達(dá)到四、五百TB。
對于這樣的遷移,首先擺在面前的問題是,在不影響業(yè)務(wù)的正常運(yùn)營的同時,不僅僅要考慮如何遷移數(shù)據(jù),并且還要保證滿足版本的發(fā)布要求。遷移面臨的數(shù)據(jù)量巨大,時間短,任務(wù)多,網(wǎng)絡(luò)環(huán)境復(fù)雜等問題,所有這些要求綜合起來,對遷移的技術(shù)要求非常苛刻。
專訪中,楊繁描述這一段經(jīng)歷“不可能完成的遷移”的經(jīng)歷時表示:
“我們別無選擇,只能成功不能失敗。在遷移之初,我們首先派騰訊云數(shù)據(jù)庫的產(chǎn)品架構(gòu)師精英,從零開始了解客戶系統(tǒng)架構(gòu)和運(yùn)作模式,根據(jù)當(dāng)前的業(yè)務(wù)情況,打造遷移模型,在正式遷移前不斷演練。當(dāng)時我們吃住都在客戶的辦公室,我們的技術(shù)實(shí)力,服務(wù)態(tài)度和對方案精益求精的精神,得到用戶的認(rèn)可”
“在經(jīng)歷了無數(shù)次演練之后,我們通過演練數(shù)據(jù),做出一份客戶高度認(rèn)可的遷移方案。2017年5月份,遷移正式開始。遷移過程中,我們秉承“以用戶價值為依歸”的經(jīng)營理念,所有的問題解決方案都是圍繞不影響客戶的業(yè)務(wù)和數(shù)據(jù),不管是加班加點(diǎn),還是協(xié)調(diào)各種網(wǎng)絡(luò)/云主機(jī)的專家,歷時五個月的數(shù)據(jù)庫遷移,完全0故障0影響,我們較計(jì)劃提前一個月完成遷移?!?br />
目前騰訊云的支撐下,該電商企業(yè)的業(yè)務(wù)規(guī)模實(shí)現(xiàn)了跨越式的發(fā)展,其中,數(shù)據(jù)庫的遷移功不可沒。同時,騰訊云數(shù)據(jù)庫在電商行業(yè)積累的經(jīng)驗(yàn),也賦能到其他電商:唯品會,蘑菇街等。騰訊云數(shù)據(jù)庫強(qiáng)大的技術(shù)實(shí)力,一流的產(chǎn)品功能性能,以及優(yōu)質(zhì)的服務(wù),成為云數(shù)據(jù)庫的標(biāo)桿。
? ? ? 性能超主流水平3倍,好的產(chǎn)品自己會說話
據(jù)行業(yè)數(shù)據(jù)顯示,目前Top100的直播平臺中,已有超過80%的企業(yè)選擇騰訊云。在游戲直播盛行的時代,直播平臺看中的不僅僅是騰訊游戲在國內(nèi)的主導(dǎo)地位,更是騰訊云背后的技術(shù)和性能支撐。
楊繁介紹了騰訊云的一家典型用戶,2016年初,以視頻和游戲研發(fā)為主的這家用戶,已經(jīng)有了上云的想法,并且已經(jīng)有了目標(biāo)。彼時,騰訊云正好研發(fā)出了一款新的產(chǎn)品,結(jié)合了軟件和硬件的能力,性能指標(biāo)方面超過友商以及國內(nèi)主流水平的3倍。
當(dāng)這家技術(shù)團(tuán)隊(duì)負(fù)責(zé)人了解到這些時,決定選擇對騰訊云的數(shù)據(jù)庫產(chǎn)品做一次性能測試。
“我們的DBA團(tuán)隊(duì)和研發(fā)團(tuán)隊(duì)一起對該用戶的具體業(yè)務(wù)以及每條SQL的優(yōu)化進(jìn)行了全面的跟蹤,從云主機(jī)、網(wǎng)絡(luò)、云數(shù)據(jù)庫所有產(chǎn)品都進(jìn)行了優(yōu)化。兩周時間,測試結(jié)果出來,我們的性能大幅超過了其它廠商,基于此,該用戶最終選擇了騰訊云”。
優(yōu)異的性能成為用戶選擇的關(guān)鍵因素,好的產(chǎn)品自己會說話。
? ? ? 欲速則不達(dá),騰訊云數(shù)據(jù)庫研發(fā)歷程揭秘
研發(fā)是數(shù)據(jù)庫產(chǎn)品的重要環(huán)節(jié),研發(fā)過程也對產(chǎn)品的開發(fā)周期以及產(chǎn)品性能產(chǎn)生著重要的影響。
一個不那么敏捷的方案、看似傳統(tǒng)的方式,可能對產(chǎn)品研發(fā)來說更效率更高、更靠譜。
楊繁透露,目前騰訊云的自研數(shù)據(jù)庫從立項(xiàng)到現(xiàn)在,第一期已經(jīng)基本結(jié)束,總共花了3個月的時間。
? ? ? “老中醫(yī)”和他的團(tuán)隊(duì)”
? ? ? 從立項(xiàng)開始需要和多個部門協(xié)作,為保證團(tuán)隊(duì)協(xié)作以及質(zhì)量控制,我們整體團(tuán)隊(duì)開發(fā)之前會把所有的方案全部對齊,討論到每個接口細(xì)節(jié)問題,定版之后形成文檔,然后交付到每個人,哪個模塊是誰負(fù)責(zé)的話,這個文檔就必須要寫到接口級,并且要寫到每個參數(shù)級別的細(xì)節(jié),達(dá)到即使有改動,也可以回溯整個鏈條。”
在這種方案指導(dǎo)下,騰訊云自研數(shù)據(jù)庫一期的代碼只用了一個月的時間就已完成,留下了近兩個月的時間可以用來調(diào)優(yōu)和debug。而在這個過程中,沒有發(fā)生任何一起因?yàn)樵O(shè)計(jì)不當(dāng)而導(dǎo)致的問題。
同時,憑借這樣一個“傳統(tǒng)”的方案,騰訊云數(shù)據(jù)庫產(chǎn)品的可靠性、穩(wěn)定性已經(jīng)做到業(yè)內(nèi)頂級。
“可靠性方面,我們采用了數(shù)據(jù)副本的模式,假如一份數(shù)據(jù)出三份,即使丟了兩份,還有最后一份可用;在穩(wěn)定性方面,采用了Raft協(xié)議保證一致性,并且會進(jìn)行日志備份模式,保證數(shù)據(jù)完全不可丟。
? ? ? “老中醫(yī)”的稱呼,源自同事們的信任和對技術(shù)的敬畏
? ? ? 深沉的“老中醫(yī)”
? ? ? 談及“老中醫(yī)”這個稱號,楊繁表示:“老中醫(yī)其實(shí)寄托著同事們對我的信任。因?yàn)榭赡芪易陨砉ぷ髂晗薇容^久一些,之前在做互聯(lián)網(wǎng)業(yè)務(wù)開發(fā)的時候,和業(yè)務(wù)團(tuán)隊(duì)去定位問題的過程中,幫助他們解決了不少的問題,所以慢慢地就形成了這種印象吧。”
楊繁在項(xiàng)目開發(fā)方面具有豐富的經(jīng)驗(yàn)積累以及廣泛涉獵。在工作之余,他非常關(guān)注相關(guān)硬件領(lǐng)域的最新動向,喜歡鉆研軟硬兼容、提升產(chǎn)品能力的各種新技術(shù)。對于新人,他經(jīng)常告誡他們,技術(shù)領(lǐng)域,至少要工作七、八年才能形成一定的業(yè)界感知度,這樣,接下來無論是做技術(shù)還是管理才會游刃有余,所以他不太建議技術(shù)新人僅僅工作三年左右就從事管理崗位。
“談及數(shù)據(jù)庫的發(fā)展趨勢,楊繁認(rèn)為“國外的云服務(wù),在中國多少會有一些水土不服,我們需要做中國本土特色的云產(chǎn)品,而中國的數(shù)據(jù)庫產(chǎn)品需要和其它云產(chǎn)品聯(lián)動起來,只有這樣,用戶的可選擇性、可用性才會更好?!?/p>
? ? ? 結(jié)語:
目前,各大云廠商在數(shù)據(jù)庫領(lǐng)域的投入越來越大,在銀行、保險等金融行業(yè),以及政府部門都在提倡使用去IOE,其中一個最重要的就是云數(shù)據(jù)庫??梢灶A(yù)見,未來云數(shù)據(jù)庫,特別是開源關(guān)系型數(shù)據(jù)庫產(chǎn)品將更有市場空間,騰訊云也將會進(jìn)一步聯(lián)合生態(tài)內(nèi)的合作伙伴,打造技術(shù)領(lǐng)先,更易用的數(shù)據(jù)庫產(chǎn)品,讓云計(jì)算真正成為普惠科技,推動全行業(yè)的數(shù)字化轉(zhuǎn)型升級。