云智慧CEO殷晉

記者:您是怎么走近APM這個行業(yè)的呢?

殷晉:我是05年清華畢業(yè),后來做應(yīng)用系統(tǒng)管理這塊。當(dāng)時的應(yīng)用性能管理主要功能如下:1、監(jiān)測企業(yè)關(guān)鍵應(yīng)用性能:提供服務(wù)的硬件組件的利用率,如CPU利用率以及通過網(wǎng)絡(luò)傳輸?shù)淖止?jié)數(shù)。但卻忽視了最重要的因素–最終用戶的響應(yīng)時間。2、快速定位應(yīng)用系統(tǒng)性能故障:通過對應(yīng)用系統(tǒng)各種組件(數(shù)據(jù)庫、中間件)的監(jiān)測,迅速定位系統(tǒng)故障,如發(fā)生Oracle數(shù)據(jù)庫死鎖等問題。3、優(yōu)化系統(tǒng)性能:精確分析系統(tǒng)各個組件占用系統(tǒng)資源情況,中間件、數(shù)據(jù)庫執(zhí)行效率,保證應(yīng)用在整個壽命周期內(nèi)使用的系統(tǒng)資源要求最少,節(jié)約TCO。但是隨著云計算和大數(shù)據(jù)的發(fā)展,傳統(tǒng)的APM在數(shù)據(jù)分析方面,支撐的粒度以及程度參差不齊,而且基于SaaS的APM市場更是一片空白,傳統(tǒng)的IT運維管理模式亟待創(chuàng)新,我覺得這是一個機會,我希望通過基于SaaS的APM將IT運維人員解放出來,于是我當(dāng)時參與創(chuàng)立了云智慧這家公司。

記者:您認(rèn)為這個行業(yè)目前的技術(shù)門檻在哪里?

殷晉:第一:全面的監(jiān)控能力。1、必須實時監(jiān)控企業(yè)的所有環(huán)節(jié),比如說網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、防火墻、CPU、磁盤、內(nèi)存等等,所有你使用的設(shè)備包括軟硬件都必須監(jiān)控起來,這些東西都可能影響到你的系統(tǒng)性能;2、對于外網(wǎng)的監(jiān)控;3、用戶數(shù)據(jù)的監(jiān)控,除了用戶的基本信息,還需要做到用戶代碼級的監(jiān)控。

第二:數(shù)據(jù)的收集能力。比如說你做SaaS平臺,你用戶做一個APP,有一億的用戶量,你收集這一億用戶的數(shù)據(jù),就需要他們每秒和你進(jìn)行通信,這個時候你每秒需要處理的信息條數(shù),將會是一個天文數(shù)字,你的IT架構(gòu)不一定能夠抗住這種數(shù)據(jù)量的。

第三:數(shù)據(jù)的處理能力。大家都知道,數(shù)據(jù)收集過來以后應(yīng)該進(jìn)行數(shù)據(jù)分析,但是怎么去分析、怎么去建模,這些事運維和開發(fā)人員很難做到的。目前云服務(wù)遍地開花,國內(nèi)的一些廠商都在做APM服務(wù),但是這些同行目前提供的更多的是監(jiān)控服務(wù),他們還處于第一個層次,并不能完全滿足用戶的深度需要。

記者:你們宣稱是智慧的APM,這個智慧主要體現(xiàn)在那里?對于企業(yè)來說,智慧APM可以給企業(yè)帶來哪些價值?

殷晉:當(dāng)你的用戶或者監(jiān)控系統(tǒng)告訴你系統(tǒng)宕掉、或者變慢了,你去處理問題,但是此時已經(jīng)給企業(yè)帶來損失了。舉個例子:順豐,大家都覺得它是一家快遞公司,其實我覺得它更像一家IT公司,因為順豐的核心服務(wù)能力是通過IT系統(tǒng)來傳遞給它的用戶的。如果順豐的IT系統(tǒng)性能降低10%,一天將會損失幾十萬訂單。如果我們能夠防范于未然,比如說隨著你業(yè)務(wù)量增長,我會告訴你,你整個IT系統(tǒng)哪些環(huán)節(jié)會有問題,如果你不改造的話,系統(tǒng)會在我們始料未及的時刻垮掉。傳統(tǒng)的運維只是根據(jù)一些CPU、存儲等硬件來做預(yù)測,這些是遠(yuǎn)遠(yuǎn)不夠的,我們能夠做到在硬件檢測的基礎(chǔ)上,檢測軟件的性能,代碼的性能,做到一個真正的基于大數(shù)據(jù)的預(yù)測。

簡單來說我們的監(jiān)測可以分為三個層次:

一是IT運維可視。例如用戶在前端某個商城下單,而這一操作產(chǎn)生的是整個數(shù)據(jù)的流動和IT響應(yīng)的過程。云智慧通過一個人工可視化的方式使其能夠被看見,然后通過數(shù)據(jù)分析發(fā)現(xiàn)問題的存在。

二是運營風(fēng)險可控。有一個較為典型的案例,去年某知名化妝品電商,在促銷期間投入幾千萬引來流量,但是網(wǎng)站本身崩潰,不僅成本賠掉,用戶口碑也受到嚴(yán)重影響。殷晉表示,類似的運營風(fēng)險之所以未能及時控制住,是其后臺的數(shù)據(jù)不被人所知。透視寶這一款產(chǎn)品,就是通過歷史數(shù)據(jù)、增長趨勢,預(yù)測風(fēng)險在哪些點,是否會爆發(fā)崩潰,該如何改進(jìn)。

三是業(yè)務(wù)增長可期。通過IT運維的數(shù)據(jù),洞察業(yè)務(wù)的趨勢。甚至在基礎(chǔ)設(shè)施層面問題解決的時間較長和難度較大時,選擇其他方案,比如,在產(chǎn)品設(shè)計角度,上個例子就可以在下單流程做改進(jìn),從而將風(fēng)險和損失降到較低水平。

記者:目前APM最大的挑戰(zhàn)是什么?云智慧在這些方面有什么應(yīng)對之策?

殷晉:對我們來講,APM這個產(chǎn)品做到最后其實就是一個大數(shù)據(jù)的分析處理產(chǎn)品。所以未來還是有幾方面需要改進(jìn)。

第一,海量數(shù)據(jù)處理能力,數(shù)據(jù)處理速度越快,用戶也就越多,因此我們需要一個彈性的基礎(chǔ)設(shè)施,目前我們準(zhǔn)備放在云上。

第二,大數(shù)據(jù)模型的優(yōu)化。我們會不斷的優(yōu)化數(shù)據(jù)處理模型,同時增強機器的自助學(xué)習(xí)能力,因為技術(shù)的研究是沒有盡頭的,我們在這方面會不斷地進(jìn)行投入。

第三,市場的壓力。因為APM最終的演化,肯定會成為一個企業(yè)中最核心的應(yīng)用,成為企業(yè)的一個大數(shù)據(jù)管理平臺。此時我們可能需要面對市場上一些軟件廠商的壓力。

記者:公司未來有什么規(guī)劃?在你看來APM未來發(fā)展方向如何?

殷晉:公司的未來將向企業(yè)大數(shù)據(jù)服務(wù)商的角色演變,APM是我們基于企業(yè)應(yīng)用的性能數(shù)據(jù)推出的第一個大數(shù)據(jù)應(yīng)用。未來我們的大數(shù)據(jù)平臺上將接入更多的企業(yè)業(yè)務(wù)數(shù)據(jù),推出更多的企業(yè)級大數(shù)據(jù)應(yīng)用。

應(yīng)用性能管理需求將成為一個企業(yè)在發(fā)展過程中剛性需求,各行各業(yè)的企業(yè)都會需要專業(yè)的第三方APM服務(wù),所以未來APM的發(fā)展空間非常大,在整個云計算領(lǐng)域,可能會是和IaaS規(guī)模相當(dāng)?shù)囊粋€市場。

分享到

fanz

相關(guān)推薦