可以看出,對(duì)于諸如銀行,運(yùn)營(yíng)商,規(guī)模制造業(yè)等大型企業(yè)來(lái)講,其IT系統(tǒng)經(jīng)過(guò)多年演變,不斷發(fā)展,功能相對(duì)齊備;但組件繁多,相互間依存關(guān)系也極其復(fù)雜。針對(duì)這樣復(fù)雜IT系統(tǒng)的服務(wù)管理,主要著眼于以下幾方面:

  服務(wù)的可用性:如何保證系統(tǒng)在需要的時(shí)間段內(nèi)能夠提供正常的服務(wù)。隨著IT的不斷發(fā)展,競(jìng)爭(zhēng)不斷加劇,市場(chǎng)對(duì)企業(yè)的要求也不斷增加。如在上世紀(jì)九十年代,銀行的IT系統(tǒng)只需對(duì)外營(yíng)業(yè)到下午6點(diǎn),而現(xiàn)在,隨著信用卡,網(wǎng)上銀行等需求的出現(xiàn),絕大多數(shù)銀行都已提供每周7天,每天24小時(shí)的所謂7×24的不間斷服務(wù)。IT系統(tǒng)復(fù)雜如“蜘蛛網(wǎng)”,其中任何一個(gè)點(diǎn)上出現(xiàn)的問(wèn)題,是否會(huì)影響到部分或全部的對(duì)外服務(wù)?影響有多大?如何修復(fù)?從而不影響或盡量少的影響到系統(tǒng)對(duì)最終用戶的功能。

  服務(wù)的性能:設(shè)想您走到某一臺(tái)自動(dòng)取款機(jī)前,插入銀行卡,希望取出500塊錢,您的每一個(gè)操作,都要等待十幾秒或數(shù)十秒,您是否會(huì)對(duì)此家銀行的服務(wù)滿意呢?如果時(shí)常如此,您是否會(huì)考慮改用另一家銀行的服務(wù)?當(dāng)您插入銀行卡或在POS終端上劃卡時(shí),從您面前的終端,經(jīng)過(guò)一系列服務(wù)器,網(wǎng)絡(luò)等IT組件及設(shè)備,交易是一個(gè)極其復(fù)雜的過(guò)程,代表交易的電子信號(hào)可能要在IT系統(tǒng)中“旅行”上千公里,在許多節(jié)點(diǎn)停留并被處理,而通常要求這個(gè)過(guò)程必須在幾秒甚至零點(diǎn)幾秒內(nèi)完成。如何能夠保證?當(dāng)途中的某個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題時(shí),如何能夠及早的發(fā)現(xiàn)并改善,這都是有關(guān)服務(wù)性能的話題。

  事件的管理及根源分析:一個(gè)復(fù)雜的IT系統(tǒng)中,每天會(huì)發(fā)生眾多的事件,如某個(gè)端口狀態(tài)改變,某個(gè)服務(wù)器CPU使用過(guò)高等。這些事件有些是偶發(fā)的,獨(dú)立的,有些是其他事件引起的;有些是非常嚴(yán)重的,會(huì)對(duì)系統(tǒng)服務(wù)或性能造成傷害,而有些又是無(wú)關(guān)緊要的。如何在成千上萬(wàn)的事件中抓住主要矛盾,即造成服務(wù)水平和質(zhì)量下降的根源,是事件管理的關(guān)鍵。

  服務(wù)水平管理:越來(lái)越多的企業(yè)要求對(duì)IT部門提供的服務(wù)進(jìn)行量化管理,即要求某一級(jí)別的服務(wù),及其持續(xù)時(shí)間。如要求某項(xiàng)服務(wù)的響應(yīng)時(shí)間必須小于2秒,并保證在一年中99%的時(shí)間都能保持這種情況。更進(jìn)一步,以實(shí)際發(fā)生的數(shù)據(jù)作為IT部門整體考核的一個(gè)關(guān)鍵指標(biāo);隨著服務(wù)外包,IT系統(tǒng)服務(wù)以商品的形式在市場(chǎng)上供需要的企業(yè)購(gòu)買,并與類似的提供IT服務(wù)的企業(yè)開(kāi)展競(jìng)爭(zhēng)。其產(chǎn)品的好壞,除功能強(qiáng)大與否外,也體現(xiàn)在服務(wù)水平方面。作為IT系統(tǒng)的管理者,要對(duì)自己所提供服務(wù)的水平有清晰的了解和認(rèn)識(shí),才能做進(jìn)一步的改進(jìn)與提升。

  類似的要求還有很多,如,IT服務(wù)報(bào)表,以直觀的方式掌握IT系統(tǒng)在過(guò)去一段時(shí)間內(nèi)的統(tǒng)計(jì)信息;財(cái)務(wù)管理,相對(duì)精確的統(tǒng)計(jì)出每一個(gè)服務(wù)的投入與產(chǎn)出,進(jìn)而優(yōu)化IT投資;等等。

  針對(duì)以上要求,我們?nèi)绾螌?shí)現(xiàn)IT服務(wù)管理呢?一個(gè)“簡(jiǎn)單”的思路,也是筆者在項(xiàng)目中經(jīng)常遇到的思路,即,針對(duì)IT架構(gòu)中的每個(gè)組件,每個(gè)連接進(jìn)行度量,在所有IT部件上安放監(jiān)控探針,并通過(guò)網(wǎng)絡(luò)將監(jiān)控到的結(jié)果進(jìn)行集中,即將有關(guān)性能的信息,如某個(gè)CPU使用率達(dá)到90%,某些交易的響應(yīng)時(shí)間增長(zhǎng)到5秒等,和有關(guān)事件的信息,如某個(gè)網(wǎng)絡(luò)端口異常關(guān)閉,某個(gè)硬盤出現(xiàn)故障等,進(jìn)行關(guān)聯(lián),可以進(jìn)行較復(fù)雜的數(shù)學(xué)計(jì)算與分析,從而得到IT服務(wù)管理想要的結(jié)果-服務(wù)的狀態(tài),水平,問(wèn)題根源等。真的如此簡(jiǎn)單嗎?事實(shí)往往并不是這樣的。

  用一個(gè)形象的比喻,西方有句諺語(yǔ):Looking for a needle in a haystack,即從一個(gè)干草堆中找一根針,類似我們說(shuō)的“大海撈針”。有人曾經(jīng)提出一個(gè)充滿理想主義色彩的想法,以達(dá)到能自動(dòng)的從干草堆中找到一根針的目的,就是在每個(gè)草棍兒上安放一個(gè)指南針,由于金屬針的存在,其周圍的指南針會(huì)有所顯示,將所有指南針的信息收集到一起,就可以立刻知道針在干草堆中的位置。這樣做可行嗎?

  這是一個(gè)很形象的類比,與前一段欲在每個(gè)IT組件上安放監(jiān)控探針的想法類似。其結(jié)果當(dāng)然是不可行。首先,其代價(jià)非常昂貴,用戶必須針對(duì)不同平臺(tái),不同廠商的不同組件,均實(shí)施有效的監(jiān)控(對(duì)于大型企業(yè)來(lái)講,其數(shù)量將是成百上千);其次,其架構(gòu)將及其復(fù)雜,不但需要有效的度量,還要將度量到的信息集中、關(guān)聯(lián)、篩選;另外,任何企業(yè)的IT系統(tǒng)都是在不斷演化,發(fā)展中,對(duì)于每個(gè)IT組件上的監(jiān)控,如何與IT系統(tǒng)的變化保持一致;最后,監(jiān)控點(diǎn)越多,出現(xiàn)錯(cuò)誤的可能性就越大,從而對(duì)整個(gè)的服務(wù)管理結(jié)果產(chǎn)生偏差,甚至完全無(wú)效。

  在一個(gè)實(shí)際的IT環(huán)境中,當(dāng)某個(gè)部分發(fā)生問(wèn)題(如硬件故障致使磁盤無(wú)法讀??;或軟件問(wèn)題,如程序處理出錯(cuò)致使某緩沖區(qū)溢出等),經(jīng)過(guò)與其上下游的功能銜接,會(huì)對(duì)整個(gè)IT服務(wù)(或某一部分)造成一定的影響。要對(duì)這種情況進(jìn)行服務(wù)管理,通常的做法是對(duì)關(guān)鍵的部件實(shí)施有效的度量(注意,不是所有部件,只是關(guān)鍵部件),從而大致了解IT系統(tǒng)中正在發(fā)生的事情;根據(jù)系統(tǒng)的組成,應(yīng)用的邏輯,構(gòu)建系統(tǒng)服務(wù)模型,并存放到服務(wù)模型數(shù)據(jù)庫(kù)中(通常為符合ITIL標(biāo)準(zhǔn)的配置管理數(shù)據(jù)庫(kù)(Configuration Management Database-CMDB)),用以模擬出某一事件對(duì)系統(tǒng)服務(wù)的影響??梢?jiàn),在度量方面,通常只針對(duì)關(guān)鍵的部件進(jìn)行部署,所以我們不可能知道IT系統(tǒng)中發(fā)生的所有事情;在服務(wù)模型方面,也不可能做到能夠100%的模擬實(shí)際的應(yīng)用系統(tǒng);那么,可以預(yù)見(jiàn),基于此得到的服務(wù)管理的監(jiān)測(cè)結(jié)果必然不會(huì)是100%的準(zhǔn)確。這是每一個(gè)服務(wù)管理項(xiàng)目所必須正視的一個(gè)問(wèn)題,即“無(wú)法在服務(wù)管理中做到100%的準(zhǔn)確”,用戶只能根據(jù)技術(shù),投資,工期等多方面因素與現(xiàn)狀,得到一個(gè)相對(duì)好的結(jié)果。

  從另一方面看,任何一個(gè)項(xiàng)目,都應(yīng)考慮投入與產(chǎn)出的關(guān)系。對(duì)于IT服務(wù)管理項(xiàng)目,同樣,我們不能忽視其投入與產(chǎn)出,以下三張圖有效的解釋了IT服務(wù)管理項(xiàng)目相關(guān)的投入與產(chǎn)出:

 

  圖A顯示的是企業(yè)IT服務(wù)管理項(xiàng)目實(shí)施的完整性與項(xiàng)目成本間的關(guān)系,可以看出,實(shí)施的越充分,越完整,整個(gè)項(xiàng)目的成本就越高。并且,在實(shí)施的開(kāi)始階段,成本的增加并不顯著,隨著完整性的增加,成本的增加也越來(lái)越明顯,按照曲線的發(fā)展趨勢(shì)來(lái)看,到最后(即橫坐標(biāo)向右發(fā)展),即使無(wú)限的投入也幾乎無(wú)法提高任何完整性。

 

  圖B顯示的是IT服務(wù)管理項(xiàng)目所能達(dá)到的準(zhǔn)確性與整個(gè)項(xiàng)目最后完成的效果之間的關(guān)系。顯而易見(jiàn),其也并非是線性的。

  我們將以上兩條曲線重合,就不難看出,一個(gè)IT服務(wù)管理項(xiàng)目,在什么情況下容易得到較高的投資回報(bào),而什么情況下就應(yīng)及時(shí)收手。如圖C所示:

 

  圖中A點(diǎn)處,投資較少,而項(xiàng)目能達(dá)到的效果較大,故此處為投資回報(bào)最高的地方,即最大的投入產(chǎn)出比;而圖中的B點(diǎn)往右,整個(gè)項(xiàng)目的投資會(huì)急劇增加,而能達(dá)到的效果增長(zhǎng)卻完全不明顯,也就是我們常說(shuō)的“費(fèi)力不討好”。從項(xiàng)目管理的角度,從投入產(chǎn)出的經(jīng)濟(jì)性來(lái)講,都是應(yīng)盡量避免的。

  另一個(gè)經(jīng)常遇到的問(wèn)題,或用戶經(jīng)常提出的要求就是針對(duì)那些出現(xiàn)概率極低的問(wèn)題及其對(duì)業(yè)務(wù)服務(wù)的影響是否進(jìn)行管理與監(jiān)控,或者說(shuō),在實(shí)施企業(yè)業(yè)務(wù)服務(wù)管理項(xiàng)目時(shí),我們是否應(yīng)該包含那些曾經(jīng)出現(xiàn)過(guò)的小概率事件?對(duì)于這個(gè)問(wèn)題,不能以簡(jiǎn)單的是或不是來(lái)回答。一個(gè)IT系統(tǒng)經(jīng)年累月的運(yùn)行,一定會(huì)出現(xiàn)這樣那樣的故障,其中有的故障可能只出現(xiàn)過(guò)一次,或者有的故障只在其他類似企業(yè)出現(xiàn)過(guò),對(duì)于這樣的事件,更多的是應(yīng)該從系統(tǒng)架構(gòu)的設(shè)計(jì)方面予以有效的避免,而不是過(guò)多的著眼于在IT服務(wù)管理項(xiàng)目中將其及時(shí)發(fā)現(xiàn)并進(jìn)行影響性分析。這同樣是一個(gè)有關(guān)投入與產(chǎn)出比的問(wèn)題,與其花費(fèi)大量的人力物力和時(shí)間應(yīng)對(duì)一個(gè)幾乎不會(huì)再發(fā)生的問(wèn)題,不如基于現(xiàn)有的條件完善那些針對(duì)日常經(jīng)常出現(xiàn)問(wèn)題的處理。

  總之,對(duì)于IT服務(wù)管理,應(yīng)該以項(xiàng)目的眼光和角度出發(fā),均衡企業(yè)現(xiàn)有的人,財(cái),物,開(kāi)展有針對(duì)性的工作?;谝延械南到y(tǒng),軟硬件條件,進(jìn)行必要的補(bǔ)足后,搭建起企業(yè)的IT服務(wù)管理平臺(tái)。在這一過(guò)程中,切記不要過(guò)分強(qiáng)調(diào)細(xì)節(jié),也不要好高騖遠(yuǎn),盡量從簡(jiǎn)單的業(yè)務(wù)系統(tǒng)開(kāi)始,以簡(jiǎn)單的業(yè)務(wù)模型為起點(diǎn),逐步完整,層層深入,循序漸進(jìn)。并且,實(shí)施IT服務(wù)管理絕不是一個(gè)一次性的工程,而是要隨著企業(yè)業(yè)務(wù)發(fā)展而不斷做出必要的調(diào)整,改進(jìn),完善。可以說(shuō),企業(yè)實(shí)施IT服務(wù)管理,重要的是過(guò)程,過(guò)程對(duì)了,自然會(huì)有結(jié)果。

  以下是筆者從實(shí)際的服務(wù)管理項(xiàng)目中總結(jié)出的幾條經(jīng)驗(yàn)教訓(xùn),供讀者參考。可能部分內(nèi)容對(duì)于您的企業(yè)實(shí)際情況并不合適,這也是非常正常的,畢竟,實(shí)施企業(yè)IT服務(wù)管理的最根本的是要從企業(yè)系統(tǒng)的實(shí)際出發(fā),因企業(yè)而異,因系統(tǒng)而異。

  首先,在實(shí)施服務(wù)管理項(xiàng)目前,從領(lǐng)導(dǎo)決策層到技術(shù)實(shí)施團(tuán)隊(duì)都應(yīng)該達(dá)成一個(gè)共識(shí),即IT服務(wù)管理是粗略的管理,不可能做到100%的精準(zhǔn)與100%的控制。在這一點(diǎn)上,筆者的一個(gè)同事曾做過(guò)一個(gè)非常貼切的比喻,即IT服務(wù)管理就好象是我們定期進(jìn)行的體檢,我們只能通過(guò)一些體征指標(biāo),大體上了解身體的狀態(tài);大多數(shù)人沒(méi)有時(shí)間,沒(méi)有能力,更負(fù)擔(dān)不起去把身體的每個(gè)部件,從里到外,用各種能用的設(shè)備來(lái)都做一個(gè)全面的檢查。同樣,一個(gè)IT服務(wù)管理項(xiàng)目,也是從一些關(guān)鍵的點(diǎn)入手,從三個(gè)層面來(lái)進(jìn)行。從離基礎(chǔ)架構(gòu)最近的資源層:根據(jù)系統(tǒng)特點(diǎn),選擇關(guān)鍵的測(cè)試點(diǎn),以實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的方式構(gòu)建出基礎(chǔ)架構(gòu)的“關(guān)鍵運(yùn)行指標(biāo)”(即我們常說(shuō)的KPI-Key Performance Index/Indicator);在與管理者最近的業(yè)務(wù)服務(wù)管理層:要構(gòu)建業(yè)務(wù)運(yùn)行的KPI,使領(lǐng)導(dǎo)者,業(yè)務(wù)經(jīng)理等管理層能夠了解當(dāng)前系統(tǒng)業(yè)務(wù)服務(wù)的狀態(tài);在以上兩層之間,還需要有一個(gè)能夠提供深度問(wèn)題分析,問(wèn)題關(guān)聯(lián),業(yè)務(wù)拓?fù)涔芾淼囊粚印?/p>

  在基礎(chǔ)架構(gòu)管理中,就像前面提到過(guò)的,要對(duì)資源的運(yùn)行進(jìn)行必要的度量,要有針對(duì)性的選擇進(jìn)行度量的切入點(diǎn),但切記不能過(guò)分追求度量的范圍與數(shù)量。在這一部分中,要收集資源的事件,資源的運(yùn)行性能,并且通過(guò)必要的工具,收集并整理資源間的調(diào)用關(guān)系。通過(guò)資源管理工具,對(duì)收集到的信息進(jìn)行整理和處理,并以相對(duì)直觀的方式表現(xiàn)出來(lái),使管理和運(yùn)維人員對(duì)系統(tǒng)資源的運(yùn)行狀況有一個(gè)相對(duì)清晰的概念。

  在業(yè)務(wù)服務(wù)管理中,應(yīng)建立業(yè)務(wù)服務(wù)的模型和業(yè)務(wù)影響性分析,并且一切都應(yīng)該從業(yè)務(wù)服務(wù)的角度出發(fā)(而不是從IT的角度)。在這一部分中,最好有了解業(yè)務(wù)的人員參加,因?yàn)橹挥辛私鈽I(yè)務(wù)的人員才知道對(duì)于某一業(yè)務(wù)服務(wù),什么是最重要的。

  其次,要建立可行的手段了解業(yè)務(wù)服務(wù)的結(jié)果。盡量從業(yè)務(wù)服務(wù)的邊際上發(fā)現(xiàn)并測(cè)量業(yè)務(wù)服務(wù)的狀態(tài),而不是通過(guò)若干個(gè)中間指標(biāo)生成。那么,哪些業(yè)務(wù)服務(wù)的狀態(tài)是最常要了解的?

  系統(tǒng)的可用性,即在多長(zhǎng)時(shí)間內(nèi)某項(xiàng)服務(wù)是能夠被最終用戶所正常使用的。隨著業(yè)務(wù)復(fù)雜性的不斷提升,影響業(yè)務(wù)可用性的因素也越來(lái)越多,要通過(guò)分析,了解構(gòu)成業(yè)務(wù)可用性的“短板”,及時(shí)加以度量,并通過(guò)手段進(jìn)行提升。

  響應(yīng)時(shí)間是另一個(gè)經(jīng)常使用的指標(biāo),很多時(shí)候,它直接影響著用戶對(duì)業(yè)務(wù)服務(wù)的滿意程度。試想一下,您從網(wǎng)頁(yè)上提交一個(gè)服務(wù)請(qǐng)求,您的耐心給您多長(zhǎng)時(shí)間來(lái)等待網(wǎng)頁(yè)的回應(yīng)?對(duì)于響應(yīng)時(shí)間的測(cè)量也有多種方式,如使用類似測(cè)試工具那樣的交易模擬機(jī)制,定期通過(guò)網(wǎng)絡(luò)觸發(fā)測(cè)試交易并記錄其響應(yīng)時(shí)間;也可以從服務(wù)器的角度,通過(guò)性能管理工具直接記錄后臺(tái)服務(wù)器中交易的相應(yīng)時(shí)間。這兩種方法各有特點(diǎn),應(yīng)結(jié)合使用。

  客戶滿意度也是一個(gè)重要的業(yè)務(wù)服務(wù)指標(biāo)。業(yè)務(wù)服務(wù)的對(duì)象即為客戶,所謂從業(yè)務(wù)服務(wù)出發(fā),就不能不包含客戶對(duì)業(yè)務(wù)服務(wù)的印象。越來(lái)越多的業(yè)務(wù)服務(wù)管理項(xiàng)目,把客戶滿意度作用一個(gè)關(guān)鍵的指標(biāo)加以度量。讀者可以都有經(jīng)歷,在電話銀行服務(wù)后被要求對(duì)當(dāng)次服務(wù)進(jìn)行評(píng)價(jià)。其他的客戶滿意度還包括服務(wù)中心的正在處理案件數(shù),平均處理時(shí)間等。在設(shè)計(jì)IT服務(wù)管理項(xiàng)目中,應(yīng)該考慮將現(xiàn)有的與客戶滿意度有關(guān)的數(shù)據(jù)如何包含進(jìn)來(lái),并從一個(gè)合適的切入點(diǎn)導(dǎo)入的到業(yè)務(wù)服務(wù)模型之中。

  其他的與業(yè)務(wù)服務(wù)結(jié)果有關(guān)的指標(biāo)還有很多,如系統(tǒng)/網(wǎng)絡(luò)的吞吐量;重要組件(如批量處理,離線數(shù)據(jù)處理)的處理時(shí)間等。在項(xiàng)目設(shè)計(jì)過(guò)程中,應(yīng)均衡考慮,從簡(jiǎn)單直接的指標(biāo)入手,逐漸豐富。

  第三點(diǎn),從向與業(yè)務(wù)服務(wù)相關(guān)各方提供一個(gè)有關(guān)業(yè)務(wù)實(shí)時(shí)交付情況的集成監(jiān)視儀表盤(Dashboard)開(kāi)始開(kāi)展項(xiàng)目。通過(guò)可視化的手段,讓各方及時(shí)了解系統(tǒng)業(yè)務(wù)服務(wù)的狀態(tài),這往往能夠在短時(shí)間內(nèi)達(dá)到事半功倍的效果。所謂‘業(yè)務(wù)服務(wù)的相關(guān)各方’,是指那些系統(tǒng)服務(wù)的使用者,付費(fèi)者,管理者,等等,在現(xiàn)今的企業(yè)中,可能涉及到企業(yè)中絕大多數(shù)的人員。讓這些人有一個(gè)直接的手段或方法了解其所使用,其所購(gòu)買,或其所管理的服務(wù)的運(yùn)行狀態(tài),是實(shí)施系統(tǒng)服務(wù)管理的目的,而通過(guò)一個(gè)集成儀表盤式的界面將眾多的KPI合理有機(jī)的組合,展現(xiàn),是項(xiàng)目成敗的關(guān)鍵所在。

  在構(gòu)建集成監(jiān)控儀表盤的初期,甚至可以考慮以‘只讀’的模式進(jìn)行展現(xiàn)。即在項(xiàng)目的初期,只是通過(guò)集成監(jiān)控儀表盤對(duì)不同監(jiān)控工具或用戶相關(guān)數(shù)據(jù)進(jìn)行有機(jī)的集成,展現(xiàn),并不作為系統(tǒng)管理的‘門戶’供使用者發(fā)現(xiàn)問(wèn)題后能做深度問(wèn)題發(fā)掘與分析。也就是說(shuō),‘業(yè)務(wù)服務(wù)的相關(guān)各方’只能通過(guò)這個(gè)界面了解服務(wù)狀態(tài),而不能直接通過(guò)它發(fā)現(xiàn)并處理問(wèn)題的根源。這樣做的好處是,在項(xiàng)目初期,盡量減少服務(wù)管理項(xiàng)目的復(fù)雜程度,使大家可以將更多的資源用在如何將各種手段獲取的KPI映射,轉(zhuǎn)化為各方接受的業(yè)務(wù)服務(wù)狀態(tài)。而關(guān)于問(wèn)題跟蹤,深度分析的功能,可以通過(guò)相關(guān)的專業(yè)工具或手段進(jìn)行。

  第四,應(yīng)該看到,在當(dāng)前的企業(yè)組織結(jié)構(gòu),尤其是IT部門的組織中,依照技術(shù)特點(diǎn)或技術(shù)種類,IT系統(tǒng)的管理被分成多個(gè)小組。這種分割基本上還完全是依技術(shù)而定,而沒(méi)有依照IT系統(tǒng)所服務(wù)的業(yè)務(wù)來(lái)分。這樣的管理方式有其存在的必要性和必然性,當(dāng)然從業(yè)務(wù)管理的角度也有其弊端。上面提到的建立整合的服務(wù)管理監(jiān)控儀表盤,從某種程度上可以緩解個(gè)技術(shù)組織間的隔閡,使不同技術(shù)組織都對(duì)一個(gè)相關(guān)的業(yè)務(wù)服務(wù)有一個(gè)一致的了解;在另一方面,通過(guò)必要的技術(shù)手段,建立并強(qiáng)化流程式的管理,針對(duì)于某項(xiàng)業(yè)務(wù)服務(wù)管理,通過(guò)流程,串聯(lián)起各個(gè)小組中的相關(guān)人員,形成臨時(shí)的虛擬團(tuán)隊(duì),也有利于開(kāi)展以業(yè)務(wù)為導(dǎo)向的管理工作。

  關(guān)于業(yè)務(wù)管理流程,是一個(gè)當(dāng)前非常熱門的話題,國(guó)際上眾多標(biāo)準(zhǔn)化組織也針對(duì)IT服務(wù)管理總結(jié)出很多的理論和體系,如ITIL等。針對(duì)企業(yè)中IT管理流程實(shí)施的成熟度,國(guó)際知名的IT咨詢研究公司Gartner曾做過(guò)相關(guān)的市場(chǎng)調(diào)研,對(duì)于IT管理流程的實(shí)施程度,從初始的階段,到其高級(jí)階段,分為0到5共6個(gè)層次。如下表:

 

  Gartner的調(diào)查結(jié)果顯示,在2007年,絕大多數(shù)企業(yè)處于1和2之間,即對(duì)流程的重要性有了充分的認(rèn)知,對(duì)部分IT服務(wù)也開(kāi)始指定并遵守一些必要的管理流程。調(diào)查的另一個(gè)出人意料的結(jié)果是,到2012年,大多數(shù)企業(yè)的流程成熟的也只能達(dá)到2和3之間。也就是說(shuō),對(duì)于企業(yè)中IT服務(wù)管理流程的實(shí)施,并不像人們普遍認(rèn)為的那樣簡(jiǎn)單容易。

  所以,對(duì)于企業(yè)計(jì)劃IT服務(wù)管理,我們的建議是從簡(jiǎn)單入手,如可以從實(shí)施可用性管理,性能管理等流程開(kāi)始,將這些流程在企業(yè)中的實(shí)施提升到主動(dòng)的階段或?qū)哟?,即針?duì)上述管理,制定具有可重復(fù)的流程,并且實(shí)現(xiàn)這些流程的自動(dòng)化。而對(duì)于諸如變更管理,服務(wù)生命周期管理等較復(fù)雜的管理流程,可以考慮稍后再開(kāi)始進(jìn)行。

  接下來(lái),讓我們討論一下有關(guān)KPI的問(wèn)題。雖然企業(yè)的IT管理組織還是依照技術(shù)特點(diǎn)而定,(而不是依照所提供的服務(wù)而定),我們還是可以從不同的技術(shù)系統(tǒng)中獲取必要的有關(guān)業(yè)務(wù)的關(guān)鍵運(yùn)行指標(biāo)(KPI)。然后再對(duì)這些KPI進(jìn)行組合,處理等后續(xù)工作,提煉出有關(guān)業(yè)務(wù)服務(wù)狀態(tài)的業(yè)務(wù)服務(wù)管理指標(biāo),并依前面提到過(guò)的方式在企業(yè)集成服務(wù)管理儀表盤上進(jìn)行顯示。

  對(duì)KPI的選擇至關(guān)重要,并且需要業(yè)務(wù)人員與相關(guān)IT人員充分合作,深度討論而得到。其中一條重要的原則就是,切勿過(guò)多!只選擇那些非常關(guān)鍵的一組指標(biāo)。這里有一個(gè)經(jīng)驗(yàn)數(shù)值,即每個(gè)服務(wù)或系統(tǒng)最多不易超過(guò)20個(gè)KPI。其次,建議在服務(wù)的邊界處采集KPI。在SOA(Service Oriented Architecture)的架構(gòu)中,組成系統(tǒng)的是眾多的服務(wù),KPI的采集點(diǎn)就應(yīng)該在各項(xiàng)服務(wù)或各組服務(wù)的對(duì)外接口處;對(duì)于那些傳統(tǒng)架構(gòu)的IT系統(tǒng),則應(yīng)該在組件的對(duì)外接口處進(jìn)行,如數(shù)據(jù)庫(kù)的對(duì)外連接,子網(wǎng)的邊界處等。

  第六點(diǎn),有關(guān)“黃線”的問(wèn)題。在指定業(yè)務(wù)服務(wù)監(jiān)控的報(bào)警閾值時(shí),大家都會(huì)指定兩個(gè)值,預(yù)警值(即常說(shuō)的Warning,用黃色表示)和臨界值(即Critical,多用紅色)。這樣做的好處是,當(dāng)出現(xiàn)黃色報(bào)警時(shí),管理人員就可以采取一些必要的措施,避免事態(tài)進(jìn)一步惡化;如果沒(méi)有好轉(zhuǎn),出現(xiàn)了紅色報(bào)警,則采取更進(jìn)一步的手段,調(diào)用更多的資源,牽扯進(jìn)更多的人力物力進(jìn)行解決。這樣做的初衷是好的,但是也有其弊端。靜態(tài)的定義兩個(gè)數(shù)值,分別作為預(yù)警值和臨界值的做法很不靈活,有時(shí)候也不準(zhǔn)確。如在某些情況下,系統(tǒng)服務(wù)超出預(yù)警值后,其變化可能是多種情況,如惡化的速度加快或減免,甚至于情況又自動(dòng)好轉(zhuǎn)等。針對(duì)這種情況,市場(chǎng)上有的服務(wù)監(jiān)控產(chǎn)品提供了較智能的報(bào)警方式,即以結(jié)果為導(dǎo)向的報(bào)警,用戶無(wú)需指定預(yù)警值,只需給定臨界值,和一個(gè)達(dá)到臨界值的預(yù)警時(shí)間,監(jiān)控軟件會(huì)根據(jù)當(dāng)前KPI的變化趨勢(shì),計(jì)算其達(dá)到臨界值的預(yù)計(jì)時(shí)間,如果這個(gè)時(shí)間比用戶定義的時(shí)間短就發(fā)生預(yù)警報(bào)警。

  第七點(diǎn),一個(gè)好的業(yè)務(wù)服務(wù)管理中,一定會(huì)有一些用于診斷的工具。使用這些工具,用戶可以在業(yè)務(wù)服務(wù)受到影響時(shí),及時(shí)隔離問(wèn)題,進(jìn)行必要的深入研究,進(jìn)行相應(yīng)的資源調(diào)配或程序邏輯改進(jìn),從而根本解決問(wèn)題。

  根據(jù)筆者的經(jīng)驗(yàn),診斷工具可分為以下三個(gè)方面:一,交易方面,采用跟蹤或模擬交易等手段,檢查交易的運(yùn)行,對(duì)交易的端到端響應(yīng)時(shí)間進(jìn)行細(xì)分,定位影響交易響應(yīng)的瓶頸等;應(yīng)用方面,在應(yīng)用程序和中間件級(jí)別進(jìn)行故障診斷,結(jié)合業(yè)務(wù)邏輯,分析,調(diào)試,優(yōu)化應(yīng)用程序及代碼;三,資源方面,進(jìn)行資源使用分析,監(jiān)控各組件運(yùn)行,建立相關(guān)的自動(dòng)化操作,對(duì)工作負(fù)載的變化趨勢(shì)進(jìn)行可視化處理并優(yōu)化資源環(huán)境。

  IT服務(wù)管理是一個(gè)過(guò)程,它將集成企業(yè)內(nèi)部現(xiàn)有的或正在建設(shè)的資源管理,應(yīng)用管理,事件管理等多個(gè)項(xiàng)目,并對(duì)這些相關(guān)項(xiàng)目在實(shí)現(xiàn)方法與策略上提出要求與指導(dǎo)。它不簡(jiǎn)單的是一個(gè)技術(shù)領(lǐng)域的項(xiàng)目,不應(yīng)只限于技術(shù)產(chǎn)品的招投標(biāo)與采購(gòu),更應(yīng)該關(guān)乎組織結(jié)構(gòu),管理方式和技術(shù)實(shí)現(xiàn),以一個(gè)整合的方式來(lái)實(shí)施。

  目前,國(guó)內(nèi)的部分銀行,大型的電信等IT程度較高的企業(yè)都在開(kāi)始或考慮實(shí)施IT業(yè)務(wù)服務(wù)管理,這是一個(gè)潮流,更是一個(gè)方向。在這個(gè)方向上,作為IT系統(tǒng)(甚至于企業(yè)的)管理者,與IT系統(tǒng)的使用者應(yīng)該有充分的溝通和共識(shí),統(tǒng)一思想,制定出一致的目標(biāo)和實(shí)施步驟,充分考慮業(yè)務(wù)流程的調(diào)整,組織結(jié)構(gòu)的優(yōu)化,技術(shù)實(shí)現(xiàn)與服務(wù)廠商的能力和水平等多方面因素。

  我們相信,隨著人們對(duì)IT服務(wù)管理的認(rèn)識(shí)不斷加深,市場(chǎng)上管理理念的不斷完整,以及相關(guān)廠商,產(chǎn)品的不斷完善,IT業(yè)務(wù)服務(wù)管理必將越來(lái)越顯現(xiàn)出其重要性,對(duì)其投入的產(chǎn)出也將被越來(lái)越多的企業(yè)所認(rèn)識(shí)與接受。

  以上討論的內(nèi)容與思路,來(lái)源于筆者近幾年參與的有關(guān)業(yè)務(wù)服務(wù)管理和IT資源管理的工作經(jīng)驗(yàn)和教訓(xùn),并結(jié)合了IBM公司軟件部Tivoli產(chǎn)品發(fā)展策略小組對(duì)業(yè)界實(shí)施IT服務(wù)管理的建議。

分享到

yajing

相關(guān)推薦