HDS 首席執(zhí)行官 Jack Domme
在獨家采訪Kevin Eggleston時,我問他:"你覺得為什么會有這么多人來參加這樣一場由一個獨立供應商舉辦的活動?" Kevin Eggleston的回答是:"第一是因為我們的技術,技術吸引了許多的人,另一方面是我們來自這里是來聽取客戶的意見,吸取他們的經驗。"
不過,對于這次的HDS中國用戶大會來說,人們更多的驚奇來自于David Merrill和他的"存儲經濟學",對于這樣的一個人和一個職位來說,此前不僅從未在存儲行業(yè)有所耳聞,更沒在其他的行業(yè)出現(xiàn)過服務器經濟學家、數(shù)據(jù)中心經濟學家或是網絡經濟學家–將存儲和經濟學掛鉤在一起著實是一件不可思議的事情??蓞⒁姟?font color="#0000ff">存儲經濟學:降低總體擁有成本的四項法則——日立數(shù)據(jù)系統(tǒng)首席存儲經濟學家 David R. Merrill》
當然,如果你對此有所了解之后,相比對此就不會這么吃驚了。
存儲經濟學:將存儲與經濟學一一對應
作為日立數(shù)據(jù)系統(tǒng)的首席存儲經濟學家,David Merrill身上有兩點十分引人注目:第一,首席存儲經濟學家到底是一個什么樣的職位?第二,這位首席存儲經濟學家到底研究的是哪些內容?
"在了解Merrill的工作之前,我們有必要先來回顧一下"經濟學"的三個前提:
1、資源的稀缺性是經濟學分析的前提。所謂資源的稀缺性是相對于人們無窮無盡的欲望而言的。
2、選擇行為是經濟學分析的對象。帶約束條件的選擇行為是經濟學研究的中心。
3、資源的有效配置是經濟學分析的中心目標。這里的有效是有效率,不是有效果。經濟學考核是否有效的標準是看收益是否大于機會成本。
–對于存儲來說,我們可以就此對應三點內容:
通過以上對比,我們就能夠很好的理解為何存儲和經濟學能夠進行對比和整合,并成為Merrill的工作–專注于戰(zhàn)略規(guī)劃、高級存儲架構和存儲經濟學。
事實上,Merrill的工作所體現(xiàn)的,主要是預測高級存儲架構的投資回報率和總體擁有成本,并就此將存儲經濟學擴展到包括存儲經濟學、計量經濟學、存儲基礎設施運營成本縮減,以及存儲結構規(guī)劃,此外還為存儲業(yè)務、組織和架構撰寫組合方案和咨詢開發(fā)建議,為SAN和企業(yè)存儲管理設計架構方法提供最佳策略。
因此,我們能夠很容易的理解Merrill的工作和其所提出的"存儲經濟學"的概念,即:
"存儲需要考慮其所承擔的經濟壓力,并因為這種壓力,需要與經濟的發(fā)展趨向同步發(fā)展,而不是背離一般經濟學規(guī)律。"同時,"存儲經濟學需要考慮從整體擁有成本到整體投資回報率的全面的企業(yè)存儲經濟環(huán)境,向企業(yè)展示其真正的存儲經濟環(huán)境而非部分的存儲經濟現(xiàn)狀。"
最后,在理解存儲經濟學的基礎上,制定存儲采購、利用、回收的囊括整個存儲生命周期和企業(yè)采購周期的方法論,更好的指導已經占企業(yè)IT支出越來越多,且肯定會無限膨脹下去的存儲采購–尤其是"目前是處于經濟危機中,我們必須要看到數(shù)據(jù)在高速增長,如何以新型的方式去看存儲、看數(shù)據(jù)管理。"Merrill表示。
存儲經濟學:與社會經濟學有不同之處
雖然存儲經濟學在經濟學的三個重要方面和一般我們在學校所學的社會經濟學有完全一致的地方,但是,就單獨的經濟學范疇和經濟學研究個體上,存儲經濟學仍然有其獨特的地方,對此,Merrill舉了個很形象的例子:
“舉個例子,拿美國總統(tǒng)來舉例子。在我們總統(tǒng)的國家數(shù)據(jù)庫中,存儲在克林頓總統(tǒng)的時候是3個TB,布什政府的時候是146個TB,再看奧巴馬總統(tǒng)不得了,在各種各樣的網站上這樣的數(shù)據(jù)是無法計量的,所以我們覺得應該是一個PB級的有關于奧巴馬總統(tǒng)的數(shù)據(jù)。如果要看這樣的架構,有不同的行為方式,因此這種經濟性與我們目前所了解的經濟性是完全不一樣的。”
根據(jù)Merrill所引用的分析機構IDC的資料,在很多年之前,大概是10到12年之前,硬件的支出占總的存儲的成本的大部分。但是到了現(xiàn)在,其實存儲購買的成本只是總擁有成本的一小部分,可能也就20%,或者是15%。所以,如果我們只是看存儲的成本的降低,這只是解決了一個大問題的小部分。我們要看的是總擁有成本,比如說管理的成本、人工的成本、電費。存儲的成本,這事實上本身購買成本只是總的擁有成本當中的一小部分。
HDS 首席存儲經濟學家 David Merrill 發(fā)表主題演講
Merrill表示,目前存儲市場上的供應商和客戶都應該看到的非常重要的一點是,也就是從經濟的角度來講是與眾不同的架構–Merrill談到,”在過去的8到9年中我們有各種各樣的領先結構,比如說企業(yè)級的磁盤陣列有存儲、局域網有NAS、存儲網絡等各種各樣的結構。我們所使用、所打造的2003年、2004年的存儲架構,無法滿足到目前非結構化數(shù)據(jù)的增長的需求。而且也無法滿足我們目前在成本控制方面的要求。”
Merrill認為,這就是存儲經濟學目前遇到的最大的問題:無法擁有一個能夠滿足包括成本、可靠性??捎眯栽趦鹊亩喾N需求在內的可持續(xù)的符合”存儲經濟學”的發(fā)展戰(zhàn)略。
33項成本類型:經濟學需要定位自己的研究對象
Merrill令人吃驚的列出了33項不同的存儲成本類型–幸好他沒有說CIO應該對這33個類型全都予以100%的關心。
從經濟學的角度來說,經濟學的研究對象是互相具有關聯(lián)性的,而非割裂的個體,而不同的經濟學分支擁有各自不同的研究對象,但是,無論是產階級經濟學家還是馬克思主義經濟學家,對于經濟學有一個共同的看法,那就是”經濟學一定要有一個明確、清晰的研究對象”–因此,33項成本類型就構成了一個完整的存儲經濟學的研究對象。
“我們必須了解,使用這個存儲設備用一年成本是多少,很多人不知道這怎么計算,不知道是什么意思,他說我在這個技術上花了多少錢,但是并不知道去運轉這個存儲。比如說三到五年要花多少錢,這種成本是很重要的。我們有時候無法獲知這樣的信息,因此無法做出管理和經濟上的決策。因此,這里談到了如何去讓你的存儲更加經濟化、優(yōu)化,如何呢?這就意味著你必須知道到底在存儲方面要花哪些類型的成本或者是錢呢?”Merrill表示,CIO們應該了解”購買的成本”–CIO們得看維護費用、動態(tài)、備份等等各種各樣的成本,我們要看到整個資產的生命周期所帶來的成本,因此,需要用ROI投資回報和TCO總擁有成本以及其它的方式來展示完整的存儲經濟學。
在大會演講上,Merrill對與會的嘉賓(其中有大部分是企業(yè)的IT人員)表示:”你們要去決定這33種成本中哪些對對來講是重要的,然后你們進行一個TCO的計算,建立一個模型,計算一下到底一個TB的磁盤要花多少錢。通過這樣做,我們可以開始理解錢到底花在哪里去了,是勞動力?還是在配置的時間上,還是備份的成本或者是硬件的維護?軟件的維護?到底是拷貝的成本等等。”
David Merrill:HDS能做什么?以及 HDS在做什么?
除研究對象和三大前提之外,經濟學的另一個顯著的特征是,研究經濟學一定要采取科學的研究方法,”經濟學家使用的方法在很多地方和自然科學家們使用的相同,為了解釋和預測,經濟學家建立了一些經濟模型,用以表示各種經濟現(xiàn)象背后的經濟關系。”
因此,研究經濟學,一個有效、完整和可信的經濟模型是必要的,當然,一個經濟模型的有效性還要接受來自于實踐的檢驗。經濟學家要根據(jù)是否成功地解釋和預測現(xiàn)實經濟現(xiàn)象來對模型進行評價。如果預測是錯誤的,首先要檢查推理是否正確;如果推理正確,那就必須對模型進行改進或用其他預測更為準確的模型來代替。有時盡管模型的預測不準確,經濟學家也想把這個模型保留下來,因為它有助于深入考察經濟的運行。
對于HDS來說,33項成本類型已經成為了奠定一個經濟模型的基礎–作為一個經濟模型或者可能的數(shù)學模型,33項成本類型奠定了模型的”因果關系”,這33項成本模型正是整個經濟模型中影響存儲經濟學走向的33個”成因”或者說是33個變量,通過一些系數(shù)的推倒,它們將很容易的推導出一個最后的結果:存儲的成本到底有多少?
但是,這樣的理論方法顯然對企業(yè)管理者們沒有什么用處,更有用的是HDS的技術、產品、方法論和咨詢服務團隊的能力。
日立數(shù)據(jù)系統(tǒng)存儲經濟學方法論、模型和工具以總體擁有成本(TCO)、投資回報率(ROI)、資產回報率(ROA)以及其它財務和經濟原則為核心。
Merrill就此談到:”我們有一些技術、方法、工具,我們也有這樣的咨詢來幫助你們提供業(yè)務上的案例,幫助你們表明虛擬化的技術、動態(tài)的配置、或者是一些精簡的配置,還包括一些回收的存儲,怎么樣給你提供一個回報期或者是節(jié)省了多少的費用。我們會有這樣的計算,涉及到單位成本的降低包括這樣的一些Jack Domme也講了會對企業(yè)有什么樣的意義,也有很多的案例,我們可以幫助人們并不用增加一個磁盤,5個月、8個月不用買,這是長期的。這是為什么我們不向你們賣更多的磁盤,這是我們希望幫助你們利用現(xiàn)有的投資做得更多一些,現(xiàn)在的經濟很困難,我們也面臨了非常困難的經濟,希望中國比其他的全球國家發(fā)展得更快,希望你們引導著世界的發(fā)展。但是對于每個公司來講,都面臨了非常難的經濟的決策,投資的決策,IT的決策,我們必須要使用經濟的辦法給你們提供一些戰(zhàn)略。”
但是,由于往往在經濟學模型和數(shù)學模型中,存在無法預知的變量–對于,存儲來說,或許這就是用戶的使用方法和數(shù)據(jù)量的變化,(當然,從所舉的美國總統(tǒng)的例子來看,Merrill對此認為是無法預估的,但是從計算數(shù)學的角度來說,是可以獲得多個解,或是一個存在于區(qū)間范圍內的多個解的,不過對于企業(yè)社會來說,顯然多個解是無法接受的,只能取優(yōu)。)
對此,Merrill舉了個HDS親身遇到的例子。
“我舉個例子,這是我們所做的一些客戶,我們差不多已經在全球做了700個項目,我們也是非常積極地,盡可能取的亞洲地區(qū)的例子。這是來自于北美盡可能大的金融機構,幾年前我們做了分析,預計虛擬化、動態(tài)分層差不多14個月、15個月能回報,最后我們錯了,3個月就回報了。客戶非常驚訝,但是成本的節(jié)省我們是為他們看到了。我們回頭來考量一下成本的影響,以及他所節(jié)余的成果,通過動態(tài)的分層和虛擬化,我們客戶做的虛擬化差不多是4年前做的項目。”
根據(jù)Merrill的介紹,這是HDS在做虛擬化早期的客戶:”他們是叫做單層的現(xiàn)在變成多層的存儲,來降低這樣增長的成本,我們去給他們展示了一些節(jié)省,從存儲的管理。還有一些節(jié)省是來自于勞動力的節(jié)余,還有管理存儲的一些費用的節(jié)省。還有減少停機的時間,還有包括對環(huán)境的節(jié)省、備份成本的結余,他說這都是錢的非常重要的投入。差不多有32種情況,我們進行了節(jié)余,回頭來看結果是保守的結果,我低估了了實際當中能做的節(jié)余,包括備份、恢復、容災、勞動力方面的成本都下降了。能夠少用人去做更多的事情,這是節(jié)余之后不需要那么多的基礎設施,不需要那么多的人,不需要那么多的硬件、軟件,回報期差不多是12個月到13個月,實際的結果是比這還短的回報期。”
根據(jù)Merrill的完整介紹,關于存儲的經濟性,第一,價格并不等于成本。第二,價格并不等于成本的話,什么相當于成本。HDS定義了幾種不同定義的成本,這是為了了解創(chuàng)造機械的時候。第三,HDS鼓勵客戶去創(chuàng)造一個經濟上的底線,要擁有的存儲每年要按照容量花多少錢。還有經濟上一些非常優(yōu)越的存儲的架構,這些新的架構非常重要的進行投資,即使在經濟不好的時候也一樣。
當然,Merrill也不忘了為HDS做些更多的”廣告”:”HDS這里面幫助你們有這樣的流程,我們有差不多十年的經驗。我們有一些工具、白皮書、案例的研究、成果,還有我們的服務,還有我們的專題討論會,幫助你們搞清楚你的成本在什么地方,以及什么樣的類型資金你能夠來使用,鼓勵你上我們的網站去下載某些文件、案例、工具,然后再來找到我們,今天可以交換一些名片,我們可以給你們提供,幫助你們搞清楚成本所在,以及你下一步怎么樣去做。”
針對中國的客戶,Merrill表示:”希望中國能夠引導經濟的復蘇,會有這樣的經濟上的決策、存儲的決策或者現(xiàn)在去做,或者今年去做,你們需要做出一些決策,給你們提供一個更好的經濟的復蘇。你們有這樣數(shù)據(jù)的增長率,還有一些決策去購買不同的存儲產品,我鼓勵你們去看看經濟上的存儲架構,不同的觀點怎么樣考量存儲的效率,并不是從管理的角度、技術的角度,因為從經濟角度要加以考量。”
從客觀的多方面了解存儲經濟學
不過,對于存儲經濟學的某些內容,實際上我們還需要從更多的方面去看。
盡管經濟學和自然科學使用的模型相似,但經濟模型并不像自然科學中的模型那樣可以作出準確的預測,主要有以下兩個原因。
經濟學中不可能做有條件控制的實驗。物理學家建立模型后可以用嚴格控制條件的實驗室實驗來驗證,然而經濟學家在研究經常變化的環(huán)境和個人、團體、機構等之間復雜的關系時,為了發(fā)展合理的簡單化模型,他們不得不做簡化的假設,比如一個常用的假設是”其他情況保持不變”。然而,與物理學家不同,經濟學家事實上不能讓那些被假定為不變的有關條件保持不變。
從這個意義上說,經濟學有點像氣象學等一些自然科學。由于眾多因素影響氣象系統(tǒng)的過程和發(fā)展,氣象學家不得不做出各種簡化,以便得出較為簡單的預測。不過,隨著近年來衛(wèi)星和計算機的使用,大氣預報越來越精確。在經濟學中也是這樣,在計算機協(xié)助下,經濟學家發(fā)展了更復雜的模型,從而增強了經濟學的預測能力。
人的行為之間的差異是經濟模型面臨的又一個嚴重的困難。盡管在相似情形下人們會做出類似的反應,但這些行為卻時常會有一些差異。例如,做投資決策時公司對膨脹率會怎樣做出反應?這依賴于公司商業(yè)信用狀況等不可預測的因素。在經濟模型中,人們的行為往往被假定為相同,這就導致模型不可能得出精確的預測。
由于這些原因,經常學中不同的模型之間差別很大,每一種所做假設不同,得到的結論也不同。結果,經濟學經常存在著很多爭論。在現(xiàn)實社會中,不同的政黨可能和不同的經濟學思想相結合,左派政黨所借用的模型認為要減少失業(yè),政府必須進行干預;右派政黨所持模型則認為如果政府減少干預,更多地依賴于自由市場經濟,就可以減少失業(yè)。
因此,我們必須要了解的一點是:經濟學并非是萬能的能夠解決問題的,其所做的更多在于”取優(yōu)”和”去粗”,而非提供一個”唯一的解決之道”,尤其是,從另一個角度來說,經濟學屬于一門社會科學,這也就意味著,存儲經濟學也應該是一門社會科學,因此,大而全的方法是難以逐一而用的,對于存儲經濟學指導下的企業(yè)存儲來說,小而精的令存儲更加經濟化的方法是唯一可行卻又需要付出高昂代價的。
既然是社會科學,顯然就應該了解中國的社會文化和學科演進,好在Merrill對此已經有所了解,他表示,”中國的文化是這樣的,你們要求長期地不斷地降低成本來達到我們的路線圖。”因此,Merrill自己表示,對于長期來說,存儲經濟學是一項長期的戰(zhàn)略,Merrill向中國的用戶表示:”這樣的計劃,并不是今年、明年的計劃,而是很多年的計劃,中國有這樣長期的計劃是非常著名的,長期的戰(zhàn)略和長期存儲IT的部署,需要在你IT發(fā)展圖里面長期的理念,對降低成本和對成本的衡量,還有一些理念是關于歸檔的,有更好的管理、更好的虛擬化,以及圍繞我們考核、考評的辦法包括流程等等,這都是長期的目標,這可以帶來我們持續(xù)的發(fā)展,和長期成本的節(jié)省。”
附Merrill所列33種成本類型:
降低成本往往是一項架構設計工作而非產品選擇流程。定義一種存儲架構是否具有優(yōu)異經濟性,在某種程度上取決于它們降低各類存儲擁有成本的效率。這些成本類型包括:
1. 硬件折舊(租賃)-每年的硬件折舊成本或每月的租金;
2. 軟件購置或折舊 - 每月或每年的軟件購置成本。某些軟件可能隨最初的硬件采購一起提供。
3. 硬件維護 - 所有存儲硬件在基礎保修期之后的經常性維護或保修成本。
4. 軟件維護 - 所有存儲軟件的經常性維護或保修成本。
5. 存儲管理勞動力 - 與各種存儲管理任務,如:配置、調試、負載均衡、故障排除和升級等相關的勞動力管理成本。
6. 備份和災難恢復勞動力 - 除存儲管理外,規(guī)劃并測試有關備份、恢復以及災難恢復的額外勞動力成本。
7. 遷移,重新配置 - 在存儲系統(tǒng)到達壽命時有關數(shù)據(jù)遷移的各種成本。在大型環(huán)境下,數(shù)據(jù)遷移工作需要不斷投入大量勞動力。
8. 數(shù)據(jù)移動性 - 向不同層次或歸檔解決方案移動數(shù)據(jù)所需的時間和工作。與數(shù)據(jù)重新管制不同,數(shù)據(jù)移動性在數(shù)據(jù)生命周期之后,而非系統(tǒng)生命周期之后。
9. 電力消耗和冷卻 - 數(shù)據(jù)中心電力kVA、BTU成本(轉換成kW)。電力成本應該包括工業(yè)級的空調以及電池或柴油機等后備電力成本。
10. 監(jiān)測 - 有關存儲、SAN和備份平臺的SNMP、NOC和運行控制臺。
11. 數(shù)據(jù)中心占地空間 - 每平方米數(shù)據(jù)中心地面空間的成本。此成本往往包括無間斷電源(UPS)和活動地板成本。
12. 配置時間 - 從發(fā)出請求到把容量提交給主機這段等待時間對業(yè)務的影響。
13. 浪費成本 - 有兩種類型:可用卻沒有分配,分配卻沒有使用。
14. 拷貝成本 - 數(shù)據(jù)庫管理系統(tǒng)(DBMS)和其它應用往往需要進行拷貝。可能進行層次內拷貝,也可能進行層次外拷貝。測試、開發(fā)、質量保證(QA)、數(shù)據(jù)集市、數(shù)據(jù)加載程序及類似的應用都需要多個結構化和非結構化數(shù)據(jù)拷貝。
15. 數(shù)據(jù)復制成本 - 除多重拷貝外,由于同樣的數(shù)據(jù)存在多個副本而導致的管理成本。這種現(xiàn)象在非結構化文件系統(tǒng)中很常見。
16. 增長成本 - 從根本上來說,每個存儲架構都存在增長成本。在高增長環(huán)境下,如果采用錯誤的架構,增長成本會非常高。
17. 計劃的系統(tǒng)停機成本 - 微碼改變,容量升級。
18. 非計劃內的系統(tǒng)停機(與機器有關的)成本 - 發(fā)生在存儲系統(tǒng)、接口或數(shù)據(jù)通道的成本。
19. 非計劃內的系統(tǒng)停機(與人和流程有關的)成本 - 往往由于容量問題、運行控制和物理閾值而引發(fā)。
20. 災難風險、業(yè)務重新恢復成本 - 發(fā)生重大災難事故后進行緩慢或快速恢復對業(yè)務產生的影響。
21. 恢復時間目標和恢復點目標(RTO和RPO)成本 - 在系統(tǒng)出現(xiàn)故障或進行備份恢復之后,退回到某個恢復時間(或恢復點)所花費的時間對業(yè)務造成影響的成本。
22. 數(shù)據(jù)損失 - 由于數(shù)據(jù)丟失、損壞或者無法恢復,對業(yè)務和整個企業(yè)帶來的成本。
23. 訴訟、事實披露風險 - 與訴訟有關的法律風險以及電子資料搜集的時間成本。還包括一般數(shù)據(jù)定位和恢復工作所需的時間。
24. 減少有害廢物 - 主要是由于類似RoHS這樣的由歐盟制定的強制性標準所導致的成本(Restriction of Hazardous Substances,限制在電子電器設備中使用某些有害成分的指令)。不符合規(guī)定的硬件可能會由于資產處置原因而被征收額外的關稅。
25. 性能成本 - 總體存儲性能(IOPS、延時、MB/秒)對業(yè)務的影響(好或壞)。
26. 備份基礎設施 - 用于備份的固定成本基礎設施。包括備份服務器、媒體服務器、磁帶庫及驅動器等。
27. 備份介質 - 用于備份的本地和遠程介質成本;經常性成本以及與容量有關的成本。
28. 與備份窗口相關的風險成本 - 縮短或者有限的備份窗口對業(yè)務產生的影響。
29. 與CIFS、NFS相關的基礎架構 - 文件管理程序、網關以及在企業(yè)內提供文件服務器和共享服務所必需的軟件。
30. 本地和遠程數(shù)據(jù)電路 - 用于SAN擴展、遠程復制及相關軟件的暗光纖。
31. 存儲區(qū)域聯(lián)網 - 專用的光纖通道、iSCSI或NAS連接基礎架構。包括:路由器、網關、主機總線適配器交換機和控制器。
32. 違反相關規(guī)定的風險(歸檔、數(shù)據(jù)保留) — 多項法律和立法要求(如:HIPAA、Basel II、Sarbanes-Oxley法案、碳排放法案),違反這些法律可能招致罰款,公眾形象受損以及被追究刑事責任。
33. 安全、加密 - 與存儲基礎架構數(shù)據(jù)保護、安全和加密有關的成本。
上述33類成本并非享有同等的重要性或時間相關性。按照日立數(shù)據(jù)系統(tǒng)的經驗,IT規(guī)劃者傾向于選擇8-15%的這些成本來建立他們公司自己的總體擁有成本(TCO)基線。在所有成本分析中,某些成本屬于硬成本(實際預算已經花出,并且可以衡量),而某些成本則屬于軟成本(難以量化,例如未來潛在的事故成本)。無論硬成本還是軟成本,都要根據(jù)業(yè)務需求被選中并進行衡量。對制定和實施能夠降低存儲總成本的計劃來說,對這些成本進行組織和排序非常重要。如果不能對成本進行衡量,就談不上改善。