▲Pivotal HD Hadoop堆棧的不同版本與插件
HAWQ是一種實時查詢語言并被用于代替Hive,它使用類SQL查詢并將其劃入MapReduce批量任務(wù)。HAWQ與Cloudera CDH4發(fā)行版中的Impala數(shù)據(jù)庫層也存在競爭關(guān)系,而經(jīng)過加速的HBase功能也是MapR M7發(fā)行版中的組成部分。
在針對Pivotal HD 1.0發(fā)布撰寫的博文中,Pivotal公司Hadoop堆棧產(chǎn)品戰(zhàn)略與前景部門負責人Saravana Krishnamurthy解釋稱,目前有三套Hadoop代碼軟件包可供選擇:前面提到的社區(qū)版、企業(yè)版以及名為Pivotal單節(jié)點(Single Node)的版本。
社區(qū)版提供免費下載,大家可以將其融入產(chǎn)品并利用社區(qū)網(wǎng)絡(luò)支持構(gòu)建起最多擁有50個節(jié)點的集群。(目前我們還不清楚用戶是否需要購買技術(shù)支持合約或者進行付費升級。)
企業(yè)版則集萬千寵愛于一身,不過用戶需要支付費用——每個服務(wù)器節(jié)點每年的社區(qū)支持費用為1000美元。相比之下,Hortonworks開出的每個集群(至少由十個節(jié)點構(gòu)成)要價12000美元顯得不夠厚道,Cloudera與MapR在各自版本中開出的單節(jié)點4000美元到5000美元的價格更是有些夸張。(兩者的定價都有些模糊,且各個版本之間的功能集也并不一致。)當然,大家也可以直接購買企業(yè)版終身使用權(quán),但Pivotal并未披露其具體售價。
HAWQ為HDFS提供的SQL數(shù)據(jù)庫查詢層與Pivotal HD企業(yè)版一樣以節(jié)點為基礎(chǔ)進行計費,不過Pivotal同樣沒有泄露具體價格。我們很難估量Pivotal將如何為這項功能制定計費標準,但同類關(guān)系型數(shù)據(jù)庫往往每個計算核心都要求用戶支付數(shù)萬美元。如果確定以每臺服務(wù)器節(jié)點作為基礎(chǔ),則盈利空間也將至少達到數(shù)千乃至數(shù)萬美元。
如果硬要El Reg網(wǎng)站存儲頻道做出判斷,我們認為如果數(shù)據(jù)倉儲的價格為每TB 20000美元而僅搭配HDFS與HBase的原始Hadoop集群每TB要價500美元,則Pivotal可能會以HAWQ作為計費分界線,并為此開出10000美元每TB的價位。
如果大家采用搭配12塊3TB磁盤驅(qū)動器的惠普DL380e Gen8服務(wù)器節(jié)點,那么整體數(shù)據(jù)容量將達到36TB。根據(jù)前面得到的結(jié)論,每TB 10000美元的定價意味著用戶將需要在這臺節(jié)點設(shè)備身上花掉360000美元。這樣的要價聽起來好像是窮瘋了,但如果與IBM及甲骨文在關(guān)系類數(shù)據(jù)庫的企業(yè)版本中開出的價格相比較,以上數(shù)字還算可以接受。不過在雙插槽服務(wù)器方面,其實際支出又會大幅提升。
問題的關(guān)鍵是,排除價格因素,Pivotal真正出售的并非Hadoop支持而是HAWQ數(shù)據(jù)庫層。這家年輕的企業(yè)顯然不希望走上低調(diào)上市、后期漲價的道路。
相反,Pivotal公司希望將HAWQ定位為特定領(lǐng)域的關(guān)系類數(shù)據(jù)庫替代方案,并希望以競爭對手的售價以及市場承受能力作為基礎(chǔ)參考。不過最后的結(jié)果很可能是主流客戶根本不會為任何其它方案掏出與關(guān)系類數(shù)據(jù)庫同級別的資金投入,甚至連打個對折都不會考慮。HAWQ最終將不得不嘗試按量計費的方針,正如Linux與MySQl一樣。
而且如果Pivotal對于HAWQ的定價過高,企業(yè)用戶將很可能轉(zhuǎn)而投向Impala項目懷抱甚至選擇自主研發(fā)方案(這要看Cloudera給Impala開出怎樣的社區(qū)支持價碼)??梢哉f目前Hadoop的類SQL或SQL查詢層方面進入了價格競低的時代,哪家廠商敢于開出業(yè)界最低的價位、他們就將掌握該領(lǐng)域的階段性定價權(quán)。
不過目前還沒人急于探詢價格底限——除了Hadoop客戶自己。