惠普Vertica市場營銷副總裁Chris Selland
Vertica 6.1:更專業(yè)的大數據時代選手
“我們同樣也要注意到,大數據意味著種類非常地紛繁復雜,速度是非常地快速。因此很多公司所需要尋找的解決方案是在面臨種類紛繁復雜的海量數據時,如何快速、更好地獲得我們所需要的解決方案來管理數據和信息,并且以更安全便捷的方式來進行管理,分析我們面臨的問題,找到我們所想找到的答案,并作出預測,這就是我們所說的新一代的信息平臺。” Chris Selland表示,惠普Vertica 6.1在“海量信息的高效處理方面擁有強大的功能,可以迅速的移動數據、管理數據,更快的從數據中獲取洞察力。”
Vertica來自于惠普2011年對數據分析軟件公司Vertica的收購,在收購之前,Vertica作為數據分析、數據倉庫領域的知名公司,位列分析機構Gartner數據倉庫數據管理魔力象限的中游,在執(zhí)行力和技術前瞻性方面都有不錯的表現(xiàn)。事實上,Vertica在2011年被惠普的收購,是當年針對數據倉庫、數據分析公司收購浪潮中最晚的,在此之前,IBM、EMC、SAP和微軟分別收購了Netezza、Greenplum、Sybase和DATAllegro等業(yè)界知名公司。
Chris Selland表示Vertica 6.1的版本更新雖然并不顯著,但作為“專為大數據而設計的高性能數據分析平臺”,它具有四個方面的顯著特征:
極快的數據分析:查詢速度比傳統(tǒng)產品快50-1000倍,接近實時的數據洞察。
大規(guī)模擴展能力:可添加無限數量的行業(yè)標準服務器,無限擴展用戶的解決方案。
開放式架構:內置Hadoop、R及一系列ETL和業(yè)務情報工具的支持能力,保護和利用用戶原來在軟硬件上的投資。
優(yōu)化的數據存儲:利用專利的柱狀壓縮技術,每臺服務器可存儲10-30倍于行數據庫的數據。
Vertica與Hadoop整合,加速數據分析
與Hadoop相結合已經成為大數據時代數據管理和數據分析解決方案的必修課,因此,Chris Selland特別提到,Vertica 6.1與Hadoop進行了深度的捆綁,新增了數據管理選擇,能夠通過Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System (HDFS))連接器來優(yōu)化大數據,HDFS連接器的數據加載速度比惠普Vertica分析平臺6.0中的前代連接器版本快四倍以上。
據介紹,用戶可以有兩種選擇:1、將數據直接加載到惠普 Vertica 分析平臺上;2、存儲在Hadoop中并通過惠普 Vertica 分析平臺進行分析。Chris Selland認為,無論是哪種情況,與Hadoop的更好集成都能幫助客戶更快地從大數據中獲得洞察。連接器還可確保各種商業(yè)智能(BI)工具都能通過惠普 Vertica 分析平臺在Hadoop上運行。
不過,他也表示,Hadoop并非沒有缺點,而Vertica 6.1是能夠彌補這些缺陷的產品:“Hadoop現(xiàn)在是勢頭正勁,它本身也是非常強大的工具,可以非常快速地存儲和管理多種類信息。但其中一個不太適合的方面是在高性能的分析方面,利用它(HDFS連接器)的分層存儲和數據歸檔來幫助企業(yè)實現(xiàn)更為便捷的管理,因為它可以實現(xiàn)Hadoop和Vertica之間的自由的數據傳輸和存儲,更為快速。”
在官方資料中,惠普方面表示,通過Vertica 6.1中提供的HDFS連接器“可確保HDFS與惠普 Vertica 分析平臺之間的無縫原生集成,且無需任何資源密集型MapReduce代碼。這種原生集成能使客戶將惠普 Vertica 分析平臺和Hadoop上的分析查詢相結合,從而確保以簡單、可擴展的方式進行高性能分析。”
“我們目前即使把信息給到企業(yè),并不是很多企業(yè)現(xiàn)有的掌握大數據管理方面的人才就可以分析出來的。因為他只是從表象看,看不到深層次的問題,所以我們建議碰到了這樣的情況最好是找一些專業(yè)的廠商。” 談到Vertica 6.1與Hadoop平臺在企業(yè)中所發(fā)揮的不同作用,于志偉表示,“Vertica和Hadoop,他們有不同的特性,Hadoop是處理不同類型的信息,非常有廣度”而Vertica 6.1“能看到更深層次的東西”。
中國惠普有限公司軟件事業(yè)部大中華區(qū)總經理于志偉
與于志偉的觀點類似,Chris Selland認為,在企業(yè)——尤其是大型企業(yè)中——Hadoop和Vertica方案“雙管齊下”非常重要,他表示,Hadoop并非是針對高性能、多層次、高深度(精度)進行設計的,其最初是被用來“針對更加廣泛的類別,所以甚至并不注重速度。”雖然這難以稱得上是Hadoop的缺點,但對于企業(yè)來說這畢竟是有缺陷的,所以“如果企業(yè)要雙管齊下”,從這個角度來講,Hadoop和Vertica有著非常大的互補。
整合數據解決方案:惠普關注行業(yè)特性
在此次發(fā)布的產品更新與解決方案中,包含了惠普許多整合性的解決方案升級以及針對特定應用、特定行業(yè)的產品功能發(fā)布,這顯然是對大數據時代鮮明的應用與行業(yè)特色的一種回應。
惠普電信大數據以及分析(HP Telco Big Data and Analytics)解決方案最為引人關注,作為專門針對通信服務提供商(CSP)的解決方案,其能夠將包括用戶經驗和喜好的各種來源的數據轉換為行動情報。通過利用惠普大數據分析軟件,以及惠普的咨詢、研發(fā)、信息管理和商業(yè)智能經驗,惠普電信大數據及分析解決方案能夠讓通信服務供應商管理、分析并使用與業(yè)務相關的結構化及非結構化數據。
中國惠普有限公司企業(yè)服務集團首席技術官王紀奎
中國惠普有限公司企業(yè)服務集團首席技術官王紀奎在面向媒體的演講中特別指出,“惠普具有面向行業(yè)的大數據服務能力”,并就惠普電信大數據以及分析(HP Telco Big Data and Analytics)解決方案談及,惠普在通信行業(yè)提供的行業(yè)和功能加速器整體解決方案,這一方案包括:商業(yè)智能戰(zhàn)略與管理、企業(yè)數據管理、績效管理與分析,其不僅提供數據整合與數據倉庫,還在更細節(jié)的部分提供信息戰(zhàn)略與治理、主數據管理及信息質量管理等多項功能。
“在不同的行業(yè)里要了解如何在產生大數據的時候去分析用戶的商業(yè)價值,我們要了解它管理信息的戰(zhàn)略。當然也要了解整體數據,到底是從什么系統(tǒng)來,做什么用,最后和哪些客戶有關系,目前處理的,大部分還是跟內部的系統(tǒng)有關系。”王紀奎認為,利用Vertica、Autonomy包括相關的管理軟件工具,最重要的是“要深入理解這個行業(yè)里數據對它意味著什么?”而惠普所做的,正是把這些數據、客戶需要的價值、行業(yè)的數據特點、分析結果、客戶需要的效果整合起來。
因此,王紀奎指出,惠普通信行業(yè)大數據及分析服務整合了從軟件到硬件的惠普多個層面的產品,其中包括:HP Smart Profile Server、HP Actionable Experience Management、HP Ad Experience Personalization、Information Optimization Transformation Experience Workshop以及針對通信服務提供商的“信息優(yōu)化轉型體驗研討會”。
“惠普通信行業(yè)大數據及分析服務讓運營商在已有的IT中洞察和充分發(fā)掘結構化和非結構化信息價值。”王紀奎透露,這一解決方案已經幫助國內的某個運營商提高了1.5%的運營收入,而國內的另外一家運營商也開始嘗試使用這一解決方案來優(yōu)化管理其運營架構和流程:“如何讓整個公司真正地產生大數據價值,要有很好的數據管理和業(yè)務流程設計,從而讓客戶來了以后真正地產生價值。所以我們通過整個流程設計和解決方案分析,把數據流程理清楚以后產生價值。”
王紀奎建議,要想讓大數據產生價值,一定要深入的理解行業(yè),與行業(yè)特征進行有效的結合,“只有深入地了解這個行業(yè)里的業(yè)務系統(tǒng)、應用系統(tǒng)、客戶信息以及不同的數據對它意味著什么,才能真正地讓數據的價值產生出來。”以電信行業(yè)為例,就要考慮網絡優(yōu)化,考慮如何把廣告和相關的搜索引擎、用戶的商業(yè)模式進行結合,“大數據落地與用戶的價值相結合”才是真正的目的和目標。