噜噜噜综合,又色又爽又高潮免费观看,综合无码一区二区三区四区五区,中文字幕无码人妻aaa片,四虎成人精品永久网站

Facebook存儲技術(shù)方案:找出“暖性BLOB”數(shù)據(jù)

ZDNet存儲頻道 發(fā)表于:14年10月14日 14:43 [綜述] DOIT.com.cn

  • 分享:
[導(dǎo)讀]Facebook公司已經(jīng)在其近線存儲體系當(dāng)中徹底棄用RAID與復(fù)制機(jī)制,轉(zhuǎn)而采用分布式擦除編碼以隔離其所謂的“暖性BLOB”。

Facebook公司已經(jīng)在其近線存儲體系當(dāng)中徹底棄用RAID與復(fù)制機(jī)制,轉(zhuǎn)而采用分布式擦除編碼以隔離其所謂的“暖性BLOB”。

暖性?BLOB?這都是些什么東西?大家別急,馬上為您講解:

  • BLOB——也就是二進(jìn)制大對象,包括Facebook用戶的圖片以及視頻等等。
  • 暖性——是指那些必須進(jìn)行保存,訪問頻率低于熱門數(shù)據(jù)但卻又高于歸檔或者冷門數(shù)據(jù)的信息。通常情況下,這些數(shù)據(jù)已經(jīng)產(chǎn)生了一周以上。當(dāng)然,熱門BLOB的訪問頻率仍然較高。
  • 擦除編碼——向一條字節(jié)串中添加經(jīng)過計(jì)算的奇偶校驗(yàn)值(即里德所羅門碼,簡稱RS),這樣由于錯(cuò)誤刪除或者損壞了完整內(nèi)容之后、該字符串仍能被恢復(fù)為原樣。一般來講,這種機(jī)制能夠比RAID更為有效地對數(shù)據(jù)加以保護(hù)、并且無需占用太多存儲空間。

Facebook公司面臨的一大特殊問題在于,其擁有三種主要用戶數(shù)據(jù)類型外加與之相關(guān)的元數(shù)據(jù),而且這三種類型都要求 擁有龐大的存儲空間作為支撐。Facebook最為主要且訪問頻率最高的數(shù)據(jù)集是那些生成時(shí)間不長,且在用戶時(shí)間表中留存時(shí)間不足一周的發(fā)布信息。這些內(nèi) 容往往會受到該用戶“好友”們的大量訪問。

Facebook利用其Haystack存儲系統(tǒng)處理這些數(shù)據(jù),這套方案采用三級復(fù)制機(jī)制對數(shù)據(jù)中以保護(hù)、確保這部分?jǐn)?shù)據(jù)能夠始終接受訪問且具備快速的響應(yīng)能力,同時(shí)盡可能將訪問指向單一磁盤(當(dāng)元數(shù)據(jù)計(jì)算開始運(yùn)行之后)。

當(dāng)這部分?jǐn)?shù)據(jù)逐漸陳舊之后,其訪問頻率通常也會有所降低——也就是前面提到的由熱門轉(zhuǎn)向“暖性”,但我們?nèi)匀恍枰獮槠涮?供較快的訪問速度、從而切實(shí)滿足調(diào)用需求。這就產(chǎn)生了新的問題,數(shù)據(jù)總量一直處于規(guī)模膨脹態(tài)勢當(dāng)中。舉例來說,截至今年一月份,F(xiàn)acebook所保存的 照片總數(shù)已經(jīng)超過4000億張。

Facebook存儲技術(shù)方案:我們使盡渾身解數(shù)找出“暖性BLOB”數(shù)據(jù)

根據(jù)時(shí)間推移,請求的相對頻率也如圖示發(fā)生衰減。每一條只對應(yīng)單獨(dú)一類存儲對象,圖中取其絕對值以增加易讀性。另外圓點(diǎn)部分代表著訪問請求頻率降低至下一數(shù)量級的轉(zhuǎn)折位置。

在對每TB數(shù)據(jù)IO次數(shù)進(jìn)行計(jì)算之后,我們可以看到這種暖性型數(shù)據(jù)的IO密度要遠(yuǎn)低于熱門數(shù)據(jù),這意味著此類數(shù)據(jù)已經(jīng)不再需要利用三級復(fù)制機(jī)制加以保存,但卻仍然需要具備可以接受的訪問速度,同時(shí)擁有必要的保護(hù)手段以避免遭受磁盤、主機(jī)以及機(jī)架故障的影響。

Facebook公司的工程師們已經(jīng)打造出一款新型存儲系統(tǒng),也就是f4,專門用于保存這些暖性BLOB。工程師們在一篇論文中解釋道:“f4是一款新型系統(tǒng),能夠在降低暖性BLOB有效復(fù)制因素的同時(shí)保持其容錯(cuò)性以及對較低數(shù)據(jù)吞需求的支持能力。”

Facebook存儲技術(shù)方案:我們使盡渾身解數(shù)找出“暖性BLOB”數(shù)據(jù)

Facebook的工程師們指出:

f4采用里德所羅門編碼機(jī)制并將數(shù)據(jù)塊排布在多臺不同機(jī)架之上,從 而確保單一數(shù)據(jù)中心內(nèi)部的磁盤、主機(jī)以及機(jī)架故障不會對數(shù)據(jù)可用性造成影響。它還在廣域?qū)用胬肵OR編碼機(jī)制以確保數(shù)據(jù)中心的故障彈性。f4已經(jīng)在 Facebook的生產(chǎn)環(huán)境之下運(yùn)行了超過19個(gè)月。f4目前保存的邏輯數(shù)據(jù)超過65PB,幫助公司節(jié)約的存儲空間則超過53PB。

BLOB與聚合文件系統(tǒng)元數(shù)據(jù)共同被匯聚在以100GB為單位的邏輯分卷當(dāng)中。這類邏輯分卷由數(shù)據(jù)文件、索引文件以及日志文件共同構(gòu)成。其中索引文件其實(shí)是一套針對內(nèi)存內(nèi)存儲主機(jī)查找結(jié)構(gòu)的快照。當(dāng)所有分卷都被鎖定時(shí),則不允許再創(chuàng)建新的分卷。

這些分卷構(gòu)成多個(gè)cell單元并被保存在數(shù)據(jù)中心內(nèi)部,其中每個(gè)單元由包含15臺主機(jī)的14套機(jī)架構(gòu)成、每臺主機(jī)配備 30塊4TB磁盤驅(qū)動器。每個(gè)分卷/字符串/數(shù)據(jù)塊都擁有一個(gè)位于其它不同地理位置的對應(yīng)分卷/字符串/數(shù)據(jù)塊。Facebook公司還會在獨(dú)立的第三個(gè) 區(qū)域另行保存一套XOR數(shù)據(jù)內(nèi)容。這套體系能夠保證任意區(qū)域出現(xiàn)故障時(shí),用戶仍能順利訪問所需數(shù)據(jù)信息。

那么一般性企業(yè)用戶是否需要建立這樣一套存儲體系來打理自己的近線數(shù)據(jù)呢?基本上用不著,畢竟大部分企業(yè)用戶根本不需要像Facebook那樣面對如此龐大的數(shù)據(jù)總量,也不可能遇到同等規(guī)模的數(shù)據(jù)增長速度或者信息不變性。

[責(zé)任編輯:朱朋博]
高性能計(jì)算的發(fā)展需要國家的支持和投入,也需要足夠多人口基數(shù)來關(guān)注,讓更多的人參與進(jìn)來才能選出好的苗子。我們希望以此次大賽為切入點(diǎn)調(diào)動學(xué)生參與的積極性,通過類似精彩的比賽來吸引大家關(guān)注,不能僅限于高大上的國家項(xiàng)目,應(yīng)該有更多更普及的應(yīng)用。
官方微信
weixin
精彩專題更多
存儲風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動。回顧2014年,存儲作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素,已經(jīng)成為了推動信息產(chǎn)業(yè)發(fā)展的核心動力,存儲產(chǎn)業(yè)的發(fā)展邁向成熟,數(shù)據(jù)經(jīng)濟(jì)的概念順勢而為的提出。
華為OceanStor V3系列存儲系統(tǒng)是面向企業(yè)級應(yīng)用的新一代統(tǒng)一存儲產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達(dá)到業(yè)界領(lǐng)先水平,很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計(jì)算等各種應(yīng)用下的數(shù)據(jù)存儲需求。
聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會
 

公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.