隨著電腦在容量上的發(fā)展,卡片本身的存儲(chǔ)能力與速度都成為一個(gè)問題,更不用說還存在容易被損壞的問題了。紙帶卷成為了替換品,特別是可應(yīng)用于第一代微型電腦,如Digital Equipment PDP-8。
紙帶的推出
紙帶的行和列都是連續(xù)的,每一列也是以孔洞的形式表示二進(jìn)制數(shù)值。紙帶從電傳打字機(jī)進(jìn)入電腦,數(shù)據(jù)采用ASCII編碼。
它被保存到紙袋卷或是以復(fù)寫紙的形式保存,被傳送到光學(xué)讀取器處,且是用帶穿孔機(jī)寫入。當(dāng)存儲(chǔ)介質(zhì)通過讀取器時(shí),系統(tǒng)要知道它位于紙帶的哪個(gè)位置,這樣才能完成讀取。也就是說,紙帶要準(zhǔn)確移動(dòng)到讀取位置,這樣才能順利讀取紙帶的信息。鏈輪齒可以確保紙帶處于正確位置。
Digital Equipment DEC Type PC09C紙帶讀取器每秒讀取300個(gè)字符,相當(dāng)于每分鐘18kb。
紙帶更小,而且比穿孔卡更方便,但缺陷是容易被撕破。隨著電腦容量的發(fā)展,人們需要更多紙帶來保存較大的程序和更多數(shù)據(jù)——PDP-8逐步被16位PDP-12取代,而后又被32位VAX取代。
數(shù)據(jù)量的增加提升了電腦的處理能力,這意味著系統(tǒng)內(nèi)存可允許更大的電腦程序和更多數(shù)據(jù)。第一款VAX是11/780系統(tǒng),有4G處理能力,比PDP 11的64KB要大得多。12位的PDP-8有4KB的主存儲(chǔ)器。
紙帶速度不能和這些較大型的電腦匹配,所以就出現(xiàn)了數(shù)字磁帶。
磁帶的魅力
磁帶是德國Fritz Pfleumer公司在1928年發(fā)明的錄音介質(zhì)。1951年它被首次被用作UNIVAC 1電腦上的數(shù)字存儲(chǔ)介質(zhì)。
磁帶仍然是連續(xù)的,現(xiàn)在被稱為磁道。數(shù)字信號(hào)仍然行和列交叉處,但是現(xiàn)在是用磁場(chǎng)方向來記錄;北或南;正或負(fù);1或0.記錄密度比遠(yuǎn)遠(yuǎn)優(yōu)于紙帶和穿孔卡;在UNIVAC 1上,每英寸128個(gè)字符使用八個(gè)磁道。
磁帶被保存在圓卷上,從一個(gè)卷傳遞到另一個(gè)卷的時(shí)候,由磁頭讀取。
10.5英寸,9磁道的磁帶卷
磁帶提供了很重要的新特性。由于所保存信號(hào),數(shù)據(jù)量都日漸減少,所以同一地區(qū)可保存更多數(shù)據(jù),從而增加了區(qū)域密度。再者,磁帶比紙帶通過讀取頭的速度要快,因此這也增加了數(shù)據(jù)的訪問速度。
讀寫數(shù)據(jù)的進(jìn)程也可在單獨(dú)的讀取頭執(zhí)行。這可以加快數(shù)據(jù)寫入的速度,這樣一來,電腦更快地把信息輸出到存儲(chǔ),使其可以把數(shù)據(jù)備份到磁帶,作為長時(shí)存儲(chǔ)。
與此同時(shí),磁帶驅(qū)動(dòng)由于具備磁性,所以也可以收縮,這樣最初的落地式元件被安裝在電腦前的驅(qū)動(dòng)所取代。
后來人們研發(fā)出了用于大型機(jī)和個(gè)人PC的各種磁帶型號(hào)和格式,逐漸淘汰了紙帶。盡管如此,數(shù)據(jù)訪問速度仍然有限,因?yàn)榇艓?qū)動(dòng)只有一個(gè)讀取頭。要想在磁帶上獲取某個(gè)文件時(shí),必須把這個(gè)文件放到讀取頭下;磁帶是按順序通過讀取頭的。
為了解決這個(gè)問題,人們最先是想到了聯(lián)網(wǎng)式或共享式存儲(chǔ)。磁帶庫中收集了一組驅(qū)動(dòng)和一套磁帶卷,供若干電腦共享,從而成就了SAN和NAS的輝煌。
還不止這些。用磁帶的時(shí)候,錯(cuò)誤檢測(cè)和糾正都變得更為重要,因?yàn)槎M(jìn)制的信號(hào)可能被減弱,于是人們想出了各種辦法來保障二進(jìn)制數(shù)值的確定性。這類辦法隨著位存儲(chǔ)介質(zhì)越變?cè)叫∫蚨絹碓綇?fù)雜。
磁帶技術(shù)穩(wěn)步發(fā)展,數(shù)據(jù)容量和傳輸速度都在提升。下圖顯示了LTO格式容量和速度的發(fā)展情況,從2000年的LTO-1到去年年底的LTO-6:
隨著電腦處理器的速度越來越快,它在磁帶上定位和寫入數(shù)據(jù)的時(shí)長成為了一個(gè)問題。但是處理器速度和數(shù)據(jù)存儲(chǔ)速度的不協(xié)調(diào)一直存在,而這也刺激了主要存儲(chǔ)技術(shù)的發(fā)展。
電腦數(shù)據(jù)存儲(chǔ)技術(shù)的每一次革新都解決了此前存儲(chǔ)技術(shù)中存在的一些問題,但是新問題又接踵而至,如此循環(huán)往復(fù),技術(shù)不斷推陳出新。正是在磁帶的基礎(chǔ)上,IBM才制造出了磁盤。
磁盤將存儲(chǔ)帶入旋轉(zhuǎn)時(shí)代
IBM在1956年發(fā)布350 RAMAC(會(huì)計(jì)與控制的隨機(jī)存取方法)磁盤系統(tǒng)。用一個(gè)扁平的磁盤平面來作為記錄媒介是劃時(shí)代的,不過它還需要另一個(gè)重要的方法來實(shí)用化。我們用移動(dòng)的讀取/寫入頭和旋轉(zhuǎn)式磁盤平面取代了固定式的讀取/寫入頭和移動(dòng)式的磁帶。
?
The IBM 350 RAMAC磁盤系統(tǒng)
突然間,數(shù)據(jù)的訪問速度大幅提升。過去我們要等待磁帶順序地移動(dòng)到指定的數(shù)據(jù)位置,然后才能將讀取頭移動(dòng)到正確的軌道上。新的方法可以隨機(jī)地快速訪問任何數(shù)據(jù),無論在哪里。我們實(shí)現(xiàn)了隨機(jī)訪問。
RAMAC有兩個(gè)讀取/寫入頭,可以在堆棧內(nèi)上下移動(dòng)來選擇磁盤,然后內(nèi)外移動(dòng)來選擇磁道。然后磁盤技術(shù)發(fā)展到每個(gè)記錄平面都有讀取/寫入頭,從而避免了磁盤磁片的尋找時(shí)間延遲。多個(gè)移動(dòng)的讀取-寫入頭帶來了隨機(jī)的數(shù)據(jù)讀取功能,一下子解決了磁帶的I/O等待問題。在數(shù)據(jù)存儲(chǔ)技術(shù)領(lǐng)域,它是一個(gè)非常大的進(jìn)步。讓一個(gè)磁頭在非常近的距離內(nèi)在磁盤平面上來回移動(dòng)相當(dāng)于讓一架大型噴氣式飛機(jī)離地幾米飛行而不墜毀。
RAMAC使用6位字符和50個(gè)24寸磁盤,提供5MB的容量。這些磁盤的兩面都可以作為記錄面。磁盤驅(qū)動(dòng)器很快地越變?cè)叫?,記錄密度飛快提升到如今的水準(zhǔn)?,F(xiàn)在我們可以在一個(gè)差不多4個(gè)CD盒大小的機(jī)盒內(nèi)配置4TB 4磁片驅(qū)動(dòng)器,讓驅(qū)動(dòng)器一個(gè)挨一個(gè)地堆在各自上面。
一個(gè)重要的發(fā)展就是軟盤。軟盤是一個(gè)放在一個(gè)盒子里的一個(gè)可扭彎的磁片,可以插入到軟盤驅(qū)動(dòng)器。它讓人想起磁帶,不過它們非常便宜。個(gè)人電腦先驅(qū)們?cè)跀?shù)據(jù)存儲(chǔ)上選擇了軟盤,不過軟盤只是中間過渡產(chǎn)品,因?yàn)橐坏?.5英寸硬盤驅(qū)動(dòng)器格式和SCSI(小型計(jì)算機(jī)系統(tǒng)接口)訪問協(xié)議出現(xiàn),個(gè)人電腦和工作站的擁有者們就傾向后面的這些技術(shù)來獲得更高的數(shù)據(jù)訪問速度、可靠性和容量。
配置2個(gè)軟盤驅(qū)動(dòng)器的Apple II
3.5英寸格式成為主流,在如今所有的電腦上都可以看到,包括大型機(jī)、服務(wù)器、工作站和臺(tái)式機(jī)。
個(gè)人電腦擁有率的快速增長推動(dòng)了磁盤制造業(yè)的擴(kuò)張,而網(wǎng)絡(luò)磁盤存儲(chǔ)陣列的崛起更推動(dòng)了這一進(jìn)程。服務(wù)器中的應(yīng)用程序被誘導(dǎo)為認(rèn)為它們正在訪問的是本地的直連式磁盤,雖然它們實(shí)際上是在一個(gè)共享式的磁盤驅(qū)動(dòng)器陣列上讀取和寫入數(shù)據(jù)。
應(yīng)用程序,比如數(shù)據(jù)庫,通過文件協(xié)議(文件系統(tǒng)設(shè)備或NAS)來訪問陣列或?qū)㈥嚵锌醋鱏AN(存儲(chǔ)局域網(wǎng))陣列——裸磁盤塊——來訪問。通常,SAN是通過專門的光纖通道鏈接來訪問的,而文件系統(tǒng)設(shè)備是通過以太網(wǎng)或局域網(wǎng)(LAN)來訪問的。
隨著讀寫頭技術(shù)越來越復(fù)雜,磁盤驅(qū)動(dòng)器制造逐漸變得越來越昂貴。能在這個(gè)行業(yè)中獲取利潤并支持營運(yùn)的是那些善于組織它們的組件供應(yīng)鏈、制造高成本經(jīng)濟(jì)性和高可靠性產(chǎn)品并能夠有效管理成本和銷售產(chǎn)品的公司。
其他公司的利潤減少,陷入負(fù)債深淵,或破產(chǎn)或被收購。曾經(jīng)市場(chǎng)上有超過200家磁盤驅(qū)動(dòng)器制造商。現(xiàn)在只有三家了:希捷、東芝和西數(shù)/HGST。
Seagate的ST-412磁盤driveE
磁盤驅(qū)動(dòng)器陣列的崛起以及單位GB成本的下降意味著它們可以承擔(dān)備份數(shù)據(jù)存儲(chǔ)責(zé)任,尤其是如果備份數(shù)據(jù)集中的重復(fù)數(shù)據(jù)可以被重復(fù)數(shù)據(jù)刪除技術(shù)所移除的話。這對(duì)磁帶備份業(yè)是一個(gè)沉重的打擊,帶來了快速的格式合并浪潮?,F(xiàn)在,實(shí)際上我們只有兩家擁有專有數(shù)據(jù)格式的大型機(jī)磁帶供應(yīng)商,即IBM和Oracle,然后只剩下一個(gè)服務(wù)器計(jì)算機(jī)磁帶格式,LTO。LTO指的是線性磁帶開放格式,現(xiàn)在已經(jīng)發(fā)展到第六代。LTO格式是由一個(gè)三家廠商所組成的聯(lián)盟開發(fā)的:惠普、IBM和Quantum。
雖然磁盤可以承載越來越多的數(shù)據(jù)并且技術(shù)發(fā)展使得磁盤可以更快地讀取和寫入數(shù)據(jù),一個(gè)很大的問題仍然存在。磁盤可能會(huì)發(fā)生故障,導(dǎo)致所有被存儲(chǔ)的數(shù)據(jù)丟失。這個(gè)問題可以通過制作額外的數(shù)據(jù)備份來避免。RAID技術(shù)——獨(dú)立磁盤冗余陣列——可以算術(shù)式地處理數(shù)據(jù),使得數(shù)據(jù)所需要的磁盤數(shù)量減少,從而降低數(shù)據(jù)保護(hù)成本。不同的RAID框架包括RAID 0、1、2、4、5、20,每個(gè)框架都可以對(duì)數(shù)據(jù)訪問速度、數(shù)據(jù)保護(hù)可靠性和容量需求進(jìn)行優(yōu)化。
在RAID框架下,故障磁盤中的內(nèi)容可以通過正常驅(qū)動(dòng)器上的RAID數(shù)據(jù)來重建。不過這個(gè)RAID重建過程所需要的時(shí)間隨著驅(qū)動(dòng)器容量的增長而增長。
HGST 7K500 3.5英寸硬盤驅(qū)動(dòng)器
隨著陣列中驅(qū)動(dòng)器的數(shù)量增加到數(shù)百個(gè),隨后又超過1000個(gè)的門檻,很有必要在第一個(gè)驅(qū)動(dòng)器故障還未恢復(fù)而第二個(gè)驅(qū)動(dòng)器發(fā)生故障的時(shí)候擁有能夠恢復(fù)數(shù)據(jù)的能力,因此RAID 6就被開發(fā)出來。
磁盤驅(qū)動(dòng)器的增長快速提高了被存儲(chǔ)的數(shù)字信息的總量,研究者認(rèn)為數(shù)字存儲(chǔ)容量在2002年超過了模擬存儲(chǔ)容量,而這個(gè)增長速度仍在繼續(xù)加快。
IDC數(shù)字世界增長(按EB計(jì)算)(IDC/EMC 2011年6月)
由于磁盤中的轉(zhuǎn)速對(duì)數(shù)據(jù)讀取訪問速度非常重要,因此制造商們度在努力提高每分鐘轉(zhuǎn)速(RPM)。磁盤速度在不斷提高,直到觸及到1.5萬轉(zhuǎn)的門檻。轉(zhuǎn)速更高的話,磁盤磁片有可能因?yàn)殡x心力和振動(dòng)而解體。較低轉(zhuǎn)速的驅(qū)動(dòng)器可以保存更多的數(shù)據(jù),轉(zhuǎn)速保持在5400轉(zhuǎn)就可以了。這意味著隨著驅(qū)動(dòng)器容量的不斷提高,從磁盤中讀取和寫入數(shù)據(jù)的速度卻沒有變化,這越來越成為一個(gè)制約因素。
另一個(gè)問題是隨著摩爾定律下的計(jì)算機(jī)處理器速度不斷提高,磁盤I/O速度已經(jīng)遠(yuǎn)遠(yuǎn)落后。遷移到2.5英寸驅(qū)動(dòng)器意味著磁盤驅(qū)動(dòng)器機(jī)箱可以提高整體I/O速度,但是幅度并不大。
在磁盤無法跟上主機(jī)速度的背景下,我們看到NAND固態(tài)閃存存儲(chǔ)的快速崛起。閃存沒有移動(dòng)的磁頭,實(shí)際上完全沒有任何讀取/寫入頭。
NAND閃存
NAND閃存是東芝的Fujio Masuoka博士在1980年發(fā)明的。NAND閃存的形式是一個(gè)個(gè)塊中的單元,必須被同時(shí)寫入。因此,嚴(yán)格地說,NAND閃存不是隨機(jī)訪問設(shè)備。
閃存記憶體單元的示意圖
作為閃存的一種類型,NOR在手機(jī)和其他設(shè)備中作為只讀記憶體的一種形式被使用。NAND在照相機(jī)、U盤、平板電腦、筆記本電腦和各種需要小尺寸、低能耗和超越磁盤訪問速度的持續(xù)數(shù)據(jù)存儲(chǔ)的設(shè)備中作為數(shù)據(jù)存儲(chǔ)被使用。
閃存是一個(gè)半導(dǎo)體技術(shù),不包含任何機(jī)械部件,同樣容量下的體積要遠(yuǎn)遠(yuǎn)小于磁盤。一個(gè)1TB的U盤可以就放在你手心上,而且比4CD盒裝的3.5英寸磁盤驅(qū)動(dòng)器要輕得多。
光學(xué)存儲(chǔ)的快速回顧
CD和DVD也被用于歸檔數(shù)據(jù)存儲(chǔ),不過由于它們本身存在的缺陷,它們沒有被廣泛使用。與磁盤驅(qū)動(dòng)器相比,光盤的容量低,寫入速度慢,而磁帶在存儲(chǔ)大容量數(shù)據(jù)上的價(jià)格又低于磁盤和CD/DVD。磁盤在寫入和讀取備份數(shù)據(jù)上的速度也更快。所有這些都意味著光盤只能在如今小眾市場(chǎng)上找到。
同時(shí),廠商們也在努力開發(fā)全息存儲(chǔ)技術(shù)來提供更長的歸檔期和更高的容量。他們失敗了?,F(xiàn)在,我們甚至可以考慮在歸檔存儲(chǔ)上使用非常便宜的閃存記憶體,TLC閃存。
閃存有三種類型。單層單元(SLC)閃存的每個(gè)單元存儲(chǔ)1比特,是最快也是最貴的閃存。它的問題在于在它的PE(編程/擦除)周期次數(shù)有限。
每單元2比特的閃存被稱為MLC(多層單元)閃存。它的容量比SLC閃存高,但是速度慢,盡管價(jià)格更便宜些,而且工作壽命也更短。三比特的閃存被稱為TLC(三層單元閃存)。TLC比MLC更便宜、更慢,壽命也更短。TLC用于數(shù)碼相機(jī)以及類似的PE周期在2500次以下也可以接受的場(chǎng)合。
過量配置可以延長閃存的耐久性,可以將空閑的未使用的單元代替已經(jīng)損耗殆盡的單元。我們還有一個(gè)問題。提高閃存單位密度的唯一方式就是縮小單元尺寸。不過,隨著我們這樣做,從40納米單元尺寸(49-40納米范圍)到30納米范圍到20納米范圍以至更小,閃存單元的耐久度也隨之下降。如今最新的閃存是16納米制程。也許廠商會(huì)推出更小的迭代,但是某種形式的NAND晶圓堆棧,也就是一個(gè)堆一個(gè),將有它的必要性。三星已經(jīng)宣布自己的3D V-NAND驅(qū)動(dòng)器。
閃存記憶體晶圓
臺(tái)式機(jī)和服務(wù)器的閃存記憶體一般是封裝在磁盤驅(qū)動(dòng)器大小的機(jī)盒內(nèi)——通常是2.5英寸——并被稱為SSD(固態(tài)驅(qū)動(dòng)器)。它使用磁盤的訪問接口,SATA或SAS。
使用閃存記憶體的計(jì)算機(jī)可以在數(shù)毫秒時(shí)間內(nèi)訪問數(shù)據(jù),而磁盤驅(qū)動(dòng)器需要數(shù)微秒,因?yàn)榇疟P的讀取頭必須先被移動(dòng)到正確的軌道。因此,使用閃存的計(jì)算機(jī)可以更快地運(yùn)行應(yīng)用程序,在虛擬化的服務(wù)器中支持更多的虛擬機(jī)。
另一個(gè)提供閃存的方式是將它直接連到內(nèi)部的PCIe插槽,這可以提供更快的數(shù)據(jù)訪問速度,因?yàn)椴恍枰疟PI/O轉(zhuǎn)換。這種PCIe閃存卡記憶體正在快速發(fā)展。鎂光將在明年推出16TB版本。
SSD或卡形式的閃存,比如Violin Memory的VIMM,可以被用于創(chuàng)建網(wǎng)絡(luò)純閃存陣列。這種陣列的訪問速度比硬盤驅(qū)動(dòng)器更快,只需要后者十分之一或者更少的物理空間,耗電也只有后者的十分之一。系統(tǒng)可以用重復(fù)數(shù)據(jù)刪除技術(shù)來提高有效容量,并提供媲美磁盤驅(qū)動(dòng)器陣列的單位GB成本。
磁盤驅(qū)動(dòng)器陣列制造商們現(xiàn)在使用SSD來存儲(chǔ)最活躍的數(shù)據(jù),在控制器中使用閃存高速緩存來加快數(shù)據(jù)訪問。有可能目前存儲(chǔ)在磁盤驅(qū)動(dòng)器陣列中的主數(shù)據(jù)將來會(huì)慢慢遷移到純閃存陣列。
磁盤驅(qū)動(dòng)器將用于存儲(chǔ)二級(jí)或近線數(shù)據(jù)。將閃存用于主數(shù)據(jù)并將磁盤用于二級(jí)數(shù)據(jù)的復(fù)合式陣列可以在純閃存陣列和純磁盤陣列之間提供一個(gè)過渡點(diǎn)。這種陣列的價(jià)格低于純閃存陣列,速度快于純磁盤那陣列,同時(shí)仍然提供磁盤級(jí)的容量。
隨著時(shí)間流逝,閃存技術(shù)也將退出主流并被其他技術(shù)所取代。目前,相變記憶體和電阻式RAM(隨機(jī)存取記憶體)都被看作是潛在的候選技術(shù)。這兩種技術(shù)都提供接近DRAM(動(dòng)態(tài)隨機(jī)存取記憶體)的速度,完全的隨機(jī)訪問和非易失性。
過去,磁帶是在相當(dāng)于紙上打一個(gè)孔的面積上承載一個(gè)比特,現(xiàn)在同樣的面積可以承載MB或GB的數(shù)據(jù)。存儲(chǔ)過去需要英寸級(jí)或厘米級(jí)的面積來存儲(chǔ)看得見的比特?cái)?shù)據(jù)?,F(xiàn)在,它在納米級(jí)的范圍內(nèi)存儲(chǔ)看不見的比特,而且速度快到我們幾乎無法理解它們。
如果我們要繼續(xù)推動(dòng)計(jì)算機(jī)的使用,存儲(chǔ)就必須更快、更小、更便宜和更可靠。我們現(xiàn)在既是處在計(jì)算機(jī)時(shí)代,也是處在存儲(chǔ)時(shí)代。
?