數(shù)字圖書館定義


    數(shù)字圖書館在本質(zhì)上就是一個集數(shù)據(jù)庫應(yīng)用平臺、信息資源電子商務(wù)平臺與資源數(shù)字化加工服務(wù)平臺于一體的巨大數(shù)據(jù)倉庫,以互聯(lián)網(wǎng)為平臺,面向全球用戶提供基于內(nèi)容的服務(wù)。作為圖書館發(fā)展的方向,數(shù)字圖書館應(yīng)以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為基礎(chǔ)、以數(shù)字化的各種信息為底層、以分布式海量資源庫群為支撐、以智能檢索技術(shù)為手段、以電子商務(wù)為管理方式,以寬帶高速網(wǎng)絡(luò)為傳輸通道,將豐富多彩的多媒體信息傳遞到千家萬戶。但是,隨著數(shù)字圖書館事業(yè)的不斷進展,由于理念和思路的不同,各家數(shù)字圖書館的模式也有很大的不同。


    Soul對數(shù)字化圖書館的定義為:


    在互聯(lián)網(wǎng)的支撐下,以內(nèi)容管理為核心,以海量信息處理、知識發(fā)現(xiàn)與加工交流為主要技術(shù)手段的智能知識服務(wù)基礎(chǔ)平臺,是運行在互聯(lián)網(wǎng)上的、超大規(guī)模的、便于使用的、沒有時空限制的知識中心。


    背景資料


    數(shù)字圖書館是采用現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng),是下一代因特網(wǎng)上信息資源的管理模式,將從根本上改變目前因特網(wǎng)上信息分散不便使用的現(xiàn)狀。通俗地說,數(shù)字圖書館是沒有時空限制的、便于使用的、超大規(guī)模的知識中心。


    作為知識經(jīng)濟的重要載體,數(shù)字圖書館是國家信息基礎(chǔ)設(shè)施重要組成部分,目前已成為評價一個國家信息基礎(chǔ)水平的重要標(biāo)志和本世紀(jì)各國文化科技競爭的焦點之一。對于我國來說,數(shù)字圖書館的研發(fā)起步較晚,因此,建設(shè)數(shù)字圖書館更加具有必要性和緊迫性。其重要意義在于:


    首先,數(shù)字圖書館將改變以往信息存儲、加工、管理、使用的傳統(tǒng)方式,借助網(wǎng)絡(luò)環(huán)境和高性能計算機等實現(xiàn)信息資源的有效利用和共享。它的建設(shè)將使我國在綜合國力的競爭中搶占先機,掌握發(fā)展的主動權(quán),實現(xiàn)跨越式發(fā)展。


    其次,數(shù)字圖書館建設(shè)的核心是以中文信息為主的各種信息資源,它將迅速扭轉(zhuǎn)互聯(lián)網(wǎng)上中文信息匱乏的狀況,形成中華文化在互聯(lián)網(wǎng)上的整體優(yōu)勢。我們要通過數(shù)字圖書館的建設(shè),將我國悠久的歷史、燦爛的文化,特別是當(dāng)代建設(shè)的成就通過互聯(lián)網(wǎng)向全世界展示,讓世界了解中國,讓中國走向世界。


    第三,數(shù)字圖書館的建設(shè)將促進我國信息技術(shù)的發(fā)展,同時帶動與之相關(guān)的計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、通訊技術(shù)和多媒體技術(shù)等各項高新技術(shù)的迅速發(fā)展。這些高新技術(shù)迅速轉(zhuǎn)化為現(xiàn)實生產(chǎn)力, 將對我國知識創(chuàng)新體系的建立起到極大的促進作用。


    第四,數(shù)字圖書館建設(shè)是”科教興國”戰(zhàn)略的源泉和動力,也是實現(xiàn)公民終身教育的大課堂。數(shù)字圖書館以其對信息資源的整理加工和有序組織,為”科教興國”戰(zhàn)略提供了最為便捷、有效的發(fā)展環(huán)境。同時,數(shù)字圖書館可以最大限度地突破時空限制,營造出進行全民終身教育的良好環(huán)境,對于我國國民素質(zhì)教育將起到巨大的提升作用。


    第五,數(shù)字圖書館將改變目前圖書館的工作方式和服務(wù)模式。數(shù)字圖書館可以更好地履行圖書館在倡導(dǎo)、組織和服務(wù)全民讀書中的重要職能。圖書館館員將成為捕捉和整理信息的專家,讀者可以在世界各地通過網(wǎng)絡(luò)閱覽數(shù)字圖書館中的豐富信息。圖書館的發(fā)展將進入一個前所未有的新階段,發(fā)生根本性的變化。


    系統(tǒng)原理


    從系統(tǒng)結(jié)構(gòu)上看,數(shù)字圖書館是一個以數(shù)據(jù)存儲系統(tǒng)為核心和低層支持,配合業(yè)務(wù)應(yīng)用系統(tǒng)進行多功能數(shù)據(jù)查詢服務(wù)的大型數(shù)據(jù)庫應(yīng)用解決方案。在數(shù)字圖書館中,數(shù)據(jù)的存儲和管理是整個系統(tǒng)的核心部件,一切的應(yīng)用服務(wù)全部由處于核心位置的數(shù)據(jù)存儲和管理系統(tǒng)來支撐。為了便于理解,我們將從兩個方面來分析數(shù)字圖書館的系統(tǒng)原理。


    數(shù)字圖書館的業(yè)務(wù)應(yīng)用體系


    從數(shù)字圖書館業(yè)務(wù)應(yīng)用的角度看,一個完整的數(shù)字圖書館應(yīng)該由三個層次組成:


    1. 元數(shù)據(jù)服務(wù)器和對象服務(wù)器;


    2. 圖書館應(yīng)用系統(tǒng)


    3. 具體應(yīng)用部件


    在數(shù)字圖書館中,數(shù)據(jù)庫的管理和操作是最核心的問題,所有的電子圖書、期刊和多媒體數(shù)據(jù)全部存放在元數(shù)據(jù)服務(wù)器中,它是整個數(shù)字圖書館的支撐點。這部分的服務(wù)主要分成三個部分:


    數(shù)據(jù)庫服務(wù)器


    數(shù)據(jù)庫服務(wù)器的作用是處理大量的數(shù)據(jù)存取、檢索和管理,它是支持支持整個圖書館的最底層服務(wù)器,由于數(shù)字圖書館的數(shù)據(jù)存數(shù)量很多,所以對于數(shù)據(jù)庫服務(wù)器的性能要求也相對比較高。一般需要使用服務(wù)器集群技術(shù)(Cluster),如使用聯(lián)想的NS集群系統(tǒng),由兩臺或者兩臺以上獨立的計算機系統(tǒng)互聯(lián),功能上是作為一個單一系統(tǒng),從而提高整個系統(tǒng)的可用性及性能。在數(shù)據(jù)庫的選擇方面,推薦使用一些大型的數(shù)據(jù)庫軟件,如Oracle、Sybase等。


    海量存儲設(shè)備


    數(shù)字圖書館的數(shù)據(jù)資料是非常龐大的。單單使用數(shù)據(jù)庫服務(wù)器本地硬盤根本不能滿足數(shù)據(jù)存儲的要求。另外,為了達到高數(shù)據(jù)處理能力的要求,現(xiàn)在的數(shù)據(jù)庫服務(wù)器一般使用集群(Cluster)技術(shù),多臺服務(wù)器協(xié)同工作。在這種情況下集中使用海量存儲設(shè)備可以提高集群的工作效率。


    隨著技術(shù)的發(fā)展現(xiàn)在的海量存儲設(shè)備主要產(chǎn)品是使用光纖通道技術(shù)(Fibre Channel)技術(shù)的存儲區(qū)域網(wǎng)絡(luò)(SAN)來實現(xiàn)。SAN是位于服務(wù)器后端,為連接服務(wù)器、磁盤陣列、帶庫等存儲設(shè)備而建立的高性能網(wǎng)絡(luò)。因此又稱為后端網(wǎng)絡(luò)。


    SAN提供了靈活的存儲連接,服務(wù)器可以訪問存儲區(qū)域網(wǎng)上的任何存儲設(shè)備,如帶庫、磁盤陣列;同時存儲設(shè)備之間、存儲設(shè)備同SAN交換機之間也可以進行通信。


    SAN不是一種產(chǎn)品,而是一種獨立于服務(wù)器網(wǎng)絡(luò)的一種專門的網(wǎng)絡(luò),這種網(wǎng)絡(luò)通過采用光纖通道協(xié)議來傳輸數(shù)據(jù),在連接上可以使用光纖或銅纜。由于光纖通道協(xié)議具有極高的可靠性、很好的性能、超長距離支持能力、良好的擴展性,因此SAN使得將存儲同服務(wù)器分開成為現(xiàn)實。


    存儲區(qū)域網(wǎng)特別適合于服務(wù)器集群、大型數(shù)據(jù)存儲、災(zāi)難恢復(fù)等關(guān)鍵領(lǐng)域。


    對象服務(wù)器


    對象服務(wù)器是各種應(yīng)用系統(tǒng)的支撐服務(wù)器,所有的應(yīng)用服務(wù)系統(tǒng)都要運行在對象服務(wù)器上。
元數(shù)據(jù)服務(wù)器和對象服務(wù)器為整個數(shù)字圖書館的系統(tǒng)服務(wù)提供了基礎(chǔ)的硬件設(shè)備,構(gòu)成了數(shù)字圖書館業(yè)務(wù)體系的底層托盤。


    數(shù)字圖書館的網(wǎng)絡(luò)結(jié)構(gòu)分析


    現(xiàn)代型的數(shù)字圖書館在網(wǎng)絡(luò)結(jié)構(gòu)上一般都是由數(shù)字圖書館系統(tǒng)管理服務(wù)器、數(shù)據(jù)庫服務(wù)器和各類應(yīng)用服務(wù)器組成局域網(wǎng)絡(luò),向外部提供各類的業(yè)務(wù)應(yīng)用服務(wù)。同時所有的服務(wù)器通過SAN共享海量存儲設(shè)備,在保證高可用性的前提下,盡量節(jié)約存儲冗余空間,使用集群技術(shù)提高系統(tǒng)的性能。
其具體的功能實現(xiàn)是:在一個局域網(wǎng)內(nèi)搭建業(yè)務(wù)支持平臺,每個應(yīng)用服務(wù)模塊使用雙機或者多機集群技術(shù),提高模塊的性能,后端使用SAN存儲,外部使用統(tǒng)一的網(wǎng)絡(luò)出口并使用硬件防火墻把內(nèi)部網(wǎng)絡(luò)和外部網(wǎng)絡(luò)進行隔離,屏蔽外部的網(wǎng)絡(luò)信息,確保整體的安全性。


    傳統(tǒng)應(yīng)用方案分析


    目前,圖書館內(nèi)提供數(shù)字圖書服務(wù)的資源多種多樣,在傳統(tǒng)的方案中資源庫采用DAS的連接方式較多,這樣的存儲方式在集中存儲,擴容以及管理等方面都給校方帶來很大的不方便,下圖為這種方式的應(yīng)用:



    這種方案在SAN網(wǎng)絡(luò)構(gòu)架還不成熟的時候,是比較常用的圖書館系統(tǒng)方案解決辦法,其特點是結(jié)構(gòu)簡單,直接通過一根SCSI線把磁盤陣列連接到服務(wù)器上實現(xiàn)數(shù)據(jù)存儲的擴容,但是,這種方式存在著最大的弊端就是數(shù)據(jù)傳輸距離很短,SCSI連接線極限值只有25米,對于一個大型的計算機中心,如此長的傳輸距離是遠遠不夠的。同時,由于使用線纜而導(dǎo)致的干擾,會嚴重影響數(shù)據(jù)傳輸?shù)臏?zhǔn)確性和安全性,尤其是在大量服務(wù)器集中的機房中使用SCSI直連的方式是非常不科學(xué)的。這種存儲方式在實際應(yīng)用中已經(jīng)逐漸被淘汰。隨著光纖SAN存儲技術(shù)的成熟,使得集群共享后端海量存儲的方案成為可能,這一存儲形式的推出,淘汰了原有的傳輸速率低下、數(shù)據(jù)傳輸誤碼率高、無法實現(xiàn)數(shù)據(jù)大集中的DAS直連存儲方式。為圖書館的數(shù)字化發(fā)展提供了更為先進的技術(shù)和更大的發(fā)展空間。下圖為其應(yīng)用方式:


分享到

多易

相關(guān)推薦