I n t e r n e t訂閱服務(wù)也會(huì)產(chǎn)生類似的結(jié)果, I n t e r n e t訂閱服務(wù)發(fā)送各種更新的信息,從股票價(jià)格、新聞到天氣預(yù)報(bào),無所不包。信息驅(qū)動(dòng)的結(jié)果之一是當(dāng)人們希望某條信息時(shí),他們就訂閱它。訂閱服務(wù)系統(tǒng)每天都給辦公室工作人員發(fā)送許多則消息,這些消息都是他們認(rèn)為有用的、重要常困難。
軟件發(fā)布是另一個(gè)數(shù)據(jù)流的源。熟悉I n t e r n e t軟件發(fā)布的用戶經(jīng)常訂閱各種軟件服務(wù),這些軟件服務(wù)包括更新、發(fā)布軟件信息、預(yù)先發(fā)布軟件的測(cè)試版,甚至更嚴(yán)重的情況,這樣,一個(gè)軟件很快就有4、5個(gè)拷貝保存在磁盤上,大大消耗網(wǎng)絡(luò)服務(wù)器的存儲(chǔ)空間,同時(shí),在這種環(huán)境下,計(jì)劃適合的存儲(chǔ)需求也十分困難。
2. 流體數(shù)據(jù)目標(biāo)的識(shí)別
一旦數(shù)據(jù)進(jìn)入一個(gè)機(jī)構(gòu),接下來的問題是:數(shù)據(jù)應(yīng)該存放在那里?結(jié)構(gòu)數(shù)據(jù)很容易跟蹤,因?yàn)樗呀?jīng)編入了最初存放的地方。然而,事件驅(qū)動(dòng)的應(yīng)用能夠?qū)?shù)據(jù)的內(nèi)容做出反應(yīng),并起動(dòng)一個(gè)新的動(dòng)作將數(shù)據(jù)傳到其他的系統(tǒng)。例如,特許零售商的銷售報(bào)告先通過電子的形式傳到總部,經(jīng)過正常的處理后,最后再把它傳到另一個(gè)系統(tǒng),以計(jì)算在銷售戰(zhàn)中所獲得的成果。
E R P系統(tǒng)的設(shè)計(jì)目的是把分散的全局?jǐn)?shù)據(jù)集成為單一的邏輯系統(tǒng),它的主要思想是以電子的方式連接所有的商業(yè)過程,這樣就能在整個(gè)組織范圍內(nèi)做出更好的決策。依照這種方法,一個(gè)部門中的活動(dòng)可能成為同一公司中另一部門決策的部分信息。舉一個(gè)簡(jiǎn)單的例子,假如一個(gè)部門庫存過剩,則可以把過剩的庫存送到另一部門去,以減輕該部門庫存壓力。
然而,結(jié)構(gòu)數(shù)據(jù)流的實(shí)際目的地不是它所發(fā)送的系統(tǒng),而是連接到這個(gè)系統(tǒng)的存儲(chǔ)設(shè)備。為了真正地了解這些系統(tǒng)的性能,理解從發(fā)送機(jī)器的設(shè)備到目的機(jī)器的設(shè)備的數(shù)據(jù)流是很重要的。盡管通常存儲(chǔ)成分理所當(dāng)然地存在,但正如我們?cè)诒緯蟛糠终鹿?jié)中所探討的那樣,情況并不是這樣。非結(jié)構(gòu)數(shù)據(jù)流一般有許多種類各異的目標(biāo), e – m a i l消息及附件最終散布在各種不同的文件夾、本地磁盤和網(wǎng)絡(luò)服務(wù)器中。圖1 – 3顯示了一個(gè)e – m a i l被同時(shí)放在三個(gè)不同位置的例子。
出于自我保護(hù)的本能,許多用戶都堅(jiān)持把一些文件的多余拷貝保存起來,以備將來萬一能用上。但是,當(dāng)對(duì)某一案件作判決時(shí), e – m a i l消息卻經(jīng)常被理解為與政治有牽連,而招致麻煩。這些“可憐人”之所以采用如此的災(zāi)難保護(hù)辦法,是因?yàn)檫^去曾經(jīng)丟失過大量有價(jià)值的資料,因此被弄得焦頭爛額,苦不堪言。保存e – m a i l也可能引起麻煩,注意到這一點(diǎn)是饒有趣味的。例如,在1 9 8 7年,由于e – m a i l的摘錄,導(dǎo)致了對(duì)I r a n – C o n t r a一案審判受到影響。在最近的司法部反托拉斯訴訟案中,內(nèi)部的e – m a i l信息給微軟招致了很大的麻煩。
當(dāng)然,一旦某個(gè)信息被人堅(jiān)持放入個(gè)人歸檔文件中時(shí),刪除它的可能性是很小的。當(dāng)e – m a i l系統(tǒng)的存儲(chǔ)空間太緊張時(shí),系統(tǒng)管理員可能發(fā)送e – m a i l給該系統(tǒng)的用戶,要求他們刪除不必要的信息,也可以通過限制每個(gè)用戶的存儲(chǔ)配額的辦法,迫使用戶刪除不必要的文件。這雖然減輕了e – m a i l系統(tǒng)的存儲(chǔ)壓力,但用戶可能把這些過期的e -m a i l轉(zhuǎn)存到其他地方,以便在必要的時(shí)候使用。事實(shí)上,差不多沒有人有時(shí)間重讀那些過時(shí)的e – m a i l,有些人甚至都來不及閱讀當(dāng)前的e -m a i l。是否保存過期的e – m a i l是一個(gè)人對(duì)緊缺資源的自律態(tài)度問題?,F(xiàn)在由于每G B硬盤容量?jī)r(jià)格的下降,用戶并不為節(jié)省存儲(chǔ)資源而感到煩惱。
I n t e r n e t文件與e – m a i l稍微有點(diǎn)不同,因?yàn)楫?dāng)某人認(rèn)為某We b頁面有用或令人感興趣時(shí),他才去獲得并瀏覽該頁面。從這個(gè)意義上說, I n t e r n e t文件是政治中性的,與e – m a i l相比,它的保存價(jià)值更小。但是它的吸引力在于它是純粹用來提供知識(shí)的,它能使人獲得更多的知識(shí)、更快的決策、發(fā)現(xiàn)問題和識(shí)別機(jī)會(huì),總之,是能為人類帶來榮譽(yù)的知識(shí)。
I n t e r n e t的訂閱服務(wù)帶來相當(dāng)特殊的問題。在同一單位里可能有若干個(gè)人訂閱同一服務(wù)內(nèi)容的、導(dǎo)致存儲(chǔ)同樣數(shù)據(jù)的多份拷貝。圖1 – 4顯示了由e – m a i l和I n t e r n e t等引起的相同信息的多份拷貝問題,這使得對(duì)數(shù)據(jù)的管理變得相當(dāng)困難。
3. 結(jié)構(gòu)數(shù)據(jù)流和非結(jié)構(gòu)數(shù)據(jù)流的區(qū)別
除了結(jié)構(gòu)數(shù)據(jù)流定義了源和目標(biāo)以外,它還在多個(gè)方面不同于非結(jié)構(gòu)數(shù)據(jù),如表1 – 3所示。
4. 管理流體數(shù)據(jù)
知道結(jié)構(gòu)數(shù)據(jù)流的源、目標(biāo)及其支撐的網(wǎng)絡(luò)技術(shù)后,則可以對(duì)數(shù)據(jù)流實(shí)施監(jiān)控,并可以在問題發(fā)生之前預(yù)測(cè)它們。例如,知道平均的數(shù)據(jù)傳輸量、它的增長(zhǎng)率及網(wǎng)絡(luò)連接的性能,就可以確定在所有其他因素不變的情況下,現(xiàn)存的網(wǎng)絡(luò)能維持運(yùn)行多長(zhǎng)時(shí)間。
管理非結(jié)構(gòu)數(shù)據(jù)是一個(gè)更困難的任務(wù)。不知道數(shù)據(jù)的源和目標(biāo),可資利用的資源又不多。雖然網(wǎng)絡(luò)的瀏覽傳輸能夠用一些工具加以過濾和監(jiān)控,但是用戶認(rèn)為侵犯了他們的隱私,阻礙他們的工作效率。最好的辦法大概是建立一個(gè)I n t e r n e t內(nèi)容存儲(chǔ)策略,并使人們明白,為了確保有足夠的可用資源,這樣的責(zé)任機(jī)制有時(shí)是必須的。
如何將企業(yè)的數(shù)據(jù)組織成為I n t e r n e t內(nèi)容?一個(gè)簡(jiǎn)單的辦法是為那些內(nèi)容建立部門或功能目錄,如圖1 – 5所示。在這樣的策略下,用戶可以養(yǎng)成把下載來的文件存儲(chǔ)在他們各自的目錄中的習(xí)慣。放在功能目錄中的文件甚至可以連接到企業(yè)We b頁面上,以供其他感興趣的人享用。用戶可以通過e – m a i l連接到共享的文檔上來交換文件,而不必發(fā)送這些文檔的整個(gè)拷貝。