- 相關(guān)推薦
淺論數(shù)字圖書館的信息管理
江西省新余市第三中學(xué) 胡勇摘要:圖書館的數(shù)字化是信息社會發(fā)展的必然,如何將本館已有電子信息資源加以組織整合、提高館藏利用率是非,F(xiàn)實的問題。本文就數(shù)字圖書館的信息共享管理做初步的論述。
主題詞:數(shù)字圖書館 信息 管理
隨著社會的飛速發(fā)展,傳統(tǒng)意義上的圖書館已經(jīng)不能滿足大家的需要,人們對圖書檢索與查閱的質(zhì)量和效率上的要求越來越高,信息技術(shù)的發(fā)展為這種需求提供了可能。目前,許多圖書館都建立了與國際互聯(lián)網(wǎng)(Internet)聯(lián)網(wǎng)的數(shù)字化圖書館,如何利用Internet網(wǎng)絡(luò)資源為用戶服務(wù),如何將本館已有電子信息資源加以組織整合、提高館藏利用率是非常現(xiàn)實的問題。本文就數(shù)字圖書館的信息共享管理做初步的論述。
1、數(shù)字圖書館的概念與特征
數(shù)字圖書館是一種知識管理實體(entity),它將傳統(tǒng)圖書館范疇與遠程通信和計算機技術(shù)的應(yīng)用有效地結(jié)合起來,通過將圖書館自身擁有的資源、圖書館母體機構(gòu)專有的信息、外部的世界范圍內(nèi)的信息資源無縫地 整合,促進每個用戶快速地存取和有效地使用信息。 從這個定義我們可以得出數(shù)字圖書館具有如下特征: (1)資源數(shù)字化。 數(shù)字圖書館在許多構(gòu)成要素方面都突破了傳統(tǒng)圖書館所規(guī)定的物理邊界,擁有來自世界各 地的以電子摘要/目錄、電子期刊、電子報紙、電子書籍、電子信箱、網(wǎng)絡(luò)數(shù)據(jù)庫、網(wǎng)絡(luò)檢索工具等不同形式 存在的多種信息資源。這些資源不屬我有,卻勝似我有,也就是說實現(xiàn)了資源的數(shù)字化; (2)館藏數(shù)字化。 所有聚合在數(shù)字圖書館的信息資源不管它是圖書、文獻,還是圖片、音像資料,都必須經(jīng)過數(shù)字化存貯在一定 的載體上; (3)傳遞網(wǎng)絡(luò)化。數(shù)字圖書館的信息資源都要通過國際互聯(lián)網(wǎng)——局域網(wǎng)——單位或個人計算機 這樣一種網(wǎng)絡(luò)通道的傳遞,才能隨時隨地存取、檢索與下載;(4)存取自由化。 網(wǎng)絡(luò)用戶都可以自由存取網(wǎng) 上信息資源,而不受時間、條件與數(shù)量的限制;(5)操作計算機化。 數(shù)字圖書館信息資源的傳遞、存取、檢 索、咨詢與復(fù)制都是通過計算機實現(xiàn);(6)資源共享化。凡是網(wǎng)絡(luò)用戶,不分國家、地區(qū)、部門和單位, 都 可共同使用網(wǎng)絡(luò)信息資源,實現(xiàn)資源共享。然而在實踐工作中, 要實現(xiàn)數(shù)字圖書館信息資源的共享,并不 是件很容易的事,我們必須加強對數(shù)字圖書館信息共享管理問題的研究。
2、數(shù)字圖書館信息共享管理的必要性
為什么提出數(shù)字圖書館的信息共享管理,是我們首先必須考慮的第一個問題。我初步認為是基于如下兩個 方面的原因:
2.1 網(wǎng)絡(luò)信息資源的某些特征是推動數(shù)字圖書館信息共享管理的內(nèi)在因素。
Internet網(wǎng)上極其豐富的信息資源是實現(xiàn)數(shù)字圖書館信息共享的物質(zhì)源泉,它的某些特征是推動數(shù)字圖書 館信息共享管理的內(nèi)在因素。這些特征主要包括:(1)網(wǎng)絡(luò)信息資源缺乏有效的組織。 為適應(yīng)網(wǎng)絡(luò)環(huán)境下信 息組織的對象多樣化、成分復(fù)雜化、傳遞高速化的要求,傳統(tǒng)的以文獻為單元的信息組織形式失去了用武之地 ,需要創(chuàng)造全新的知識信息組織方法,實現(xiàn)從信息層次到知識層次的根本轉(zhuǎn)變;(2 )網(wǎng)絡(luò)信息資源的分散性 、無序性相當嚴重。這種分散性與無序性明顯地表現(xiàn)為用戶使用不同的檢索工具(如Yahoo、Infoseek、ProFu sion等)執(zhí)行相同的檢索指令時,會得到一大堆各不相同的網(wǎng)頁地址,有時即使用同一個搜索引擎,前后兩次 也會不同。這一方面說明了檢索工具各具特色,另一方面也說明了網(wǎng)絡(luò)信息資源的分散性與無序性。正是這種 分散性與無序性使檢索到的數(shù)據(jù)的正確性、可靠性缺乏保障;(3 )網(wǎng)絡(luò)信息資源缺乏深層次的開發(fā)。雖然 Internet 能夠提供多種網(wǎng)絡(luò)信息開發(fā)工具,如WWW、FTP、Telnet、Archie、Gopher、WAIS、Whois、IRC 、 E-mail、Fax等,但大多數(shù)停留在瀏覽功能來提供信息查詢的階段, 尚未深入到對網(wǎng)絡(luò)信息資源在信息單元、 知識單元層面的開發(fā)利用;(4 )數(shù)字化信息自身的局限性。這種局限性體現(xiàn)為:一是已有印刷型信息資料不 可能全部轉(zhuǎn)化為數(shù)字化形式;二是只有部分新的信息資料僅僅以數(shù)字化形式出版;三是不能保證用戶能從Internet網(wǎng)上真正獲取個人所需的數(shù)字化信息,如任何一篇文獻、報告或其它文檔。為解決上述幾個關(guān)鍵性問題, 我們必須加強數(shù)字圖書館的信息共享管理。
2.2 信息共享需求是數(shù)字圖書館信息共享管理的內(nèi)在動力。
數(shù)字圖書館的組織與信息資源極具動態(tài)性與實時性,在信息共享管理方面有其特殊的需求。這包括:①互 操作性。數(shù)字圖書館的信息資源涉及到各國政治、經(jīng)濟、技術(shù)、文化與社會等許多方面,各信息源數(shù)據(jù)庫與信 息平臺差異可能很大,為集中數(shù)字圖書館信息資源的選擇范圍,實現(xiàn)信息資源的最佳組合,數(shù)字圖書館必須具 有異構(gòu)計算機軟硬件平臺間良好的互操作性;②動態(tài)配置。數(shù)字圖書館的信息資源時刻處于動態(tài)變化中,數(shù)字 圖書館應(yīng)具有隨時調(diào)整、支持動態(tài)配置的能力;③標準化技術(shù)。數(shù)字圖書館的運作涉及到大量的標準化技術(shù), 如VPN (數(shù)字專用網(wǎng))技術(shù)、VLAN(數(shù)字局域網(wǎng))技術(shù)、VDB(數(shù)字數(shù)據(jù)庫)技術(shù)、 HTML(超文本標記語言) 技術(shù)、CORBA(Common Object Request BrokerArchitecture)技術(shù)等;④安全性。“計算機病毒、磁場、 電磁脈沖對數(shù)字化信息和計算機系統(tǒng)的破壞程度,并不亞于一把火把傳統(tǒng)圖書館化為灰燼”。因此,數(shù)字圖 書館信息資源的安全性尤其值得重視。 總之,這些特殊需求構(gòu)成了數(shù)字圖書館信息共享管理的內(nèi)在動力。
3、實現(xiàn)數(shù)字圖書館信息共享的主要措施
在數(shù)字圖書館信息共享管理的過程中,我們必然會遇到許多棘手問題,如網(wǎng)絡(luò)環(huán)境下信息資源的收集、組 織、利用、安全維護與用戶管理等,我們必須利用目前的最新技術(shù)和采取必要的措施來促進數(shù)字圖書館的信息 共享。這些技術(shù)和措施包括:
3.1 開發(fā)和利用智能搜索工具來收集、 組織數(shù)字圖書館信息資源。
Internet的迅速發(fā)展給數(shù)字圖書館帶來了豐富的、動態(tài)的網(wǎng)絡(luò)信息資源,同時也呼喚新的檢索機制與工具 。雖然目前開發(fā)了不少搜索引擎,如HYTELNET、Archie、Veronica、Jughead、Gopher Jewels、 Yahoo、Alta
Vista、Lycos、Open Text、Infoseek、Excite、Netscape等,但是用戶要想方便快捷地找到所需信息,卻很 不容易。因為用戶在發(fā)出一個明確的查詢請求后,返回的信息中往往有許多不相干的信息,如果再想從這些雜 亂的信息中去瀏覽、選擇和挖掘那些真正有用的信息,就不知不覺地浪費了許多時間和費用。為解決這個問題 ,我們可以采取兩種方案:
3.1.1為數(shù)字圖書館提供基于元搜索引擎的檢索機制。 所謂元搜索引擎,是對分布于網(wǎng)絡(luò)的多種檢索工具 的全局控制機制,它通過一個統(tǒng)一用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的(基至是同時利用若 干個)搜索引擎來實現(xiàn)檢索操作。元搜索引擎不象常用的搜索引擎那樣擁有自己獨立的數(shù)據(jù)庫,卻更多地提供 統(tǒng)一聯(lián)結(jié)界面,或進一步地提供統(tǒng)一檢索方式與結(jié)果整理,形成一個由多個分布的、具有獨立功能的搜索引擎 構(gòu)成的數(shù)字邏輯整體,從而實現(xiàn)對這個數(shù)字整體中各獨立搜索引擎數(shù)據(jù)庫的查詢與數(shù)據(jù)處理。目前,在Int ernet 網(wǎng)上已經(jīng)開發(fā)了多線索式元搜索引擎,如Metacrawler ( http://www. go2net. com/search.html) 、ProFusion(http://www.profusion. com ),All-in-one元搜索引擎(http://www.albany. net/allin one. html),桌面元搜索引擎Webcompass(http://www. qdeck. com/products/Webcompass)等。用戶可以 運用這些元搜索引擎來優(yōu)化檢索結(jié)果, 提高檢索效率。
3.1.2為數(shù)字圖書館建立基于Push技術(shù)的信息檢索系統(tǒng)。 目前慣用的Internet搜索引擎及其信息瀏覽方式 通常是用戶發(fā)出請求到Web, 然后Web將信息送回用戶端,也就是用戶需要拉。≒ull)信息。 而Push(推送 )技術(shù)通過它的信息代理機制,在用戶初次使用時設(shè)定所需的信息后,能夠把網(wǎng)上相關(guān)信息用推送(Push)或 網(wǎng)播(Netcasting)的方式送到用戶面前。Push技術(shù)為Internet帶來了重大的變革, 使網(wǎng)絡(luò)信息流不再是 單一的“拉”,還包括反方向的“推”,從而使用戶避免了網(wǎng)上漫無邊際的查找與長時間的等待,極大地提高 信息檢索效率。北航采用基于Push技術(shù)開發(fā)的Internet中文信息應(yīng)用平臺——天唐2000,建立了一個完整的In ternet 信息檢索系統(tǒng)。 該系統(tǒng)是一個采用開放式Client / Server網(wǎng)絡(luò)體系結(jié)構(gòu)建立起來的支持TCP / IP 協(xié) 議的分布式計算機網(wǎng)絡(luò),具有如下特征與功能:(1)可以自由增加、修改、 管理信息樹上的信息頻道,自由 選擇與優(yōu)化信息資源;(2 )具有智能化的信息預(yù)采集機制,可自動跟蹤、獲取用戶事先預(yù)定的信息,集中并 發(fā)式推送信息,無需重復(fù)搜索與等待;(3 )采取交互訂制與廣播發(fā)布相結(jié)合的信息推送傳播方式,可以實時 或定時方式推送預(yù)定頻道的信息;(4)采用離線閱讀方式來提高通道利用率和有效數(shù)據(jù)的傳輸率, 降低重復(fù) 數(shù)據(jù)的通道占用量;(5)具有高效的智能搜索引擎, 可根據(jù)用戶需求對網(wǎng)上信息進行全文檢索等。這種基于 Push技術(shù)的Internet信息檢索技術(shù)既為用戶搜索、瀏覽Internet網(wǎng)上的相關(guān)信息提供了快捷入口,又為數(shù)字圖 書館在廣域網(wǎng)內(nèi)的信息共享提供了技術(shù)支持。
3.2 利用數(shù)字數(shù)據(jù)庫技術(shù)、 網(wǎng)絡(luò)存取技術(shù)來實現(xiàn)數(shù)字圖書館的信息共享。
數(shù)字圖書館要實現(xiàn)對分布式數(shù)據(jù)庫的采集、傳播、存取和共享,實時性的交換與處理靜態(tài)和動態(tài)的多媒體 信息,必須開發(fā)和利用數(shù)字數(shù)據(jù)庫技術(shù)和網(wǎng)絡(luò)存取技術(shù)。數(shù)字數(shù)據(jù)庫VDB(Virtual Database )技術(shù)是使外界 的數(shù)據(jù)表現(xiàn)為一個特定的關(guān)系數(shù)據(jù)庫系統(tǒng)的一個擴展。 在當今的信息社會中,世界上有90%以上的數(shù)據(jù)屬 于關(guān)系數(shù)據(jù)庫以外的數(shù)據(jù),分布在Web網(wǎng)站、數(shù)據(jù)庫系統(tǒng)和傳統(tǒng)的應(yīng)用中。在這些數(shù)據(jù)源中, 數(shù)據(jù)的組織方式 、所用詞匯和存取機制均有差異,其中大多數(shù)數(shù)據(jù)源可能不支持現(xiàn)有數(shù)據(jù)庫中的查詢操作。因此,如果用戶要 檢索分布于各種數(shù)據(jù)庫中的數(shù)據(jù),必須利用數(shù)字數(shù)據(jù)庫技術(shù)的收集、組織、集成功能來形成和提供統(tǒng)一的關(guān)系 數(shù)據(jù)庫系統(tǒng)。這種關(guān)系數(shù)據(jù)庫系統(tǒng)的一般框架是由數(shù)據(jù)開采和集成系統(tǒng)、數(shù)據(jù)發(fā)布系統(tǒng)兩個子系統(tǒng)組成。前者 挖掘來自多個數(shù)據(jù)源中的數(shù)據(jù),并提供一個統(tǒng)一的關(guān)系數(shù)據(jù)庫的界面;后者利用發(fā)布規(guī)則安排數(shù)據(jù)獲取、數(shù)據(jù) 轉(zhuǎn)換和數(shù)據(jù)傳播,即安排各種數(shù)據(jù)集成任務(wù)——主頁、變換和抽象,并以規(guī)定的間隔周期發(fā)布集成后的數(shù)據(jù)表 (IDT[,s])。 不過,目前數(shù)字數(shù)據(jù)庫理論并不完善,要實現(xiàn)數(shù)字圖書館的信息共享我們還要開發(fā)和利用網(wǎng)絡(luò) 存取技術(shù)。
面向?qū)ο蟮亩嗝襟w數(shù)據(jù)庫存取系統(tǒng)是用來對于分布在不同地域上的不同物理結(jié)點上的多媒體數(shù)據(jù)信息實行 統(tǒng)一的管理、控制和處理,為計算機的分布式多媒體信息提供存取和處理手段。這種多媒體數(shù)據(jù)存取系統(tǒng)一般 由公告接口模塊、分析處理模塊、發(fā)送模塊和更新模塊四大部分組成,能夠采用Powerscrip語言,開發(fā)一個面 向?qū)ο蟮挠脩艚缑,并提供菜單?qū)動和管理、窗口功能和管理、圖形顯示與編輯、文件操作與管理、在線幫助 與接口處理程序等多項功能。它還能利用PowerBuilder支持廣泛的數(shù)據(jù)連接和對本機數(shù)據(jù)庫的存取,利用LAN Workplace及NFS等軟件實現(xiàn)了遠程查詢,通過ODBC接口實現(xiàn)對不同平臺、不同機型上的異質(zhì)數(shù)據(jù)庫中的多媒體 數(shù)據(jù)的存取。這種面向?qū)ο蟮亩嗝襟w數(shù)據(jù)庫存取系統(tǒng)可以幫助用戶遠程存取數(shù)字圖書館中的各種信息資源。
3.3 利用數(shù)字專用網(wǎng)(VPN)技術(shù)解決數(shù)字圖書館信息共享的安全問題。
要想利用Internet實現(xiàn)數(shù)字圖書館信息共享,不可避免地要解決網(wǎng)絡(luò)的信息安全問題, 因而產(chǎn)生了數(shù)字 專用網(wǎng)(Virtual PrivateNetworks)技術(shù)。有人這樣定義VPN:隧道、加密、 鑒別以及存取控制技術(shù)的綜 合體,和在因特網(wǎng)、IP網(wǎng)或ISP 的主干網(wǎng)上管理交通運輸?shù)姆⻊?wù)器。它至少具有加密數(shù)據(jù)、信息認證和身份 認證、 提供訪問控制三種功能。數(shù)字圖書館可以內(nèi)部使用VPN、外部使用VPN兩種方式來管理信息資源。通過公 共網(wǎng)絡(luò)將一個組織的各分支機構(gòu)的局域網(wǎng)(LAN )連接而成一個獨立的邏輯局域網(wǎng),即數(shù)字局域網(wǎng)絡(luò)(VLAN) ,是內(nèi)部使用VPN技術(shù)的具體應(yīng)用。管理者運用VLAN技術(shù)能迅速建立工作人員組, 動態(tài)地分配用戶到特定組中 并且從任何一組限制其他組,從而使LAN 的組成更加靈活,更具隨意性、安全性。外部使用VPN主要是為了在用 戶、圖書館、Internet間建立一條安全連接通道,保證數(shù)據(jù)在傳輸過程中不被修改,保護網(wǎng)絡(luò)資源不受外部威 脅(如病毒感染);其次也為了保證包括TCP和UDP服務(wù)在內(nèi)的各種應(yīng)用服務(wù)的安全,例如E-mail、HTTP、FTP 、Real Audio、數(shù)據(jù)庫的安全以及一些應(yīng)用程序如Java、Active X的安全。VPN根據(jù)參數(shù)選擇來控制對網(wǎng)絡(luò)資 源的訪問, 這些參數(shù)包括源地址、目的地址、應(yīng)用程序的用途、所用的加密和認證類型、個人身份、工作組、 子網(wǎng)等。今后VPN技術(shù)將朝著適用于各種操作系統(tǒng)和平臺、 適應(yīng)現(xiàn)在的IP地址分配協(xié)議IP[,v]4(也能很容易地 升級到IP[,v]6)、包含防火墻的功能、可以在路由器上嵌入IPS[,ec]協(xié)議和防火墻技術(shù)、提供綜合的VPN管理 能力等方向發(fā)展,為數(shù)字圖書館信息共享提供更高層次的安全保障。
參考文獻:
汪冰.電子圖書館理論與實踐研究.北京:北京圖書館出版社,1997.12
黃宗忠.論21世紀的數(shù)字圖書館與傳統(tǒng)圖書館(上).圖書館理論與實踐,1998(1)
徐云.圖書館網(wǎng)上信息資源的組織與管理.圖書館雜志,1999(8)
王芳,張曉林.元搜索引擎:原理與利用.現(xiàn)代圖書情報技術(shù),1998(6)
張利平.基于Push技術(shù)的Internet網(wǎng)絡(luò)信息檢索系統(tǒng). 現(xiàn)代圖書情報技術(shù),1998(6)
陳莉.數(shù)據(jù)挖掘與數(shù)字數(shù)據(jù)庫. 四川師范大學(xué)學(xué)報(自然科學(xué)版),1998.11,21(6)
尚彤.VPN應(yīng)用“三板斧”.中國計算機報,1999年3月4日第12期C.17
馮運波等.數(shù)字專用網(wǎng)技術(shù).電子科技導(dǎo)報,1998(8)
【淺論數(shù)字圖書館的信息管理】相關(guān)文章:
圖書館與地方文獻資源價值淺論08-09
數(shù)字圖書館館藏評價08-05
數(shù)字圖書館的評估研究08-05
數(shù)字圖書館的宏觀管理總論08-05