- 相關(guān)推薦
數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)有關(guān)問題探討
【內(nèi)容提要】在闡述數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)原則的基礎(chǔ)上,對(duì)數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)有關(guān)問題進(jìn)行較為深入的思考,并且提出若干建議。【摘 要 題】專題探討
【英文摘要】This article begins with the illustration of&n
1 數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)原則
元數(shù)據(jù)方案就是數(shù)字圖書館中所使用的信息描述方法。數(shù)字圖書館的運(yùn)作,無論是存取過程還是檢索過程,都是以元數(shù)據(jù)方案為基礎(chǔ)實(shí)現(xiàn)的。換言之,元數(shù)據(jù)方案為數(shù)字圖書館分布式信息資源的發(fā)現(xiàn)和檢索奠定了基礎(chǔ)。因此,元數(shù)據(jù)方案決定了數(shù)字圖書館的功能特征、運(yùn)行模式和系統(tǒng)運(yùn)行的總體性能。為了實(shí)現(xiàn)這一總體性能,達(dá)到共建共享信息資源的目的,數(shù)字圖書館元數(shù)據(jù)方案應(yīng)遵循下列原則。
1.1 元數(shù)據(jù)方案的標(biāo)準(zhǔn)化原則
在數(shù)字圖書館建設(shè)中,標(biāo)準(zhǔn)問題最重要的是元數(shù)據(jù)的制作,而與元數(shù)據(jù)的制作緊密相關(guān)的問題是元數(shù)據(jù)方案的設(shè)計(jì)。
然而,目前在元數(shù)據(jù)方案的標(biāo)準(zhǔn)化方面存在很多問題。首先,就DC系列元數(shù)據(jù)而言,在同一元素的著錄內(nèi)容上存在較大的差異。如,北京大學(xué)拓片元數(shù)據(jù)要求在權(quán)限(Rights)元素中著錄館藏地址、允許使用的用戶范圍,而在《數(shù)字式中文全文文獻(xiàn)通用格式》規(guī)定著錄有關(guān)權(quán)限管理的聲明,包括知識(shí)產(chǎn)權(quán)等。其次,對(duì)于同類型信息資源的組織,有的圖書館已經(jīng)采用DC元數(shù)據(jù),有的則仍然采用MARC元數(shù)據(jù)。這種著錄內(nèi)容和同類信息資源所用元數(shù)據(jù)的不一致都會(huì)給數(shù)據(jù)交換的帶來困難。最后,各個(gè)元數(shù)據(jù)所采用的編碼語言也是各不相同,有的采用HTML,有的采用SGML或XML。由于各個(gè)編碼語言的標(biāo)簽設(shè)置、內(nèi)容、可擴(kuò)展性的不同,則會(huì)影響元數(shù)據(jù)的通用性。
元數(shù)據(jù)方案的標(biāo)準(zhǔn)化原則具有廣泛的內(nèi)涵。它包括元素著錄內(nèi)容的標(biāo)準(zhǔn)化、同類型數(shù)字化信息資源的著錄所采用元數(shù)據(jù)的一致性、元數(shù)據(jù)方案所采用編碼語言的統(tǒng)一性這幾個(gè)方面。
1.2 元數(shù)據(jù)方案的準(zhǔn)確性原則
所謂準(zhǔn)確性原則一方面指元數(shù)據(jù)方案中元素的定義、使用的術(shù)語等不能模棱兩可,容易產(chǎn)生歧義,導(dǎo)致不同的理解;另一方面指元數(shù)據(jù)方案能夠準(zhǔn)確地描述信息資源。也就是說,元數(shù)據(jù)方案不僅要規(guī)定元素的設(shè)置、著錄規(guī)則、標(biāo)記語言的使用,而且要規(guī)定著錄所依據(jù)的標(biāo)準(zhǔn)、傳輸交換語言等。
當(dāng)前困擾各個(gè)搜索引擎的問題是如何提高其查準(zhǔn)率。搜索引擎的低查準(zhǔn)率究其原因是其對(duì)信息資源特征的揭示不夠準(zhǔn)確、深入。數(shù)字圖書館的信息資源類型多樣,既有文字信息,也有音頻、視頻信息,只有準(zhǔn)確地揭示它們的特征,提供高質(zhì)量的元數(shù)據(jù),才能保證較高的查準(zhǔn)率。
1.3 元數(shù)據(jù)方案的通用性與專用性原則
元數(shù)據(jù)方案的通用性與專用性都是相對(duì)而言的。所謂通用性是指元數(shù)據(jù)方案可用于數(shù)字圖書館多種信息資源的元數(shù)據(jù)制作。所謂專用性是指元數(shù)據(jù)方案只適用于數(shù)字圖書館某一特定類型信息資源的元數(shù)據(jù)制作。具有通用性的元數(shù)據(jù)適用于組織多種類型的信息資源。通用性元數(shù)據(jù)有兩種:一種通用性元數(shù)據(jù)的結(jié)構(gòu)非常龐大、復(fù)雜,但是具有很好的描述深度,因?yàn)樗械那闆r都已經(jīng)定義了,比如MARC元數(shù)據(jù)。另一種通用性元數(shù)據(jù),其結(jié)構(gòu)非常簡(jiǎn)單,好學(xué)易用,僅僅只有幾個(gè)非常普遍的屬性,但對(duì)特定類型的信息資源的描述能力不夠。而具有很好專用性的元數(shù)據(jù),其對(duì)于某一特定類型的信息資源描述能力很強(qiáng),但無法覆蓋其它類型的信息資源。數(shù)字圖書館信息資源類型多樣,過分強(qiáng)調(diào)專用性會(huì)導(dǎo)致多種元數(shù)據(jù)各自為政。因此,在設(shè)計(jì)元數(shù)據(jù)方案時(shí),設(shè)計(jì)人員需要在通用性和專用性之間加以協(xié)調(diào)、平衡,才能產(chǎn)生更好的效果。
1.4 元素設(shè)置的可擴(kuò)展性原則
所謂元素設(shè)置的可擴(kuò)展性原則是指在元數(shù)據(jù)方案設(shè)計(jì)時(shí),為元素、元素的限定詞以及屬性值的擴(kuò)充留有一定的余地。數(shù)字圖書館要處理的數(shù)字化信息資源非常廣泛,而且各類數(shù)字化信息資源的應(yīng)用背景更為復(fù)雜。如果元數(shù)據(jù)方案只提供最廣泛意義上的描述,一些針對(duì)特定應(yīng)用背景的內(nèi)容并不納入,那么,應(yīng)允許使用者在不破壞已規(guī)定的標(biāo)準(zhǔn)內(nèi)容(如元素的語義定義)的條件下,擴(kuò)充一些元素或?qū)傩灾怠4送,元?shù)據(jù)是一個(gè)發(fā)展活躍的領(lǐng)域,新的元數(shù)據(jù)元素會(huì)不斷出現(xiàn),老的元數(shù)據(jù)元素會(huì)不斷修改完善。數(shù)字圖書館的生存環(huán)境是一個(gè)不斷變化的環(huán)境,新的信息源也會(huì)層出不窮。這就要求元數(shù)據(jù)方案允許將新的元數(shù)據(jù)元素容納于其中,或者要求修改更新已經(jīng)注冊(cè)的元數(shù)據(jù)方案。
1.5 元數(shù)據(jù)方案的互操作性原則
所謂元數(shù)據(jù)方案的互操作性,是指在由不同的組織制定與管理且技術(shù)規(guī)范不盡相同的元數(shù)據(jù)環(huán)境下,要向用戶提供一個(gè)統(tǒng)一的數(shù)據(jù)檢索界面,確保系統(tǒng)對(duì)用戶的一致性服務(wù)。在具體應(yīng)用上,互操作性表現(xiàn)為易轉(zhuǎn)換性,即在所攜信息損失最小的前提下,可方便地轉(zhuǎn)換為其它系統(tǒng)常用的元數(shù)據(jù)。
2 數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)應(yīng)注意的問題
2.1 非MARC元數(shù)據(jù)與數(shù)字圖書館信息資源組織的質(zhì)量問題
在此,根據(jù)我國(guó)當(dāng)前引進(jìn)、研制元數(shù)據(jù)的狀況,將現(xiàn)存的元數(shù)據(jù)分為兩類,即MARC元數(shù)據(jù)和非MARC元數(shù)據(jù)。MARC元數(shù)據(jù)包括USMARC、UNIMARC、CNMARC等。非MARC元數(shù)據(jù)包括DC系列元數(shù)據(jù)和非DC系列元數(shù)據(jù)。DC系列元數(shù)據(jù)是指我國(guó)在數(shù)字圖書館建設(shè)的過程中,對(duì)DC元數(shù)據(jù)加以引進(jìn)并改造而生成的針對(duì)特殊類型信息資源的元數(shù)據(jù),也就是說這些新出現(xiàn)的元數(shù)據(jù)是在DC元數(shù)據(jù)的基礎(chǔ)上進(jìn)行了擴(kuò)充、改進(jìn)。例如,DC元數(shù)據(jù)、北京大學(xué)拓片元數(shù)據(jù)、《數(shù)字式中文全文文獻(xiàn)通用格式》以及清華大學(xué)的建筑元數(shù)據(jù)。非DC系列元數(shù)據(jù)包括TEI頭標(biāo)、EAD、GILS等。目前將非DC系列元數(shù)據(jù)用于數(shù)字圖書館信息資源組織的呼聲很高。美國(guó)圖書館協(xié)會(huì)(the American Library Association,簡(jiǎn)稱ALA)編目:著錄與檢索委員會(huì)(Committee on Cataloging: Description and Access,簡(jiǎn)稱CC:DA)在《元數(shù)據(jù)與編目規(guī)則研究報(bào)告》(CC:DA Task Force on metadata and Cataloging Rules:Final Report)中以TEI頭標(biāo)、EAD等元數(shù)據(jù)為例,就非DC系列元數(shù)據(jù)作為編目源的情況做出評(píng)估,得出三點(diǎn)重要結(jié)論。第一,非MARC元數(shù)據(jù)在專門針對(duì)其用途而設(shè)計(jì)的系統(tǒng)中效率最高,但在圖書館目錄系統(tǒng)中的效率就不是最高的。第二
,不符合AACR的普通元數(shù)據(jù)進(jìn)入圖書館目錄的時(shí)候,總是需要圖書館編目人員對(duì)其進(jìn)行嚴(yán)格審查。第三,絕大多數(shù)非MARC元數(shù)據(jù)方案沒有提供足夠的信息以區(qū)別相似的信息資源或者內(nèi)容基本相同而不同版本信息資源。[1]也就是說,只有充分地利用各種編目規(guī)則和其它一些質(zhì)量保證手段,非MARC元數(shù)據(jù)才能具有較高的質(zhì)量,才能用于圖書館信息資源組織。
眾所周知,非MARC元數(shù)據(jù)大多數(shù)是一些資源描述機(jī)構(gòu)針對(duì)自己的需要而開發(fā)的。在這些元數(shù)據(jù)方案中,元數(shù)據(jù)的制作可以由專業(yè)的編目人員完成,也可以由根本沒有任何經(jīng)驗(yàn)信息資源的提供者自己完成。非專業(yè)人員制作的元數(shù)據(jù)具有費(fèi)用低、元數(shù)據(jù)的專指性較好的優(yōu)點(diǎn)。但是,這樣做會(huì)導(dǎo)致對(duì)數(shù)字化信息資源的屬性和特征的揭示程度差別很大,進(jìn)而影響元數(shù)據(jù)的總體質(zhì)量。到目前為止,絕大多數(shù)元數(shù)據(jù)仍然由專業(yè)人員提供。例如,TEI頭標(biāo)是一種復(fù)雜的元數(shù)據(jù),絕大多數(shù)TEI文本都是由人文科學(xué)領(lǐng)域非圖書館專業(yè)人員創(chuàng)建,而TEI頭標(biāo)通常是由圖書館員創(chuàng)建或維護(hù)。如果讓非專業(yè)人員參與元數(shù)據(jù)的制作,那么數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)就應(yīng)解決元數(shù)據(jù)制作質(zhì)量的檢測(cè)與管理問題。
2.2 DC系列元數(shù)據(jù)與MARC元數(shù)據(jù)的關(guān)系
目前,有些數(shù)字圖書館紛紛采用DC元數(shù)據(jù)作為描述數(shù)字化信息資源的格式。例如,清華大學(xué)圖書館的建筑數(shù)字圖書館項(xiàng)目以DC元數(shù)據(jù)作為基本框架,結(jié)合建筑資料的實(shí)際情況對(duì)DC元數(shù)據(jù)進(jìn)行改造,擴(kuò)充為THDL——清華大學(xué)建筑數(shù)字圖書館元數(shù)據(jù)格式。北京大學(xué)依據(jù)DC元數(shù)據(jù)開發(fā)了拓片元數(shù)據(jù)格式。上海圖書館也使用了DC元數(shù)據(jù)。自從DC元數(shù)據(jù)產(chǎn)生以來,圖書館界爭(zhēng)論不休的問題是,圖書館是繼續(xù)使用MARC元數(shù)據(jù),還是舍棄MARC元數(shù)據(jù),改用DC元數(shù)據(jù)?具體到我國(guó),在任何一個(gè)數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)過程中,必然要涉及到MARC元數(shù)據(jù)與DC系列元數(shù)據(jù)關(guān)系的處理。
DC元數(shù)據(jù)最初的定位是處于全文索引和復(fù)雜格式的元數(shù)據(jù)之間,提供簡(jiǎn)單明了的元數(shù)據(jù)格式。DC元數(shù)據(jù)與MARC元數(shù)據(jù)的最主要的區(qū)別在于DC元數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單,而MARC元數(shù)據(jù)復(fù)雜。DC元數(shù)據(jù)經(jīng)過數(shù)次研討會(huì)后,對(duì)其進(jìn)行擴(kuò)展,使用修飾限定詞使得DC元數(shù)據(jù)不可避免地復(fù)雜起來。其擴(kuò)展的原因有兩個(gè)。一是應(yīng)用領(lǐng)域比較復(fù)雜,DC元數(shù)據(jù)沒有足夠的元素來描述信息資源的各種重要特征;二是人們希望DC元數(shù)據(jù)應(yīng)用于多個(gè)領(lǐng)域。實(shí)際上,無論如何擴(kuò)展,DC元數(shù)據(jù)不可能解決所有數(shù)字化信息資源的描述問題。筆者建議:由國(guó)家標(biāo)準(zhǔn)化權(quán)威機(jī)構(gòu)——全國(guó)信息與文獻(xiàn)標(biāo)準(zhǔn)化技術(shù)委員會(huì)來制定適應(yīng)于各類數(shù)字化信息資源的元數(shù)據(jù)方案。這樣做,可以在全國(guó)范圍內(nèi),就某一類數(shù)字化信息資源采用何種元數(shù)據(jù)著錄達(dá)成共識(shí)。目前,在MARC元數(shù)據(jù)與DC系列元數(shù)據(jù)并存的情況下,信息資源的存儲(chǔ)與檢索必然涉及MARC元數(shù)據(jù)與DC系列元數(shù)據(jù)兩者之間的轉(zhuǎn)換,是將全部MARC元數(shù)據(jù)轉(zhuǎn)換為DC元數(shù)據(jù),還是將DC元數(shù)據(jù)轉(zhuǎn)換為MARC元數(shù)據(jù)?筆者認(rèn)為,MARC元數(shù)據(jù)與DC元數(shù)據(jù)之間轉(zhuǎn)換的目的是實(shí)現(xiàn)一條記錄可以以MARC元數(shù)據(jù)和DC元數(shù)據(jù)兩種格式來顯示以及數(shù)據(jù)的交換與共享。但是,如果用戶沒有這種需求或者兩者之間不轉(zhuǎn)換并不影響數(shù)據(jù)交換,則沒有必要進(jìn)行轉(zhuǎn)換。也就是說,根據(jù)實(shí)際需要來決定是否需要MARC元數(shù)據(jù)與DC元數(shù)據(jù)之間相互轉(zhuǎn)換。MARC元數(shù)據(jù)與DC元數(shù)據(jù)之間的轉(zhuǎn)換會(huì)產(chǎn)生很多問題。由于MARC元數(shù)據(jù)的描述能力大大豐富于DC元數(shù)據(jù),如何盡量解決兩者之間轉(zhuǎn)換所產(chǎn)生的歧義與不確定性以及信息丟失等難題。
2.3 元數(shù)據(jù)的編碼語言問題
元數(shù)據(jù)的編碼語言是指針對(duì)元數(shù)據(jù)元素和結(jié)構(gòu)進(jìn)行定義和描述的具體語法和語義規(guī)則。目前,各種元數(shù)據(jù)使用的編碼語言是不同的,包括標(biāo)準(zhǔn)通用標(biāo)記語言(Standard General Markup Language,簡(jiǎn)稱SGML)、超文本標(biāo)記語言(Hypertext Markup Language,簡(jiǎn)稱HTML)、可擴(kuò)展標(biāo)記語言(Extensible Markup Language,簡(jiǎn)稱XML)三種形式。有些元數(shù)據(jù)明確規(guī)定使用何種標(biāo)記語言,如TEI頭標(biāo)、EAD和美國(guó)聯(lián)邦地理數(shù)據(jù)委員會(huì)《數(shù)字地理空間元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)》使用SGML。也有些元數(shù)據(jù)沒有規(guī)定使用何種編碼語言,如DC元數(shù)據(jù),有使用HTML,也有使用XML的。從數(shù)據(jù)交換和共享的需要出發(fā),元數(shù)據(jù)的作用是傳遞計(jì)算機(jī)系統(tǒng)可以理解的描述信息和存儲(chǔ)數(shù)據(jù)。計(jì)算機(jī)首先要理解元數(shù)據(jù)的各個(gè)元素或字段序列化的方式,即按怎樣的順序和結(jié)構(gòu)來組織各個(gè)元素及其內(nèi)容。所使用的編碼語言不同,元數(shù)據(jù)編碼規(guī)則以及記錄格式也存在差異。這樣則不利于數(shù)據(jù)的交換和信息資源的共享。因此,從長(zhǎng)遠(yuǎn)利益來看,有必要對(duì)元數(shù)據(jù)的編碼語言進(jìn)行統(tǒng)一。
3 對(duì)我國(guó)數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)的若干建議
3.1 推進(jìn)元數(shù)據(jù)標(biāo)準(zhǔn)化進(jìn)程,提高元數(shù)據(jù)的互操作能力
目前,國(guó)內(nèi)出現(xiàn)了許多種元數(shù)據(jù),例如,拓片元數(shù)據(jù)、建筑元數(shù)據(jù)、古籍元數(shù)據(jù)、中文數(shù)字化全文文獻(xiàn)元數(shù)據(jù)等,由于每種元數(shù)據(jù)都是由不同圖書館研制而成的,并且針對(duì)不同類型的數(shù)字化信息資源。因此,就會(huì)出現(xiàn)DC系列元數(shù)據(jù)與MARC元數(shù)據(jù)并存的局面。這種局面有利于DC系列元數(shù)據(jù)與MARC元數(shù)據(jù)形成優(yōu)勢(shì)互補(bǔ),也可以使某些適合用DC系列元數(shù)據(jù)描述的特定類型信息資源被充分地揭示和利用。同時(shí),這種局面也會(huì)帶來一些問題。目前,我國(guó)DC系列元數(shù)據(jù)至少有4種以上,那么對(duì)DC系列元數(shù)據(jù)是否一體化;那些特定類型信息資源以前的機(jī)讀記錄該如何處理等。
筆者主張DC系列元數(shù)據(jù)一體化,反對(duì)各自為政。DC系列元數(shù)據(jù)都是在DC元數(shù)據(jù)的基礎(chǔ)上根據(jù)用戶的需求與信息資源特點(diǎn)進(jìn)行了修正,所以這些元數(shù)據(jù)的核心或?qū)嵸|(zhì)仍然是DC元數(shù)據(jù)。這一點(diǎn)可以作為DC系列元數(shù)據(jù)一體化的基礎(chǔ),但是,這種一體化工作完成就需要各個(gè)研制單位之間的協(xié)調(diào)與合作,需要以國(guó)家標(biāo)準(zhǔn)的形式出現(xiàn)加以強(qiáng)制執(zhí)行,從而結(jié)束元數(shù)據(jù)結(jié)構(gòu)各自為政的局面。對(duì)于那些原由MARC元數(shù)據(jù)著錄的信息資源來說,MARC記錄已為受編信息資源提供了著錄內(nèi)容詳盡,查全率高的機(jī)讀格式,在受編信息資源數(shù)字化的過程中沒有必要舍棄原有的元數(shù)據(jù),而采用其它元數(shù)據(jù)方案。
3.2 選擇適用的編碼語言
在數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)中,編碼語言的選擇也是關(guān)鍵步驟之一。目前,在DC系列元數(shù)據(jù)中通常使用HTML、SGML或XML。有比較才有鑒別和選擇,我們不妨對(duì)這三種編碼語言的優(yōu)劣進(jìn)行分析比較。
XML是SGML語言的一個(gè)子集,同HTML一起成為SGML家族的主要成員。SGML是一種元語言,可以用來定義其它更專門的標(biāo)記語言。HTML是由SGML定義出來的,專門使用在WWW上的標(biāo)記語言。SGML是很好的資料存儲(chǔ)格式,適用于任何復(fù)雜的文件,但不便于網(wǎng)絡(luò)傳輸,SGML非常復(fù)雜,不易學(xué)習(xí)掌握。XML與HTML不同,XML是SGML的一個(gè)簡(jiǎn)化版本,實(shí)際上,XML也是一種元語言。與HTML不同的是,XML并沒有語義上的元素定義,也沒有預(yù)先定義好的一套標(biāo)記系統(tǒng)。在實(shí)際應(yīng)用中,可以根據(jù)需要定義自己的標(biāo)記。
XML是可擴(kuò)展的,具有較強(qiáng)的靈活性和適用能力,同時(shí)它很有可能在今后成為應(yīng)用最為廣泛的標(biāo)記語言。但是,目前,XML在網(wǎng)絡(luò)上的應(yīng)用不如HTML廣泛。由于HTML文檔本身的結(jié)構(gòu)性不強(qiáng),擴(kuò)展能力差,描述內(nèi)容的能力也較弱,因此不太可能成為今后數(shù)字圖書館元數(shù)據(jù)方案的主要編碼語言。筆者建議,數(shù)字圖書館元數(shù)據(jù)方案的編碼語言采用XML。
3.3 數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)應(yīng)面向?qū)I(yè)編目人員
信息資源編目實(shí)際上是信息資源進(jìn)行分析、判斷和組織的過程。組織過程包括分類、描述、歸并及格式化等過程;分析過程則包括區(qū)分、驗(yàn)證、評(píng)估、比較、解釋及綜合過程。[2]總之,信息資源編目是一個(gè)復(fù)雜的、信息增值的過程。目前,困擾信息資源編目的主要問題是費(fèi)用。一是時(shí)間的花費(fèi),二是金錢的花費(fèi)。費(fèi)用問題使得許多元數(shù)據(jù)方案的設(shè)計(jì)者希望所研制的元數(shù)據(jù)可以由非專業(yè)人員制作。毫無疑問,非專業(yè)人員制作元數(shù)據(jù)的費(fèi)用低,然而這種低費(fèi)用是以犧牲元數(shù)據(jù)的質(zhì)量為代價(jià)的。筆者認(rèn)為,對(duì)于數(shù)字圖書館的建設(shè)而言,元數(shù)據(jù)的總體質(zhì)量是不容忽視的。如果沒有高質(zhì)量的元數(shù)據(jù),數(shù)字化信息資源的利用也就成為一句空話,甚至?xí)袼阉饕嬉粯,查?zhǔn)率很低。所以,建議數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)應(yīng)面向?qū)I(yè)編目人員。只有專業(yè)編目人員利用編目規(guī)則及書目控制等手段,才能夠提供具有較高質(zhì)量的元數(shù)據(jù)。
3.4 數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)中應(yīng)考慮到其它技術(shù)運(yùn)用
在數(shù)字圖書館建設(shè)的過程中,必然要涉及到許多技術(shù),其中包括數(shù)據(jù)庫(kù)技術(shù)、全文檢索技術(shù)、開放式網(wǎng)絡(luò)詞表/分類技術(shù)、地理信息系統(tǒng)(GIS)等。在數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)中,我們需要與這些技術(shù)進(jìn)行銜接并加以應(yīng)用。以聯(lián)合在線資源目錄(Cooperative Online Resource Catalog,簡(jiǎn)稱CORC)為例加以說明。CORC是建立在網(wǎng)絡(luò)環(huán)境下的為本地或網(wǎng)絡(luò)電子資源創(chuàng)建書目元數(shù)據(jù)的系統(tǒng),是一種為電子資源編目的數(shù)據(jù)庫(kù)和工具包。CORC利用了網(wǎng)上杜威分類法數(shù)據(jù)庫(kù),實(shí)現(xiàn)了編目過程中DDC號(hào)碼和主題標(biāo)目自動(dòng)分配。同時(shí),CORC數(shù)據(jù)庫(kù)的軟件平臺(tái)采用Mantis,這是一種適用于任何元數(shù)據(jù)定義與界面的網(wǎng)絡(luò)資源編目系統(tǒng)工具箱。Mantis用XML存儲(chǔ)記錄,使得記錄的輸出非常容易,且有MARC、DC HTML和DC RDF、XML多種格式可供選擇。CORC的成功在于其能夠充分利用各種技術(shù)。因此,我國(guó)在數(shù)字圖書館元數(shù)據(jù)方案的設(shè)計(jì)過程中,也需要考慮其它技術(shù)的運(yùn)用。
【參考文獻(xiàn)】
[1]CC:DA Task Force on metadata and Cataloging Rules:Final Report,August 21,1998[EB/OL].[2001—03—05]. http://www.ala.org/alcts/organization/ccs/ccda.
[2]真溱.矛盾重重的元數(shù)據(jù)世界[J].中國(guó)圖書館學(xué)報(bào),2001,(6):56—59
【數(shù)字圖書館元數(shù)據(jù)方案設(shè)計(jì)問題探討】相關(guān)文章:
數(shù)字信息資源合理使用問題探討08-05
基于數(shù)字圖書館的電子商務(wù)模式探討08-05
高校圖書館地方文獻(xiàn)專題數(shù)據(jù)庫(kù)建設(shè)探討08-09
GIS訪問網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中若干技術(shù)問題的探討08-06
數(shù)字圖書館和有關(guān)著作權(quán)問題的思考08-05
對(duì)“債轉(zhuǎn)股”有關(guān)問題的探討08-07
“留置盤問”問題探討08-05