- 相關推薦
制造信息服務站點的開發(fā)與研究
摘要 以CIMSNET信息中心網(wǎng)站的開發(fā)與建設為背景,本文系統(tǒng)地分析和闡述了建立一個制造技術信息服務網(wǎng)站需要考慮的問題和解決方法,包括網(wǎng)站的總體設計、硬軟件平臺的選擇、信息資源的采集、加工方法、維護方法和組織方法等。希望能對中國的制造信息服務網(wǎng)站的建設有所幫助。關鍵詞 因特網(wǎng),信息資源,信息服務
在知識經(jīng)濟飛速發(fā)展的今天,對信息資源的發(fā)掘和利用關系著一個國家經(jīng)濟發(fā)展的潛力和速度,能否及時、準確、快速獲取豐富的信息資源,也往往決定著企業(yè)在瞬息萬變的市場中競爭的成敗。作為國民經(jīng)濟的支柱產(chǎn)業(yè),制造業(yè)要發(fā)展,也必須充分發(fā)掘利用好豐富的信息資源,因此進行互聯(lián)網(wǎng)建設、建立專門為本領域服務的專業(yè)網(wǎng)站已成為制造業(yè)發(fā)展的一個重點。
1 制造信息服務網(wǎng)站
制造信息服務網(wǎng)站是將經(jīng)過選擇的、系統(tǒng)的、符合制造學科體系的信息,包括技術信息、產(chǎn)品信息、經(jīng)濟信息等制造類專業(yè)信息提供給用戶,以滿足他們對制造領域相關信息的需求,其目的就是在于節(jié)省用戶的查找時間和通信費用,提高查準率和查全率。為從事制造領域管理的各級領導及研究的有關專家提供決策依據(jù),為科研、管理人員提供有關技術信息、咨詢服務,促進我國制造業(yè)的騰飛。
目前,我國制造業(yè)信息服務網(wǎng)站基本上可分為三種模式:第一種是以館藏文獻為基礎的文獻檢索、報道、傳遞網(wǎng)站;第二種是以網(wǎng)絡化資源為基礎的專業(yè)信息檢索和專業(yè)信息門戶網(wǎng)站;第三種是以信息交流為導向的專業(yè)信息園區(qū)。本文以第二種模式為基礎,試圖通過開發(fā)“CIMSNET信息中心站點”摸索出一套開發(fā)專業(yè)制造信息服務網(wǎng)站的方法。
2.系統(tǒng)硬軟件的選擇
2.1 硬件平臺的選擇
硬件平臺的選擇是十分重要的。一個網(wǎng)站如果速度太慢,則很難吸引眾多的用戶,同時也是對網(wǎng)站用戶不負責任的體現(xiàn)。硬件平臺的選擇可從預計的客戶規(guī)模、站點內(nèi)容和可提供的服務、經(jīng)費等方面進行考慮。下面是由WEBBENCH2.0測試所得的兩張圖表明客戶規(guī)模和站點的內(nèi)容(靜態(tài)與動態(tài)內(nèi)容)是如何影響服務器性能的。
從圖2.1可以看出,對于靜態(tài)內(nèi)容而言,如果沒有足夠的內(nèi)存作為緩存,服務器就被迫使用磁盤子系統(tǒng),使服務器整體系統(tǒng)性能下降,如果加上足夠的內(nèi)存,就可以使系統(tǒng)不使用磁盤子系統(tǒng)而使服務器獲得最佳的性能。但有了足夠的內(nèi)存來容納所有的靜態(tài)內(nèi)容,再增加內(nèi)存就不會提高服務器的性能,而增加處理器就是最好的選擇。
從圖2.2可以看出,如果站點有大量的動態(tài)內(nèi)容(如CGI程序),增加CPU可能是較好的選擇。因為動態(tài)內(nèi)容占用CPU的處理時間更多一些,當有了足夠的內(nèi)存來容納所有的靜態(tài)內(nèi)容時,CPU將花費大量的時間處理動態(tài)內(nèi)容會導致服務器性能降低。
圖2.1
每秒頁面請求數(shù)越高表示性能越好
注:以60個客戶機為準,吞吐量由高到低的5條線分別代表:
2CPU-521MB;1CPU-256MB;1CPU-128MB;2CUP-64MB;1CPU-64MB。
圖2.2
每秒頁面請求數(shù)越高表示性能越好
注:以60個客戶機為準,吞吐量由高到低的6條線分別代表:
靜態(tài)1CPU-256MB;動態(tài)1CPU-256MB;
動態(tài)1CPU-128MB;動態(tài)1CPU-64MB;
靜態(tài)1CPU-128MB;靜態(tài)1CPU-64MB。
在CIMSNET信息中心站點項目中,選擇了曙光GT140和GT355E兩臺服務器分別作為Web服務器和Mail服務器。其配置分別是PowerPC 604e,128M內(nèi)存、PowerPC 604e,和256M內(nèi)存。
2.2 操作系統(tǒng)及開發(fā)工具的選擇
2.2.1 操作系統(tǒng)的選擇
當前可供選擇的操作系統(tǒng)包括Windows NT、UNIX和LINUX,但總的來說目前較為流行、好用而且功能強大的還是UNIX系統(tǒng),當然如果由于經(jīng)費的原因,而且從可維護性等方面考慮,Windows NT也是不錯的選擇。
本項目的操作系統(tǒng)是AIX4.2。
2.2.2 數(shù)據(jù)庫系統(tǒng)的選擇
目前無論是UNIX平臺還是Windows NT平臺,可選擇的數(shù)據(jù)庫產(chǎn)品還是相當多的,如Oracle、Informix、Sybase、SQL Server等。從技術上看它們各有優(yōu)勢,用戶可以根據(jù)自己的實際情況、應用的方面來選擇不同的數(shù)據(jù)庫產(chǎn)品。
本項目的數(shù)據(jù)庫系統(tǒng)是Oracle 8.0.4 for AIX。
2.2.3 開發(fā)工具的選擇
2.2.3.1.Web網(wǎng)頁開發(fā)工具的選擇
制作Web頁面的工具有很多,包括Microsoft FrontPage、Netscape編輯器、Adobe Pagemill3.5、Dreamwaver3.0等等,我們選擇了“功能強大、容易上手”的FrontPage98。
和Web頁面相關的圖形、圖象及動畫,除可選擇Photoshop、CoreDraw等圖形制作軟件制作外,也可直接選用現(xiàn)成的來做,如市面上出售的光盤上有大量的圖形、圖象和動畫庫,可根據(jù)需要選擇。
2.2.3.2.數(shù)據(jù)庫開發(fā)工具的選擇
不同的數(shù)據(jù)庫有他們各自的開發(fā)工具,如Sybase的PowerBuilder6.5,Oracle的Developer2000等。根據(jù)我們所選擇的數(shù)據(jù)庫,選擇了Oracle的PL/SQL和Pro*C,數(shù)據(jù)庫維護工具選用PowerBuilder6.5。
3 CIMSNET信息中心站點設計
3.1 CIMSNET信息中心站點設計原則
CIMSNET信息中心站點的設計原則始終是以“用戶為中心”的,其目的就是“讓用戶以最小的代價,最短的時間,獲得最滿意的結果”。因為使用制造業(yè)信息服務站點的用戶往往都是對制造領域的信息感興趣的人,如果不能滿足這部分用戶群的需求,那么專業(yè)信息服務站點就失去了使用的價值。
經(jīng)過充分的考慮,我們提出了CIMSNET信息中心站點的功能結構。站在用戶的角度,我們在設計頁面時,加入了站點結構、導航條、檢索幫助等多種幫助信息;在設計檢索功能時,提供了盡量多的檢索方式和途徑,如全文檢索、聯(lián)庫檢索、漸近檢索、策略式檢索等。同時為了進一步完善網(wǎng)站功能和方便用戶,還應提供交互工具,如站內(nèi)檢索、網(wǎng)上書店、在線注冊、留言板、技術論壇等,為網(wǎng)上用戶提供一個集訂閱、交流、信息反饋于一體的綜合的、動態(tài)的交互環(huán)境,幫助用戶更好的針對個人需求發(fā)掘和獲取站內(nèi)信息資源。
3.2 功能結構
圖3 系統(tǒng)功能結構圖
4&n
bsp;網(wǎng)站資源的收集
良好的信息資源是保證專業(yè)技術網(wǎng)站信息內(nèi)容充實、質量優(yōu)異的根本,如果專業(yè)技術信息網(wǎng)站信息資源不夠,就成了“無本之木,無源之水”。因此專業(yè)技術信息網(wǎng)站信息資源建設就成了網(wǎng)站建設的“重中之重”。由于專業(yè)技術信息網(wǎng)站的目標是提供準確、有效的信息,所以收集信息時的重點應放在“精”,而不是“廣”。根據(jù)不同領域信息的特點,可以選擇不同的信息采集方式。
4.1 自動采集
自動采集指用“機器人(Robot)”或“蜘蛛(Spider)”定期地到指定的網(wǎng)站去下載部分內(nèi)容或全部內(nèi)容,然后對這些信息進行分析、加工。具備這一條件是現(xiàn)代專業(yè)技術信息服務網(wǎng)站作好服務工作的基礎。上述工具網(wǎng)上某些站點提供免費下載,如 http://www.tardis.ed.ac.uk/harvest/ 。
4.2 手工采集
手工采集在自動采集還未實現(xiàn)智能化之前是信息采集的重要手段。手工采集的方式主要有:
通過因特網(wǎng)進行網(wǎng)上信息資源的采集
因特網(wǎng)上的制造類專業(yè)站點有很多,而且這些網(wǎng)站的技術側重點也不進相同,信息更新較快,運用傳統(tǒng)的手工收集印刷型和電子型的工具書遠遠不能滿足網(wǎng)站用戶的需求。因此網(wǎng)上信息的收集是專業(yè)技術信息服務網(wǎng)站資源建設的重點工作。
(1)調研與整理步驟
確定主題,利用所確定的報導內(nèi)容確定主題詞;
上網(wǎng)檢索,利用網(wǎng)上搜索引擎(如Yahoo, Infoseek等)對所選主題進行檢索,得到站點信息與URL地址,URL也可在紙基傳統(tǒng)媒體掃描進行積累,如有許多權威的出版社出版了許多站點大全、站點手冊等進行網(wǎng)上沖浪的工具書,這些工具書往往具有較為清晰的分類體系,并會對站點進行簡要的介紹,從這里我們也可以得到一些相關站點的網(wǎng)址;
內(nèi)容瀏覽,利用URL地址訪問目標站點,瀏覽站點內(nèi)容;
檢索結果的組織利用,將瀏覽過的站點中有價值的篩選出來加以記錄,并記錄URL地址以備進一步利用。
(2)網(wǎng)上資源調查結果分析
由于上網(wǎng)的各機構、組織都分別采用各種方式宣傳和擴大自己的影響,因此可通過網(wǎng)絡迅速獲得各種信息,包括有關的出版及會議消息,對于我們做好專業(yè)技術信息服務有重要作用,這主要體現(xiàn)在:
①公開出版物在網(wǎng)上有預告,這對我們文獻的獲取計劃制定非常有力,以往僅能依賴公共圖書館的館藏,現(xiàn)在利用網(wǎng)上資源,在時效性方面獲得了很大優(yōu)勢;
②協(xié)會、科研機構咨詢機構舉辦的會議在網(wǎng)上也有預告,公開出版的會議錄、研究報告也有采購辦法的通告,這對我們掌握學術動態(tài)以及文獻獲取有重要意義;
③科研機構網(wǎng)站上一般都有其性質、背景、演變、隸屬關系等方面的詳細介紹,另外還包含他們的研究成果,正在進行的項目等的介紹,這對我們?nèi)媪私鈾C構,掌握國際研究進展狀態(tài)具有很大意義。
④CIMS各分領域產(chǎn)品供應商網(wǎng)站發(fā)布的產(chǎn)品介紹、應用案例分析、客戶服務等信息對于我們掌握工業(yè)發(fā)展動態(tài)、產(chǎn)品選型參考,技術實施等都有重要參考價值。
當然,上網(wǎng)的組織機構一方面是擴大自己的影響,同時,他們也注重贏利的主要目的,因而許多有價值的出版物我們都無法直接獲得原文,只能通過訂購獲得。
2)通過報刊、專著、會議錄、工具書等紙基媒體進行信息采集
通過分析,我們將期刊分為學術類期刊和新聞動態(tài)類期刊。學術類期刊、專著、會議錄、工具書主要充實數(shù)據(jù)庫信息,而報紙、新聞動態(tài)類期刊則主要報導技術動態(tài)及技術綜述,將其作為Web頁面信息的來源。當然,學術類期刊、專著等報導的新內(nèi)容我們也將在頁面上進行報導。
(1)調研與搜集整理步驟
以國家圖書館的館藏為主,并結合信息中心訂閱的報刊,用CIMS主題分類,SME分類體系的主題詞進行篩選,確定調研范圍;
設計文獻源調查表(如表1所示),表中設文獻名稱、類型、出版信息(時間、地點、期刊有出版周期)、館藏(館藏地、館藏號)主要報道內(nèi)容等項目;
到館藏地點提取文獻源,由調查人員對文獻源從其權威性、時效性、可靠性等方面做出評價,若符合入選標準,則填寫文獻源調查表,作為入選的文獻源備用。
3)利用商用數(shù)據(jù)庫進行信息采集
一些大型的信息機構會定期出版信息庫光盤,如Dialog公司的商用數(shù)據(jù)庫和中國萬方公司出版的信息庫光盤等。我們信息的調研主要是為數(shù)據(jù)庫建設而進行的數(shù)據(jù)準備工作,對工程索引、美國政府報告、中國科技名人、中國科研機構、中國企業(yè)、公司及產(chǎn)品數(shù)據(jù)庫、北美商情等七個數(shù)據(jù)庫進行的調研,并對每個數(shù)據(jù)庫都提取了樣記錄。
4)利用政府機關、CIMS主題及國內(nèi)相關機構、相關學術與商業(yè)活動進行信息采集
這類信息資源的確定,一是要反映國內(nèi)的發(fā)展動態(tài),二是要為數(shù)據(jù)庫建設收集信息。對于這類信息資源,信息中心以信息交流與共享為前提,以信函、電話、面談、參加博覽會等方式,與國內(nèi)數(shù)十家相關組織建立了信息交流伙伴的關系。
5 信息加工手段及其方法
對上述過程獲得的信息資源中信息的采集、加工直到最后到網(wǎng)上發(fā)布應用,是一個非常耗時的艱苦過程,也是非常重要的一個過程。
5.1欄目信息的加工方法
網(wǎng)站欄目中的信息內(nèi)容主要從國內(nèi)外報刊、新聞媒體、網(wǎng)上信息資源、主題及相關機構、企業(yè)協(xié)作中采集。具體流程如下:
首先網(wǎng)站信息維護人員對信息源進行掃描或主動預約信息,將認為有價值的信息保存下來,提交給信息審核人員進行審核,審核通過后即可進行信息處理,如翻譯、錄入、校對、加工成HTML格式,提交給Web管理員,由管理員將信息上網(wǎng)發(fā)布。欄目信息加工方法流程如圖5.1所視
5.2數(shù)據(jù)庫信息的加工方法
數(shù)據(jù)庫的信息內(nèi)容主要從國內(nèi)外科技期刊、專著、商業(yè)數(shù)據(jù)庫、網(wǎng)上資源、主題及相關機構中獲得。具體流程如下:
首先網(wǎng)站信息維護人員對信息源進行掃描、預約信息或檢索,將與各數(shù)據(jù)庫有關的信息保存下來,提交給信息審核人員進行審核,審核通過后即可進行信息處理,如標引、錄入、轉庫、校對,將原始信息進入臨時庫。最后由數(shù)據(jù)庫管理員將臨時庫中的數(shù)據(jù)轉入正式數(shù)據(jù)庫中。
數(shù)據(jù)庫信息加工方法流程如圖5.2所示。
圖5.1 欄目信息加工方法流程圖
圖5.2 數(shù)據(jù)庫信息加工方法流程圖
5.3 建立完善的信息維護制度
信息的采集與加工,最終是要提交給各欄目發(fā)
布并供服務對象最終應用,欄目的內(nèi)容決定著信息的采集與加工,而信息采集加工工作的質量最終也影響著欄目的內(nèi)容。
為保證欄目內(nèi)容的質量,應建立欄目專人負責的制度,對于所確定的各個欄目,要有專人負責。專欄負責人有權對信息研究人員進行征稿,確定信息發(fā)布內(nèi)容。欄目負責人的責任是:制定本欄目信息的采集與發(fā)布的標準流程、審核制度,并保證信息的質量與嚴格的更新周期。對于數(shù)據(jù)庫的信息建設,同樣也有相應的操作規(guī)范。各個庫設有專門負責人,并明確確定各庫收錄范圍、在此基礎上,制定數(shù)據(jù)采集與入庫的標準流程。
同時,為使信息的采集更好地服務于欄目,還應建立信息采集機制,根據(jù)要報道的信息技術領域范圍以及所確定的權威文獻源,定期對所確定的文獻源進行掃描和訪問,記錄掃描結果并提交給欄目應用。
最后要建立信息審核制度。從各個信息源收集來的信息,其質量、準確性和及時性都是有差異的,并不都是可用的,這就需要建立信息審核制度來保證網(wǎng)站信息的質量,我們建議應由網(wǎng)站的管理人員和負責人牽頭建立信息審核小組,審查和監(jiān)督信息的質量。
6 信息資源的組織
信息資源的組織包括兩個方面,一個是Web頁面的信息組織,另一方面是數(shù)據(jù)庫的信息組織。
6.1 Web頁面的信息組織
6.1.1 目錄結構與文件命名
路徑清晰、含義明確的目錄結構不僅能使設計過程變得嚴謹和有條理,同時也有利于今后的維護和擴充。有許多方法來組織Web的信息,歸納起來有以下幾種:
單目錄網(wǎng)站 所有的HTML文件和圖象文件都防在一個目錄下;
按功能組織目錄 把一些相關的HTML文件放在相同的目錄中;
按文件類型組織目錄 按文件的類型而不是按內(nèi)容建立目錄;
混合組織 借鑒第二和第三種方法組織目錄,這是目前組織大型網(wǎng)站目錄的最好方法。
一般來講,網(wǎng)站的目錄冊次不應超過4層,否則將會對網(wǎng)站的維護造成一定的困難。
一個好的文件名能夠反映文件的內(nèi)容,便于設計者和今后的維護人員查找需要的文檔,提高工作效率。所以在命名文件名時一定要考慮這個問題。
6.1.2 設計Web頁面應注意的問題
在設計Web頁面時應在頁面的醒目處設有清晰的路標或位置信息或導航條;
在頁面中要注意Metadata標記的使用。該標記可以對整個頁面的標題、主題、內(nèi)容等進行描述,其意義在于搜索引擎對頁面的自動標引和檢索;
盡量避免頁面過長,如果頁面過長,則應在頁面內(nèi)部設置錨鏈接方式,避免用戶滾動整個網(wǎng)頁;
應在網(wǎng)站中設置站內(nèi)導航,使用戶能迅速從網(wǎng)站中找到所需信息。
6.2 數(shù)據(jù)庫信息的組織
數(shù)據(jù)庫信息通過對信息源的加工、標引而來,重點在于對數(shù)據(jù)庫信息的分類和標引。對數(shù)據(jù)庫信息我們參照《國防科技敘詞表》、863/CIMS技術體系和SME分類體系進行標引工作,即抽象出信息主題的各個特征,歸入數(shù)據(jù)庫,并提供檢索功能。
7 結束語
目前國內(nèi)的制造技術信息服務站點還處于起步階段,提供的服務主要是數(shù)據(jù)庫檢索、業(yè)內(nèi)網(wǎng)站導航、技術文獻提供、技術動態(tài)新聞等。隨著電子商務的興起,對制造技術信息服務網(wǎng)站提出了更高的要求,如開設網(wǎng)上資料訂購、網(wǎng)上會議、網(wǎng)上課程培訓及網(wǎng)上社區(qū)等功能,更好地為制造領域內(nèi)的廣大用戶服務。
參考文獻
何俊梅. 因特網(wǎng)上高校院系Web站點的設計.情報理論與實踐,2000,23(2).
彭曉蓉,孔桃.專業(yè)信息服務網(wǎng)站的開發(fā)研究.情報理論與實踐,2000,23(1).
漆宏. 探索21世紀信息服務體系.情報理論與實踐,1999,22(3).
4.洪偉. 科技期刊網(wǎng)頁的設計和制作. 情報理論與實踐,1999,22(2).
【制造信息服務站點的開發(fā)與研究】相關文章:
信息服務模式研究08-05
信息披露制度研究08-05
合作研究開發(fā)合同01-29
《電影課程開發(fā)》研究方案08-17
志愿服務立法研究08-12