⑴ 什麼是政務信息資源政務信息資源目錄有哪些
政務信息資源是指政..府中與信息採集能力,信息處理能力,信息利用能力,以及信息交流能力有關的一切資源,包括人員、設備、資金、信息及技術。換而言之,政務信息資源並不僅僅指政..府信息而言,其涵義和涉及的范圍比信息本身更要廣泛得多。相應地,政務信息資源的管理也包括對人員、設備、資金及技術的管理。政務信息資源看作是等同於政..府.部.門的人力資源、物質資源和財務資源的組織資源,政務信息資源管理從支持政..府職能發展到政府的管理職能,同政..府的其他重要職能一樣重要。
政務信息資源目錄體系的關鍵標准包括 6個方面的內容,其中「第1部分:總體框架」規定了政務信息資源目錄體系的總體結構、基本功能等內容;「第2部分:技術要求」規定了政務信息資源目錄體系建設的基本技術要求;「第3部分:核心元數據」規定了公共資源核心元數據和交換服務資源核心元數據應當遵循的內容標准;「第 4部分:政務信息資源分類」規定了政務信息資源的分類與編碼;「第5部
分:政務信息資源標識符編碼方案」規定了政務信息資源的唯一標識符編碼方案;「第 6部分:管理要求」規定了政務信息資源目錄體系的基本管理要求。
(1) 總體框架
「總體框架」給出了政務信息資源目錄體系所涉及的關鍵術語,定義了政務信息資源、公共資源、交換資源、政務信息資源目錄體系等關鍵概念,明確了政務信息資源目錄的管理者、提供者和使用者三個角色及其職責。各級政務部門工作人員和相關的技術開發人員在建設政務信息資源目錄體系時,可按照「總體框架」規定的總體結構建立起符合其概念模型的政務信息資源目錄系統,並要實現對目錄內容的編目、注冊、發布、查詢和維護等基本功能。
(2) 技術要求
目錄技術要求的核心是目錄服務規范,它能夠整合分布在各部門的政務信息資源,並形成完整的政務信息資源目錄體系,為政務信息資源的交換建立良好的基礎。
目錄服務規范主要定義由發現和管理兩大類介面組成,並為其提供外部介面。其中,發現服務是對政務信息資源的查找、瀏覽、定位功能。發現服務對政務信息資源的查找、瀏覽及定位是通過元數據進行的,提供對政務信息資源的元數據級的訪問。管理服務提供對目錄本身的管理功能,如修改目錄信息、增加或刪除目錄等。根據不同的應用需求,目錄服務規范規定了針對公共資源的服務介面規范和交換服務資源的服務介面規范兩部分的技術規定。
(3) 元數據
從組成上來說,元數據的主要內容包括信息資源的標識、內容、分發、數據質量、數據表現、數據模式、圖示表達、限制和維護等信息。
標識是信息資源的一個重要特性,包括信息資源的唯一標識符、信息資源的摘要信息、創建信息資源目的、信息資源的狀態等信息。內容重點描述信息資源的基本數據組成,包括信息資源包含哪些具體的數據。分發著重說明使用者如何獲得信息資源的信息,包括數據分發格式信息、分發者信息以及用戶獲取數據集的途徑。數據質量信息包含數據志信息以及數據質量報告等內容,數據志說明的是信息資源的生產依據和過程,數據質量報告給出了按特定的數據生產標准進行評價的結果。數據表現確定了數據的展現方式,包括圖形、影像、文字等方式的說明。數據模式信息包含有關數據的物理模式的信息。圖示表達則進一步說明了採用圖形進行數據表達的具體規則。限制和維護信息既包括信息資源本身也包括元數據的使用以及日常維護方面的信息。
一般來說,元數據的具體組成需要結合具體的領域、部門以及具體的信息資源的情況來加以確定。
⑵ 編目什麼意思
編目:按照一定的標准和規則,對某范圍內文獻信息資源每種實體的外部特徵和內容特徵進行分析、選擇、描述,並予以記錄成為款目,繼而將款目按一定順序組織成為目錄或書目的過程。
⑶ 什麼叫信息資源的半結構化
文摘:要對網路信息資源進行更好的管理和查詢,首先要建立一種合理的信息資源描述機制。Metadata是描述網路信息資源的有力工具,但新的信息描述機制——linking機制不僅能表述Metadata的內容,而義可以表達比Metadata更豐富的語義,彌補Metadata自身不能克服的一些缺陷。
關鍵詞:半結構化信息 信息資源描述 Metadata linking
隨著數字化、網路化技術的飛速發展,數字圖書館建設成為圖書情報界重要的研究方向,其中網路信息資源組織是數字圖書館建設的核心內容。網路信息資源的動念性、分布性、多元性和無序性等特點,使信息的查找和檢索變得越來越困難。對於21世紀的信息用戶和信息管理者來說,困擾他們的不是信息太少,而是倍息過多的問題。因此,如何對網路信息資源進行合理的描述,組織、序化網路信息資源,提高信息利用率,是當前重要的研究課題。
1 網路半結構化信息資源
目前,網路半結構化數據日趨豐富。完全結構化數據有非常良好的數據結構,如關系資料庫、面向對象資料庫中的數據。完全無結構數據是指聲音、圖像文件等無模式數據。而半結構化數據是介於完全結構化數據和無結構數據之間的一種數據類型。
半結構化數據雖然有一定的結構,但卻是不嚴格的、多變的和不完整的。
從網路的信息層次來看,網路半結構化信息的研究對象分為3個層面:網頁層面、網站層面、網路層面。
——www網頁:最主要的研究方向。
● HTML(Hypertext Markup Language)——由於其在目前網路資源描述格式中所佔的比例最高,所以有關研究持別多。
● XML(extensible Markup Language)——作為一種新的網上數據交換的標准,正在引起人們極大的關注。XML是標準的通用標記語言SGML(ISO8879)的一個子集,用於支持Internet亡有結構文檔的交換。和HTML相比,XML是面向內容的,它具有更多樣化的結構和更豐富的語義,並具有可擴展性良好、易於零握、自描述等特點,適用於web上的數據交換。可以預言,川L將成為數據組織和交換的事實標難,大量的XML數據將出現在Web上。XML數據模型與半結構數據模型有著很多的相似性,即它既為半結構數據的研究提供了廣闊的應用前景,同時也推動了半結構化數據研究的發展。
——網站的半結構化研究:充分利用網頁內容、錨文本、網頁鏈接、鏈接的兄弟關系等進行導航。
——網路的半結構化研究:通過挖掘利用網路信息半結構化的特點,設計智能搜索引擎,提供某一主題的高效檢索,要更好地組織網路半結構化信息.首先要對半結構化信息進行合理的組織描述。
2 半結構化信息資源的描述
目前,大多採用帶標記的有向圖作為半結構化數據模型,最典型的就是OEM(對象交換模型)模型。概括地說,主要有兩種描述方法:
2.1 基於邏輯的描述形式
在已經提出的半結構化數據模式的描述形式中,基於邏輯的描述形式是重要的一類,如一階邏輯(first-order logic)、描述邏輯(description logic)以及Datalog等。它們非常類似,但在表達能力等方面有所差別,其中比較典型的是基於Datalog的模式描述形式。
2.2 基於圖的描述形式
由於半結構化數據一般採用帶標記的有向圖來表示,所以這種描述形式的一個顯著優點是模式和數據採用同一種數據模型(圖模型).非常便於處理。模式圖通常是一個有根、邊上帶標記的有向圖.其邊上的標記可以與數據圖相同,也可以加以擴充,如允許類似於「name | address」的形式,或採用特定形式的規則(如一元渭詞).等等。對模式圖中的節點,可以加以一定的注釋.表明其代表的語義或其它特定的含義,其中最有代表性的是OEM。 此外,還有概念模型。通過一個自然簡單的方法,了解HTML頁面的內部結構。它不同於OEM,而類似於人對文檔的概念化。它提供雖然很少卻十分有效的高層結構,用於描述文本的內容(如通過引入LIST對象解決了圖、樹描述方法所不能解決的LIST表問題)。另有一套相應的規則,把內容自動映射到概念模型中。但到目前為止.還沒有相應的查詢語言。
2.3 半結構化模式的特點
● 先有數據,後有模式。一般是先進行查詢,查詢結果即為數據結構及其模式。
● 用於描述數據的結構信息.而不是對數據結構進行強制性約束。
● 規模可能很大,甚至超過源數據的規模,而且因數據的不斷更新而處於動態的變化過程之中
● 不講求精確性,可能描述其中一部分結構,也可能根據數據處理的不同階段的視角而不同。
● 非常靈活,能滿足網路這種復雜分布式環境的要求。
● 加大了數據處理的難度。
3 從metadata到linking的組織描述
為了描述網頁半結構化信息資源,人們提出了元數據(metadata)的概念。提出metadata的目的.是將圖書情報領域的分類法和標引技術普及到一般的網頁製作者,以組織龐大的網路信息資源。metadata系統被認為是一個用於抽取構成對象的屬性和方便信息訪問的強有力的通用機制。
較早出現的元數據格式是MARC(主要被用來詳細著錄書目),它是全球范圍內公認的較為成熟的傳統機讀編目格式.其結構嚴謹.類目復雜;系統完善.但是並不適合對一般網路信息資源的描述。首先,網路信息資源描述格式並不需要那樣復雜;其次,網路信息資源浩如煙海,讓編目人員對每個網頁都進行詳細著錄.需耗費相當的人力物力,這是不合實際的。
為了研究一種適用於描述一般網路信息資源的元數據標准.制定一種通用的網路著錄規則.1995年3月由OCLC與NCSA聯合發起,52位來自圖書館界和電腦網路界的專家共同研究產生了都柏林核心元數據集(Dublin Core,簡稱DC)。DC適合揭示各類型電子文獻的內容和其它特性.能有效地對網上資源進行組織、分類、索引。
DC由15個基本元素組成,分成三大部分:①內容描述部分行題名、主題、說明、來源、語種、關聯和覆蓋范圍;②知識產權部分有創建者、出版者、其他責任者和許可權;③外形描述部分有日期、類型、形式和標識符。
DC比較易於應用到網路信息資源的描述中,著錄數據與著錄對象可以存在於同一文件中,也可以存在於不同文件中。
3.1 DC的優點
● 結構簡單:數據元素的含義,易學易記,非編目人員也能很快理解。對網路資源的描述性編目,主要由資源製作者在製作資源的同時提供.這不僅降低了記錄的製作成本.又能適應網路信息資源巨量增長的需要。在資源製作者描述的基礎上,信息工作者則把主要精力放在對質量較高、穩定性較好的網路資源的標引和規范控制上,為用戶構建高效實用的檢索系統。
● 可重復性。 DC規定所有入素都是可重復的,因而解決了多著者或多版本等重復元素的著錄問題。
● 可選擇性:著錄項目可以簡化,只須確保最低限度的7個元素(題名、出版者、形式、類型、標識符、日期和主題)即可。
● 可擴展性。各個DC地方版可以在15個元素的基礎上增加新的元素或新的修飾詞,允許資料以地區性規范出現,並保持元數據的一些特性,以便日後有擴充的餘地。
● 可以與其它元數據連接使用,以彌補其自身的不足。在統一資源描述框架(RDF)下,可以實現與其它元數據的連接。
3.2 metadata存在的兩大理由
● 提供在一個系統內擴張對象的通用機制。要注意的是,這一對象不一定是文獻。
● metadata在系統中可以用於分組、排序並訪問對象,即提供信息檢索服務。
3.3 metadata的缺陷
● 主要是對文獻的外部特徵進行描述,雖然採用了主題這個元素對文獻內部特徵進行揭示,但描述得不夠詳細
● 沒有充分利用半結構數據中的結構信息。
● metadata機制看不出所描述的對象類型。
● matadata值對(名字和值)是不對稱的,單向可讀,域和域值角色不能交換。
實踐中,有的研究者把DC和全文檢索技術結合起來建立搜索引擎,但尚無實質性進展。故此,更切合對半結構化數據進行描述的機制——聯接(1inking)機制應運而生。
聯接(1inking)機制和metadata之間具有相似性,即它同樣有能力抽取對象的屬性,並給用戶提供更有效的信息訪問手段。
首先,metadata可以用1inking形式表示出來。
把metadata值對視為系統內可以識別的子對象,這樣,metadata值對就成了對象的子對象,通過名字在錨(anchor)和metadata值對間建立映射。
示例1:
<docl,<author,hq>>:其中<author,hq>為metadata值對,用P表示,有<doc1,p>,p視為doc的子對象,從而與錨的表達一致。
其次,1inking機制可以表達比metadata更豐富的語義,能揭示關系對的類型,並且是對稱的。
示例2:
<<「doc2」.「document」>, <」hq」,」author」>「DocumentAuthoredBy」>
<<「hq」,「supervisor」>,<「lj」,」supervises」>,」supervises」>
第一句的語義為:doc2 is the document authored by hq。第二句的語義為hq supervises lj。 通過這個例子可以發現,linking機制揭示了metadata模型不可能揭示的關系對的類型:document和supervisor。並且,它使metadata對稱化了,其中hq這個1ink中的「錨」既可以做第一個關系對doc2的域值,也可以做另一個關系對hq的域名。
分析表明,linking機制更適合對網路半結構化信息的描述。在對網路半結構化信息資源合理描述的基礎上,再進行信息抽取和信息查詢,系統就可以提供更為精確的檢索結果,提供更有價值的信息。
⑷ 有人寫過這個的論文嗎高分懸賞
相關範文:
數字圖書館元數據方案設計有關問題探討
【內容提要】在闡述數字圖書館元數據方案設計原則的基礎上,對數字圖書館元數據方案的設計有關問題進行較為深入的思考,並且提出若干建議。
【摘 要 題】專題探討
【英文摘要】This article begins with the illustration of&n
1 數字圖書館元數據方案設計原則
元數據方案就是數字圖書館中所使用的信息描述方法。數字圖書館的運作,無論是存取過程還是檢索過程,都是以元數據方案為基礎實現的。換言之,元數據方案為數字圖書館分布式信息資源的發現和檢索奠定了基礎。因此,元數據方案決定了數字圖書館的功能特徵、運行模式和系統運行的總體性能。為了實現這一總體性能,達到共建共享信息資源的目的,數字圖書館元數據方案應遵循下列原則。
1.1 元數據方案的標准化原則
在數字圖書館建設中,標准問題最重要的是元數據的製作,而與元數據的製作緊密相關的問題是元數據方案的設計。
然而,目前在元數據方案的標准化方面存在很多問題。首先,就DC系列元數據而言,在同一元素的著錄內容上存在較大的差異。如,北京大學拓片元數據要求在許可權(Rights)元素中著錄館藏地址、允許使用的用戶范圍,而在《數字式中文全文文獻通用格式》規定著錄有關許可權管理的聲明,包括知識產權等。其次,對於同類型信息資源的組織,有的圖書館已經採用DC元數據,有的則仍然採用MARC元數據。這種著錄內容和同類信息資源所用元數據的不一致都會給數據交換的帶來困難。最後,各個元數據所採用的編碼語言也是各不相同,有的採用HTML,有的採用SGML或XML。由於各個編碼語言的標簽設置、內容、可擴展性的不同,則會影響元數據的通用性。
元數據方案的標准化原則具有廣泛的內涵。它包括元素著錄內容的標准化、同類型數字化信息資源的著錄所採用元數據的一致性、元數據方案所採用編碼語言的統一性這幾個方面。
1.2 元數據方案的准確性原則
所謂准確性原則一方面指元數據方案中元素的定義、使用的術語等不能模稜兩可,容易產生歧義,導致不同的理解;另一方面指元數據方案能夠准確地描述信息資源。也就是說,元數據方案不僅要規定元素的設置、著錄規則、標記語言的使用,而且要規定著錄所依據的標准、傳輸交換語言等。
當前困擾各個搜索引擎的問題是如何提高其查准率。搜索引擎的低查准率究其原因是其對信息資源特徵的揭示不夠准確、深入。數字圖書館的信息資源類型多樣,既有文字信息,也有音頻、視頻信息,只有準確地揭示它們的特徵,提供高質量的元數據,才能保證較高的查准率。
1.3 元數據方案的通用性與專用性原則
元數據方案的通用性與專用性都是相對而言的。所謂通用性是指元數據方案可用於數字圖書館多種信息資源的元數據製作。所謂專用性是指元數據方案只適用於數字圖書館某一特定類型信息資源的元數據製作。具有通用性的元數據適用於組織多種類型的信息資源。通用性元數據有兩種:一種通用性元數據的結構非常龐大、復雜,但是具有很好的描述深度,因為所有的情況都已經定義了,比如MARC元數據。另一種通用性元數據,其結構非常簡單,好學易用,僅僅只有幾個非常普遍的屬性,但對特定類型的信息資源的描述能力不夠。而具有很好專用性的元數據,其對於某一特定類型的信息資源描述能力很強,但無法覆蓋其它類型的信息資源。數字圖書館信息資源類型多樣,過分強調專用性會導致多種元數據各自為政。因此,在設計元數據方案時,設計人員需要在通用性和專用性之間加以協調、平衡,才能產生更好的效果。
1.4 元素設置的可擴展性原則
所謂元素設置的可擴展性原則是指在元數據方案設計時,為元素、元素的限定詞以及屬性值的擴充留有一定的餘地。數字圖書館要處理的數字化信息資源非常廣泛,而且各類數字化信息資源的應用背景更為復雜。如果元數據方案只提供最廣泛意義上的描述,一些針對特定應用背景的內容並不納入,那麼,應允許使用者在不破壞已規定的標准內容(如元素的語義定義)的條件下,擴充一些元素或屬性值。此外,元數據是一個發展活躍的領域,新的元數據元素會不斷出現,老的元數據元素會不斷修改完善。數字圖書館的生存環境是一個不斷變化的環境,新的信息源也會層出不窮。這就要求元數據方案允許將新的元數據元素容納於其中,或者要求修改更新已經注冊的元數據方案。
1.5 元數據方案的互操作性原則
所謂元數據方案的互操作性,是指在由不同的組織制定與管理且技術規范不盡相同的元數據環境下,要向用戶提供一個統一的數據檢索界面,確保系統對用戶的一致性服務。在具體應用上,互操作性表現為易轉換性,即在所攜信息損失最小的前提下,可方便地轉換為其它系統常用的元數據。
2 數字圖書館元數據方案設計應注意的問題
2.1 非MARC元數據與數字圖書館信息資源組織的質量問題
在此,根據我國當前引進、研製元數據的狀況,將現存的元數據分為兩類,即MARC元數據和非MARC元數據。MARC元數據包括USMARC、UNIMARC、CNMARC等。非MARC元數據包括DC系列元數據和非DC系列元數據。DC系列元數據是指我國在數字圖書館建設的過程中,對DC元數據加以引進並改造而生成的針對特殊類型信息資源的元數據,也就是說這些新出現的元數據是在DC元數據的基礎上進行了擴充、改進。例如,DC元數據、北京大學拓片元數據、《數字式中文全文文獻通用格式》以及清華大學的建築元數據。非DC系列元數據包括TEI頭標、EAD、GILS等。目前將非DC系列元數據用於數字圖書館信息資源組織的呼聲很高。美國圖書館協會(the American Library Association,簡稱ALA)編目:著錄與檢索委員會(Committee on Cataloging: Description and Access,簡稱CC:DA)在《元數據與編目規則研究報告》(CC:DA Task Force on metadata and Cataloging Rules:Final Report)中以TEI頭標、EAD等元數據為例,就非DC系列元數據作為編目源的情況做出評估,得出三點重要結論。第一,非MARC元數據在專門針對其用途而設計的系統中效率最高,但在圖書館目錄系統中的效率就不是最高的。第二,不符合AACR的普通元數據進入圖書館目錄的時候,總是需要圖書館編目人員對其進行嚴格審查。第三,絕大多數非MARC元數據方案沒有提供足夠的信息以區別相似的信息資源或者內容基本相同而不同版本信息資源。[1]也就是說,只有充分地利用各種編目規則和其它一些質量保證手段,非MARC元數據才能具有較高的質量,才能用於圖書館信息資源組織。
眾所周知,非MARC元數據大多數是一些資源描述機構針對自己的需要而開發的。在這些元數據方案中,元數據的製作可以由專業的編目人員完成,也可以由根本沒有任何經驗信息資源的提供者自己完成。非專業人員製作的元數據具有費用低、元數據的專指性較好的優點。但是,這樣做會導致對數字化信息資源的屬性和特徵的揭示程度差別很大,進而影響元數據的總體質量。到目前為止,絕大多數元數據仍然由專業人員提供。例如,TEI頭標是一種復雜的元數據,絕大多數TEI文本都是由人文科學領域非圖書館專業人員創建,而TEI頭標通常是由圖書館員創建或維護。如果讓非專業人員參與元數據的製作,那麼數字圖書館元數據方案設計就應解決元數據製作質量的檢測與管理問題。
2.2 DC系列元數據與MARC元數據的關系
目前,有些數字圖書館紛紛採用DC元數據作為描述數字化信息資源的格式。例如,清華大學圖書館的建築數字圖書館項目以DC元數據作為基本框架,結合建築資料的實際情況對DC元數據進行改造,擴充為THDL——清華大學建築數字圖書館元數據格式。北京大學依據DC元數據開發了拓片元數據格式。上海圖書館也使用了DC元數據。自從DC元數據產生以來,圖書館界爭論不休的問題是,圖書館是繼續使用MARC元數據,還是舍棄MARC元數據,改用DC元數據?具體到我國,在任何一個數字圖書館元數據方案的設計過程中,必然要涉及到MARC元數據與DC系列元數據關系的處理。
DC元數據最初的定位是處於全文索引和復雜格式的元數據之間,提供簡單明了的元數據格式。DC元數據與MARC元數據的最主要的區別在於DC元數據結構簡單,而MARC元數據復雜。DC元數據經過數次研討會後,對其進行擴展,使用修飾限定詞使得DC元數據不可避免地復雜起來。其擴展的原因有兩個。一是應用領域比較復雜,DC元數據沒有足夠的元素來描述信息資源的各種重要特徵;二是人們希望DC元數據應用於多個領域。實際上,無論如何擴展,DC元數據不可能解決所有數字化信息資源的描述問題。筆者建議:由國家標准化權威機構——全國信息與文獻標准化技術委員會來制定適應於各類數字化信息資源的元數據方案。這樣做,可以在全國范圍內,就某一類數字化信息資源採用何種元數據著錄達成共識。目前,在MARC元數據與DC系列元數據並存的情況下,信息資源的存儲與檢索必然涉及MARC元數據與DC系列元數據兩者之間的轉換,是將全部MARC元數據轉換為DC元數據,還是將DC元數據轉換為MARC元數據?筆者認為,MARC元數據與DC元數據之間轉換的目的是實現一條記錄可以以MARC元數據和DC元數據兩種格式來顯示以及數據的交換與共享。但是,如果用戶沒有這種需求或者兩者之間不轉換並不影響數據交換,則沒有必要進行轉換。也就是說,根據實際需要來決定是否需要MARC元數據與DC元數據之間相互轉換。MARC元數據與DC元數據之間的轉換會產生很多問題。由於MARC元數據的描述能力大大豐富於DC元數據,如何盡量解決兩者之間轉換所產生的歧義與不確定性以及信息丟失等難題。
2.3 元數據的編碼語言問題
元數據的編碼語言是指針對元數據元素和結構進行定義和描述的具體語法和語義規則。目前,各種元數據使用的編碼語言是不同的,包括標准通用標記語言(Standard General Markup Language,簡稱SGML)、超文本標記語言(Hypertext Markup Language,簡稱HTML)、可擴展標記語言(Extensible Markup Language,簡稱XML)三種形式。有些元數據明確規定使用何種標記語言,如TEI頭標、EAD和美國聯邦地理數據委員會《數字地理空間元數據內容標准》使用SGML。也有些元數據沒有規定使用何種編碼語言,如DC元數據,有使用HTML,也有使用XML的。從數據交換和共享的需要出發,元數據的作用是傳遞計算機系統可以理解的描述信息和存儲數據。計算機首先要理解元數據的各個元素或欄位序列化的方式,即按怎樣的順序和結構來組織各個元素及其內容。所使用的編碼語言不同,元數據編碼規則以及記錄格式也存在差異。這樣則不利於數據的交換和信息資源的共享。因此,從長遠利益來看,有必要對元數據的編碼語言進行統一。
3 對我國數字圖書館元數據方案設計的若干建議
3.1 推進元數據標准化進程,提高元數據的互操作能力
目前,國內出現了許多種元數據,例如,拓片元數據、建築元數據、古籍元數據、中文數字化全文文獻元數據等,由於每種元數據都是由不同圖書館研製而成的,並且針對不同類型的數字化信息資源。因此,就會出現DC系列元數據與MARC元數據並存的局面。這種局面有利於DC系列元數據與MARC元數據形成優勢互補,也可以使某些適合用DC系列元數據描述的特定類型信息資源被充分地揭示和利用。同時,這種局面也會帶來一些問題。目前,我國DC系列元數據至少有4種以上,那麼對DC系列元數據是否一體化;那些特定類型信息資源以前的機讀記錄該如何處理等。
筆者主張DC系列元數據一體化,反對各自為政。DC系列元數據都是在DC元數據的基礎上根據用戶的需求與信息資源特點進行了修正,所以這些元數據的核心或實質仍然是DC元數據。這一點可以作為DC系列元數據一體化的基礎,但是,這種一體化工作完成就需要各個研製單位之間的協調與合作,需要以國家標準的形式出現加以強制執行,從而結束元數據結構各自為政的局面。對於那些原由MARC元數據著錄的信息資源來說,MARC記錄已為受編信息資源提供了著錄內容詳盡,查全率高的機讀格式,在受編信息資源數字化的過程中沒有必要舍棄原有的元數據,而採用其它元數據方案。
3.2 選擇適用的編碼語言
在數字圖書館元數據方案設計中,編碼語言的選擇也是關鍵步驟之一。目前,在DC系列元數據中通常使用HTML、SGML或XML。有比較才有鑒別和選擇,我們不妨對這三種編碼語言的優劣進行分析比較。
XML是SGML語言的一個子集,同HTML一起成為SGML家族的主要成員。SGML是一種元語言,可以用來定義其它更專門的標記語言。HTML是由SGML定義出來的,專門使用在WWW上的標記語言。SGML是很好的資料存儲格式,適用於任何復雜的文件,但不便於網路傳輸,SGML非常復雜,不易學習掌握。XML與HTML不同,XML是SGML的一個簡化版本,實際上,XML也是一種元語言。與HTML不同的是,XML並沒有語義上的元素定義,也沒有預先定義好的一套標記系統。在實際應用中,可以根據需要定義自己的標記。XML是可擴展的
,具有較強的靈活性和適用能力,同時它很有可能在今後成為應用最為廣泛的標記語言。但是,目前,XML在網路上的應用不如HTML廣泛。由於HTML文檔本身的結構性不強,擴展能力差,描述內容的能力也較弱,因此不太可能成為今後數字圖書館元數據方案的主要編碼語言。筆者建議,數字圖書館元數據方案的編碼語言採用XML。
3.3 數字圖書館元數據方案的設計應面向專業編目人員
信息資源編目實際上是信息資源進行分析、判斷和組織的過程。組織過程包括分類、描述、歸並及格式化等過程;分析過程則包括區分、驗證、評估、比較、解釋及綜合過程。[2]總之,信息資源編目是一個復雜的、信息增值的過程。目前,困擾信息資源編目的主要問題是費用。一是時間的花費,二是金錢的花費。費用問題使得許多元數據方案的設計者希望所研製的元數據可以由非專業人員製作。毫無疑問,非專業人員製作元數據的費用低,然而這種低費用是以犧牲元數據的質量為代價的。筆者認為,對於數字圖書館的建設而言,元數據的總體質量是不容忽視的。如果沒有高質量的元數據,數字化信息資源的利用也就成為一句空話,甚至會像搜索引擎一樣,查准率很低。所以,建議數字圖書館元數據方案的設計應面向專業編目人員。只有專業編目人員利用編目規則及書目控制等手段,才能夠提供具有較高質量的元數據。
3.4 數字圖書館元數據方案的設計中應考慮到其它技術運用
在數字圖書館建設的過程中,必然要涉及到許多技術,其中包括資料庫技術、全文檢索技術、開放式網路詞表/分類技術、地理信息系統(GIS)等。在數字圖書館元數據方案的設計中,我們需要與這些技術進行銜接並加以應用。以聯合在線資源目錄(Cooperative Online Resource Catalog,簡稱CORC)為例加以說明。CORC是建立在網路環境下的為本地或網路電子資源創建書目元數據的系統,是一種為電子資源編目的資料庫和工具包。CORC利用了網上杜威分類法資料庫,實現了編目過程中DDC號碼和主題標目自動分配。同時,CORC資料庫的軟體平台採用Mantis,這是一種適用於任何元數據定義與界面的網路資源編目系統工具箱。Mantis用XML存儲記錄,使得記錄的輸出非常容易,且有MARC、DC HTML和DC RDF、XML多種格式可供選擇。CORC的成功在於其能夠充分利用各種技術。因此,我國在數字圖書館元數據方案的設計過程中,也需要考慮其它技術的運用。
【參考文獻】
[1]CC:DA Task Force on metadata and Cataloging Rules:Final Report,August 21,1998[EB/OL].[2001—03—05]. http://www.ala.org/alcts/organization/ccs/ccda.
[2]真溱.矛盾重重的元數據世界[J].中國圖書館學報,2001,(6):56—59
僅供參考,請自借鑒
希望對您有幫助
⑸ 華東理工大學圖書情報專碩考研專業分析
圖書情報 依託於管理學院的“圖情檔案”一級學科,旨在培養具備系統的圖書館學基礎理論知識和必備的相關學科知識,擁有熟練地運用現代化技術手段搜集、整理和開發利用文獻信息的能力、能在圖書情報機構、政府部門、金融機構、數據產品開發機構、出版發行機構和各類企事業單位的信息部門從事信息服務與管理工作的應用型、復合型專門人才。就業與發展:圖書情報機構、政府部門、金融機構、數據產品開發機構、出版發行機構和各類企事業單位的信息部門;研究生階段對口的研修學科為圖書館學學術型碩士、情報學學術型碩士、圖書情報專業碩士(MLIS);職業發展預期:成為信息機構的信息主管、圖書館與信息服務類機構的管理者。主幹學科: 管理學、 文獻學與傳播學、 計算機科學與技術。核心課程:按照“大類招生、分流培養”招生,前2學期開設相同課程,從第3學期開始開設專業特色課程。主要課程有:信息管理概論、文獻學、目錄學、圖書館學基礎、信息資源編目、信息組織、信息服務、信息系統分析與設計、圖書館管理、信息檢索、信息政策與法律、信息資源建設、數字圖書館導論、信息素養。實踐性教學環節:主要有信息資源編目、信息組織、信息檢索、信息系統分析與設計等課程中開設實驗課;實習實訓模塊,包括軍事訓練、專業調查、專業實訓和(來自:考研派之家公眾號)畢業實習;論文(設計)模塊,包括課程論文和畢業論文/畢業設計;課外科研創新實踐活動模塊,包括參加各類競賽、學術論文、文藝作品、科研訓練活動、發明創造、校園文化活動、職業資格和技能訓練、社會實踐等。
華東理工大學圖書情報專碩考研專業分析小編就總結到這里了,更多關於圖書情報專碩的備考技巧,備考干貨,新聞資訊,考試時間,考試報名入口,考試報名時間,成績查詢時間,成績查詢入口等內容小編會持續更新,祝願各位考生都能認真備考,順利通過考試。
⑹ 編目室是做什麼的
一般文獻采訪、編目室、樣本室是靠著的
若空間不夠或要求不高的話,可在書庫中隔離出一部分作為編目室
在現行規范JGJ38-1999《圖書館建築設計規范》的4.6.3條對采編用房做了如下規定
「4.6.3 采編用房應符合下列規定:
1、位置應與讀者活動區分開 與典藏室 書庫 書刊入口有便捷聯系;
2、平面布置應符合採購 交換 拆包 驗收 登記 分類 編目和加工等工藝流程的要求;
3、拆包間應鄰近工作人員入口或專設的書刊入口 進書量大者入口處應設卸貨平台;
4、每一工作人員的使用面積不宜小於10平方米;
5、應配置足夠的計算機網路 通信介面和電源插座。」
需要規范的話 可以傳給你 給你做參考
編目室崗位職責
編目室是圖書館基礎業務部門之一,其基本職能是組織藏書、揭示館藏,把無序的雜亂無章的文獻加工成可供檢索的、具有科學體系的文獻集合體。編目工作為適應現代化圖書館的需要,現正朝著文獻著錄標准化,編目工作規范化,編目技術自動化,聯機編目網路化方向發展。其具體崗位職責如下:�
一、負責進館圖書的驗收工作,仔細核對批次、書名、價格,保證新購圖書在種類、數量、價值上的正確無誤。�
二、認真做好圖書條形碼的保管、粘貼工作,保證圖書財產帳的清晰、完整和安全。�
三、在新書入庫的交接工作中,要認真履行交接簽名手續,驗書單與新書種類、冊數必須相符,有附件的需在交接單中註明,保證新書及時完整入庫。入庫前,圖書一律不得外借。如有特殊情況,需經館長批准後,由書庫人員辦妥臨時手續,並限期歸還。�
四、對入藏的圖書要嚴格按照《中國圖書館圖書分類法》(第四版)進行新到圖書的圖書分類工作,確保本館圖書分類號的規范、科學、標准。�
五、盡最大可能套錄全國統一圖書編目數據(北圖MARC數據),嚴格按照MARC著錄格式進行圖書數據輸入,做好本館分類號、索書號、館藏地點及其它相應數據的加註。保證本館資料庫與全國圖書館資料庫的協調統一。為確保數據的准確無誤,每一批書在加工過程中都要認真進行校對,發現問題立即糾正,未經復核,不得入庫。�
六、認真列印、編排、保管本館圖書的個別登記帳、總括登記帳和圖書分類目錄,保證館藏備查系統的正確完整。�
七、認真做好新書介紹工作,為讀者及時傳遞新書信息。�
八、認真保養和愛護圖書館電腦網路系統,對所有網路辦公設備要嚴格按照操作要求規范使用和管理。不得將與工作無關的光碟、軟盤以及各類軟體數據置於本操作系統工作用機內,嚴防病毒侵入,以免給該網路造成重大損失。�
九、負責圖書的統計工作,建立館際的圖書交換、贈閱與協調關系,認真做好圖書的注銷工作。�
十、搞好專業技術的學習,刻苦鑽研現代化網路管理知識,不斷提高專業技能,使圖書館工作朝著更加科學、規范的方向發展
⑺ 什麼是calis有關rda編目
RDA(Resource Description & Access, 資源描述與檢索)是為了滿足數字環境下資源著錄與檢索的新要求,成為信息資源描述與檢索的標准而編制的。可以參考編目精靈的博文詳細了解。http://catwizard.net/posts/tag/rda
⑻ 圖書館工作中的編目 標目和款目分別指什麼
《中國文獻編目規則》和《西文文獻著錄條例》之比較
楊小雲
(渭南師范學院 圖書館,陝西 渭南 714000)
文摘:《中國文獻編目規則》和《西文文獻著錄條例》都積極採用國際標准,在適用范
圍、對電子資源的著錄等方面都有一致性,但在著錄規則、標目形式、版本說明等又各不相同。
關鍵詞:編目規則 ;文獻著錄;中國文獻編目規則;西文文獻著錄條例
1. 《中國文獻編目規則》是我國編目人員進行中文編目的主要依據和重要工具。近10年來,隨著網路資源和電子文獻的迅速發展,信息載體、信息傳播方式、信息組織形式等都有較大變化,為了適應這種變化,由國家圖書館《中國文獻編目規則》修訂組歷時兩年半時間修訂的《中國文獻編目規則》第二版(以下簡稱《規則》)於2005年4月正式出版,它與1996年出版的《中國文獻編目規則》第一版相比,新版在內容、章節、結構上作了大量調整、修改,更加客觀、更加規范,也更加貼近編目工作的實際需要。1985年8月,中國圖書館學會本著等效採用ISBDS和「基本採用、個別改動」AACR2的精神,結合中國西文文獻編目工作的實際需要制定了《西文文獻著錄條例》,「試圖既能滿足手工記錄的需要,又能照顧到自動化的發展」。它在規范西文文獻著錄方面發揮了極其重要的作用,使中國西文文獻的著錄與國際接軌,為共享西文文獻書目數據奠定了基礎。2003年,科學技術文獻出版社出版了《西文文獻著錄條例》第二版,中國的編目規則日趨完善。
2. 《中國文獻編目規則》和《西文文獻著錄條例》的相同點:
《中國文獻編目規則》和《西文文獻著錄條例》盡管修訂的時間和機構不同,但卻不約而同地遵循了以下修訂原則:
2.1堅持與國際接軌,積極採用國際標准。
修訂版《中國文獻編目規則》和《西文文獻著錄條例》堅持與國際接軌,積極採用國際標准,《規則》的前言說,「修訂要堅持與國際接軌,依據ISBD、GB3792.1最新版、AACR2R/2002年版等」。以ISBD最新版與GB3792.1最新版等為依據,既體現編目原則,又不機械照搬。《西文文獻著錄條例》由中國圖書館學會組織的修訂組進行修訂工作,2002年4月完成了「徵求意見稿」。修訂稿的內容完全遵照ISBD和AACR 2 1998 Rev.和AACR2R-93的原則,為適合於我國西文文獻編目、著錄人員的使用,除對國際標准條文作了一些必要的說明外,還對我國個人和團體著者的著錄規定作了詳細闡述;對原有的「附錄」進行了增補和擴充。《西文文獻著錄條例》基本上可以滿足當前從事西文文獻編目、著錄工作人員的要求,可以說,它的編輯、出版標志著我國圖書館西文文獻編目、著錄工作方法的第三個階段。
2.2適用范圍的廣泛性。
《中國文獻編目規則》和《西文文獻著錄條例》的適用范圍具有廣泛性。從文獻類型角度分析,《西文文獻著錄條例》適用於普通圖書、連續出版物、電子資源、非書資料、測繪制圖資料、樂譜;《中國文獻編目規則》的適用范圍不僅包括前者的適用范圍,而且將非書資料拓展為音像資料、縮微文獻、手稿、古籍等。《西文文獻著錄條例》中「連續性資源」 是AACR2-2002修訂的重點,AACR2-2002採用新名稱「連續性資源」取代了「連續出版物」, 其適用文獻的范圍也擴大到「連續出版物」和「集成性資源」。
2.3對電子資源的著錄。
《中國文獻編目規則》和《西文文獻著錄條例》考慮到網路環境下電子資源的特點,而者都專門設章闡述電子資源的著錄。修訂時既堅持整個編目規則體系的一致性,又考慮了各種文獻的特殊性。《西文文獻著錄條例》吸納了AACR2-2002最新修訂的內容。採用新名稱「電子資源」取代了「計算機文件」,並修訂了「連續性資源」和「電子資源」的具體著錄規則。
2.4 二者在編目規則上趨於一致。
由於中文文獻的自身特點和用戶查找文獻的習慣的不同,《中國文獻編目規則》作了一些個性化的規定。修訂後的《西文文獻著錄條例》本土化特色突現。對中國人名、中國團體和中國地名的標目形式作了比較明確的規定。一方面使條例完全適用於我國編目工作的實際情況,可謂是「中國特色」。另一方面,也是國內首次為本國專用名稱的西文標目問題作出了具體規定,完全可供西方國家在編制條例或編目實踐中參考借鑒,為中國專用名稱國際標准化鋪平了道路。
3. 《中國文獻編目規則》和《西文文獻著錄條例》的差異
3.1著錄款目上的差異:《中國文獻編目規則》取消了主要款目和附加款目,與此同時,增加了通用款目,確立了交替標目在款目和圖書館目錄中的地位。《西文文獻著錄條例》則保留了主要款目。
3. 2著錄規則上的差異
《中國文獻編目規則》中明確規定:對於中國古代著者,規定信息源載有古代責任者的所處朝代(1912年以前)簡稱,著錄於姓名前圓括弧內。
例如:三國演義/(明)羅貫中著
紅樓夢/(清)曹雪芹,(清)高鶚著
《中國文獻編目規則》中明確規定:對於僧人責任者的法名原樣照錄,法名前原題冠「釋」字,著錄於圓括弧內。
例如:弘一大師文集/(釋)弘一大師著
少林文水詩選/(釋)海燈著
對於外國著者,《中國文獻編目規則》規定:規定信息源載有外國責任者國別時,將國別簡稱著錄於姓名前圓括弧內,若同時載有漢譯姓名和姓名原文,姓名原文著錄於漢譯姓名後圓括弧內。
例如: 編目工作/(英)E.T.亨特(Eric J.Hunter),K.G .B .貝克韋爾( K.G .B .Bakewell),編著;
林毅[等]譯
《西文文獻著錄條例》要求個人著者按照規定信息源如實照錄,在題名責任說明項內不著錄個人著者的朝代、國別或者在僧人的法名前冠「釋」字。
3.3標目形式的差異
3.3.1個人名稱標目的不同。
《中國文獻編目規則》規定:「個人名稱標目由標目主要成分及附加成分組成」。不同類型的個人名稱,其個人名稱標目的主要成分有別。例如:普通漢語個人名稱標目的主要成分包括姓名、筆名、字、號等。普通古代人物名稱標目的主要成分包括姓名、字、號等,普通外國人中譯名稱標目的主要成分包括中譯姓氏、中譯姓名等。
個人名稱標目的附加成分,用於修飾和區分標目主要成分,包括生卒年、朝代、國別、民族、性別、學科、職業、稱號籍貫、外國人姓名原文等。個人名稱標目的附加成分,應在之前和之後各置一組圓括弧內,各附加成分之間應隔一空格位。
例如:魯迅(1881.9.25—1936.10.19)
(唐)李白(701-762)
(美)愛因斯坦(Einstein,Albert1879.3-1955.4)
《西文文獻著錄條例》規定:「個人名稱由主體部分和附加部分共同構成。」 主體部分一般為姓名,附加部分則包括貴族頭銜、皇室、教皇、姓氏、年代等。該條例還規定「按普通話讀音用漢語拼音方式轉寫,並在姓與名之間用逗號、空格(,)分隔,雙字名拼音連寫。」
例如: Lu,Xun(魯迅),1881—1936
Zhang,Xuecheng(章學誠),1738—1801
Kangxi(康熙),Emperor of China,1654—1722
3.3.2機關團體標目形式的不同
在中文文獻標目,機關團體標目無主標目與副標目之分。而《西文文獻著錄條例》則明確規定「從屬團體名稱不具有獨立識別性,則應作為上級團體的從屬標目(亦稱副標目)」
3.3.3版本說明上的不同
《中國文獻編目規則》版本說明通常以序數詞與「版」字相結合的術語或以區別其他版本的術語形式出現,數字一律用阿拉伯數字著錄,省略「第」字,著錄為「X版」,初版或第一版不予著錄。
但是有一個例6:中國圖書館分類法(第四版)/ 中國圖書館分類法編輯委員會編(版權頁題:第1版第1次印刷)
例6將題名頁中的「第四版」視為題名的一部分,不符合用戶的認識與習慣。在題名頁中標注版本說明的中文文獻,在目前有增多的趨勢,所以對此實例的質疑有普遍意義。《西文文獻著錄條例》將版本概念按不同文獻類型分別描述的做法是很好的。
當前,機讀目錄格式正被各類型圖書館所普遍使用,網路化環境的形成使得編目數據的共享成為現實。數據共享是資源共享的必要前提,而建立標准化的機讀目錄和高質量的書目數據是資源共享的重要基礎。對此, 《中國文獻編目規則》和《西文文獻著錄條例》應完善原有的條文、補充尚未明確的項目,同時根據計算機編目對文獻特徵揭示得更為細致的要求進行更嚴密詳盡的修訂。使二者更具有實用性、可操作性強的特點,從而指導編目實踐,讓編目工作每個具體環節都能有據可循。
參考文獻:
1. 富平.繼承與變革:談《中國文獻編目規則》的修訂[J].國家圖書館學刊,2005.2
2.國家圖書館《中國文獻編目規則》修訂組.中國文獻編目規則[M].第二版。北京:北京圖書館出版社,2005
3林明.《西文文獻著錄條例》(修訂擴大版)的若干新特點[J].大學圖書館學報2004.4P73-75
4 方威明.《西文文獻著錄條例(修訂擴大版)》之變化[J].國家圖書館學刊2004.2P56-57
5段明蓮.中國文獻編目規則的現狀與發展趨勢[J].中國圖書館學報,2006.3P83-86
作者簡介:楊小雲(1968—),女,陝西韓城人,畢業於西北大學圖書館系圖書館學專業。現任渭南師范學院圖書館館員,已發表論文數篇。
聯系電話:13369135933
E-mail:[email protected]
[email protected]
⑼ 名詞解釋 信息資源
信息資源是指人類社會信息活動中積累起來的以信息為核心的各類信息活動要素(信息技術、設備、設施、信息生產者等)的集合。