地理信息元數據標准
A. 什麼是元數據
元數據的英文名稱是「Metadata",它是「關於數據的數據」在地理空間信息中用於描述地理數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵,它是實現地理空間信息共享的核心標准之一。目前,國際上對空間元數據標准內容進行研究的組織主要有三個,分別是歐洲標准化委員會(CEN/TC287)、美國聯邦地理數據委員會(FGDC)和國際標准化組織地理信息/地球信息技術委員會(ISO/TC211)。空間元數據標准內容分兩個層次。第一層是目錄信息,主要用於對數據集信息進行宏觀描述,它適合在數字地球的國家級空間信息交換中心或區域以及全球范圍內管理和查詢空間信息時使用。第二層是詳細信息,用來詳細或全面描述地理空間信息的空間元數據標准內容,是數據集生產者在提供空間數據集時必須要提供的信息。
元數據主要有下列幾個方面的作用:
(1)用來組織和管理空間信息,並挖掘空間信息資源,這正是數字地球的特點和優點所在。通過它可以在廣域網或網際網路上准確地識別、定位和訪問空間信息。
(2)幫助數據使用者查詢所需空間信息。比如,它可以按照不同的地理區間、指定的語言以及具體的時間段來查找空間信息資源。
(3)組織和維護一個機構對數據的投資。
(4)用來建立空間信息的數據目錄和數據交換中心。通過數據目錄和數據交換中心等提供的空間元數據內容,用戶可以共享空間信息、維護數據結果,以及對它們進行優化等。
(5)提供數據轉換方面的信息。使用戶在獲取空間信息的同時便可以得到空間元數據信息。通過空間元數據,人們可以接受並理解空間信息,與自己的空間信息集成在一起,進行不同方面的科學分析和決策。描述空間信息的元數據標准體系內容按照部分、復合元素和數據元素來組織,它們是依次包含關系,前者包含後者,即:後者依次組成前者。具體分為8個基本內容部分和4個引用部分,由12個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、實體和屬性信息、發行信息以及空間元數據參考信息等內容,另外還有4個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。元數據標准內容體系是通過元數據網路管理系統來實現的,該系統主要由許可權驗證功能(伺服器端驗證)、輸入和合法性校驗功能(客戶端校驗)、查詢功能(伺服器端查詢)與返回和顯示功能(伺服器端格式化查詢結果並返回,客戶端顯示)等組成。利用空間元數據網路管理系統作為空間交換站的共享軟體可基本上實現空間信息的網路共享。
B. 元數據相關標准有那些呢
生態科學數據元數據
林業信息元數據
月球信息元數據
地理信息 元數據
數字音樂元數據
氣象數據集核心元數據
有很多很多,融融網就有,搜索下,希望可以幫助你。
C. 地質資料核心元數據標准研究初探
吳小平
(全國地質資料館)
摘 要 本文結合地質資料數據的特點,在國內外相關元數據標准研究的基礎上,研究定義一個對地質資料數據資源最通用屬性描述的核心元素集合,實現對地質資料數據資源信息基本情況的描述;以加強對地質資料數據的有效描述、組織、揭示、表達、管理,促進地質資料數據資源的利用、共享、交換和整合,提高地質資料數據管理現代化水平和地質資料數據公共服務能力。
關鍵詞 地質資料 核心元數據 標准研究
1 引言
1.1 背景
隨著經濟社會的發展,地質工作在長期的實踐發展中,積累了大量的地質資料數據,形成了大量不同資源類型、遍及地質各個學科的專業數據集,涉及區域地質、礦產地質、水文—工程—環境地質、農業地質、海洋地質、基礎地質、地球化學、地球物理、遙感、地學科研等領域。數據量大,數據類型豐富,系統異構,數據格式多樣化,是當前地質資料數據的重要特徵。
應用的不斷深入,社會需求不斷增加,越來越多的研究需要基礎數據支撐。地質資料數據的多學科、多標准、多類型、多尺度、海量性等特點,在一定程度上阻礙了其深入利用與共享。如何有效地描述、組織、揭示、表達、管理這些數據,以促進地質資料數據資源的利用、共享、交換和整合,提高數據共享水平,是提高地質資料數據管理現代化水平和提升地質資料數據社會化服務能力的基礎。
為解決這個問題,前人開展了卓有成效的研究工作,提出利用元數據的標准化來統一管理分散的數據資源,並通過 Web 實現數據共享與服務[1-9]。元數據具有描述、揭示、組織、管理、控制、保存、互操作等功能[9-11]。元數據標准和技術是實現數據標准化、數據共享、數據交換和互操作等的重要手段。利用元數據標准提高對數據的描述與表達深度,實現對數據資源內涵的描述、發現、處理、評價,提高數據管理效率和用戶檢索數據的查詢效率;通過元數據標准化來逐步解決數據資源間的語義獨立和異構問題,最大程度地實現數據互操作,為實現數據資源的整合與交換奠定基礎;通過建立相關的元數據記錄,建立與數據資源管理相關的維護、保存等信息,加強對數據管理過程的控制,對進一步管好用好地質資料數據具有重要作用。
1.2 現狀
目前,在地質資料管理與服務工作中,已形成《地質資料檔案著錄細則》、《成果地質資料管理技術要求》、《成果地質資料目錄資料庫著錄表和著錄要求》,以及相應的軟體系統等一套地質資料目錄標准規范,用以規范地質資料數據成果的建設、管理和服務。目前,各級地質資料館藏機構均已建成地質資料目錄資料庫,並初步實現館際目錄間基本數據信息的交換,在地質資料數據的管理、共享、服務中發揮了重要作用。
地質資料目錄資料庫是對地質資料檔案基本信息的描述與組織,是地質資料元數據體系中重要的組成部分,為地質資料數據的持續發展和進一步構建地質資料數據的豐富應用奠定了堅實的基礎。
2 相關元數據標准基本情況
2.1 DC(DUBLIN CORE)都柏林核心元素集
DUBLIN CORE 元數據格式由美國 OCLC 公司發起,國際性合作項目 Dublin Core Metadata Initiative設計,由參與合作項目的機構共同維護修改,適用於網路資源描述,目前最新版本為 version 1.1,1999 年7 月 2 日發布執行。
DC 元數據作為網路時代一種新型的信息資源通用描述工具,正在為越來越多不同專業領域以及不同語種、不同文化背景的國家和地區所接受。DC 元數據標准,主要是指 DC 元數據元素、元素定義和注釋等內容及由這些內容構成的規范化或標准化文本。
DC 最初應用目的是為了網路資源的著錄與挖掘,由於 DC 元素簡單易用,加之 OCLC 的大力推廣和網路資源著錄的巨大需求,DC 很快適用於任何媒體。簡單的元素定義和設置可以很方便地著錄,是 DC獲得廣泛應用的重要原因;然而它也帶來另外一個問題,對著錄對象的描述深度不夠,不能進行專指度較高的檢索[12]。2010 年,DC 元數據的中文版正式發布,《信息與文獻 都柏林核心元數據元素集》(GB/T 25100-2010
名稱(Name):元素名稱;
標識(Identifier):元素唯一標識;
版本(Version):產生該元素的元數據版本;
注冊機構(RegistrationAuthority):注冊元素的授權機構;
語言(Language):元素說明語言;
定義(Definition):對元素概念與內涵的說明;
選項(Obligation):說明元素是限定必須使用的還是可選擇的;
數據類型(Datatype):元素值中所表現的數據類型;
最大使用頻率(Maximum Occurrence):元素的最大使用頻次,即是否可重復使用;
注釋(Comment):元素應用注釋。
DC 元素依據其所描述內容的類別和范圍可分為三組(表 1):①對資源內容的描述;②對知識產權的描述;③對外部屬性的描述(instantiation)。
表 1 DC 元數據元素列表
2.2 數字地理空間元數據內容標准
數字地理空間元數據內容標准(Content Standard for Digital Geospatial Metadata)由美國聯邦地球空間數據委員會組織編寫並發布[4,9,11,14]。該標准 1992 年 7 月開始起草,幾經修改,1994 年 7 月 8 日,FGDC 正式確認該標准為美國國家地球空間數據元數據標准,並於 1997 年 4 月發布其修訂版(FGDC1994,FGDC 1997)。
FGDC 數字地理元數據內容標準的目的,是確定一個描述數字地理空間數據的術語及其定義集合,包括滿足這些目的的數據元素、復合元素(一組數據元素)以及它們的定義和域值,描述數字地理空間數據集的元數據信息內容。
FGDC 是按照段(section)、復合元素(compound element)、數據元素(data element)來組織的,包括 7 個主要子集和 3 個輔助子集(見表 2),共有 460 個元數據實體(含復合元素)和元素。FGDC 規定了三種性質的子集、復合元素和元素。這三種性質是:必需的,即必須提供的信息;一定條件下必需的,即如果正在建立的元數據包含某子集、某個實體,或某個元素說明的特徵,則必需提供的信息;可選的,即該信息是可選的,由用戶決定是否將其包含在元數據文件中。FGDC 元數據標准沒有規定語法格式或編碼規則,因此同 DC 一樣,只是一個內容標准。
表 2 FGDC 元素列表
2.3 ISO TC211 元數據標准
ISO TC211 元數據標准由國際標准化組織(The International Organization for Standardization)第三工作組組織研究,項目編號為 15046-15。1996 年 2 月 9 日通過 1.0 版草案,後幾經修改,於 1997 年 1 月20 日發布 210 版標准(ISO TC211,1997)[4]。TC211 元數據內容項分為三種類型:必須型(M),指必須給出的內容(M 是 Mandatory 的縮寫);條件型(C),指在一定條件下需要給出的內容(C 表示 Conditional);可選型(O),指可有可無的內容(O 表示 Optional)。元數據內容採用逐項逐行方式表達;標准中給出了元數據製作、管理等規范。
TC211 元數據標准中把元數據的內容分為 7 類,每一類中又包括若乾子類或具體元數據項,主要包括元數據內容、標識信息內容、數據質量信息內容、空間數據表達信息內容、空間參考信息內容、特徵與屬性信息內容、數據傳播信息內容、數據參考信息內容等方面。
3 地質資料核心元數據
3.1 概念
「核心元數據規范」擬定義一個對地質資料數據資源最通用屬性描述的數據元素集合,實現對數據信息基本情況的描述。
3.2 目的
地質資料核心元數據標准(Geology Data Core Metadata,GDCM)擬通過建立一套用以描述各種地質資料數據集的元素集合,為地質資料數據資源提供一套通用的描述元素及規范,供管理者和用戶在通用領域應用中描述具有相同特徵或屬性的數據集,為地質資料數據資源的檢索、整合、交換、服務和共享提供支持。
3.3 范圍
地質資料數據核心元數據是關於地質資料數據資源的基本描述信息,是由數據資源的共同特點確定的元數據集合。
3.4 原則
3.4.1 用戶需求原則
核心元數據作為地質資料數據的一組基礎性、通用性描述數據,在設計與選擇核心元素時必須充分考慮用戶的需求,以深入地揭示信息資源的內涵。在結構與格式的設計、元素的增加與取捨、語義規則的制定等方面,要盡可能地從用戶的角度出發,增加系統與用戶間的交互渠道(如開放式的詞表系統的使用、增加提供用戶反饋的元素等),為用戶提供多層次的檢索體系[9]。
3.4.2 簡單性與適用性原則
簡單性與適用性原則要求元數據方案在應用時簡單易於理解,便於計算機著錄,有利於實現互操作;同時需兼顧適用性,選取最能表達需求的元數據集合,以解決元素過少產生的不準確性,提高檢索的精度,做到繁簡適當。
3.4.3 互操作與易轉換性原則
互操作性是不同數據格式以及異構系統間實現數據交換的重要原則。元數據方案的設計,要充分考慮數據間的互操作性,通過建立映射、數據交換機制、語義共享等實現互操作性,實現不同系統間、不同數據格式間的數據交換。
3.4.4 專指性與通用性原則
專指性與通用性原則要求元數據方案的設計應統籌考慮各類資源的應用特性,協調好資源應用深度與應用廣度。
3.4.5 可擴展性與可持續性原則
可擴展性是指數據方案的生命。隨著數字資源內容不斷豐富、應用不斷深入、需求不斷增加,元數據方案必須能夠適應資源應用、需求的變化,將一些特殊的應用加入,以適應不斷變化的需求。一些具體應用可能會要求更為細致精確的描述,應允許使用者在不破壞已規定的標准內容(如元素的語義定義)的條件下,擴充一些元素、子元素或屬性值[9]。可持續性原則是指要充分考慮與現有標准規范的銜接,充分利用現有標準的成果,保證元數據方案的可持續發展。
4 地質資料數據核心元數據元素定義
4.1 基本定義
定義元數據(Metadata)、核心元數據(Core Metadata)和數據集(Dataset)三個基本術語。元數據是關於數據的數據;核心元數據是指能夠描述地質資料數據的一組通用的描述元素及相應的規范;數據集是由相關數據對象組成的一個可標識的數據集合體。將被描述的地質資料數據作為一個群組,一個群組可以看做一個數據集。一個數據集可能是一個較小的數據集合,在物理上或邏輯上位於一個較大的數據集之內;反之,一個數據集也可能由若干數據集組成,是這些子數據集的父數據集。如根據地質資料數據文件的組織方式,一個數據集可以是正文、附件、附圖、附表、附件、其他類等的集合。在本研究中,數據集是元數據的描述對象,以成果地質資料電子文件的分類組織數據集。
借鑒 ISO/IEC 11179-3 標准,本研究定義元素的屬性基本上採用與 Dublin Core 一致的方法,按以下九個方面對元素進行定義:
1)中文名稱(Chinese Name):元素中文名稱;
2)英文名稱(English Name):元素英文名稱;
3)標識(Identifier):元素唯一標識;
4)定義(Definition):對元素概念與內涵的說明;
5)類型(Data Type):元素值中的數據類型;
6)約束(Constraint)指明元素是否是限定必須使用還是可選擇的(必備性);
7)出現次數(Maximum Occurrence)元素是否可重復以及可重復的次數;
8)值域(Value Domain):元數據元素的取值范圍;
9)注釋(Comment):對元素的補充說明、著錄格式的建議及其它。
4.2 核心元素內容
本研究參考都柏林核心元數據計劃(The Dublin Core Metadata Initiative,DCMI)發布的《都柏林核心元數據元素集》(V1.1 版)和《信息與文獻都柏林核心元數據元素集》(GB/T 25100-2010
表 3 地質資料數據核心元數據(GDCM)標准核心元素(擬)
5 結論及思考
核心元數據作為描述地質資料數據的一部分,需進一步加強研究,逐步規范完善。由於地質資料數據涉及范圍廣,格式、類型多樣,需要制定系列元數據標准來系統描述數據資源,並建立多個不同元數據標准間的語義共享與映射,提高對數據的描述深度與層級,優化數據組織方式與結構,不斷提高地質資料數據管理、服務與共享水平。
參 考 文 獻
[1] 國家地理空間信息協調委員會辦公室 . 自然資源和地理空間信息整合與共享研究 [M]. 北京:科學出版社,2007.
[2] 徐冠華 . 實施科學數據共享,增強科技競爭力 [J]. 中國基礎科學,2003(1):5 ~ 9.
[3] 孫樞 . 地球數據是地球科學創新的重要源泉—從地球科學談科學數據共享 [J]. 中國基礎科學,2003(1):19 ~ 23.
[4] 李軍,周成虎 . 地球空間數據元數據標准初探 [J]. 地理科學進展,1998,17(4):55 ~ 63.
[5] 張立,龔健雅 . 地理空間元數據管理的研究與實現 [J]. 武漢測繪科技大學學報,2000,25(5):127 ~ 131.
[6] 沈體雁,程承旗 . 地理元數據技術系統的設計與實現 [J]. 武漢測繪科技大學學報,1999,24(4):34 ~ 37.
[7] 王卷樂,游松財,謝傳節 . 地學數據共享中的元數據標准結構分析與設計 [J]. 地理與地理信息科學,2005,21(1):16 ~ 18.
[8] 劉緯等 .2010. 數字圖書館的語義描述與服務升級 [M]. 北京:國家圖書館出版社 .
[9] 肖瓏等,中文元數據標准框架及其應用 [J] 數字圖書館論壇,2011,5:29 ~ 35.
[10]http://cdls.nstl.gov.cn/,數字圖書館標准與規范建設—基本元數據標准規范,2005—12.
[11] 馮項雲,肖瓏,廖三三等 . 國外常用元數據標准比較研究 [J]. 數字圖書館論壇,2011,4:15 ~ 21.
[12] 中文文獻元數據標准研究項目組系列報告之一 國外元數據標准比較研究報告,北京大學圖書館中文元數據標准研究項目組(2000 年12 月).
[13] 信息與文獻 都柏林核心元數據元素集,GB/T 25100-2010(ISO 15836:2009,MOD),2010-09-02.
[14] 薛明 . 美國聯邦地理數據委員會的標准參考模型 [J]. 測繪標准化,總第 62 期第 20 卷 .
[15]http://www.cdi.cn/CMS/searcher/. 中文元數據方案 . 國家圖書館,2002.03.
[16]http://blincore.org/documents/2006/12/18/dcmi-terms/,DCMI 元數據術語,2006-12-18.
[17]http://blincore.org/documents/2000/07/11/dcmes-qualifiers/ 都柏林核心修飾詞,2000-07-11.
[18]http://blincore.org/groups/collections/collection-application-profile/,都柏林核心資源集合描述應用綱要,2006-08-24.
[19]http://blincore.org/documents/2004/09/10/library-application-profile/,都柏林核心圖書館應用綱要,2004-09-10.
[20]http://www.sdb.ac.cn,中國科學院科學資料庫核心元數據標准(1.1),2003-08.
[21] 地質資料檔案著錄細則 . 中華人民共和國檔案行業標准:DA/T 23—2000.
[22] 成果地質調查資料著錄表及著錄要求 . 中國地質調查局發展研究中心,2004-11-11.
D. 簡述地理信息系統中元數據的內容有哪些
元數據是描述數據的數據,因為要描述的數據不同,元數據也不同,這個必須要結合它描述的數據來談
E. 什麼是元數據(指數據中心建設而言)舉個例子說明一下。
元數據的英文名稱是「Metadata",它是「關於數據的數據」在地理空間信息中用於描述地理數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵,它是實現地理空間信息共享的核心標准之一。目前,國際上對空間元數據標准內容進行研究的組織主要有三個,分別是歐洲標准化委員會(CEN/TC287)、美國聯邦地理數據委員會(FGDC)和國際標准化組織地理信息/地球信息技術委員會(ISO/TC211)。空間元數據標准內容分兩個層次。第一層是目錄信息,主要用於對數據集信息進行宏觀描述,它適合在數字地球的國家級空間信息交換中心或區域以及全球范圍內管理和查詢空間信息時使用。第二層是詳細信息,用來詳細或全面描述地理空間信息的空間元數據標准內容,是數據集生產者在提供空間數據集時必須要提供的信息。
元數據主要有下列幾個方面的作用:
(1)用來組織和管理空間信息,並挖掘空間信息資源,這正是數字地球的特點和優點所在。通過它可以在廣域網或網際網路上准確地識別、定位和訪問空間信息。
(2)幫助數據使用者查詢所需空間信息。比如,它可以按照不同的地理區間、指定的語言以及具體的時間段來查找空間信息資源。
(3)組織和維護一個機構對數據的投資。
(4)用來建立空間信息的數據目錄和數據交換中心。通過數據目錄和數據交換中心等提供的空間元數據內容,用戶可以共享空間信息、維護數據結果,以及對它們進行優化等。
(5)提供數據轉換方面的信息。使用戶在獲取空間信息的同時便可以得到空間元數據信息。通過空間元數據,人們可以接受並理解空間信息,與自己的空間信息集成在一起,進行不同方面的科學分析和決策。描述空間信息的元數據標准體系內容按照部分、復合元素和數據元素來組織,它們是依次包含關系,前者包含後者,即:後者依次組成前者。具體分為8個基本內容部分和4個引用部分,由12個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、實體和屬性信息、發行信息以及空間元數據參考信息等內容,另外還有4個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。元數據標准內容體系是通過元數據網路管理系統來實現的,該系統主要由許可權驗證功能(伺服器端驗證)、輸入和合法性校驗功能(客戶端校驗)、查詢功能(伺服器端查詢)與返回和顯示功能(伺服器端格式化查詢結果並返回,客戶端顯示)等組成。利用空間元數據網路管理系統作為空間交換站的共享軟體可基本上實現空間信息的網路共享。
F. 元數據的標准
1、數字圖書館資源組織框架
2. 元數據開發應用框架
元數據的基本意義 Metadata(元數據)是「關於數據的數據」;
元數據為各種形態的數字化信息單元和資源集合提供規范、普遍的描述方法和檢索工具;
元數據為分布的、由多種數字化資源有機構成的信息體系(如數字圖書館)提供整合的工具與紐帶。
離開元數據的數字圖書館將是一盤散沙,將無法提供有效的檢索和處理。
3. 元數據應用環境
3.1 Metadata的應用目的
(1)確認和檢索(Discovery andentification),主要致力於如何幫助人們檢索和確認所需要的資源,數據元素往往限於作者、標題、主題、位置等簡單信息,Dublin Core是其典型代表。
(2)著錄描述(Cataloging),用於對數據單元進行詳細、全面的著錄描述,數據元素囊括內容、載體、位置與獲取方式、製作與利用方法、甚至相關數據單元方面等,數據元素數量往往較多,MARC、GILS和FGDC/CSDGM是這類Metadata的典型代表。
(3)資源管理(Resource Administration),支持資源的存儲和使用管理,數據元素除比較全面的著錄描述信息外,還往往包括權利管理(Rights/Privacy Management)、電子簽名(Digital Signature)、資源評鑒(Seal of Approval/Rating)、使用管理(Access Management)、支付審計(Payment and Accounting)等方面的信息。
(4)資源保護與長期保存(Preservation and Archiving),支持對資源進行長期保存,數據元素除對資源進行描述和確認外,往往包括詳細的格式信息、製作信息、保護條件、轉換方式(Migration Methods)、保存責任等內容。
3.2 Metadata在不同領域的應用 根據不同領域的數據特點和應用需要,90年代以來,許多Metadata格式在各個不同領域出現
例如:
網路資源:Dublin Core、IAFA Template、CDF、Web Collections
文獻資料:MARC(with 856 Field),Dublic Core
人文科學:TEI Header
社會科學數據集:ICPSR SGML Codebook
博物館與藝術作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空間信息:FGDC/CSDGM
數字圖像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
檔案庫與資源集合:EAD
技術報告:RFC 1807
連續圖像:MPEG-7
3.3 Metadata格式的應用程度
不同領域的Metadata處於不同的標准化階段:
在網路資源描述方面,Dublin Core經過多年國際性努力,已經成為一個廣為接受和應用的事實標准;
在政府信息方面,由於美國政府大力推動和有關法律、標準的實行,GILS已經成為政府信息描述標准,並在世界若干國家得到相當程度的應用,與此類似的還有地理空間信息處理的FGDC/CSDGM;
但在某些領域,由於技術的迅速發展變化,仍然存在多個方案競爭,典型的是數字圖像的Metadata,提出的許多標准都處於實驗和完善的階段。
3.4 Metadata格式「標准化」程度問題
Metadata開發應用經驗表明,很難有一個統一的Metadata格式來滿足所有領域的數據描述需要;即使在同一個領域,也可能為了不同目的而需要不同的但可相互轉換的Metadata格式。
同時,統一的集中計劃式的Metadata格式標准也不適合Internet環境,不利於充分利用市場機制和各方面力量。
但在同一領域,應爭取「標准化」,在不同領域,應妥善解決不同格式的互操作問題。
4. 元數據結構
4.1 總體結構定義方式 一個Metadata格式由多層次的結構予以定義:
(1)內容結構(Content Structure),對該Metadata的構成元素及其定義標准進行描述。
(2)句法結構(Syntax Structure),定義Metadata結構以及如何描述這種結構。
(3)語義結構(Semantic Structure),定義Metadata元素的具體描述方法。
4.2 內容結構
內容結構定義Metadata的構成元素,可包括: 描述性元素、技術性元素、管理性元素、結構性元素(例如與編碼語言、Namespace、數據單元等的鏈接)。
這些數據元素很可能依據一定標准來選取,因此元數據內容結構中需要對此進行說明,例如MARC記錄所依據的ISBD,EAD所參照的ISAD(G),ICPSR所依據的ICPSR Data Preparation Manual。
4.3 句法結構
句法結構定義格式結構及其描述方式,例如元素的分區分段組織、元素選取使用規則、元素描述方法(例如Dublin Core採用ISO/IEC 11179標准)、元素結構描述方法(例如MARC記錄結構、SGML結構、XML結構)、結構語句描述語言(例如EBNF Notation)等。
有時,句法結構需要指出元數據是否與所描述的數據對象捆綁在一起、或作為單獨數據存在但以一定形式與數據對象鏈接,還可能描述與定義標准、DTD結構和Namespace等的鏈接方式。
4.4 語義結構 語義結構定義元素的具體描述方法,例如 描述元素時所採用的標准、最佳實踐(Best Practices)或自定義的描述要求(Instructions)。
有些元數據格式本身定義了語義結構,而另外一些則由具體採用單位規定語義結構,例如Dublin Core建議日期元素採用ISO 8601、資源類型採用Dublin Core Types、數據格式可採用MIME、識別號採用URL或DOI或ISBN;
又如OhioLink在使用VRA Core時要求主題元素使用A&AT、TGM和TGN,人名元素用ULAN。
5. 元數據編碼語言與製作方式
5.1 元數據編碼語言
元數據編碼語言(Metadata Encoding Languages)指對元數據元素和結構進行定義和描述的具體語法和語義規則,常稱為定義描述語言(DDL)。
在元數據發展初期人們常使用自定義的記錄語言(例如MARC)或資料庫記錄結構(如ROADS等),但隨著元數據格式的增多和互操作的要求,人們開始採用一些標准化的DDL來描述元數據,例如SGML和XML,其中以XML最有潛力。
5.2 元數據製作方式
(1)專門編制模塊(例如對MARC、GILS、FGDC等)
(2)數據處理時自動編制(例如對Dublin Core等)
(3)數據物理處理時自動編制(例如數字圖像掃描時的某些元數據參數)
(4)共享元數據(例如OCLC/CORC、IMESH
6. 元數據互操作性
6.1 元數據互操作性問題
由於不同的領域(甚至同一領域)往往存在多個元數據格式,當在用不同元數據格式描述的資源體系之間進行檢索、資源描述和資源利用時,就存在元數據的互操作性問題(Interoperability):
多個不同元數據格式的釋讀、轉換和由多個元數據格式描述的數字化信息資源體系之間的透明檢索。
6.2 元數據格式映射
利用特定轉換程序對不同元數據元格式進行轉換,稱為元數據映射(Metadata Mapping/Crosswalking)。
已有大量的轉換程序存在,供若幹流行元數據格式之間的轉化,例如
Dublin Core與USMARC; Dublin Core與EAD
Dublin Core與GILS;GILS與MARC TEI
Header與MARC FGDC與MARC
也可利用一種中介格式對同一格式框架下的多種元數據格式進行轉換,例如UNIverse項目利用GRS格式進行各種MARC格式和其它記錄格式的轉換。格式映射轉換准確、轉換效率較高。不過,這種方法在面對多種元數據格式並存的開放式環境中的應用效率明顯受到限制。
6.3 標准描述框架
解決元數據互操作性的另一種思路是建立一個標準的資源描述框架,用這個框架來描述所有元數據格式,那麼只要一個系統能夠解析這個標准描述框架,就能解讀相應的Metadata格式. 實際上,XML和RDF從不同角度起著類似的作用。
XML通過其標準的DTD定義方式,允許所有能夠解讀XML語句的系統辨識用XML_DTD定義的Metadata格式,從而解決對不同格式的釋讀問題。
RDF定義了由Resources、Properties和Statements等三種對象組成的基本模型,其中Resources和Properties關系類似於E-R模型,而Statements則對該關系進行具體描述。
RDF通過這個抽象的數據模型為定義和使用元數據建立一個框架,元數據元素可看成其描述的資源的屬性。
進一步地,RDF定義了標准Schema,規定了聲明資源類型、聲明相關屬性及其語義的機制,以及定義屬性與其它資源間關系的方法。另外,RDF還規定了利用XML Namespace方法調用已有定義規范的機制。
6.4數字對象方式
建立包含元數據及其轉換機制的數字對象可能從另一個角度解決元數據互操作性問題。
Cornell/FEDORA項目提出由內核(Structural Kernel)和功能傳播層(Disseminator Layer)組成的復合數字對象。
內核里,可以容納以比特流形式存在的文獻內容、描述該文獻的元數據、以及對這個文獻及元數據進行存取控制的有關數據。
功能傳播層,主功能傳播器(PrimitiveDisseminator)支持有關解構內核數據類型和對內核數據讀取的服務功能,還可有內容類型傳播器(Content-Type Disseminators),它們可內嵌元數據格式轉換機制。
例如,在一個數字對象的內核中存有MARC格式的元數據,在功能傳播層裝載有請求Dublin Core格式及其轉換服務的內容類型傳播器。當數字對象使用者要求讀取以Dublin Core表示的元數據時,相應的內容類型傳播器將通過網路請求存儲有Dublin Core及其轉換服務程序的數字對象,然後將被請求數字對象中的MARC形式元數據轉換為Dublin Core形式,在輸出給用戶。
7. 幾點建議
跟蹤元數據發展、積極參與制定元數據標准、加快元數據應用、注意國際接軌。
加快研究有效利用元數據進行檢索(包括異構系統透明檢索)、相關性學習、個性化處理等的機制。
加快研究元數據與數字對象和數字化資源體系有機整合的途徑與方法。
推進研究利用元數據進行基於知識的數據組織和知識發現。
G. 影像元數據的標准,地理信息數據的標准
全國地理信息標准化技術委員會(以下簡稱地理信息標委會)是在地理信息領內域從事全國性標准化工作的容技術組織,主要負責地理信息領域國家標準的規劃、協調和技術歸口工作,其宗旨是加快我國地理信息標准化步伐,促進地理信息資源建設和應用,推動地理信息共享。受國家標准化管理委員會(以下簡稱國家標准委)委託,國家測繪局負責領導和管理地理信息標委會的工作。
最新專業網站:http://www.gistandard.org.cn
H. 海洋科學數據元數據標准和規范
元數據是描述數據及其環境的數據。它不僅可以幫助數據生產單位有效地管理和維護空間數據,建立數據文檔,還可以提供有關數據生產單位數據存儲、數據分類、數據內容、數據質量等信息,並能夠幫助用戶了解數據及其是否能滿足需求。因此,元數據是使數據充分發揮作用的重要條件之一。對此,對元數據標準的研究也是整個數據共享的核心內容之一。
中國科學院在 21 世紀初已經把 「科學資料庫及其應用系統」作為科學院信息化建設的重要基礎設施,納入信息化建設的重大項目,其中標准與規范的建設、數據資源和系統平台建設成為科學資料庫的三大建設任務,在標准與規范中首要的一點就是研究科學資料庫元數據標准體系的建立。同樣,中國科技部正在進行的國家科學數據共享工程項目,對標准和規范的研究也是列在各項研究的前面。依託於上述的項目,海洋信息元數據標准化工作也在標準的統一、共享標準的制定、國際標准採用等方面有所側重。
從國際看,目前主要有三個組織進行元數據標準的研究工作,分別是歐洲標准化組織(CEN/TC 287)、美國聯邦地理數據委員會(FGDC)以及國際標准化組織(ISO/TC211)。表 3.2 給出了這三個組織的元數據內容對比。
表 3.2 元數據內容組成
在 CEN/TC 287 中,元數據分為數據集標識信息、數據集綜述信息、數據集質量元素、空間參照系信息、范圍信息、數據定義、分類信息、管理信息、元數據參考以及元數據語言,並用這 10 個部分來描述數據集,每一部分又有各自的組成元素。FGDC 的元數據內容由標識信息、數據質量信息、空間數據組織信息、空間參照系信息、實體和屬性信息、發行信息以及元數據參考信息 7 部分組成。包含 7 個主要子集和 3 個次要子集,共有460 個元數據實體和元素。它是目前國際上許多元數據標准體系的藍本。在 ISO/TC 211中,元數據的內容標准由兩大部分組成,一部分是標准化部分,它是用戶必須遵循的標准; 另一部分是信息化部分,它用於通過提供示例等方法來幫助指導用戶,以便更好地理解標准。標准化部分是元數據內容的核心,它定義了描述地理信息所必需的規則以及元數據的元素組成,共由 8 個部分組成,依次為標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、應用要素分類信息、發行信息以及元數據參考信息。這三個組織雖然在元數據標準的制定上各有一套體系,但都遵循著一些相似的原則,即保留一些必需元數據信息,對一些輔助的信息用可選項進行描述。表 3.3 列出了元數據的必選項,表 3.4 列出了元數據的可選項。
表 3.3 各種元數據標准中元數據必選項的說明
表 3.4 各種元數據標准中元數據可選項的說明
通過對 CEN/TC 287 、FGDC 和 ISO/TC 211 等元數據標准體系的分析以及對整個數字地理信息標准化理論前提的研究,我國已經制定了一套國家基礎地理信息系統(NFGIS)元數據標准草案。該體系由 12 個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據、表示信息、空間參照信息、實體和屬性信息、發行信息以及元數據參考信息 8 個部分。另外還有 4 個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。
在上述元數據標準的基礎上,根據海洋信息的特點,研究制定海洋元數據標准。海洋信息元數據標准規定海洋科學數據共享元數據的內容、提供有關數據採集源、採集單位、數據標示、覆蓋范圍、數據質量、空間和時間模式、空間參照系統、信息分發和用戶限制等信息。
在本數據集成平台的設計中,在參考我國元數據標准草案的基礎上,針對不同的數據種類,設計具體的元數據內容(表 3.5)。
表 3.5 各種類型數據集的元數據內容設計
續表
I. 地理學的18個標準是什麼
18項測繪地理行業標准:
18項行業標准中均為新制定標准,具體包括CH/T 1026-2012《數字高程模型質量檢驗技術規程》、CH/T
1027-2012《數字正射影像圖質量檢驗技術規程》、CH/T 1028-2012《變形測量成果質量檢驗技術規程》、CH/T
1029-2012《航空攝影成果質量檢驗技術規程 第1部分:常規光學航空攝影》、CH/T 1030-2012《基礎測繪項目文件歸檔技術規定》、CH/T
1031-2012《新農村建設測量與制圖規范》、CH/T 2011-2012《全球導航衛星系統連續運行基準站網運行維護技術規范》、CH/T
3009-2012《1:50000地形圖合成孔徑雷達航天攝影測量技術規定》、CH/T
3010-2012《1:50000地形圖合成孔徑雷達航空攝影技術規定》、CH/T
3011-2012《1:50000地形圖合成孔徑雷達航空攝影測量技術規定》、CH/T 4017-2012《矢量地圖符號製作規范》、CH/T
9013-2012《數字城市地理信息公共平台建設要求》、CH/T 9014-2012《數字城市地理信息公共平台運行服務規范》、CH/T
9015-2012《三維地理信息模型數據產品規范》、CH/T 9016-2012《三維地理信息模型生產規范》、CH/T
9017-2012《三維地理信息模型資料庫規范》、CH/Z 9018-2012《地理信息網路分發服務元數據內容規范》、CH/Z
9019-2012《地理信息元數據服務介面規范》。
CH/T 1026-2012《數字高程模型質量檢驗技術規程》、CH/T 1027-2012《數字正射影像圖質量檢驗技術規程》、CH/T
1028-2012《變形測量成果質量檢驗技術規程》、CH/T 1029-2012《航空攝影成果質量檢驗技術規程
第1部分:常規光學航空攝影》這4項行業標准在GB/T
24356-2009《測繪成果質量檢查與驗收》的基礎上,分別細化了數字高程模型、數字正射影像圖、變形測量成果以及常規光學航空攝影成果的質量檢查內容和方法,為相應測繪地理信息成果的質量檢驗提供了技術依據。
CH/T 9013-2012《數字城市地理信息公共平台建設要求》和CH/T
9014-2012《數字城市地理信息公共平台運行服務規范》2項行業標准分別規定了數字城市地理信息公共平台前期建設實施以及後期運行服務階段的各項內容和要求,與先前發布實施的相關標准構成了數字城市地理信息公共平台建設與應用的標准系列,對於規范引導數字城市建設與應用十分重要。CH/T
9015-2012《三維地理信息模型數據產品規范》、CH/T 9016-2012《三維地理信息模型生產規范》、CH/T
9017-2012《三維地理信息模型資料庫規范》等3項行業標准分別規定了三維模型的數據獲取、加工處理和生產建庫等過程以及技術要求,填補了行業領域三維地理信息模型標准方面的空白。
CH/T 3009-2012《1:50000地形圖合成孔徑雷達航天攝影測量技術規定》、CH/T
3010-2012《1:50000地形圖合成孔徑雷達航空攝影技術規定》、CH/T
3011-2012《1:50000地形圖合成孔徑雷達航空攝影測量技術規定》等3項行業標准分別規定了針對1:50000地形圖測繪的星載合成孔徑雷達數據航天攝影測量內業成圖、合成孔徑雷達航空攝影以及航測成圖基本技術要求,對於推廣應用基於合成孔徑雷達數據的地形圖測繪技術具有重要的引導作用。行業標准化指導性技術文件CH/Z
9018-2012《地理信息網路分發服務元數據內容規范》和CH/Z
9019-2012《地理信息元數據服務介面規范》分別規定了地理信息網路分發服務中元數據內容及其編碼方法、地理信息元數據服務的信息模型及其訪問介面,為地理信息網路分發服務的元數據信息服務和地理信息元數據服務的互操作訪問提供了技術保障。
CH/T 1030-2012《基礎測繪項目文件歸檔技術規定》、CH/T 1031-2012《新農村建設測量與制圖規范》、CH/T
2011-2012《全球導航衛星系統連續運行基準站網運行維護技術規范》、CH/T
4017-2012《矢量地圖符號製作規范》等4項行業標准分別規范了基礎測繪項目文件整理與歸檔、新農村建設測量與制圖、全球導航衛星系統連續運行基準站網運行與維護、地形圖圖式矢量地圖符號製作的相關技術要求,能夠為規范基礎測繪項目文件歸檔管理、新農村建設測繪保障、國家和區域基準站網運行維護、地圖符號製作繪制與共享等給予針對性的指導。
希望對您有所幫助。
J. 地理信息元數據可以分為圖形數據和屬性數據嗎
元數據是關於數抄據的描述性數據信息,說明數據內容、質量、狀況和其他有關特徵的背景信息。其目的是促進數據集的高效利用,並為計算機輔助軟體工程服務。
元數據的作用和意義:
l 幫助數據生產單位有效的維護和管理數據;
l 提供有關數據生產單位的各種有關信息供用戶查詢;
l 幫助用戶了解數據;
l 提供有關信息,以便用戶處理和轉換有用數據。
l 採用元數據可以便於數據共享。