当前位置:首页 » 地理信息 » 地理信息元数据标准

地理信息元数据标准

发布时间: 2021-02-04 16:55:20

A. 什么是元数据

元数据的英文名称是“Metadata",它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。空间元数据标准内容分两个层次。第一层是目录信息,主要用于对数据集信息进行宏观描述,它适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。第二层是详细信息,用来详细或全面描述地理空间信息的空间元数据标准内容,是数据集生产者在提供空间数据集时必须要提供的信息。

元数据主要有下列几个方面的作用:

(1)用来组织和管理空间信息,并挖掘空间信息资源,这正是数字地球的特点和优点所在。通过它可以在广域网或因特网上准确地识别、定位和访问空间信息。

(2)帮助数据使用者查询所需空间信息。比如,它可以按照不同的地理区间、指定的语言以及具体的时间段来查找空间信息资源。

(3)组织和维护一个机构对数据的投资。

(4)用来建立空间信息的数据目录和数据交换中心。通过数据目录和数据交换中心等提供的空间元数据内容,用户可以共享空间信息、维护数据结果,以及对它们进行优化等。

(5)提供数据转换方面的信息。使用户在获取空间信息的同时便可以得到空间元数据信息。通过空间元数据,人们可以接受并理解空间信息,与自己的空间信息集成在一起,进行不同方面的科学分析和决策。描述空间信息的元数据标准体系内容按照部分、复合元素和数据元素来组织,它们是依次包含关系,前者包含后者,即:后者依次组成前者。具体分为8个基本内容部分和4个引用部分,由12个部分组成,其中标准化内容包括标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、实体和属性信息、发行信息以及空间元数据参考信息等内容,另外还有4个部分是标准化部分中必须引用的信息,它们为引用信息、时间范围信息、联系信息及地址信息。元数据标准内容体系是通过元数据网络管理系统来实现的,该系统主要由权限验证功能(服务器端验证)、输入和合法性校验功能(客户端校验)、查询功能(服务器端查询)与返回和显示功能(服务器端格式化查询结果并返回,客户端显示)等组成。利用空间元数据网络管理系统作为空间交换站的共享软件可基本上实现空间信息的网络共享。

B. 元数据相关标准有那些呢

生态科学数据元数据
林业信息元数据
月球信息元数据
地理信息 元数据
数字音乐元数据
气象数据集核心元数据
有很多很多,融融网就有,搜索下,希望可以帮助你。

C. 地质资料核心元数据标准研究初探

吴小平

(全国地质资料馆)

摘 要 本文结合地质资料数据的特点,在国内外相关元数据标准研究的基础上,研究定义一个对地质资料数据资源最通用属性描述的核心元素集合,实现对地质资料数据资源信息基本情况的描述;以加强对地质资料数据的有效描述、组织、揭示、表达、管理,促进地质资料数据资源的利用、共享、交换和整合,提高地质资料数据管理现代化水平和地质资料数据公共服务能力。

关键词 地质资料 核心元数据 标准研究

1 引言

1.1 背景

随着经济社会的发展,地质工作在长期的实践发展中,积累了大量的地质资料数据,形成了大量不同资源类型、遍及地质各个学科的专业数据集,涉及区域地质、矿产地质、水文—工程—环境地质、农业地质、海洋地质、基础地质、地球化学、地球物理、遥感、地学科研等领域。数据量大,数据类型丰富,系统异构,数据格式多样化,是当前地质资料数据的重要特征。

应用的不断深入,社会需求不断增加,越来越多的研究需要基础数据支撑。地质资料数据的多学科、多标准、多类型、多尺度、海量性等特点,在一定程度上阻碍了其深入利用与共享。如何有效地描述、组织、揭示、表达、管理这些数据,以促进地质资料数据资源的利用、共享、交换和整合,提高数据共享水平,是提高地质资料数据管理现代化水平和提升地质资料数据社会化服务能力的基础。

为解决这个问题,前人开展了卓有成效的研究工作,提出利用元数据的标准化来统一管理分散的数据资源,并通过 Web 实现数据共享与服务[1-9]。元数据具有描述、揭示、组织、管理、控制、保存、互操作等功能[9-11]。元数据标准和技术是实现数据标准化、数据共享、数据交换和互操作等的重要手段。利用元数据标准提高对数据的描述与表达深度,实现对数据资源内涵的描述、发现、处理、评价,提高数据管理效率和用户检索数据的查询效率;通过元数据标准化来逐步解决数据资源间的语义独立和异构问题,最大程度地实现数据互操作,为实现数据资源的整合与交换奠定基础;通过建立相关的元数据记录,建立与数据资源管理相关的维护、保存等信息,加强对数据管理过程的控制,对进一步管好用好地质资料数据具有重要作用。

1.2 现状

目前,在地质资料管理与服务工作中,已形成《地质资料档案著录细则》、《成果地质资料管理技术要求》、《成果地质资料目录数据库著录表和著录要求》,以及相应的软件系统等一套地质资料目录标准规范,用以规范地质资料数据成果的建设、管理和服务。目前,各级地质资料馆藏机构均已建成地质资料目录数据库,并初步实现馆际目录间基本数据信息的交换,在地质资料数据的管理、共享、服务中发挥了重要作用。

地质资料目录数据库是对地质资料档案基本信息的描述与组织,是地质资料元数据体系中重要的组成部分,为地质资料数据的持续发展和进一步构建地质资料数据的丰富应用奠定了坚实的基础。

2 相关元数据标准基本情况

2.1 DC(DUBLIN CORE)都柏林核心元素集

DUBLIN CORE 元数据格式由美国 OCLC 公司发起,国际性合作项目 Dublin Core Metadata Initiative设计,由参与合作项目的机构共同维护修改,适用于网络资源描述,目前最新版本为 version 1.1,1999 年7 月 2 日发布执行。

DC 元数据作为网络时代一种新型的信息资源通用描述工具,正在为越来越多不同专业领域以及不同语种、不同文化背景的国家和地区所接受。DC 元数据标准,主要是指 DC 元数据元素、元素定义和注释等内容及由这些内容构成的规范化或标准化文本。

DC 最初应用目的是为了网络资源的著录与挖掘,由于 DC 元素简单易用,加之 OCLC 的大力推广和网络资源著录的巨大需求,DC 很快适用于任何媒体。简单的元素定义和设置可以很方便地著录,是 DC获得广泛应用的重要原因;然而它也带来另外一个问题,对著录对象的描述深度不够,不能进行专指度较高的检索[12]。2010 年,DC 元数据的中文版正式发布,《信息与文献 都柏林核心元数据元素集》(GB/T 25100-2010)进一步规范了 DC 中文化的进程[13],语义描述、元素名称等得到了统一与规范。根据《都柏林核心元数据元素集》(V1.1 版),DC 由 15 个元素组成,每个元素都根据 ISO/IEC 11179 定义 10 个属性,即:

名称(Name):元素名称;

标识(Identifier):元素唯一标识;

版本(Version):产生该元素的元数据版本;

注册机构(RegistrationAuthority):注册元素的授权机构;

语言(Language):元素说明语言;

定义(Definition):对元素概念与内涵的说明;

选项(Obligation):说明元素是限定必须使用的还是可选择的;

数据类型(Datatype):元素值中所表现的数据类型;

最大使用频率(Maximum Occurrence):元素的最大使用频次,即是否可重复使用;

注释(Comment):元素应用注释。

DC 元素依据其所描述内容的类别和范围可分为三组(表 1):①对资源内容的描述;②对知识产权的描述;③对外部属性的描述(instantiation)。

表 1 DC 元数据元素列表

2.2 数字地理空间元数据内容标准

数字地理空间元数据内容标准(Content Standard for Digital Geospatial Metadata)由美国联邦地球空间数据委员会组织编写并发布[4,9,11,14]。该标准 1992 年 7 月开始起草,几经修改,1994 年 7 月 8 日,FGDC 正式确认该标准为美国国家地球空间数据元数据标准,并于 1997 年 4 月发布其修订版(FGDC1994,FGDC 1997)。

FGDC 数字地理元数据内容标准的目的,是确定一个描述数字地理空间数据的术语及其定义集合,包括满足这些目的的数据元素、复合元素(一组数据元素)以及它们的定义和域值,描述数字地理空间数据集的元数据信息内容。

FGDC 是按照段(section)、复合元素(compound element)、数据元素(data element)来组织的,包括 7 个主要子集和 3 个辅助子集(见表 2),共有 460 个元数据实体(含复合元素)和元素。FGDC 规定了三种性质的子集、复合元素和元素。这三种性质是:必需的,即必须提供的信息;一定条件下必需的,即如果正在建立的元数据包含某子集、某个实体,或某个元素说明的特征,则必需提供的信息;可选的,即该信息是可选的,由用户决定是否将其包含在元数据文件中。FGDC 元数据标准没有规定语法格式或编码规则,因此同 DC 一样,只是一个内容标准。

表 2 FGDC 元素列表

2.3 ISO TC211 元数据标准

ISO TC211 元数据标准由国际标准化组织(The International Organization for Standardization)第三工作组组织研究,项目编号为 15046-15。1996 年 2 月 9 日通过 1.0 版草案,后几经修改,于 1997 年 1 月20 日发布 210 版标准(ISO TC211,1997)[4]。TC211 元数据内容项分为三种类型:必须型(M),指必须给出的内容(M 是 Mandatory 的缩写);条件型(C),指在一定条件下需要给出的内容(C 表示 Conditional);可选型(O),指可有可无的内容(O 表示 Optional)。元数据内容采用逐项逐行方式表达;标准中给出了元数据制作、管理等规范。

TC211 元数据标准中把元数据的内容分为 7 类,每一类中又包括若干子类或具体元数据项,主要包括元数据内容、标识信息内容、数据质量信息内容、空间数据表达信息内容、空间参考信息内容、特征与属性信息内容、数据传播信息内容、数据参考信息内容等方面。

3 地质资料核心元数据

3.1 概念

“核心元数据规范”拟定义一个对地质资料数据资源最通用属性描述的数据元素集合,实现对数据信息基本情况的描述。

3.2 目的

地质资料核心元数据标准(Geology Data Core Metadata,GDCM)拟通过建立一套用以描述各种地质资料数据集的元素集合,为地质资料数据资源提供一套通用的描述元素及规范,供管理者和用户在通用领域应用中描述具有相同特征或属性的数据集,为地质资料数据资源的检索、整合、交换、服务和共享提供支持。

3.3 范围

地质资料数据核心元数据是关于地质资料数据资源的基本描述信息,是由数据资源的共同特点确定的元数据集合。

3.4 原则

3.4.1 用户需求原则

核心元数据作为地质资料数据的一组基础性、通用性描述数据,在设计与选择核心元素时必须充分考虑用户的需求,以深入地揭示信息资源的内涵。在结构与格式的设计、元素的增加与取舍、语义规则的制定等方面,要尽可能地从用户的角度出发,增加系统与用户间的交互渠道(如开放式的词表系统的使用、增加提供用户反馈的元素等),为用户提供多层次的检索体系[9]

3.4.2 简单性与适用性原则

简单性与适用性原则要求元数据方案在应用时简单易于理解,便于计算机著录,有利于实现互操作;同时需兼顾适用性,选取最能表达需求的元数据集合,以解决元素过少产生的不准确性,提高检索的精度,做到繁简适当。

3.4.3 互操作与易转换性原则

互操作性是不同数据格式以及异构系统间实现数据交换的重要原则。元数据方案的设计,要充分考虑数据间的互操作性,通过建立映射、数据交换机制、语义共享等实现互操作性,实现不同系统间、不同数据格式间的数据交换。

3.4.4 专指性与通用性原则

专指性与通用性原则要求元数据方案的设计应统筹考虑各类资源的应用特性,协调好资源应用深度与应用广度。

3.4.5 可扩展性与可持续性原则

可扩展性是指数据方案的生命。随着数字资源内容不断丰富、应用不断深入、需求不断增加,元数据方案必须能够适应资源应用、需求的变化,将一些特殊的应用加入,以适应不断变化的需求。一些具体应用可能会要求更为细致精确的描述,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素、子元素或属性值[9]。可持续性原则是指要充分考虑与现有标准规范的衔接,充分利用现有标准的成果,保证元数据方案的可持续发展。

4 地质资料数据核心元数据元素定义

4.1 基本定义

定义元数据(Metadata)、核心元数据(Core Metadata)和数据集(Dataset)三个基本术语。元数据是关于数据的数据;核心元数据是指能够描述地质资料数据的一组通用的描述元素及相应的规范;数据集是由相关数据对象组成的一个可标识的数据集合体。将被描述的地质资料数据作为一个群组,一个群组可以看做一个数据集。一个数据集可能是一个较小的数据集合,在物理上或逻辑上位于一个较大的数据集之内;反之,一个数据集也可能由若干数据集组成,是这些子数据集的父数据集。如根据地质资料数据文件的组织方式,一个数据集可以是正文、附件、附图、附表、附件、其他类等的集合。在本研究中,数据集是元数据的描述对象,以成果地质资料电子文件的分类组织数据集。

借鉴 ISO/IEC 11179-3 标准,本研究定义元素的属性基本上采用与 Dublin Core 一致的方法,按以下九个方面对元素进行定义:

1)中文名称(Chinese Name):元素中文名称;

2)英文名称(English Name):元素英文名称;

3)标识(Identifier):元素唯一标识;

4)定义(Definition):对元素概念与内涵的说明;

5)类型(Data Type):元素值中的数据类型;

6)约束(Constraint)指明元素是否是限定必须使用还是可选择的(必备性);

7)出现次数(Maximum Occurrence)元素是否可重复以及可重复的次数;

8)值域(Value Domain):元数据元素的取值范围;

9)注释(Comment):对元素的补充说明、著录格式的建议及其它。

4.2 核心元素内容

本研究参考都柏林核心元数据计划(The Dublin Core Metadata Initiative,DCMI)发布的《都柏林核心元数据元素集》(V1.1 版)和《信息与文献都柏林核心元数据元素集》(GB/T 25100-2010[13],元素的名称、定义、注释、约束、类型的中文翻译参考了上海图书馆的《都柏林核心修饰词》[17],《DCMI 元数据术语》[16],《都柏林核心资源集合描述应用纲要》[18],《都柏林核心图书馆应用纲要》[19],《地质资料档案著录细则》(DA/T 23—2000)[21],《成果地质调查资料著录表及著录要求》[22],国家图书馆《中文元数据方案》[15],《中国科学院科学数据库核心元数据标准》[20]。地质资料数据核心元数据(GDCM)标准核心元素及定义见表 3。

表 3 地质资料数据核心元数据(GDCM)标准核心元素(拟)

5 结论及思考

核心元数据作为描述地质资料数据的一部分,需进一步加强研究,逐步规范完善。由于地质资料数据涉及范围广,格式、类型多样,需要制定系列元数据标准来系统描述数据资源,并建立多个不同元数据标准间的语义共享与映射,提高对数据的描述深度与层级,优化数据组织方式与结构,不断提高地质资料数据管理、服务与共享水平。

参 考 文 献

[1] 国家地理空间信息协调委员会办公室 . 自然资源和地理空间信息整合与共享研究 [M]. 北京:科学出版社,2007.

[2] 徐冠华 . 实施科学数据共享,增强科技竞争力 [J]. 中国基础科学,2003(1):5 ~ 9.

[3] 孙枢 . 地球数据是地球科学创新的重要源泉—从地球科学谈科学数据共享 [J]. 中国基础科学,2003(1):19 ~ 23.

[4] 李军,周成虎 . 地球空间数据元数据标准初探 [J]. 地理科学进展,1998,17(4):55 ~ 63.

[5] 张立,龚健雅 . 地理空间元数据管理的研究与实现 [J]. 武汉测绘科技大学学报,2000,25(5):127 ~ 131.

[6] 沈体雁,程承旗 . 地理元数据技术系统的设计与实现 [J]. 武汉测绘科技大学学报,1999,24(4):34 ~ 37.

[7] 王卷乐,游松财,谢传节 . 地学数据共享中的元数据标准结构分析与设计 [J]. 地理与地理信息科学,2005,21(1):16 ~ 18.

[8] 刘纬等 .2010. 数字图书馆的语义描述与服务升级 [M]. 北京:国家图书馆出版社 .

[9] 肖珑等,中文元数据标准框架及其应用 [J] 数字图书馆论坛,2011,5:29 ~ 35.

[10]http://cdls.nstl.gov.cn/,数字图书馆标准与规范建设—基本元数据标准规范,2005—12.

[11] 冯项云,肖珑,廖三三等 . 国外常用元数据标准比较研究 [J]. 数字图书馆论坛,2011,4:15 ~ 21.

[12] 中文文献元数据标准研究项目组系列报告之一 国外元数据标准比较研究报告,北京大学图书馆中文元数据标准研究项目组(2000 年12 月).

[13] 信息与文献 都柏林核心元数据元素集,GB/T 25100-2010(ISO 15836:2009,MOD),2010-09-02.

[14] 薛明 . 美国联邦地理数据委员会的标准参考模型 [J]. 测绘标准化,总第 62 期第 20 卷 .

[15]http://www.cdi.cn/CMS/searcher/. 中文元数据方案 . 国家图书馆,2002.03.

[16]http://blincore.org/documents/2006/12/18/dcmi-terms/,DCMI 元数据术语,2006-12-18.

[17]http://blincore.org/documents/2000/07/11/dcmes-qualifiers/ 都柏林核心修饰词,2000-07-11.

[18]http://blincore.org/groups/collections/collection-application-profile/,都柏林核心资源集合描述应用纲要,2006-08-24.

[19]http://blincore.org/documents/2004/09/10/library-application-profile/,都柏林核心图书馆应用纲要,2004-09-10.

[20]http://www.sdb.ac.cn,中国科学院科学数据库核心元数据标准(1.1),2003-08.

[21] 地质资料档案著录细则 . 中华人民共和国档案行业标准:DA/T 23—2000.

[22] 成果地质调查资料著录表及著录要求 . 中国地质调查局发展研究中心,2004-11-11.

D. 简述地理信息系统中元数据的内容有哪些

元数据是描述数据的数据,因为要描述的数据不同,元数据也不同,这个必须要结合它描述的数据来谈

E. 什么是元数据(指数据中心建设而言)举个例子说明一下。

元数据的英文名称是“Metadata",它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。空间元数据标准内容分两个层次。第一层是目录信息,主要用于对数据集信息进行宏观描述,它适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。第二层是详细信息,用来详细或全面描述地理空间信息的空间元数据标准内容,是数据集生产者在提供空间数据集时必须要提供的信息。

元数据主要有下列几个方面的作用:

(1)用来组织和管理空间信息,并挖掘空间信息资源,这正是数字地球的特点和优点所在。通过它可以在广域网或因特网上准确地识别、定位和访问空间信息。

(2)帮助数据使用者查询所需空间信息。比如,它可以按照不同的地理区间、指定的语言以及具体的时间段来查找空间信息资源。

(3)组织和维护一个机构对数据的投资。

(4)用来建立空间信息的数据目录和数据交换中心。通过数据目录和数据交换中心等提供的空间元数据内容,用户可以共享空间信息、维护数据结果,以及对它们进行优化等。

(5)提供数据转换方面的信息。使用户在获取空间信息的同时便可以得到空间元数据信息。通过空间元数据,人们可以接受并理解空间信息,与自己的空间信息集成在一起,进行不同方面的科学分析和决策。描述空间信息的元数据标准体系内容按照部分、复合元素和数据元素来组织,它们是依次包含关系,前者包含后者,即:后者依次组成前者。具体分为8个基本内容部分和4个引用部分,由12个部分组成,其中标准化内容包括标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、实体和属性信息、发行信息以及空间元数据参考信息等内容,另外还有4个部分是标准化部分中必须引用的信息,它们为引用信息、时间范围信息、联系信息及地址信息。元数据标准内容体系是通过元数据网络管理系统来实现的,该系统主要由权限验证功能(服务器端验证)、输入和合法性校验功能(客户端校验)、查询功能(服务器端查询)与返回和显示功能(服务器端格式化查询结果并返回,客户端显示)等组成。利用空间元数据网络管理系统作为空间交换站的共享软件可基本上实现空间信息的网络共享。

F. 元数据的标准

1、数字图书馆资源组织框架
2. 元数据开发应用框架
元数据的基本意义 Metadata(元数据)是“关于数据的数据”;
元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;
元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。
离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。
3. 元数据应用环境
3.1 Metadata的应用目的
(1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。
(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。
(3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。
(4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。
3.2 Metadata在不同领域的应用 根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现
例如:
网络资源:Dublin Core、IAFA Template、CDF、Web Collections
文献资料:MARC(with 856 Field),Dublic Core
人文科学:TEI Header
社会科学数据集:ICPSR SGML Codebook
博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空间信息:FGDC/CSDGM
数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
档案库与资源集合:EAD
技术报告:RFC 1807
连续图像:MPEG-7
3.3 Metadata格式的应用程度
不同领域的Metadata处于不同的标准化阶段:
在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;
在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经成为政府信息描述标准,并在世界若干国家得到相当程度的应用,与此类似的还有地理空间信息处理的FGDC/CSDGM;
但在某些领域,由于技术的迅速发展变化,仍然存在多个方案竞争,典型的是数字图像的Metadata,提出的许多标准都处于实验和完善的阶段。
3.4 Metadata格式“标准化”程度问题
Metadata开发应用经验表明,很难有一个统一的Metadata格式来满足所有领域的数据描述需要;即使在同一个领域,也可能为了不同目的而需要不同的但可相互转换的Metadata格式。
同时,统一的集中计划式的Metadata格式标准也不适合Internet环境,不利于充分利用市场机制和各方面力量。
但在同一领域,应争取“标准化”,在不同领域,应妥善解决不同格式的互操作问题。
4. 元数据结构
4.1 总体结构定义方式 一个Metadata格式由多层次的结构予以定义:
(1)内容结构(Content Structure),对该Metadata的构成元素及其定义标准进行描述。
(2)句法结构(Syntax Structure),定义Metadata结构以及如何描述这种结构。
(3)语义结构(Semantic Structure),定义Metadata元素的具体描述方法。
4.2 内容结构
内容结构定义Metadata的构成元素,可包括: 描述性元素、技术性元素、管理性元素、结构性元素(例如与编码语言、Namespace、数据单元等的链接)。
这些数据元素很可能依据一定标准来选取,因此元数据内容结构中需要对此进行说明,例如MARC记录所依据的ISBD,EAD所参照的ISAD(G),ICPSR所依据的ICPSR Data Preparation Manual。
4.3 句法结构
句法结构定义格式结构及其描述方式,例如元素的分区分段组织、元素选取使用规则、元素描述方法(例如Dublin Core采用ISO/IEC 11179标准)、元素结构描述方法(例如MARC记录结构、SGML结构、XML结构)、结构语句描述语言(例如EBNF Notation)等。
有时,句法结构需要指出元数据是否与所描述的数据对象捆绑在一起、或作为单独数据存在但以一定形式与数据对象链接,还可能描述与定义标准、DTD结构和Namespace等的链接方式。
4.4 语义结构 语义结构定义元素的具体描述方法,例如 描述元素时所采用的标准、最佳实践(Best Practices)或自定义的描述要求(Instructions)。
有些元数据格式本身定义了语义结构,而另外一些则由具体采用单位规定语义结构,例如Dublin Core建议日期元素采用ISO 8601、资源类型采用Dublin Core Types、数据格式可采用MIME、识别号采用URL或DOI或ISBN;
又如OhioLink在使用VRA Core时要求主题元素使用A&AT、TGM和TGN,人名元素用ULAN。
5. 元数据编码语言与制作方式
5.1 元数据编码语言
元数据编码语言(Metadata Encoding Languages)指对元数据元素和结构进行定义和描述的具体语法和语义规则,常称为定义描述语言(DDL)。
在元数据发展初期人们常使用自定义的记录语言(例如MARC)或数据库记录结构(如ROADS等),但随着元数据格式的增多和互操作的要求,人们开始采用一些标准化的DDL来描述元数据,例如SGML和XML,其中以XML最有潜力。
5.2 元数据制作方式
(1)专门编制模块(例如对MARC、GILS、FGDC等)
(2)数据处理时自动编制(例如对Dublin Core等)
(3)数据物理处理时自动编制(例如数字图像扫描时的某些元数据参数)
(4)共享元数据(例如OCLC/CORC、IMESH
6. 元数据互操作性
6.1 元数据互操作性问题
由于不同的领域(甚至同一领域)往往存在多个元数据格式,当在用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就存在元数据的互操作性问题(Interoperability):
多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。
6.2 元数据格式映射
利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(Metadata Mapping/Crosswalking)。
已有大量的转换程序存在,供若干流行元数据格式之间的转化,例如
Dublin Core与USMARC; Dublin Core与EAD
Dublin Core与GILS;GILS与MARC TEI
Header与MARC FGDC与MARC
也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse项目利用GRS格式进行各种MARC格式和其它记录格式的转换。格式映射转换准确、转换效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制。
6.3 标准描述框架
解决元数据互操作性的另一种思路是建立一个标准的资源描述框架,用这个框架来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式. 实际上,XML和RDF从不同角度起着类似的作用。
XML通过其标准的DTD定义方式,允许所有能够解读XML语句的系统辨识用XML_DTD定义的Metadata格式,从而解决对不同格式的释读问题。
RDF定义了由Resources、Properties和Statements等三种对象组成的基本模型,其中Resources和Properties关系类似于E-R模型,而Statements则对该关系进行具体描述。
RDF通过这个抽象的数据模型为定义和使用元数据建立一个框架,元数据元素可看成其描述的资源的属性。
进一步地,RDF定义了标准Schema,规定了声明资源类型、声明相关属性及其语义的机制,以及定义属性与其它资源间关系的方法。另外,RDF还规定了利用XML Namespace方法调用已有定义规范的机制。
6.4数字对象方式
建立包含元数据及其转换机制的数字对象可能从另一个角度解决元数据互操作性问题。
Cornell/FEDORA项目提出由内核(Structural Kernel)和功能传播层(Disseminator Layer)组成的复合数字对象。
内核里,可以容纳以比特流形式存在的文献内容、描述该文献的元数据、以及对这个文献及元数据进行存取控制的有关数据。
功能传播层,主功能传播器(PrimitiveDisseminator)支持有关解构内核数据类型和对内核数据读取的服务功能,还可有内容类型传播器(Content-Type Disseminators),它们可内嵌元数据格式转换机制。
例如,在一个数字对象的内核中存有MARC格式的元数据,在功能传播层装载有请求Dublin Core格式及其转换服务的内容类型传播器。当数字对象使用者要求读取以Dublin Core表示的元数据时,相应的内容类型传播器将通过网络请求存储有Dublin Core及其转换服务程序的数字对象,然后将被请求数字对象中的MARC形式元数据转换为Dublin Core形式,在输出给用户。
7. 几点建议
跟踪元数据发展、积极参与制定元数据标准、加快元数据应用、注意国际接轨。
加快研究有效利用元数据进行检索(包括异构系统透明检索)、相关性学习、个性化处理等的机制。
加快研究元数据与数字对象和数字化资源体系有机整合的途径与方法。
推进研究利用元数据进行基于知识的数据组织和知识发现。

G. 影像元数据的标准,地理信息数据的标准

全国地理信息标准化技术委员会(以下简称地理信息标委会)是在地理信息领内域从事全国性标准化工作的容技术组织,主要负责地理信息领域国家标准的规划、协调和技术归口工作,其宗旨是加快我国地理信息标准化步伐,促进地理信息资源建设和应用,推动地理信息共享。受国家标准化管理委员会(以下简称国家标准委)委托,国家测绘局负责领导和管理地理信息标委会的工作。
最新专业网站:http://www.gistandard.org.cn

H. 海洋科学数据元数据标准和规范

元数据是描述数据及其环境的数据。它不仅可以帮助数据生产单位有效地管理和维护空间数据,建立数据文档,还可以提供有关数据生产单位数据存储、数据分类、数据内容、数据质量等信息,并能够帮助用户了解数据及其是否能满足需求。因此,元数据是使数据充分发挥作用的重要条件之一。对此,对元数据标准的研究也是整个数据共享的核心内容之一。

中国科学院在 21 世纪初已经把 “科学数据库及其应用系统”作为科学院信息化建设的重要基础设施,纳入信息化建设的重大项目,其中标准与规范的建设、数据资源和系统平台建设成为科学数据库的三大建设任务,在标准与规范中首要的一点就是研究科学数据库元数据标准体系的建立。同样,中国科技部正在进行的国家科学数据共享工程项目,对标准和规范的研究也是列在各项研究的前面。依托于上述的项目,海洋信息元数据标准化工作也在标准的统一、共享标准的制定、国际标准采用等方面有所侧重。

从国际看,目前主要有三个组织进行元数据标准的研究工作,分别是欧洲标准化组织(CEN/TC 287)、美国联邦地理数据委员会(FGDC)以及国际标准化组织(ISO/TC211)。表 3.2 给出了这三个组织的元数据内容对比。

表 3.2 元数据内容组成

在 CEN/TC 287 中,元数据分为数据集标识信息、数据集综述信息、数据集质量元素、空间参照系信息、范围信息、数据定义、分类信息、管理信息、元数据参考以及元数据语言,并用这 10 个部分来描述数据集,每一部分又有各自的组成元素。FGDC 的元数据内容由标识信息、数据质量信息、空间数据组织信息、空间参照系信息、实体和属性信息、发行信息以及元数据参考信息 7 部分组成。包含 7 个主要子集和 3 个次要子集,共有460 个元数据实体和元素。它是目前国际上许多元数据标准体系的蓝本。在 ISO/TC 211中,元数据的内容标准由两大部分组成,一部分是标准化部分,它是用户必须遵循的标准; 另一部分是信息化部分,它用于通过提供示例等方法来帮助指导用户,以便更好地理解标准。标准化部分是元数据内容的核心,它定义了描述地理信息所必需的规则以及元数据的元素组成,共由 8 个部分组成,依次为标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、应用要素分类信息、发行信息以及元数据参考信息。这三个组织虽然在元数据标准的制定上各有一套体系,但都遵循着一些相似的原则,即保留一些必需元数据信息,对一些辅助的信息用可选项进行描述。表 3.3 列出了元数据的必选项,表 3.4 列出了元数据的可选项。

表 3.3 各种元数据标准中元数据必选项的说明

表 3.4 各种元数据标准中元数据可选项的说明

通过对 CEN/TC 287 、FGDC 和 ISO/TC 211 等元数据标准体系的分析以及对整个数字地理信息标准化理论前提的研究,我国已经制定了一套国家基础地理信息系统(NFGIS)元数据标准草案。该体系由 12 个部分组成,其中标准化内容包括标识信息、数据质量信息、数据集继承信息、空间数据、表示信息、空间参照信息、实体和属性信息、发行信息以及元数据参考信息 8 个部分。另外还有 4 个部分是标准化部分中必须引用的信息,它们为引用信息、时间范围信息、联系信息及地址信息。

在上述元数据标准的基础上,根据海洋信息的特点,研究制定海洋元数据标准。海洋信息元数据标准规定海洋科学数据共享元数据的内容、提供有关数据采集源、采集单位、数据标示、覆盖范围、数据质量、空间和时间模式、空间参照系统、信息分发和用户限制等信息。

在本数据集成平台的设计中,在参考我国元数据标准草案的基础上,针对不同的数据种类,设计具体的元数据内容(表 3.5)。

表 3.5 各种类型数据集的元数据内容设计

续表

I. 地理学的18个标准是什么

18项测绘地理行业标准:
18项行业标准中均为新制定标准,具体包括CH/T 1026-2012《数字高程模型质量检验技术规程》、CH/T
1027-2012《数字正射影像图质量检验技术规程》、CH/T 1028-2012《变形测量成果质量检验技术规程》、CH/T
1029-2012《航空摄影成果质量检验技术规程 第1部分:常规光学航空摄影》、CH/T 1030-2012《基础测绘项目文件归档技术规定》、CH/T
1031-2012《新农村建设测量与制图规范》、CH/T 2011-2012《全球导航卫星系统连续运行基准站网运行维护技术规范》、CH/T
3009-2012《1:50000地形图合成孔径雷达航天摄影测量技术规定》、CH/T
3010-2012《1:50000地形图合成孔径雷达航空摄影技术规定》、CH/T
3011-2012《1:50000地形图合成孔径雷达航空摄影测量技术规定》、CH/T 4017-2012《矢量地图符号制作规范》、CH/T
9013-2012《数字城市地理信息公共平台建设要求》、CH/T 9014-2012《数字城市地理信息公共平台运行服务规范》、CH/T
9015-2012《三维地理信息模型数据产品规范》、CH/T 9016-2012《三维地理信息模型生产规范》、CH/T
9017-2012《三维地理信息模型数据库规范》、CH/Z 9018-2012《地理信息网络分发服务元数据内容规范》、CH/Z
9019-2012《地理信息元数据服务接口规范》。

CH/T 1026-2012《数字高程模型质量检验技术规程》、CH/T 1027-2012《数字正射影像图质量检验技术规程》、CH/T
1028-2012《变形测量成果质量检验技术规程》、CH/T 1029-2012《航空摄影成果质量检验技术规程
第1部分:常规光学航空摄影》这4项行业标准在GB/T
24356-2009《测绘成果质量检查与验收》的基础上,分别细化了数字高程模型、数字正射影像图、变形测量成果以及常规光学航空摄影成果的质量检查内容和方法,为相应测绘地理信息成果的质量检验提供了技术依据。

CH/T 9013-2012《数字城市地理信息公共平台建设要求》和CH/T
9014-2012《数字城市地理信息公共平台运行服务规范》2项行业标准分别规定了数字城市地理信息公共平台前期建设实施以及后期运行服务阶段的各项内容和要求,与先前发布实施的相关标准构成了数字城市地理信息公共平台建设与应用的标准系列,对于规范引导数字城市建设与应用十分重要。CH/T
9015-2012《三维地理信息模型数据产品规范》、CH/T 9016-2012《三维地理信息模型生产规范》、CH/T
9017-2012《三维地理信息模型数据库规范》等3项行业标准分别规定了三维模型的数据获取、加工处理和生产建库等过程以及技术要求,填补了行业领域三维地理信息模型标准方面的空白。

CH/T 3009-2012《1:50000地形图合成孔径雷达航天摄影测量技术规定》、CH/T
3010-2012《1:50000地形图合成孔径雷达航空摄影技术规定》、CH/T
3011-2012《1:50000地形图合成孔径雷达航空摄影测量技术规定》等3项行业标准分别规定了针对1:50000地形图测绘的星载合成孔径雷达数据航天摄影测量内业成图、合成孔径雷达航空摄影以及航测成图基本技术要求,对于推广应用基于合成孔径雷达数据的地形图测绘技术具有重要的引导作用。行业标准化指导性技术文件CH/Z
9018-2012《地理信息网络分发服务元数据内容规范》和CH/Z
9019-2012《地理信息元数据服务接口规范》分别规定了地理信息网络分发服务中元数据内容及其编码方法、地理信息元数据服务的信息模型及其访问接口,为地理信息网络分发服务的元数据信息服务和地理信息元数据服务的互操作访问提供了技术保障。

CH/T 1030-2012《基础测绘项目文件归档技术规定》、CH/T 1031-2012《新农村建设测量与制图规范》、CH/T
2011-2012《全球导航卫星系统连续运行基准站网运行维护技术规范》、CH/T
4017-2012《矢量地图符号制作规范》等4项行业标准分别规范了基础测绘项目文件整理与归档、新农村建设测量与制图、全球导航卫星系统连续运行基准站网运行与维护、地形图图式矢量地图符号制作的相关技术要求,能够为规范基础测绘项目文件归档管理、新农村建设测绘保障、国家和区域基准站网运行维护、地图符号制作绘制与共享等给予针对性的指导。
希望对您有所帮助。

J. 地理信息元数据可以分为图形数据和属性数据吗

元数据是关于数抄据的描述性数据信息,说明数据内容、质量、状况和其他有关特征的背景信息。其目的是促进数据集的高效利用,并为计算机辅助软件工程服务。

元数据的作用和意义:

l 帮助数据生产单位有效的维护和管理数据;

l 提供有关数据生产单位的各种有关信息供用户查询;

l 帮助用户了解数据;

l 提供有关信息,以便用户处理和转换有用数据。

l 采用元数据可以便于数据共享。

热点内容
鹿特丹港国家地理 发布:2021-03-15 14:26:00 浏览:571
地理八年级主要的气候类型 发布:2021-03-15 14:24:09 浏览:219
戴旭龙中国地质大学武汉 发布:2021-03-15 14:19:37 浏览:408
地理因素对中国文化的影响 发布:2021-03-15 14:18:30 浏览:724
高中地理全解世界地理 发布:2021-03-15 14:16:36 浏览:425
工地质检具体干些什么 发布:2021-03-15 14:15:00 浏览:4
东南大学工程地质考试卷 发布:2021-03-15 14:13:41 浏览:840
中国地质大学自动取票机 发布:2021-03-15 14:13:15 浏览:779
曾文武汉地质大学 发布:2021-03-15 14:11:33 浏览:563
中国冶金地质总局地球物理勘察院官网 发布:2021-03-15 14:10:10 浏览:864