地理信息系统主要技术
① 地理信息系统的技术特点
地理信息系统 (Geographical Information System)
简述
简单的几句话,是不能解释地理信息系统概念的。这里仅仅是泛泛的介绍。首先,GIS是一种计算机系统,它具备一般计算机系统所具有的功能,如采集、管理、分析和表达数据等功能。其次,GIS处理的数据都和地理信息有着直接间接的关系。地理信息是有关地理实体的性质、特征、运动状态的表征和一切有用的知识,而地理数据则是各种地理特征和现象间关系的符号化表示,包括空间位置、属性特征(简称属性)及时域特征三部分。空间位置数据描述地物或现象所在位置;属性数据有时又称作非空间数据,是属于一定地物或现象、描述其特征的定性或定量指标;时域特征是指地理数据采集或地理现象发生的时刻或时段。由此,可以简单地定义地理信息系统为用于采集、模拟、处理、检索、分析和表达地理空间数据的计算机信息系统。地理信息系统是有关空间数据管理和空间信息分析的计算机系统。依照其应用领域,地理信息系统可分为土地信息系统、资源管理信息系统、地学信息系统等;根据其使用的数据模型,可分为矢量、栅格和混合型信息系统;根据其服务对象,可分为专题信息系统和区域信息系统等等。
与一般的管理信息系统相比,地理信息系统具有以下特征:(1)地理信息系统在分析处理问题中使用了空间数据与属性数据,并通过数据库管理系统将两者联系在一起共同管理、分析和应用,从而提供了认识地理现象的一种新的思维方法;而管理信息系统则只有属性数据库的管理,即使存储了图形,页往往以文件形式等机械形式存储,不能进行有关空间数据的操作,如空间查询、检索、相邻分析等,更无法进行复杂的空间分析。(2)地理信息系统强调空间分析,通过利用空间解析式模型来分析空间数据,地理信息系统的成功应用依赖于空间分析模型的研究与设计。
地理信息系统理解的歧意
目前,对地理信息系统的定义还存在分歧。这种分歧起因于地理信息系统本身诞生历史不长、发展速度很快、应用领域广泛等因素。因此,地理信息系统的定义可能基于系统具备的功能,也可能基于应用或其它方面。 David J.Cowen(1988)在分析现有地理信息系统定义的基础上,将其归结为以下四类:
(l)面向数据处理过程的定义。认为地理信息系统由地理数据的输入、存储、查询、分析与输出等子系统组成。过程定义本身很清楚,强调数据的处理流程,但其外延太广泛,不利于将地理信息系统与其它地理数据自动化处理系统分开。
(2)面向专题应用的定义。在面向过程定义的基础上,按其分析的信息类型来定义地理信息系统,如土地利用信息系统、矿产资源管理信息系统、投资环境评估信息系统、城市交通管理信息系统等。应用定义有助于描述地理信息系统的应用领域范畴。
(3)工具箱定义。这种定义基于软件系统分析的观点,认为地理信息系统包括各种复杂的处理空间数据的计算机程序和各种算法。工具箱定义系统地描述了地理信息系统软件应具备的功能,为软件系统的评价提供了基本的技术指标。
(4)数据库定义。在工具箱定义的基础上,更加强调分析工具和数据库间的联接。一个通用的地理信息系统可看成是许多特殊的空间分析方法与数据管理系统的结合。
另外,从地理信息系统在实际应用中的作用与地位来看,目前对地理信息系统的认识可归纳为三个相互独立又相互关联的观点。一是地图观点,强调地理信息系统作为信息载体与传播媒介的地图功能,认为地理信息系统是一种地图数据处理与显示系统,在此,每个地理数据集可看成是一张地图,通过地图代数实现数据的操作与运算,其结果仍然表现为一张具有新内容的地图。测绘及各种专题地图部门非常重视地理信息系统的快速生产高质量地图的能力。第二种观点称为数据库观点,多为具有计算机科学背景的用户所接纳,强调数据库系统在地理信息系统中的重要地位,认为一个完整的数据库管理系统是任何一个 成功的地理信息系统不可缺少的部分。第三种观点则是分析工具观点,强调地理信息系统的空间分析与模型分析功能,认为地理信息系统是一门空间信息科学。第三种观点普遍地为地理信息系统界所接受,并认为这是区分地理信息系统与其它地理数据自动化处理系统的唯一特征。
综上所述,地理信息系统可定义为:由计算机系统、地理数据和用户组成的,通过对地理数据的集成、存储、检索、操作和分析,生成并输出各种地理信息,从而为土地利用、资源管理、环境监测、交通运输、经济建设、城市规划以及政府各部门行政管理提供新的知识,为工程设计和规划、管理决策服务。
地理信息系统与地图学及电子地图
地图作为记录地理信息的一种图形语言形式,最为古老,久负盛誉。从历史发展看,地理信息系统脱胎于地图,并成为地图信息的又一种新的载体形式,它具有存储、分析、显示和传输的功能,尤其是计算机制图为地图特征的数字表示、操作和显示提供了成套方法,为地理信息系统的图形输出设计提供了技术支持;同时,地图仍是目前地理信息系统的重要数据来源之一。但二者间有着一定的差别:地图强调的是数据分析、符号化与显示,而地理信息系统则注重于信息分析。同时,地图学理论与方法对地理信息系统的发要的影响,并成为地理信息系统发展的根源之一。
地理信息系统与制图系统的关系存在两种看法。其一,计算机辅助制图系统是地理信息系统的一部分;其二,地理信息系统是机助制图系统之上的超结构(Superconstructure)。从地理信息系统的发展过程可以看出,地理信息系统的产生、发展与制图信息系统存在着密切的联系,两者的相通之处是基于空间数据库的空间信息的表达、显示和处理。
从系统组成和功能上,一个地理信息系统拥有机助制图系统的所有组成和功能,并且地理信息系统还有数据处理的功能。但随着电子制图系统(Electronic manning system,EMS)的出现和发展,出现了电子图集。与传统地图集相比,电子地图集有许多新的特征:①声、图文和数据多媒体集成,把图形的直观性、数字的准确性、声音的引导性和亲切感相结合,充分利用了读者的各种感官;②查询检索和分析决策功能,能够支持从地图图形到属性数据和从属性数据到图形的双向检索;③图形动态变化功能,从开窗缩放、创览阅读等基本功能到地图动画功能、多维动画图形模拟等;④具有良好的用户界面,使读者介入地图的生成过程;⑤多级比例尺之间的相互转换,由于计算机屏幕幅面的限制和计算机潜在的计算功能和巨大的存贮能力,要求具有多级比例尺不同程度的制图综合功能。与地理信息系统相比,由于电子制图系统具有电子地图集的功能,因此它所拥有的表达与显示空间信息的功能更强。好的电子制图系统应具有地理信息系统的所有功能,并且具有在电子媒体上应用各种不同的格式来创建、存贮和表达资料信息的能力。
节选自《地理信息系统导论》陈述彭等编著
② 地理信息系统专业主要学些什么 开设课程有哪些
理信息系统与地图学的基本知识、基本知识、基本技能,能在科研机版构或高等学校从事科学权研究或教学工作,能在城市、区域、资源、环境、交通、人口、住房、土地、基础设施和规划管理等领域从事与地理信息系统有关的应用研究、技术开发、生产管理和行政管理等工作.主要课程:自然地理学、人文地理学、经济地理学、地图学、遥感技术、数据库技术、地理信息系统原理、地理信息系统设计与应用等。
③ 地理信息技术的主要功能是什么
人类生活在地球上,80%以上的信息与地球上的空间位置有关。GIS的出现是信息技术及其应用发展到一定程度的必然产物。地理信息系统萌芽于上世纪的60年代。1962年,加拿大的Roger F. Tomlinson提出利用数字计算机处理和分析大量的土地利用地图数据,并建议加拿大土地调查局建立加拿大地理信息系统(CGIS),以实现专题地图的叠加、面积量算、自然资源的管理和规划等;与此同时,美国的Duane F. Marble在美国西北大学研究利用数字计算机研制数据处理软件系统,以支持大规模城市交通研究,并提出建立地理信息系统的思想。70年代是地理信息系统走向实用的发展期。美国、加拿大、英国、西德、瑞典和日本等国对GIS的研究均投入了大量人力、物力和财力。到1972年CGIS全面投入运行与使用,成为世界上第一个运行型的地理信息系统;在此期间美国地质调查局发展了50多个地理信息系统,用于获取和处理地质、地理、地形和水资源信息;1974年日本国土地理院开始建立数字国土信息系统,存储、处理和检索测量数据、航空像片信息、行政区划、土地利用、地形地质等信息;瑞典在中央、区域和城市三级建立了许多信息系统,如土地测量信息系统、斯德哥尔摩地理信息系统、城市规划信息系统等。但由于当时的GIS系统多数运行在小型机上,涉及的计算机软硬件、外部设备及GIS软件本身的价格都相当昂贵,限制了GIS的应用范围。
80年代是GIS的推广应用阶段,由于计算机技术的飞速发展,在性能大幅度提高的同时,价格迅速下降,特别是工作站和个人计算机的出现与完善,使GIS的应用领域与范围不断扩大。GIS与卫星遥感技术相结合,开始用于全球性问题的研究,如全球变化和全球监测、全球沙漠化、全球可居住区评价、厄尔尼诺现象及酸雨、核扩散及核废料等(李德仁,1994);从土地利用、城市规划等宏观管理应用,深入到各个领域解决工程问题,如环境与资源评价、工程选址、设施管理、紧急事件响应等。在这一时期,出现了一大批代表性的GIS软件,如ARC/INFO、GENAMAP、SPANS、MAPINPO、ERDAS、Microstation等,其中ARC/INFO已经愈来愈多地为世界各国地质调查部门所采用,并在区域地质调查、区域矿产资源与环境评价、矿产资源与矿权管理中发挥越来越重要作用。
90年代为GIS的用户时代,随着地理信息产业的建立和数字化信息产品在全世界的普及,GIS成为了一个产业,投入使用的GIS系统,每2~3年就翻一番,GIS市场的增长也很快。目前,GIS的应用在走向区域化和全球化的同时,己渗透到各行各业,涉及千家万户,成为人们生产、生活、学习和工作中不可缺少的工具和助手。与此同时,GIS也从单机、二维、封闭向开放、网络(包括Web GIS)、多维的方向发展。
我国地理信息系统方面的工作始于80年代初。地理信息系统进入发展阶段的标志是第七个五年计划的开始,地理信息系统研究作为政府行为,正式列入国家科技攻关计划,开始了有计划、有组织、有目标的科学研究、应用实验和工程建设工作。许多部门同时展开了地理信息系统研究与开发工作。1994年中国GIS协会在北京成立,标志中国GIS行业已形成一定规模。九五期间,国家将地理信息系统的研究应用作为重中之重的项目予以支持,1996年,为支持国产GIS软件的发展,原国家科委开始组织软件评测,并组织应用示范工程。这一系列的举措极大的促进了国产GIS软件的发展与GIS的应用。1998年,国产软件打破国外软件的垄断,在国内市场的占有率达25%。同年,在抽样调查25个省市19个行业的1000多个单位中,全部使用了地理信息系统(秦其明、袁胜元,2001)。地理信息系统在资源调查、评价、管理和监测,在城市的管理、规划和市政工程、行政管理与空间决策、灾害的评估与预测、地籍管理及土地利用,在交通、农业、公安等诸多领域得到了广泛的应用。 2. 地理信息系统的组成
GIS的应用系统由五个主要部分构成,即硬件、软件、数据、人员和方法。
④ 地理信息系统研究热点,包括哪些关键理论,技术
1 空间数据库的准确性研究
地理信息数据中误差处理和不确定性错误处理的方法和技术 ,包括 :
不确定性误差模型 ;
误差跟踪并对误差进行编码的方法 ;
计算和表达在 GIS应用中的误差 ;
数据精度的评估 ;
数据质量、元数据、数据标准等问题研究。
2 空间关系语言研究
以地理空间概念的规范化形式为基础 ,利用自然语言和数学方法 , 形成空间关系表达的理论 ;
关于定位表达的计算模型 ;
空间概念的获取和表达 ;
拓扑关系的定义 ;
空间信息的可视化 ;
GIS的用户接口。
3 空间数据的多种表达方式研究
为高效数据提取而组织的不同版本的数据及相应的拓扑关系 ,以及空间数据的多种表达方式 ;
满足数据一致性和精度要求的地图制图规则 ;
数据模型、链接、多机构、多尺度等对数据的需求。
4 地理信息的使用和价值研究
对 GIS获取、实现和使用起关键作用的因素和过程的理解 ;
GIS传播模型建立方法 ;
确定 GIS的经济价值。
5 海量空间数据库的结构体系研究
海量数据库中数据模型、结构、算法、用户接口等问题的实现方法 ;
空间代数学 ;
基于逻辑的计算机查询语言 ;
元数据的具体内容和组织 ;
数据压缩和加密方法。
6 空间决策支持系统
GIS及其相关学科在决策形成中的作用 ;
区域灾害问题解决的空间决策支持方法 ;
空间决策支持系统的模型和数据 ;
空间决策支持系统技术和实现 ;
用户需求和组织等问题研究。
7 空间信息的可视化研究
数据质量的管理和可视化表达构成研究 ;
误差模型和数据质量指标 ;
数据库中数据的质量管理 ;
使内在表达和地图显示更容易的可视化工具 ;
对数据质量信息的用户需求评估。
8 地图制图的规范化研究
研究相应的方法和准则 ,以提高空间数据的一致性 , 以及空间数据在表达方式和空间分析方面的效率和准确性 ;
地图制图语言规范化研究 ;
规范化设计评估体系 ;
将知识推理嵌入数据模型。
9 地理信息数据共享的研究
由地理信息和技术共享到空间数据共享 ;
空间数据共享的理论研究 ;
空间数据共享的场所 ;
空间数据共享的处理方法。
10 GIS中时空关系的研究
地理空间中空间、时间以及和变化相关联的对象研究 ;
不同时间概念的划分 ,如 :离散的、连续的、单调的等 ;
具体应用中 ,笛卡儿坐标和欧几里得坐标的选择 ;
将人类对时间和空间的认知过程具体化、形式化 ;
空间现象的模拟计算模式。
11 遥感和 GIS的集成研究
解决遥感和 GIS集成方面的关键问题 ,主要包括 :
数据结构和存取问题 ;
数据处理流程 ;
误差分析 ;
机构问题。
12 GIS的用户接口研究
人机交互的用户接口设计和实现 ;
在 GIS环境中 ,人和计算机相互作用的研究 ;
不同背景、语言、文化对人机交互的影响
GIS软件用户接口设计的准则和方法。
13 GIS和空间分析研究
空间统计学地理数据的空间统计分析 ;
地理边界和地图比例尺在空间数据体系中的作用 ;
空间数据的采样和内插 ;
GIS数据结构和空间统计计算之间的关系。
14 GIS在全球变化中的作用研究
全面、定量地理解 GIS应用对全球变化所起的作用 ;
从小尺度的研究出发 ,建立理论基础和计算结构 ;
全球数据质量的评估。
15 法律、信息政策和空间数据库关系研究
GIS数据适用范围 ;
科学地理解空间数据库环境中的法律和政策 ;
如何完善 GIS方面法律的内容和质量 ;
空间数据库在公众政策和法律建设方面的作用
GIS在公众政策和法律方面的有用性尝试。
16 通过协作形成空间决策系统的研究
提供开发和评估工具 ,以解决复杂空间问题 ;
建立知识获取方法 ;
建立评估方案 ;
确定协作方的相互联系方式 ;
在相互作用的环境中解决冲突的方法。
17 在社会背景中 ,如何在 GIS中表达人、空间与环境的研究
人口的管理和控制 ;
确定冲突影响的人口范围 ;
政治经济关心的自然资源的开采和使用。
18 地理信息系统的互操作研究
开放的、分布式存储的 GIS结构 ;
地理数据语义特性获取方法 ;
数据抽象和处理模型研究 ;
地理空间数据的粒度 (Granularity)。
19 地理世界的规范化模式研究
地理世界的规范化表达 ;
用空间数据结构表达现实世界时 ,基本的描述元素 ;
GIS用户对地理世界的直觉看法。
⑤ GIS基本技术有哪些
引言
地理信息系统(Geographic Information System,简称GIS)是计算机科学、地理学、测量学、地图学等多门学科综合的技术[1]。GIS的基本技术是空间数据库、地图可视化及空间分析,而空间数据库是GIS的关键。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,在GIS中的应用推动着GIS朝智能化和集成化的方向发展。
1 空间数据库与空间数据挖掘技术的特点
随着数据库技术的不断发展和数据库管理系统的广泛应用,数据库中存储的数据量也在急剧增大,在这些海量数据的背后隐藏了很多具有决策意义的信息。但是,现今数据库的大多数应用仍然停留在查询、检索阶段,数据库中隐藏的丰富的知识远远没有得到充分的发掘和利用,数据库中数据的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象。
空间数据库(数据仓库)中的空间数据除了其显式信息外,还具有丰富的隐含信息,如数字高程模型〔DEM或TIN〕,除了载荷高程信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但其中还隐含了气候的水平地带性和垂直地带性的信息,等等。这些隐含的信息只有通过数据挖掘才能显示出来。空间数据挖掘(Spatial Data Mining,简称SDM),或者称为从空间数据库中发现知识,是为了解决空间数据海量特性而扩展的一个新的数据挖掘的研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程[2]。由于SDM的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何数据、属性数据,而且存储了空间事物或对象之间的图形空间关系,因此其处理方法有别于一般的数据挖掘方法。SDM与传统的地学数据分析方法的本质区别在于SDM是在没有明确假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和可实用3个特征。
空间数据挖掘技术需要综合数据挖掘技术与空间数据库技术,它可用于对空间数据的理解,对空间关系和空间与非空间关系的发现、空间知识库的构造以及空间数据库的重组和查询的优化等。
2 空间数据挖掘技术的主要方法及特点
常用的空间数据挖掘技术包括:序列分析、分类分析、预测、聚类分析、关联规则分析、时间序列分析、粗集方法及云理论等。本文从挖掘任务和挖掘方法的角度,着重介绍了分类分析、聚类分析和关联规则分析三种常用的重要的方法。
2.1、分类分析
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和我们熟知的回归方法都可用于预测,两者的目的都是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。空间分类的规则实质是对给定数据对象集的抽象和概括,可用宏元组表示。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由特征(又称属性)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示是判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播(Back-Propagation,简称BP)算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数[3]。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1) 预测准确度;2) 计算复杂度;3) 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类器构造法就很有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
分类技术在实际应用非常重要,比如:可以根据房屋的地理位置决定房屋的档次等。
2. 2 聚类分析
聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。它的目的是使得属于同一个组的样本之间应该彼此相似,而不同组的样本应足够不相似。与分类分析不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。基于聚类分析方法的空间数据挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,对空间数据聚类分析方法的研究是一个热点。
对于空间数据,利用聚类分析方法,可以根据地理位置以及障碍物的存在情况自动地进行区域划分。例如,根据分布在不同地理位置的ATM机的情况将居民进行区域划分,根据这一信息,可以有效地进行ATM机的设置规划,避免浪费,同时也避免失掉每一个商机。
2.3 关联规则分析
关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间关联规则的形式是X->Y[S%,C%],其中X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。空间谓词的形式有3种:表示拓扑结构的谓词、表示空间方向的谓词和表示距离的谓词[5]。各种各样的空间谓词可以构成空间关联规则。如,距离信息(如Close_to(临近)、Far_away(远离))、拓扑关系(Intersect(交)、Overlap(重叠)、Disjoin(分离))和空间方位(如Right_of(右边)、West_of(西边))。实际上大多数算法都是利用空间数据的关联特性改进其分类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空间实体等。大致算法可描述如下:(1)根据查询要求查找相关的空间数据;(2)利用临近等原则描述空间属性和特定属性;(3)根据最小支持度原则过滤不重要的数据;(4)运用其它手段对数据进一步提纯(如OVERLAY);(5)生成关联规则。
关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规则比较复杂,一种自然的想法是将它转换为布尔型关联规则,由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。—种逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进一步的优化。
对于空间数据,利用关联规则分析,可以发现地理位置的关联性。例如,85%的靠近高速公路的大城镇与水相邻,或者发现通常与高尔夫球场相邻的对象是停车场等。
3 空间数据挖掘技术的研究方向
3.1 处理不同类型的数据
绝大多数数据库是关系型的,因此在关系数据库上有效地执行数据挖掘是至关重要的。但是在不同应用领域中存在各种数据和数据库,而且经常包含复杂的数据类型,例如结构数据、复杂对象、事务数据、历史数据等。由于数据类型的多样性和不同的数据挖掘目标,一个数据挖掘系统不可能处理各种数据。因此针对特定的数据类型,需要建立特定的数据挖掘系统。
3.2 数据挖掘算法的有效性和可测性
海量数据库通常有上百个属性和表及数百万个元组。GB数量级数据库已不鲜见,TB数量级数据库已经出现,高维大型数据库不仅增大了搜索空间,也增加了发现错误模式的可能性。因此必须利用领域知识降低维数,除去无关数据,从而提高算法效率。从一个大型空间数据库中抽取知识的算法必须高效、可测量,即数据挖掘算法的运行时间必须可预测,且可接受,指数和多项式复杂性的算法不具有实用价值。但当算法用有限数据为特定模型寻找适当参数时,有时也会导致物超所值,降低效率。
3.3 交互性用户界面
数据挖掘的结果应准确地描述数据挖掘的要求,并易于表达。从不同的角度考察发现的知识,并以不同形式表示,用高层次语言和图形界面表示数据挖掘要求和结果。目前许多知识发现系统和工具缺乏与用户的交互,难以有效利用领域知识。对此可以利用贝叶斯方法和演译数据库本身的演译能力发现知识。
3.4 在多抽象层上交互式挖掘知识
很难预测从数据库中会挖掘出什么样的知识,因此一个高层次的数据挖掘查询应作为进一步探询的线索。交互式挖掘使用户能交互地定义一个数据挖掘要求,深化数据挖掘过程,从不同角度灵活看待多抽象层上的数据挖掘结果。
3.5 从不同数据源挖掘信息
局域网、广域网以及Internet网将多个数据源联成一个大型分布、异构的数据库,从包含不同语义的格式化和非格式化数据中挖掘知识是对数据挖掘的一个挑战。数据挖掘可揭示大型异构数据库中存在的普通查询不能发现的知识。数据库的巨大规模、广泛分布及数据挖掘方法的计算复杂性,要求建立并行分布的数据挖掘。
3.6 私有性和安全性
数据挖掘能从不同角度、不同抽象层上看待数据,这将影响到数据挖掘的私有性和安全性。通过研究数据挖掘导致的数据非法侵入,可改进数据库安全方法,以避免信息泄漏。
3.7 和其它系统的集成
方法、功能单一的发现系统的适用范围必然受到一定的限制。要想在更广泛的领域发现知识,空间数据挖掘系统就应该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术的集成。
4 有待研究的问题
我们虽然在空间数据挖掘技术的研究和应用中取得了很大的成绩,但在一些理论及应用方面仍存在急需解决的问题。
4.1 数据访问的效率和可伸缩性
空间数据的复杂性和数据的大量性,TB数量级的数据库的出现,必然增大发现算法的搜索空间,增加了搜索的盲目性。如何有效的去除与任务无关的数据,降低问题的维数,设计出更加高效的挖掘算法对空间数据挖掘提出了巨大的挑战。
4.2 对当前一些GIS软件缺乏时间属性和静态存储的改进
由于数据挖掘的应用在很大的程度上涉及到时序关系,因此静态的数据存储严重妨碍了数据挖掘的应用。基于图层的计算模式、不同尺度空间数据之间的完全割裂也对空间数据挖掘设置了重重障碍。空间实体与属性数据之间的联系仅仅依赖于标识码,这种一维的连接方式无疑将丢失大量的连接信息,不能有效的表示多维和隐含的内在连接关系,这些都增加了数据挖掘计算的复杂度,极大地增加了数据准备阶段的工作量和人工干预的程度。
4.3 发现模式的精炼
当发现空间很大时会获得大量的结果,尽管有些是无关或没有意义的模式,这时可利用领域的知识进一步精炼发现的模式,从而得到有意义的知识。
在空间数据挖掘技术方面,重要的研究和应用的方向还包括:网络环境上的数据挖掘、栅格矢量一体化的挖掘、不确定性情况下的数据挖掘、分布式环境下的数据挖掘、数据挖掘查询语言和新的高效的挖掘算法等。
5 小结
随着GIS与数据挖掘及相关领域科学研究的不断发展,空间数据挖掘技术在广度和深度上的不断深入,在不久的将来,一个集成了挖掘技术的GIS、GPS、RS集成系统必将朝着智能化、网络化、全球化与大众化的方向发展。
⑥ 地理信息系统(GIS)技术系统原理是什么
最简单地来说,GIS是以测绘测量为基础,以数据库作为数据储存和使用的数据源,以计算机编程为平台的全球空间分析即使技术。这是GIS的本质,也是核心。
物质世界中的任何事物都被牢牢地打上了时空的烙印。人们的生产和生活中百分之八十以上的信息和地理空间位置有关。地理信息系统( Geographic Information System, 简称 GIS)作为获取、存储、分析和管理地理空间数据的重要工具、技术和学科,近年来得到了广泛关注和迅猛发展。由于信息技术的发展,数字时代的来临,理论上来说,GIS可以运用于现阶段任何行业。 从技术和应用的角度, GIS 是解决空间问题的工具、方法和技术;
从学科的角度, GIS 是在地理学、地图学、测量学和计算机科学等学科基础上发展起来的一门学科,具有独立的学科体系;
从功能上, GIS 具有空间数据的获取、存储、显示、编辑、处理、分析、输出和应用等功能;
从系统学的角度, GIS 具有一定结构和功能,是一个完整的系统。
简而言之, GIS 是一个基于数据库管理系统( DBMS )的分析和管理空间对象的信息系统,以地理空间数据为操作对象是地理信息系统与其它信息系统的根本区别。
GIS即地理信息系统(Geographic Information System),经过了40年的发展,到今天已经逐渐成为一门相当成熟的技术,并且得到了极广泛的应用。尤其是近些年,GIS更以其强大的地理信息空间分析功能,在GPS及路径优化中发挥着越来越重要的作用。GIS地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。
⑦ 地理信息系统目前主要应用到哪些领域
GIS 的应用领域
地理信息系统在最近的30多年内取得了惊人的发展,广泛应用于资源调查、环境评估、灾害预测、国土管理、城市规划、邮电通讯、交通运输、军事公安、水利电力、公共设施管理、农林牧业、统计、商业金融等几乎所有领域。 (加测绘、应急、石油石化等国民经济各个领域。)
以下地理信息系统的应用领域分别回答了在各自领域内的作用
◆ 资源管理 (Resource Management)
主要应用于农业和林业领域,解决农业和林业领域各种资源(如土地、森林、草场)分布、分级、统计、制图等问题。主要回答“定位”和“模式”两类问题。
◆ 资源配置 (Resource Configuration)
在城市中各种公用设施、救灾减灾中物资的分配、全国范围内能源保障、粮食供应等到机构的在各地的配置等都是资源配置问题。GIS在这类应用中的目标是保证资源的最合理配置和发挥最大效益。
◆ 城市规划和管理 (Urban Planning and Management)
空间规划是GIS的一个重要应用领域,城市规划和管理是其中的主要内容。例如,在大规模城市基础设施建设中如何保证绿地的比例和合理分布、如何保证学校、公共设施、运动场所、服务设施等能够有最大的服务面(城市资源配置问题)等。
◆ 土地信息系统和地籍管理 (Land Information System and Cadastral Applicaiton)
土地和地籍管理涉及土地使用性质变化、地块轮廓变化、地籍权属关系变化等许多内容,借助GIS技术可以高效、高质量地完成这些工作。
◆ 生态、环境管理与模拟 (Environmental Management and Modeling)
区域生态规划、环境现状评价、环境影响评价、污染物削减分配的决策支持、环境与区域可持续发展的决策支持、环保设施的管理、环境规划等。
◆ 应急响应 (Emergency Response)
解决在发生洪水、战争、核事故等重大自然或人为灾害时,如何安排最佳的人员撤离路线、并配备相应的运输和保障设施的问题。
◆ 地学研究与应用 (Application in GeoScience)
地形分析、流域分析、土地利用研究、经济地理研究、空间决策支持、空间统计分析、制图等都可以借助地理信息系统工具完成。
◆ 商业与市场 (Business and Marketing)
商业设施的建立充分考虑其市场潜力。例如大型商场的建立如果不考虑其他商场的分布、待建区周围居民区的分布和人数,建成之后就可能无法达到预期的市场和服务面。有时甚至商场销售的品种和市场定位都必须与待建区的人口结构(年 龄构成、性别构成、文化水平)、消费水平等结合起来考虑。地理信息系统的空间分析和数据库功能可以解决这些问题。房地产开发和销售过程中也可以利用GIS功能进行决策和分析。
◆ 基础设施管理 (Facilities Management)
城市的地上地下基础设施(电信、自来水、道路交通、天然气管线、排污设施、 电力设施等)广泛分布于城市的各个角落、且这些设施明显具有地理参照特征的。它们的管理、统计、汇总都可以借助GIS完成,而且可以大大提高工作效率。
◆ 选址分析 (Site Selecting Analysis)
根据区域地理环境的特点,综合考虑资源配置、市场潜力、交通条件、地形特征、环境影响等因素,在区域范围内选择最佳位置,是GIS的一个典型应用领域,充分体现了GIS的空间分析功能。
◆ 网络分析 (Network System Analysis)
建立交通网络、地下管线网络等的计算机模型,研究交通流量、进行交通规则、处理地下管线突发事件(爆管、断路)等应急处理。 警务和医疗救护的路径优选、车辆导航等也是GIS网络分析应用的实例。
◆ 可视化应用 (Visualization Application)
以数字地形模型为基础,建立城市、区域、或大型建筑工程、著名风景名胜区的三维可视化模型,实现多角度浏览,可广泛应用于宣传、城市和区域规划、大型工程管理和仿真、旅游等领域。
◆ 分布式地理信息应用 (Distributed Geographic Information Application)
随着网络和Internet技术的发展,运行于Intranet或Internet环境下的地理信息系统应用类型,其目标是实现地理信息的分布式存储和信息共享,以及远程空间导航等。
⑧ 地理信息系统专业是做什么的
培养目标:本专业培养适应21世纪社会经济发展的需要,德、智、体全面发展,基础扎实、知识面宽、能力强、素质高,富有创新精神的专门人才。该专业学生应具备地理信息系统及其相关学科的基本理论、基本知识、基本技能,能在科研机构或高等院校从事科研工作或教学工作,能在水利、环境、测量、交通、海洋、房产、土地、城镇建设、区域规划等领域从事与地理信息系统有关的应用研究、技术开发、生产管理等工作的地理信息系统高级专门人才。
培养要求:本专业学生主要学习地理信息系统和地图学、遥感技术方面的基本理论和基本知识,受到应用基础研究和技术开发方面的科学思维和科学实验训练,只有较好的科学素养,具有地理信息系统研究、设计与开发的基本技能及初步的教学、研究、开发和管理能力。
毕业生应获得以下几方面的知识和能力:
1.掌握数学、物理、计算机科学等方面的基本理论和基本知识;
2.掌握地理信息系统和地图学的基本理论、基本知识和基本实验技能,以及地理信息系统技术开发的基本原理和基本力法;
3.了解相邻专业如地理学、资源环境与城乡规划管理、测绘工程等的一般原理和方法;
4.了解国家科学技术政策、知识产权、可持续发展战略等有关政策和法规;
5.了解地理信息系统的理论前沿、应用前景和最新发展动态,以及地理信息系统产业发展状况;
6.掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法;具有-定的实验设计、创造实验条件,归纳、整理、分析实验结果,撰写论文,参与学术交流的能力。
主干学科:地理学、地图学、计算机科学与技术。
主要课程:自然地理学、人文地理学、经济地理学、地图学、遥感技术、数据库技术、地理信息系统原理、地理信息系统设计与应用等。
⑨ 地理信息系统专业的知识技能
毕业生应获得以下几方面的知识和能力:
1.掌握数学、物理、计算内机科学等方面的基本理论和基容本知识;
2.掌握地理信息系统和地图学的基本理论、基本知识和基本实验技能,以及地理信息系统技术开发的基本原理和基本力法;
3.了解相邻专业如地理学、资源环境与城乡规划管理、测绘工程等的一般原理和方法;
4.了解国家科学技术政策、知识产权、可持续发展战略等有关政策和法规;
5.了解地理信息系统的理论前沿、应用前景和最新发展动态,以及地理信息系统产业发展状况;
6.掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法;具有-定的实验设计、创造实验条件,归纳、整理、分析实验结果,撰写论文,参与学术交流的能力。
⑩ 地理信息技术的地理信息系统
通过上述的分析和定义可提出GIS的如下基本概念:
1、的物理外壳是计算机化的技术系统,它又由若干个相互关联的子系统构成,如数据采集子系统、数据管理子系统、数据处理和分析子系统、图像处理子系统、数据产品输出子系统等,这些子系统的优劣、结构直接影响着GIS的硬件平台、功能、效率、数据处理的方式和产品输出的类型。
2、GIS的操作对象是空间数据,即点、线、面、体这类有三维要素的地理实体。空间数据的最根本特点是每一个数据都按统一的地理坐标进行编码,实现对其定位、定性和定量的描述、这是GIS区别于其它类型信息系统的根本标志,也是其技术难点之所在。
3、GIS的技术优势在于它的数据综合、模拟与分析评价能力,可以得到常规方法或普通信息系统难以得到的重要信息,实现地理空间过程演化的模拟和预测。
4、GIS与测绘学和地理学有着密切的关系。大地测量、工程测量、矿山测量、地籍测量、航空摄影测量和遥感技术为GIS中的空间实体提供各种不同比例尺和精度的定位数;电子速测仪、GPS全球定位技术、解析或数字摄影测量工作站、遥感图像处理系统等现代测绘技术的使用,可直接、快速和自动地获取空间目标的数字信息产品,为GIS提供丰富和更为实时的信息源,并促使GIS向更高层次发展。地理学是GIS的理论依托。有的学者断言,“地理信息系统和信息地理学是地理科学第二次革命的主要工具和手段。如果说GIS的兴起和发展是地理科学信息革命的一把钥匙,那么,信息地理学的兴起和发展将是打开地理科学信息革命的一扇大门,必将为地理科学的发展和提高开辟一个崭新的天地”。GIS被誉为地学的第三代语言——用数字形式来描述空间实体。