1.数据质量的基本概念
1.1准确性(Accuracy)
1.2精度(Precision)
1.3空间分辨率(Spatial Resolution)
1.4比例尺(Scale)
1.5误差(Error)
1.6不确定性(Uncertainty)
2.空间数据质量问题的来源
2.1空间现象自身存在的不稳定性
2.2空间现象的表达
2.3空间数据处理中的误差
2.4空间数据使用中的误差
表1:数据的主要误差来源
数据处理过程 误差来源
数据搜集
野外测量误差:仪器误差、记录误差
遥感数据误差:辐射和几何纠正误差、信息提取误差
地图数据误差:原始数据误差、坐标转换、制图综合及印刷
数据输入
数字化误差:仪器误差、操作误差
不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换
数据存储
数值精度不够
空间精度不够:每个格网点太大、地图最小制图单元太大
数据处理
分类间隔不合理
多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差
比例尺太小引起的误差
数据输出
输出设备不精确引起的误差
输出的媒介不稳定造成的误差
数据使用
对数据所包含的信息的误解
对数据信息使用不当
3.空间数据质量控制
数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差.空间数据质量控制常见的方法有:
3.1传统的手工方法
质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法.
3.2元数据方法
数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化.
3.3地理相关法
用空间数据的地理特征要素自身的相关性来分析数据的质量.如从地表自然特征的空间分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,如河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,如不能确定哪层数据有问题时,可以通过将它们分别与其它质量可靠的数据层叠加来进一步分析.因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征要素的相关分析之用.