提要  本篇根据GIS具体应用实例,详细阐述了GIS的基本数学模型,深入分析了非地理属性数据的本质特性及组织方法,并提出了绘图即编码的新观点。
关键词  GIS 非地理属性数据 图形编码
0. 引言 近年来,GIS数据处理技术正以前所未有的速度,渗透到社会的各个部门。各行各业的GIS开发应用急剧增加,专业GIS平台种类繁多,新技术、新理念层出不穷,给人以目不暇接的感觉。作为一名业余GIS从业人员,根据行业应用具体例子,阐述GIS数据处理技术的基本原理及其应用方法。所述观点有偏薄之处,还请GIS行家斧正。
1. 现行GIS数学模型 GIS处理的数据对象不仅仅局限于地理测绘部门,基于地理信息基础上的规划、市政、土管、电力、电讯、自来水等相关行业,同样适用于GIS数据处理技术,这是无庸置疑的客观事实。值得探讨的是:各相关部门该如何利用测绘部门提供的基础地理信息?他们又该如何组织各自的专业数据? 现行的GIS数据处理模型,都是在海量级数字地理背景图上,叠加各自专业图符布置图,然后利用内置或外挂的关系型数据库,查询统计图形符号所属的参数记录。这样的数学模型,实际应用效果并不理想:操作人员在图形、表格之间煞费苦心,但始终不得要领;应用单位除了承担昂贵的专业GIS平台外,还得承担同样昂贵的关系型数据库平台。笔者以为,现行GIS数学模型的基本原理有待探讨。
2. GIS数据的基本结构 海量级数字地图本来是按一定比例尺度、一定投影带度(地理坐标系),分幅保存在地理测绘部门。以前都是以图纸形式,现在通行数字地图格式。大概是计算机图形处理技术太易于拼接叠加,程序设计人员很容易将数量众多的地理分幅图,拼接成海量级数字地图,作为各GIS相关行业的地理背景。这样的系统设计方法,违背了模块化设计这一信息处理技术的基本原则。 就单纯的地理信息而言,最小的、能够独立使用的基本数据模块,就是每张一定比例、一定投影带度的地理分幅图。单张地理分幅图的信息数据量相当有限,数量众多的地理分幅图叠加起来,才形成海量级地理背景图。在很小的电脑屏幕上,调集海量级图形数据,显示效果如同印象派画家的杰作,不知所云。实际应用当中,操作人员为了保持画面的清晰,常常关闭地理背景图层。早知今日,何必当初。 GIS相关行业在数据初始化阶段,确实应该尽可能搜集所有地理分幅图,包括不同坐标体系的地理图,这样可以在图纸或电子地图上,转录各自行业图符布置图,不必花费大量的人力、物力,到现场进行实地勘测,系统开发周期可以大大缩短。转录过程是必不可少的,因为测绘部门的图符规范与各行业规范不尽相同,图符之间的逻辑关系更是隔行如隔山。关于这一点,各相关行业部门并无异议,实际应用也是这样操作的。但无论从数据处理的基本原理,还是实际应用角度,都没有理由叠加海量级地理图作为基础背景。 也许有人要问,转录后的行业图符地理布置图,仍常常需要基本地理信息作为参考背景,那该如何处置?实际上这很容易解决,你只需将所有地理分幅图保存在指定的硬盘目录,需要时逐一调入叠加。很显然,这样的应用模式,更符合数据处理的基本原理,计算机系统资源也可大大节约。 这里想强调一点,无论是基础地理信息图,或是行业图符布置图,必须遵循测绘部门的地理坐标系。地理坐标系不仅具有严密的数学投影公式,而且是法定的标准规范。常常碰到一些非地理专业的设计人员,任意假定自己的地理坐标。这样的设计方法,能够应用一时,但给日后的数据维护运行带来无穷的后患。你的所有数据将成为“信息孤岛”:无法被别人共享,也无法共享别人信息。“地图永远跟不上建设”,你搜集到的最新版式的地图,很可能是五年甚至是十年前的地形地貌。动态变化的地理信息,是按照固定的坐标体系不断修测更新。地理坐标体系实际上是地理信息数据的基本编码字典,设计人员怎能凭自己的意愿,各自假定编码字典。笔者并非地理专业人员,认识地理坐标的重要性,完全是经验之谈。
3. 非地理属性数据的组织方法 笔者认同这样的观点:从内部结构上讲,计算机数据处理技术可以概括为逻辑上的关系型数据库处理模型;所有信息数据,无论是文本、数字、图形、图象、声音等等,都是以抽象的表格记录形式存贮在计算机内部。这是专业级系统开发商探讨的技术问题,笔者根本没有能力深入剖析。从具体应用角度出发,抽象的或者说是逻辑上的关系型表格数据库,是否都得影射成外观的表格数据记录,这就值得应用开发人员仔细推敲。就最常用的DXF格式的图形交换文件(数据)而言,其内部形式就是标准ASCII码表格数据,但它们的外部表现形式,则是具体形象的几何实体。对应用开发人员犹其是应用操作人员来讲,表格记录与图形数据是完全不同的数据类型,它们的组织方法、查询手段也是完全不同的。 单纯的图形数据组织方法与单纯的表格数据组织方法,谁也不会混淆。现行GIS相关行业的非地理属性数据的组织方法,笔者不敢苟同。绝大多数应用开发人员,都将它们整合成结构严谨的表格记录,并在表格数据库中进行相关的查询、统计。表面看来,似乎符合这些属性数据的管理模式。在未有计算机图形处理技术以前,这些属性数据无一例外地集中存贮在表格簿册之中。但这是不得已而为之。它们本该分散标注在图形符号的背后,只是在手工绘图阶段,根本无法实现。在计算机图形技术日臻完善的今天,可以利用隐含显示、透明叠加等计算机图形处理技术,方便准确地将属性记录标注在图形符号背后,直观形象地进行查询统计,应用效果如同“看图识字”。那只是还非地理属性数据以本来面目,从本质上讲,它们本来就属于图形数据,并非一般意义上的表格数据。它们的组织方法如同绘图一样,必须将一条条属性记录(类似于几何实体),分散标注在它们本该出现的位置。方便灵活的分散标注过程只是人机对话的表面形式,集中存贮仍是属性数据计算机内部结构。对编程人员来讲,面对的仍是整齐划一的DXF格式的数据表格,这与普通表格数据没有两样(实际上DXF格式数据只是应用开发人员的数据组码,低层的数据代码更为整齐划一,但这是专业级开发商面对的数据格式)。对具体应用人员来讲,直观形象地进行查询统计,是他们最大的愿望。
4. 图形编码法 普通表格数据库中的数字编码,我们已经运用得驾轻就熟,对图形编码[1]可能还比较陌生。但“信息技术工作者,逐步意识到用地理位置来检索数据,是组织和使用数字式数据的基本方法”[2]。讲得通俗点,使用图形编码是组织和运用图形数据(包括非地理属性数据)的基本方法。所谓图形编码法,就是以图形符号为基本工程语言,依照行业设计规范,绘制或标注图符、属性的全过程,就是图形编码法。简而言之,绘图即编码。 图形编码在未有计算机图形处理技术以前就已存在,手工绘图的全过程,运用的就是图形编码法,但使用范围局限于狭义的图形符号。随着计算机技术的迅猛发展,图形编码的使用范围早已超出狭义的制图设计过程。司空见惯的条形码技术,就是典型的图形编码在表格数据库中的具体应用。DOS操作系统与Windows操作系统最本质的区别,前者采用的是数字编码命令体系,后者采用是图形编码命令体系。 遗憾的是,由于不了解非地理属性数据的实质就是图形数据,没有认识到绘图标注过程就是编码过程,也可能是关系型数据库技术过于流行,GIS相关行业的程序设计人员,都将非地理属性数据分门别类,集中存贮在内置或外挂的关系型数据库中,并人为添加一条编码字段,进行日常的查询统计。这从数学原理上讲是不成立的,简单的图形符号,比如条形码,尚能用一串数码来描述;复杂的图形符号及其相互间的逻辑关系,根本无法用数码来表示,否则就不存在各行业的工程设计语言。实际应用当中,非地理属性数据在关系型数据库中的查询统计效果,差强人意,操作人员始终处在云里雾里。更为烦恼的是,管理人员为了维护程序设计人员外加的编码体系,费尽心机,但始终不得要领。非地理属性数据的编码字典,就是管理人员熟知的行业设计规范。程序设计人员必须首先掌握GIS及相关行业的工程设计规范,然后才能进行应用系统的组织、设计。 非地理属性数据采用图形编码法,才能满足数据模块化设计的原则。GIS相关行业的基本数据模块,就是每张专业图符(属性)地理布置图,它们是由不同类型的图符实体,依据各自的行业规范,准确连接而成的、可以独立使用的基本数据模块。这在关系型表格数据库中是无法实现的,表格数据库采用的是分门别类方法,不同类型的属性数据无法整合在同一表格簿册中。这既是它的优点,也是它的不足。数据处理技术并非只有关系型数据库一种,程序设计人员首先考虑的就是根据不同行业数据特性,选择不同的数据处理技术。
5. GIS应用实例 图例是笔者利用最普通的ACAD(R14)作为GIS平台(Autodesk公司提供专业GIS平台,如AutoCAD Map、MapGuide等系列),引用当地最常用的宁波独立坐标系,依据图形编码法,准确绘制的配网地理接线图。没有任何地理背景,需要时可以随时叠加任何已有的或者今后再版的地理分幅图。没有外挂任何关系型数据库(ACAD支持多种关系型数据库),你用鼠标就可直接点取任一电气设备的全部属性参数。为了保持画面的清晰,只显示一、二项属性参数,其余均被隐含在图形符号的背后。你当然可以根据不同的统计口径,编制小段管理程序,汇总统计各种参数,编程过程并不复杂。应用人员几乎可以不经任何培训,就能上机查询,真正体现“所见即所得”设计目标。 根据模块化设计原则,剥离了海量级地理背景图,配网地理接线图也是按馈线分别存贮在指定的硬盘目录,需要时逐一调用,这样的GIS应用模型可以在P/100/40M普通微机上流畅运行。采用更高档的系统机型,选择更专业的GIS平台,应该根据系统的综合性能价格比,由用户作出最终抉择。作为程序设计人员,必须确保信息处理的数学模型科学规范,维护运行的人机界面简单明了。
|