海量空间数据库实施策略--矢量数据1

4
分享 2015-11-30
这个系列涉及到的是海量矢量数据库的各个方面,包括入库,管理,效率等各个方面。先从序言开始吧:
序言主要包括以下三个方面:
  • 1. 什么是GDB
  • 2. 什么样子的数据算是海量数据
  • 3. 谁能胜任

先看看什么是GDB,GDB全称为GeoDatabase,即空间数据库,实际就是用来存储,查询,管理空间数据的数据库或者文件。ESRI的产品现在支持以下几方面的存储:
  • A. Personal GDB(Access)
  • B. File GDB
  • C. 关系型数据库

现在的ArcSDE一共支持五种关系型数据库,分别是:

Informix
Oracle
DB2
PostgreSQL
Oracle


然后再看看什么样子的数据算是海量数据,海量数据有一个共同的特点,那就是数据量大,那是不是数据量大的空间数据库都属于海量呢,不一定,下面的表格可以说明一些问题:
我现在有一个图层的数据,其数据量为1Tbytes,但是会有以下几种情况组成这个图层:

一共分为7种情况,Feature的数量分别从500一直到500000000,每个Feature的大小分别从2G到2K,针对这7种类型,其中第一个类型是最容易处理的,最后一种情况是最难处理的。
如对这7种情况的数据分别建立一下空间索引,所耗费的时间的长短一定是第一种情况所耗费的时间最短,最后一种情况所耗费的时间是最长的。
因此我认为第一种情况的数据并不能算作海量数据。
那到底谁能胜任这个海量数据的存储以及管理任务?
 

personal GDB:因为Access数据库的最大存储量只有2G,因此其并不能胜任这个任务。
file GDB: 其没有存储大小的限制,其并发读的效率很高,但是不能同时写,因此并不适合多人进行编辑的业务,有点NoSQL的感觉。


剩下的就是ArcSDE所支持的这5种类型的关系型数据库,除了informix没有进行测试外,其它五种类型的数据库都进行过相关的测试,是可以胜任的。

文章来源:http://blog.csdn.net/liufeng1980423/article/details/6183214

0 个评论

要回复文章请先登录注册