当前位置:文档之家› shp文件讲解

shp文件讲解

shp文件格式内部结构ESRI shp文件格式内部结构(2008-09-01 15:18:24)标签:杂谈Shape文件是ArcGIS的基础文件类型,存储了非拓扑几何和属性信息。

Shape文件支持点、线、区域的几何特征,由于不需要处理拓扑数据结构文件头,在编辑等方面具有更快的处理速度。

本文通过对ESR I公司发布的原版资料ESRI Shapefile Technical Descrip tion的翻译解读,剖析Shape文件的结构,利用VB写出直接生成Shape文件的代码。

2 Shape文件结构2. 1 Shape文件的文件构成Shape文件由3 个文件构成: 主文件、索引文件、数据文件。

其中主文件的后缀必须是. shp;索引文件的后缀必须是. shx;数据文件的后缀必须是. dbf,这3个文件共同组成Shape文件。

各文件中存储的数据相互联系又各有区别。

主文件中是Shape的位置信息;索引文件是对主文件的索引,指出主文件中记录在文件中的位置信息;数据文件中包括Shape的具体位置和属性信息。

2. 2 . shp文件的结构. shp文件由文件头和文件记录构成(图1) ,其中文件大部分结构见表1。

文件头记录头记录内容记录头记录内容记录头记录内容记录头记录内容······记录头记录内容图1 . shp文件的结构其中Shape类型是ArcGIS定义的图形类型,具体可以参考Shapefile Technical Descrip tion。

每个记录由记录头、记录内容两部分组成。

记录头部分由两部分组成: 0~3字节是长整型的记录数, 4~7字节是记录内容的长度。

文件头中的文件长度与记录头中的记录长度均以字( 2 字节)为单位。

记录内容对不同的Shape类型定义不一样,但原理是相同的。

因篇幅所限,这里以记录点(point)类型为例进行说明。

点( point)类型的每个记录的记录内容为: 0~3字节长整型的Shape类型、4~11字节双精度的X坐标、12~19字节双精度的Y坐标。

所以记录头中的记录长度就是2 + 4 + 4 = 10个字长,文件头中文件长度就是50 (文件头长) +总记录数3 14。

表1 . shp文件的文件头结构位置字段名称数据数据类型字节顺序0 文件代码9994 32位整型big - endian4 保留0 32位整型big - endian8 保留0 32位整型big - endian12 保留0 32位整型big - endian16 保留0 32位整型big - endian20 保留0 32位整型big - endian24 文件长度文件长度32位整型big - endian28 版本1000 32位整型little - endian32 Shape类型Shape类型32位整型little - endian36 范围框最小X值双精度little - endian44 范围框最小Y值双精度little - endian52 范围框最大X值双精度little - endian60 范围框最大Y值双精度little - endian68 范围框最小Z值双精度little - endian76 范围框最大Z值双精度little - endian84 范围框最小M值双精度little - endian92 范围框最大M值双精度little - endian2. 3 . shx文件结构. shx文件的结构与图1所示的. shp 文件在总体结构上相同,但内容有所区别。

文件头的定义与1shp一致,但文件长度指的是. shx的文件长度,所以这一项的数值是不同的。

每1 个记录没有记录头,内容有2部分组成: 0~3字节表示记录存储位置,以离文件开始处的字数来表示,即50 +记录数3 14;记录长度,在点(point)类型中为10。

2.4 . dbf文件结构有关描述. dbf文件是Shape文件中的数据存储文件,其格式是dbase iv的数据文件,具体的格式说明在许多网站都有说明,但在Shape 文件中的. dbf有一些特殊的规定。

①前缀必须与. shp和. shx文件一样。

②每1个图形特征必须在1个记录内。

③记录的顺序必须与. shp中的记录顺序一样。

④在. dbf文件头中的年份值是以1900年为基础的,即其数值表示年份与1900的差。

3 用VB编写直接写Shape文件的方法及代码在编写程序时要特别注意的是在一般的机器中写文件的字节顺序是little - endian方式,即小的在低地址,大的在高地址;而big - endian正好相反,所以对big - endian方式的要人为加以转换,本文编写了little2big( )函来实现。

下面是以点类型为例用VB写Shape文件的代码: txt2 shape ( ) 。

Function little2big ( x1 As Long, myt1 As Byte,myt2 As Byte, myt3 As Byte, myt4 As Byte)myt1 = Int( x1 / (2 ^ 24) )myt2 = Int ( ( x1 - ( Int ( x1 / (2 ^24) ) ) 3 2 ^24) / (2 ^ 16) )myt3 = Int ( ( x1 - myt1 3 2 ^24 - myt2 3 2^ 16) / (2 ^ 8) )myt4 = x1 - myt1 3 2 ^ 24 - myt2 3 2 ^ 16- myt3 3 2 ^ 8End FunctionPrivate Sub txt2 shape ( )Dim jdattribute (0 To 100) AsDouble‘定义点位置的xDim wdattribute (0 To 100) As Double‘定义点位置的yDim zmattribute (0 To 100) As String‘定义点位置名称,如站名Dim ylattribute (0 To 100) AsDouble‘存点的属性值,如站点雨量Dim filelen As Long‘文件长度Dim records As Long‘记录数Dim xmin AsDouble‘最小x值Dim xmax AsDouble‘最大x值Dim ymin AsDouble‘最小y值Dim ymax AsDouble‘最大y值Dim zm AsVariant‘以下为临时变量Dim temp As StringDim lin0 As LongDim dblin0 AsDoubleDim myt1 AsByte‘用于传递转换到big形式的字节临时变量Dim myt2 As ByteDim myt3 As ByteDim myt4 As Byte为了减小篇幅,本文省略信息的读入过程,即认为这些信息已经读到zmattribute ( ) 、jdattribute ( ) 、wdattribute ( ) 、ylattribute ( ) 、records等数组、变量,直接从写文件开始。

Open (workfile + " shp " ) For Binary As #5打开文件,workfile为文件名前缀,下同′开始写文件头filelen = records 3 14 + 50‘算出文件长度Call little2big ( 9994, myt1, myt2, myt3, myt4)‘将9994转换成big形式。

Put #5, , myt1′写9994的4 个字节Put #5, , myt2Put #5, , myt3Put #5, , myt4lin0 = 0For i = 1 To 5Put #5, , lin0′写入保留项NextCall little2big ( filelen, myt1, myt2, myt3,myt4) ′文件长转到big形式Put #5, , myt1′写入文件长度转成big后的4 个字节Put #5, , myt2Put #5, , myt3Put #5, , myt4lin0 = 1000Put #5, , lin0′version = 1000lin0 = 1Put #5, , lin0′图形类型shape type开’ 始求xmin, xmax, ymin, ymax。

因比较大小比较容易实现,这里略去该部分代码,而认为xmin、xmax、ymin、ymax已经得到,下面依次写入xmin、ym2in、xmax、ymax。

Put #5, , xmin : Put #5, , ymin : Put #5, ,xmax : Put #5, , ymax dblin0 = 0‘本例zmin、zmax、mmin、mmax为0,下面依次写入Put #5, , dblin0 : Put #5, , dblin0: Put #5, ,dblin0 : Put #5, , dblin0 ′Mmax = 0For i = 0 To records $ 1‘记录数转换成big形式lin0 = i + 1Call little2big ( lin0, myt1, myt2, myt3, myt4 )‘记录数转换成big后的4个字节,下面写入Put #5, , myt1: Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4lin0 = 10‘记录内容长度为10Call little2big ( lin0, myt1, myt2, myt3, myt4) ’记录内容长度转换成big后的4个字节Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3: Put #5, , myt4 lin0 = 1 ’shapetype = 1 : Put #5, , lin0‘写入图形类型shapetype Put #5, , jdattribute ( i) : Put #5, , wdat2tribute ( i) ‘写入位置信息经度和纬度NextClose (5)写’ . shx = = = = = =文件头Open (workfile + " shx" ) ForB inaryAs #5写’ 文件头,与. shp 一样,这里略去。

要区别的是文件长头长+记录数3 4 For i = 0 To records - 1lin0 = 50 + 14 3 i ′求记录位置offsetCall little2big( lin0, myt1, myt2, myt3, myt4)Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3 : Put #5, , myt4 lin0 = 10 ′记录内容长度Call little2big ( lin0, myt1, myt2, myt3,myt4)Put #5, , myt1 : Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4 NextClose (5)下面开始写. dbf文件. dbf文件的写入有许多的文章均有说明,但要注意上面2. 4中的几点。

相关主题