home > GIS > GIS Science >

空間數據庫基礎理論 GIS空間數據處理分析涉及的基本概念

author:zhoulujun    hits:

括空間現象抽象表達 、空間數據模型 、空間數據組織與管理、 空間索引技術 、空間數據查詢、訪問、 時態空間數據庫、 空間數據元數據與空間數據共享、空間數據庫設計 學習筆記

《空間數據庫》課程整理匯總,106篇課程,內容太長,學習中,把一些關鍵點,匯總記下筆記

地理空間

  • GIS中的地理空間(Geo-spatial)是指經過投影變換后,在笛卡爾坐標系中的地球表層特征空間。它是地理空間的抽象表達,是信息世界層面的地理空間。

  • 地理空間由地理空間定位框架及其所連接的地理空間特征實體組成。

  • 地理空間定位框架即大地測量控制,為建立所有地理數據的坐標位置提供通用參考系統,將所有地理要素同平面及高程坐標系連接。

  • 地理空間特征實體則為具有形狀、屬性和時序性的空間對象。

空間數據

  • 空間數據是對空間事物的描述,空間數據(Spatial Data)實質上就是指以地球表面空間位置為參照,用來描述空間實體的位置、形狀、大小及其分布特征諸多方面信息的數據。

  • 空間數據(Spatial Data)是一種帶有空間坐標的數據,包括文字、數字、圖形、影像、聲音等多種方式。

  • 空間數據是對現實世界中空間特征和過程的抽象表達,用來描述現實世界的目標,它記錄地理空間對象的位置、拓撲關系、幾何特征和時間特征。位置特征和拓撲特征是空間數據特有的特征。此外,空間數據還具有定位、定性、時間、空間關系等特性。

空間數據量是巨大的,通常稱海量數據。之所以稱為海量數據,是指它的數據量比一般的通用數據庫要大得多。一個城市地理信息系統的數據量可能達幾十GB,如果考慮影像數據的存貯,可能達幾百個GB。這樣的數據量在其他數據庫中是很少見的。地理信息系統的海量數據,帶來了系統運轉、數據組織與儲存、網絡傳輸等一系列技術困難,自然也給數據管理增加了難度。正因為空間數據量大,所以需要在二維空間上劃分塊或者圖幅,在垂直方向上劃分層來進行組織。

空間數據類型

GIS中常見的空間數據類型如下圖所示:

空間數據庫

傳統意義上的數據庫無論是FoxPRO,還是Oracle、SQL server,它們管理的信息類型主要是文字和數字,對圖形的管理功能則十分薄弱。針對空間數據以文件方式管理的不足,人們開始考慮把空間數據同屬性數據一起存入關系數據庫中,空間數據管理都在朝著集成結構的空間數據庫方向發展,實現數據庫一體化存儲和管理。

空間數據庫既要能處理空間參考對象類型,也要能處理非空間參考對象類型。而如何表示空間或地理現象即空間參考對象的關鍵是其數據模型,數據模型的設計除與應用有關外,還與提供支持模型的基本概念、方法等有密切聯系。空間數據的表示則與計算機表示數據的精度和計算機的存儲空間有關。

目前空間數據倉庫已成為空間數據庫研究的熱點:空間數據聯機分析和空間數據挖掘

GIS空間數據庫的發展歷史 https://malagis.com/the-history-gis-spatial-database.html

空間數據庫的作用

  • 空間數據處理與更新

  • 海量數據存儲與管理

  • 空間分析與決策

  • 空間信息交換與共享

GIS空間數據庫與傳統數據庫差異

1.信息描述差異

(1)在空間數據庫中,數據比較復雜,不僅有與一般數據庫性質相似的地理要素的屬性數據,還有大量的空間數據,即描述地理要素空間分布位置的數據,并且這兩種數據之間具有不可分割的聯系。

(2)空間數據庫是一個復雜的系統,要用數據來描述各種地理要素,尤其是要素的空間位置,其數據量往往很大。空間數據庫中的數據具有豐富的隱含信息,如數字高程模型(DEM或TIN)除了載荷高度信息外,還隱含了地質巖性與構造方面的信息;植物的種類是顯式信息,但植物的類型還隱含了氣候的水平地帶性和垂直地帶性的信息等。

2.數據管理差異

(1)傳統數據庫管理的是不連續的、相關性較小的數字和字符;而空間數據是連續的,具有很強的空間相關性。

(2)傳統數據庫管理的實體類型少,并且實體類型之間通常只有簡單固定的空間關系;而空間數據庫的實體類型繁多,實體類型之間存在著復雜的空間關系,并且能產生新的關系(如拓撲關系)。

(3)地理空間數據存儲操作的對象可能是一維、二維、三維甚至更高維。一方面我們可以把空間數據庫看成是傳統數據庫的擴充,另一方面,空間數據庫突破了傳統的數據庫理論,如將規范關系推向非規范關系。而傳統數據庫系統只要針對簡單對象,無法有效的支持復雜對象(如圖形、圖像)。

(4)地理空間數據的實體類型繁多,不少對象相當復雜,地理空間數據管理技術還必須具有對地理對象(大多為具有復雜結構和內涵的復雜對象)進行模擬和推理的功能。但是,傳統數據庫系統的數據模擬主要針對簡單對象,管理的實體類型較少,因而,無法有效地支持以復雜對象為主體的GIS領域。

(5)空間數據庫有許多與關系數據庫不同的顯著特征。空間數據庫包含了拓撲信息、距離信息、時空信息,通常按復雜的、多維的空間索引結構組織數據,能被特有的空間數據訪問方式所訪問,經常需要空間推理、幾何計算和空間知識表達等技術。

3.數據操作差異

從數據操作的角度,地理空間數據管理中需要進行大量的空間數據操作和查詢,如矢量地圖的剪切、疊加和緩沖區等空間操作、裁剪、合并、影像特征提取、影像分割、影像代數運算、拓撲和相似性查詢等,而傳統數據庫系統只操縱和查詢文字和數字信息,難以適應空間操作。

4.數據更新差異

(1)數據更新周期不同。傳統數據庫的更新頻度較高,而空間數據庫的更新頻度一般是以年度為限。

(2)數據更新的角色不同。空間數據庫更新一般由專人負責,一是因為要保證空間數據的準確性,二是空間數據的更新需要專門的技術。而傳統數據庫的更新可能是任何使用數據庫的人員。

(3)訪問的數據量不同。傳統數據庫每次訪問的數據量較少,而空間數據庫訪問的數據量大,因而空間數據庫要求有很高的網絡帶寬。

(4)數據更新的策略不同。傳統數據庫一般事務控制,而空間數據庫一般允許訪問時間相對滯后的數據,一方面因為空間對象的變化較緩慢;另一方面因為人為因素未能及時更新,但這不影響對先前更新的數據的訪問;再者GIS系統一般是作為決策支持系統出現的,而決策支持系統基本上使用的是歷史數據。

5.服務應用差異

(1)一個空間數據庫的服務和應用范圍相當廣泛。如地理研究、環境保護、土地利用和規劃、資源開發、生態環境、市政管理、交通運輸、稅收、商業、公安等許多領域。

(2)空間數據庫是一個共享或分享式的數據庫。

(3)傳統的關系數據庫中存儲和處理的大都是關系數據。

柵格數據存儲和管理

柵格、影像數據庫采用金字塔結構存放多種空間分辨率的柵格數據,同一分辨率的柵格數據被組織在一個層面(Layer)內,而不同分辨率的柵格數據具有上下的垂直組織關系:越靠近頂層,數據的分辨率越小,數據量也越小,只能反映原始數據的概貌;越靠近底層,數據的分辨率越大,數據量也越大,更能反映原始詳情。

組織形式

(1)縱向分層組織

GIS地圖分層-縱向分層組織

(2)橫向分塊組織

對相同金字塔層、相同波段內的數據按照一定分塊大小進行分塊存儲。Tiles結構(即空間分塊索引結構)是一種比較適合柵格數據處理的存儲方法。其優點體現在以下幾個方面:

  1. 對柵格數據瀏覽顯示時,其屏幕的可見區域只是整個數據中的一個小矩形區域,采用數據分塊管理的方法,就可以減少數據的讀盤時間;

  2. 分塊管理也利于柵格數據的壓縮,因為柵格數據具有局部相關性;

  3. 分塊管理也利于數據庫管理,現在的商用數據庫大多是關系型數據庫,關系型數據庫對數據的管理是基于數據記錄。當采用分塊方式管理柵格數據時,數據分塊可以與數據庫的記錄進行很好的對應,可以很好的利用商用數據庫管理海量柵格數據。

數據分塊的大小(數據塊的行、列值)通常取2的冪次方,具體的大小在選擇時需要考慮以下因素:數據的局部相關程度、壓縮算法、柵格數據類型、柵格數據緩沖區的管理算法、用戶感興趣區域的大小、網絡的傳輸單元等。綜合考慮以上因素,我們一般選用32K或64K大小的分塊。

存儲結構

  • 分層分塊索引

  • 在柵格數據庫中,可同時包含多個柵格數據集和柵格目錄,而柵格數據集既可由柵格數據庫直接管理,也可由柵格目錄組織管理,可根據用戶需求靈活定制。

  • 柵格數據集的物理存儲采用“金字塔層—波段—數據分塊”的多級索引機制進行組織:金字塔層—波段索引表現為柵格數據在垂直方向上多尺度、多波段的組織形式,金字塔層—數據分塊索引表現為柵格數據在水平方向上多分辨率、分塊存儲的組織形式。基于這種多級索引結構,在使用柵格數據進行分析時可快速定位到數據分塊級,有效地提高柵格數據存取速度。

存儲數據檢索

分為網格存儲和二叉樹存儲(KD/KDB/BSP樹等)。各種樹操作,燒腦,等有時間在慢慢啃

空間數據模型的類型

在GIS中與空間信息有關的空間數據模型主要有兩個:基于場(field-based)的空間模型和基于對象(object-based)的模型。

基于場(field-based)的空間模型

把地理空間的事物和現象作為連續的變量或體來看待,表示了在二維或者三維空間中,空間實體的屬性信息被看作是連續變化的數據。例如:

基于場(field-based)的空間模型

基于對象(object-based)的模型

強調了離散對象,將研究的整個地理空間看成一個空間域,地理實體和現象作為獨立的對象分布在該空間域中,根據它們的邊界線以及它們的組成或者與它們相關的其它對象,可以詳細地描述離散對象。

任何現象,無論大小,都可以被確定為一個對象(Object),且假設它可以從概念上與其鄰域現象相分離。在歐氏(Euclidean)空間中主要有點對象、線對象、多邊形對象和體。例如:

基于對象(object-based)的模型

地理信息系統兩種數據類型是通過兩種空間數據結構來實現:柵格( raster )和    矢量(vector)

柵格數據模型是典型的基于域的模型。矢量數據模型是典型的基于對象的空間數據模型。

數字表面模型

數字高程模型(Digital Elevation Model,DEM):以數字的形式按一定結構組織在一起,表示實際地形特征空間分布的數字模型,也是地形形狀大小和起伏的數字描述。DEM的核心是地形表面特征點的三維坐標數據和一套對地表提供連續描述的算法,最基本的DEM是由一系列地面點x,y位置及其相聯系的高程z做組成,用數學函數式表達為z=f(x,y), (x,y)∈DEM所在的區域。

數字地形模型(Digital Terrain Mdel,DTM):用來模擬其他二維表面上連續變化的特征,比如地面景觀的屬性、地面溫度、降水、地球磁力、重力、土地利用、土壤類型等地面特征信息。

數字表面模型



轉載本站文章《空間數據庫基礎理論 GIS空間數據處理分析涉及的基本概念》, 請注明出處:http://www.qsexmk.tw/html/GIS/GIS-Science/8163.html

延伸閱讀: