Raster-Datenstrukturen und Speichermodelle
Bild- und Rasterdaten werden normalerweise in ihrer ursprünglichen Form gespeichert. In der Regel bearbeiten Sie keine einzelnen Pixelwerte, wie beispielsweise bei einem Feature in einem Vektor-Dataset. Häufig verarbeiten Sie diese Daten, um neue Formen zu erstellen, die direkt (on-the-fly) verarbeitet werden oder als eine andere Version gespeichert werden können. Diese Datasets und daraus bestehende Sammlungen sind häufig sehr groß, sodass eine gute Verwaltungsfunktion unumgänglich ist – ArcGIS ist dafür konzipiert.
Es gibt drei Methoden zum Speichern von Bild- und Raster-Daten: als Dateien in einem Dateisystem, innerhalb einer Geodatabase oder durch Verwalten in der Geodatabase, aber Speichern in einem Dateisystem. Diese Entscheidung betrifft auch das Speichern aller Daten in einem einzelnen Dataset oder in einem Katalog mit potenziell vielen Datasets. Wenn Sie die Daten in einem Dateisystem speichern, dann speichern Sie Raster-Datasets, während in einer Geodatabase entweder Raster-Datasets oder Mosaik-Datasets gespeichert werden können. Eine dritte Geodatabase-Option ist der Raster-Katalog. Dieser wird hier nicht erläutert, da er durch das Mosaik-Dataset ersetzt wurde, das über ein Vielfaches an Funktionen und Verwendungszwecken verfügt.
Raster-Datasets
Die meisten Bild- und Rasterdaten (wie beispielsweise ein Orthofotos oder DEM) werden als Raster-Dataset zur Verfügung gestellt. Der Begriff "Raster-Dataset" verweist auf ein Raster-Datenmodell, das auf einer Festplatte oder in einer Geodatabase gespeichert wird. Dabei handelt es sich um das einfachste Raster-Datenspeichermodell, das als Grundlage für weitere Datasets dient. Raster-Datasets werden von Mosaik-Datasets verwaltet. Weiterhin handelt es sich auch um die Ausgabe von zahlreichen Geoverarbeitungswerkzeugen, die Raster-Daten verarbeiten. Im Folgenden sehen Sie ein Beispiel für ein Raster-Dataset.
Ein Raster-Dataset ist ein beliebiges gültiges Raster-Format, das in einem oder mehreren Bändern organisiert ist. Jedes Band besteht aus einem Bereich von Pixeln (Zellen), und jedes Pixel weist einen Wert auf. Ein Raster-Dataset weist mindestens ein Band auf. ArcGIS unterstützt mehr als 70 verschiedene Dateiformate für Raster-Datasets, darunter TIFF, JPEG 2000, Esri Grid und MrSid.
Weitere Informationen zu den unterstützten Dateiformaten für Raster-Datasets
Mosaik-Datasets
Ein Mosaik-Dataset ist eine Sammlung von Raster-Datasets (Bildern), die als Katalog gespeichert und angezeigt oder als einzelnes mosaikiertes Bild oder einzelne Bilder (Raster) aufgerufen werden. Diese Sammlungen können sehr groß sein – in Bezug auf die gesamte Dateigröße und auf die Anzahl der Datasets. Die Raster-Datasets in einem Mosaik-Dataset können im nativen Format auf dem Datenträger bleiben oder in der Geodatabase vorhanden sein. Die Metadaten können innerhalb des Raster-Datensatzes sowie als Attribute in der Attributtabelle verwaltet werden. Durch das Speichern von Metadaten als Attribute können Parameter, etwa Daten zur Sensorausrichtung, mühelos verwaltet werden. Zudem sind so schnelle Abfragen und die entsprechende Auswahl möglich.
Die Daten in einem Mosaik-Dataset müssen nicht benachbart oder überlappend sein, sondern können als nicht verbundene, diskontinuierliche Datasets vorhanden sein. Beispielsweise können Sie über Bilder verfügen, die eine Fläche komplett abdecken, oder über viele Bildstreifen, die zusammen kein durchgehendes Bild ergeben (z. B. entlang von Pipelines).
Die Daten können sogar vollständig oder teilweise überlappen, jedoch zu unterschiedlichen Zeiten aufgenommen worden sein. Mosaik-Datasets eignen sich ideal zum Speichern von Zeitdaten. Sie können die benötigten Bilder anhand der Zeit- oder Datumsangaben aus dem Mosaik-Dataset abrufen und mit einer Mosaik-Methode das mosaikierte Bild abhängig von einem Zeit- oder Datumsattribut anzeigen.
Mosaik-Datasets sind nicht auf einen bestimmten Raster-Datentyp beschränkt. Sie können Raster-Daten in verschiedenen Projektionen, Auflösungen, Pixeltiefen und mit einer anderen Anzahl von Bändern hinzufügen. Übersichten (wie Pyramiden) können für den gesamten Datenbestand generiert werden. Dies ermöglicht eine schnellere Ansicht der Daten und eine einfache Bereitstellung der Datasets. Es gibt auch viele weitere Ansichtseigenschaften, z. B. das Festlegen einer Mosaikierungsmethode, die diese Datasets in vielen Fällen eindeutig und funktional werden lässt. Sie können ein Mosaik-Dataset auch auf Grundlage der räumlichen und nicht räumlichen Abfragebeschränkungen abrufen. Die Ergebnisse der Abfrage können aus einer Reihe von Bildern bestehen, die einzeln verarbeitet werden können, oder aus einem dynamisch generierten, mosaikierten Bild.
Neben Raster-Daten können Sie auch LIDAR-Daten auf die gleiche Weise wie Raster-Datasets und auch zusammen mit Raster-Datasets in einem Mosaik-Dataset speichern und verwalten. Die LIDAR-Daten können im Dateisystem als LAS-Dateien oder LAS-Datasets oder in einer Geodatabase als Terrain-Datasets gespeichert werden.
Vergleichen von Raster-Datenspeichermodellen
Das einzelne Speichern der Raster-Datasets ist häufig am besten geeignet, wenn die Datasets nicht aneinander grenzen oder wenn die Datasets nur selten für das gleiche Projekt verwendet werden. Das gemeinsame Mosaikieren der Eingaben zur Bildung einer einzigen großen Ausdehnung von Raster-Daten eignet sich für viele Anwendungen, doch kann aus einem der folgenden Gründe ein Mosaik-Dataset erwünscht sein:
- Die Ausdehnungen der Raster-Datasets überlappen sich teilweise oder vollständig und Sie möchten die gemeinsamen Flächen beibehalten.
- Die Raster-Datasets stellen eine Objektgruppe von Beobachtungen desselben Bereichs zu unterschiedlichen Zeiten einer Zeitserie dar.
- Sie müssen nicht die gesamte Fläche gleichzeitig anzeigen; wenn jedoch die gesamte Fläche zu sehen sein muss, verwenden Sie ein Mosaik-Dataset.
- Sie möchten eine Reihe von Bildern als integrierte Gruppe verwalten, deren jeweilige Zustände jedoch beibehalten.
- Sie möchten zusätzliche Attributspalten für die einzelnen Bilder aufzeichnen und verwalten.
Vergleich von Raster-Datenspeichermodellen
Raster-Dataset | Mosaik-Dataset | |
---|---|---|
Beschreibung | Ein einzelnes Bild eines Objekts oder ein nahtloses Bild, das einen räumlich zusammenhängenden Bereich abdeckt. Dabei kann es sich um ein einzelnes Originalbild oder um das Ergebnis des Anhängens (Mosaikierens) vieler Bilder handeln. | Eine als Katalog gespeicherte Gruppe von Raster-Datasets, mit der Sie Raster-Daten und LIDAR-Daten speichern, verwalten, anzeigen und abfragen können. Die Anzeige erfolgt als Mosaik-Bild, Sie können jedoch auf jedes einzelne Dataset in der Gruppe zugreifen. |
Speicher | Als Datei auf einer Festplatte oder in einer Geodatabase. | Innerhalb einer Geodatabase, Sie können jedoch eine Referenz als Datei auf der Festplatte speichern. |
Karten-Layer | Ein Karten-Layer. | Ein Karten-Layer. |
Homogene oder heterogene Daten | Homogene Daten: übereinstimmende Formate, Datentypen und Dateien. | Heterogene Daten: mehrere Formate, Datentypen, Dateigrößen und Koordinatensysteme. |
Metadaten | Werden einmal gespeichert und auf das gesamte Dataset angewendet. | Können im Raster-Datensatz sowie als Attribute in der Attributtabelle gespeichert werden. |
Reduzierte Datasets | Eine einzelne Pyramide für das gesamte Raster-Dataset. | Pyramiden für jedes Raster-Dataset sowie Übersichten (z. B. eine Pyramide) für die ganze Sammlung. |
Geoverarbeitung und Bildanalyse |
|
|
Vorteile |
|
|
Nachteile | Raster-Datasets für File- und Personal-Geodatabases werden langsamer aktualisiert, da die gesamte Datei neu geschrieben werden muss. | Das Erstellen von Übersichten nimmt einige Zeit in Anspruch. |
Bereitstellung | Kann direkt als Image-Service bereitgestellt werden. | Kann direkt als Image-Service bereitgestellt werden. |
Empfehlungen | Verwenden Sie Raster-Datasets, wenn Überlappungen zwischen mosaikierten Bildern nicht beibehalten werden müssen und wenn große Mengen an Raster-Daten angezeigt werden sollen. | Zur Verwaltung und Visualisierung von Raster- und LIDAR-Daten empfiehlt sich ein Mosaik-Dataset. Geeignet für multidimensionale Daten, Abfragen, das Speichern von Metadaten sowie überlappende Daten und bietet eine gute hybride Lösung. |
Raster-Datenspeicherung in der Geodatabase
Speichern Sie Raster-Daten in der Geodatabase, wenn Sie Raster verwalten, Verhalten hinzufügen und das Schema steuern möchten, wenn Sie einen genau definierten Satz von Raster-Datasets im DBMS verwalten möchten und wenn es für Sie möglich sein muss, den gesamten Inhalt in einer Datenarchitektur zu verwalten. Es sind drei Haupttypen von Geodatabases vorhanden: Enterprise-, Personal- und File-Geodatabases.
Die Enterprise-Geodatabase verwendet ArcSDE und kann mehrere Vorgänge in seinem DBMS unterstützen. File-Geodatabases (wie die Personal-Geodatabase) sind für Einzelbenutzer konzipiert und bieten keine Unterstützung für Versionierung. Sie werden im Dateisystemverzeichnis gespeichert und erfordern für den Zugriff daher kein Kennwort. Für die File-Geodatabases und Enterprise-Geodatabases gilt dasselbe Basisspeicherschema.
Vergleich der Raster-Speicherung in File-, Enterprise- und Personal-Geodatabases
Merkmal der Raster-Speicherung | File-Geodatabase | Enterprise-Geodatabase | Personal-Geodatabase |
---|---|---|---|
Größeneinschränkung | 1 Terabyte (TB) pro Raster-Dataset |
Unbegrenzt. Die Einschränkung ist von DBMS-Einschränkungen abhängig. | 2 Gigabyte (GB) pro Geodatabase (diese Einschränkung gilt für die Tabellengröße, nicht für die Größe des Raster-Datasets) |
Dateiformat für Raster-Dataset | Raster-Dataset für File-Geodatabase |
ArcSDE-Raster-Dataset | ERDAS IMAGINE, JPEG oder JPEG 2000 |
Speicher |
|
|
|
Im Dateisystem gespeichert |
In einem RDBMS gespeichert | In Microsoft Access gespeichert | |
Komprimierung | LZ77, JPEG, JPEG 2000 oder "Kein" |
LZ77, JPEG, JPEG 2000 oder "Kein" | LZ77, JPEG, JPEG 2000 oder "Kein" |
Pyramiden | Unterstützt partielles Erstellen von Pyramiden |
Unterstützt partielles Erstellen von Pyramiden | Erstellt gesamte Pyramide neu |
Mosaikieren | Ermöglicht beim Mosaikieren das Anhängen an ein Raster-Dataset |
Ermöglicht beim Mosaikieren das Anhängen an ein Raster-Dataset | Schreibt bei jedem Mosaikieren in ein Raster-Dataset ein neues Dataset |
Aktualisieren | Ermöglicht inkrementelle Aktualisierung |
Ermöglicht inkrementelle Aktualisierung | nicht zutreffend |
Anzahl an Benutzern | Einzelbenutzer und kleine Arbeitsgruppen; einige Benutzer mit Lesezugriff und ein Benutzer mit Schreibzugriff |
Mehrere Benutzer; viele Benutzer mit Lesezugriff und viele Benutzer mit Schreibzugriff | Einzelbenutzer und kleine Arbeitsgruppen; einige Benutzer mit Lesezugriff und ein Benutzer mit Schreibzugriff |
File-Geodatabase
Das Speichermodell der File-Geodatabases ist ein Hybrid aus der Enterprise-Geodatabase und der Personal-Geodatabase, wo verwaltete Raster-Daten dem Speichermodell der Enterprise-Geodatabase folgen und nicht verwaltete Raster-Daten dem Speichermodell der Personal-Geodatabase folgen. File-Geodatabases ähneln auch Personal-Geodatabases, da sie für die Bearbeitung durch Einzelbenutzer konzipiert sind und keine Unterstützung für die Versionierung bieten. Sie werden im Dateisystemverzeichnis gespeichert und erfordern für den Zugriff daher kein Kennwort. Für die File-Geodatabases und Enterprise-Geodatabases gilt dasselbe Basisspeicherschema.
Bei Verwendung einer File-Geodatabase statt einer Personal-Geodatabase ergeben sich mehrere Vorteile. Wie bei der Enterprise-Geodatabase werden in der File-Geodatabase Daten in Blöcken gespeichert. Dies ermöglicht einen effizienteren Datenzugriff, insbesondere während der Mosaikierung. Bei der Mosaikierung von Daten in einer File-Geodatabase werden nur überlappende Blöcke aktualisiert. Wenn kein überlappender Block vorhanden ist, wird ein neuer Block eingefügt. Teilblöcke werden mit NoData-Pixeln aufgefüllt. Außerdem setzt das File-Geodatabase (und Enterprise)-Speichermodell Teilpyramidenaktualisierungen ein, die Zeit sparen. Da die Datenstruktur der File-Geodatabase mit der von Enterprise-Geodatabases identisch ist, lassen sich Daten zwischen der File-Geodatabase und der Enterprise-Geodatabase schnell kopieren und einfügen.
Die File-Geodatabase akzeptiert auch Konfigurationsschlüsselwörter, aber im Gegensatz zur Enterprise-Geodatabase verfügen die Konfigurationsschlüsselwörter über einen standardmäßigen vordefinierten Wert. Weitere Informationen zu Konfigurationsschlüsselwörtern finden Sie unter Konfigurationsschlüsselwörter für File-Geodatabases.
Enterprise-Geodatabase
Wenn in der Enterprise-Geodatabase Raster-Daten gespeichert werden, sind unternehmensweite Funktionen, wie Sicherheit, Mehrbenutzerzugriff, gemeinsame Verwendung von Daten usw. verfügbar. Hier die drei Hauptgründe für das Speichern von Raster-Daten in einer Enterprise-Geodatabase:
- Sie wird nicht regelmäßig aktualisiert (etwa alle zwei oder drei Jahre oder länger).
- Es wird schreibgeschützt darauf zugegriffen (z. B. bei der Verwendung einer Grundkarte unter Vektordaten).
- Es gibt Hunderte von Benutzern (oder mehr), die sie als Grundkarte aufrufen.
Aufgrund der Speicherstruktur werden die Raster-Daten gewissermaßen von der Geodatabase verwaltet oder vollständig gesteuert. In Enterprise-Geodatabases werden sämtliche Raster-Informationen (Pixel, Raumbezüge, alle verbundenen Tabellen sowie weitere Metadaten) für Raster-Datasets und Raster-Attribute stets in der zugehörigen relationalen Datenbank gespeichert. Dies bedeutet, dass alle eingegebenen Raster-Information in die Datenbank geladen werden, was als Formatkonvertierung aufgefasst werden kann.
Die Enterprise-Geodatabase kachelt die Bänder entsprechend der benutzerdefinierten Bemaßung gleichmäßig in Pixelblöcke (Standardwert ist 128 x 128). Durch das Kacheln der Raster-Banddaten können die Raster-Daten effizient gespeichert und abgerufen werden. Die Pyramideninformationen werden entsprechend einer abnehmenden Auflösung gespeichert. Die Höhe der Pyramide wird durch die Anzahl der von der Anwendung oder dem Benutzer angegebenen Ebenen bestimmt.
In der Raster-Blocktabelle (die größte Tabelle, in der die eigentlichen Pixelinformationen und Pyramiden gespeichert werden) wird eine Zeile pro Block (Kachel) pro Band in einem Raster-Dataset und pro Pyramidenebene gespeichert. Angenommen, ein Raster mit drei Bändern ist in 12 Blöcke unterteilt, in denen noch keine Pyramiden erstellt wurden. Dann enthält das Raster 36 Zeilen in der BLK-Tabelle: 12 Blöcke pro Band. Die Spalte mit den Pixeldaten für den Block ist ein BLOB (Binary Large Object).
Informationen zur Raster-Datenspeicherung in diesen DBMS
DBMS | Datenspeichermodell | |
---|---|---|
DB2 | ||
Informix | ||
Oracle | ||
PostgreSQL | ||
SQL Server |
Personal-Geodatabase
In einer Personal-Geodatabase wird das Raster-Dataset in eine IMAGINE-Datei (.img) konvertiert und in einem IDB-Ordner (Image Database, Bilddatenbank) gespeichert. Der IDB-Dateiordner befindet sich im Verzeichnis neben der Personal-Geodatabase. Wenn Sie ein Raster-Dataset löschen, wird das Raster im IDB-Ordner dauerhaft gelöscht.
Wenn Sie ein Mosaik-Dataset in einer Personal-Geodatabase speichern, stellt das Mosaik-Dataset eine Tabelle dar, die auf die darin enthaltenen gespeicherten Raster-Datasets zeigt. In einem Mosaik-Dataset werden die Raster-Datasets als nicht verwaltet gespeichert, deshalb enthalten sie den Pfad zum Speicherort der Raster-Datasets. Jede Zeile in der Business-Tabelle zeigt auf das gespeicherte Raster-Dataset. Die Vorgänge in einem Mosaik-Dataset wirken sich nicht auf die gespeicherten Raster-Dateien aus. Folglich werden beim Löschen von Raster-Datasets in einem Mosaik-Dataset die Raster-Datasets lediglich aus dem Mosaik-Dataset entfernt, aber nicht von der Festplatte gelöscht.
Beim Speichern eines Raster-Datasets als Attribut wird das Raster als IMG-Datei an einem vom System festgelegten Speicherort oder an dem Speicherort laut Dateisystem gespeichert, je nachdem, ob das Raster-Dataset verwaltet ist oder nicht.
Komprimierung, Pyramiden und Kachelgröße
Beim Speichern und Verwalten von Raster-Daten sind auch weitere Speicherstrukturen zu berücksichtigen, einschließlich Komprimierung, reduzierte Datasets (Pyramiden und Übersichten) und Kachelgröße.
Komprimierung
Es gibt zwei Arten von Komprimierung: verlustfrei und verlustbehaftet. Eine verlustfreie Komprimierungsmethode bedeutet, dass die Pixelwerte im Raster-Dataset nicht geändert werden, während die Komprimierung mit Verlusten zu Änderungen der Pixelwerte führt. Die Komprimierungsstufe hängt vom Typ der Pixeldaten ab, d. h. je homogener das Bild, desto höher die Komprimierungsrate. Sie sollten Daten, die für die Analyse und nicht nur für die Anzeige verwendet werden, mit einer verlustfreien Komprimierung speichern. Der Hauptvorteil der Datenkomprimierung besteht im geringeren Speicherplatz, wobei die tatsächliche Einsparung von der Komprimierungsmethode und der Redundanz der Daten abhängt. Ein zusätzlicher Nutzen ist die entscheidend verbesserte Performance, da vom Server weniger Datenpakete übertragen werden. Wenn Sie zum Beispiel auf Raster-Daten über ein Netzwerk mit geringer Bandbreite zugreifen, wird die Performance durch die Komprimierung u. U. deutlich gesteigert, da die Menge der zu übertragenden Daten deutlich reduziert wird, sodass große, nahtlose Raster-Datasets gespeichert und dem Client schnell zur Anzeige bereitgestellt werden können.
Weitere Informationen zur Raster-Komprimierung
Mosaik-Datasets weisen ebenfalls Komprimierung auf. Diese erfolgt nicht beim Speichern des verwalteten Raster-Datasets, sondern die Komprimierung wird bei der Anzeige auf das erzeugte Bild angewendet. Dies hilft außerdem beim Zugriff auf Daten über das Netzwerk, indem die Größe der übertragenen Datei reduziert wird.
Weitere Informationen zur Eigenschaft Zulässige Komprimierungsmethode
Reduzierte Datasets
Reduzierte Datasets sind Raster, die aus den Originaldaten entweder eines Raster-Datasets oder eines Mosaik-Datasets erstellt wurden. Sie werden erzeugt, um die Anzeigegeschwindigkeit und Performance zu verbessern. Wenn sie für Raster-Datasets erstellt werden, werden sie als Pyramiden bezeichnet, und wenn sie für Mosaik-Datasets erstellt werden, werden sie als Übersichten bezeichnet.
Pyramiden und Übersichten
Pyramiden | Übersichten | |
---|---|---|
Erstellt für | Raster-Datasets | Mosaik-Datasets |
Format | Schreibt .ovr-Dateien – mit wenigen Ausnahmen. Liest Pyramiden, die extern als .ovr- oder .rrd-Datei oder intern gespeichert wurden. | Schreibt .tif-Dateien. |
Speicher | In einer einzelnen Datei, die sich im Allgemeinen neben dem Quell-Raster-Dataset mit demselben Namen befindet. | Standardmäßig in einem Ordner neben der Geodatabase mit der Erweiterung *.overviews oder intern für ArcSDE. Der Speicherort kann angepasst werden. |
Speichergröße | 2 bis 10 % (im Vergleich zu den Original-Raster-Datasets) | |
Reduktionsfaktor | 2 | 3 |
Ausdehnung |
|
|
Optionen beim Erstellen |
|
|
Kachelgröße
In einer Enterprise-Geodatabase werden Raster-Daten in einer Struktur gespeichert, in der die Daten gekachelt, indiziert, mit Pyramiden versehen und zumeist komprimiert sind. Aufgrund der Kachelung, Indizierung und Pyramidenerstellung werden jedes Mal, wenn die Raster-Daten abgefragt werden, statt des gesamten Datasets nur die Kacheln zurückgegeben, die für die Ausdehnung und Auflösung der Abfrage nötig sind. Die Kachelgröße bestimmt die Anzahl der Pixel, die Sie in jedem Datenbank-Speicherblock speichern möchten. Diese ist als eine Anzahl von Pixeln in XY-Richtung festgelegt. Die Standard-Kachelgröße beträgt 128 x 128 Pixel, und bei den meisten Anwendungen wird bei einer Abweichung von diesen Standardwerten keine Gewährleistung übernommen. In einer Enterprise-Geodatabase werden die Kacheln von Raster-Daten komprimiert, bevor sie in der Geodatabase gespeichert werden.