Raster-Datenstrukturen und Speichermodelle
Bild- und Rasterdaten werden normalerweise in ihrer ursprünglichen Form gespeichert. In der Regel bearbeiten Sie keine einzelnen Pixelwerte, wie beispielsweise bei einem Feature in einem Vektor-Dataset. Häufig verarbeiten Sie diese Daten, um neue Formen zu erstellen, die direkt (on-the-fly) verarbeitet werden oder als eine andere Version gespeichert werden können. Diese Datasets und daraus bestehende Sammlungen sind häufig sehr groß, sodass eine gute Verwaltungsfunktion unumgänglich ist – ArcGIS Desktop ist dafür konzipiert.
Es gibt drei Methoden zum Speichern von Bild- und Raster-Daten: als Dateien in einem Dateisystem, innerhalb einer Geodatabase oder durch Verwalten in der Geodatabase, aber Speichern in einem Dateisystem. Diese Entscheidung betrifft auch das Speichern aller Daten in einem einzelnen Dataset oder in einem Katalog mit potenziell vielen Datasets. Wenn Sie die Daten in einem Dateisystem speichern, dann speichern Sie Raster-Datasets, während in einer Geodatabase entweder Raster-Datasets oder Mosaik-Datasets gespeichert werden können. Eine dritte Geodatabase-Option ist der Raster-Katalog. Dieser wird hier nicht erläutert, da er durch das Mosaik-Dataset ersetzt wurde, das über ein Vielfaches an Funktionen und Verwendungszwecken verfügt.
Raster-Datasets
Die meisten Bild- und Rasterdaten (wie beispielsweise ein Orthofoto oder DEM) werden als Raster-Dataset zur Verfügung gestellt. Der Begriff "Raster-Dataset" verweist auf ein Raster-Datenmodell, das auf einer Festplatte oder in einer Geodatabase gespeichert wird. Dabei handelt es sich um das einfachste Raster-Datenspeichermodell, das als Grundlage für weitere Datasets dient. Raster-Datasets werden von Mosaik-Datasets verwaltet. Weiterhin handelt es sich auch um die Ausgabe von zahlreichen Geoverarbeitungswerkzeugen, die Raster-Daten verarbeiten. Die folgende Abbildung enthält ein Beispiel für ein Raster-Dataset.
Ein Raster-Dataset ist ein beliebiges gültiges Raster-Format, das in einem oder mehreren Bändern organisiert ist. Jedes Band besteht aus einem Bereich von Pixeln (Zellen), und jedes Pixel weist einen Wert auf. Ein Raster-Dataset weist mindestens ein Band auf. ArcGIS Desktop unterstützt mehr als 70 verschiedene Dateiformate für Raster-Datasets, darunter TIFF, JPEG 2000, Esri Grid und MrSid.
Weitere Informationen zu den unterstützten Dateiformaten für Raster-Datasets
Mosaik-Datasets
Ein Mosaik-Dataset ist eine Sammlung von Raster-Datasets (Bildern), die als Katalog gespeichert und angezeigt oder als einzelnes mosaikiertes Bild oder einzelne Bilder (Raster) aufgerufen werden. Diese Sammlungen können sehr groß sein – in Bezug auf die gesamte Dateigröße und auf die Anzahl der Datasets. Die Raster-Datasets in einem Mosaik-Dataset können im nativen Format auf dem Datenträger bleiben oder in der Geodatabase vorhanden sein. Die Metadaten können innerhalb des Raster-Datensatzes sowie als Attribute in der Attributtabelle verwaltet werden. Durch das Speichern von Metadaten als Attribute können Parameter, etwa Daten zur Sensorausrichtung, leichter verwaltet werden. Zudem sind auf diese Weise schnelle Abfragen und die entsprechende Auswahl möglich.
Die Daten in einem Mosaik-Dataset müssen nicht benachbart oder überlappend sein, sondern können als nicht verbundene, diskontinuierliche Datasets vorhanden sein. Beispielsweise können Sie über Bilder verfügen, die eine Fläche komplett abdecken, oder über viele Bildstreifen, die zusammen kein durchgehendes Bild ergeben (z. B. entlang von Pipelines).
Die Daten können sogar vollständig oder teilweise überlappen, jedoch zu unterschiedlichen Zeiten aufgenommen worden sein. Mosaik-Datasets eignen sich ideal zum Speichern von Zeitdaten. Sie können die benötigten Bilder anhand der Zeit- oder Datumsangaben aus dem Mosaik-Dataset abrufen und mit einer Mosaik-Methode das mosaikierte Bild abhängig von einem Zeit- oder Datumsattribut anzeigen.
Mosaik-Datasets sind nicht auf einen bestimmten Raster-Datentyp beschränkt. Sie können Raster-Daten in verschiedenen Projektionen, Auflösungen, Pixeltiefen und mit einer anderen Anzahl von Bändern hinzufügen. Übersichten (wie Pyramiden) können für den gesamten Datenbestand generiert werden. Dies ermöglicht eine schnellere Ansicht der Daten und eine schnelle Bereitstellung der Datasets. Es gibt auch viele weitere Ansichtseigenschaften, z. B. das Festlegen einer Mosaikierungsmethode, die diese Datasets in vielen Fällen eindeutig und funktional werden lässt. Sie können ein Mosaik-Dataset auch auf Grundlage der räumlichen und nicht räumlichen Abfragebeschränkungen abrufen. Die Ergebnisse der Abfrage können aus einer Reihe von Bildern bestehen, die einzeln verarbeitet werden können, oder aus einem dynamisch generierten, mosaikierten Bild.
Neben Raster-Daten können Sie auch LIDAR-Daten auf die gleiche Weise wie Raster-Datasets und auch zusammen mit Raster-Datasets in einem Mosaik-Dataset speichern und verwalten. Die LIDAR-Daten können im Dateisystem als LAS-Dateien oder LAS-Datasets oder in einer Geodatabase als Terrain-Datasets gespeichert werden.
Raster-Datenspeichermodelle vergleichen
Das individuelle Speichern von Raster-Datasets ist häufig die beste Methode, wenn die Datasets nicht aufeinanderfolgen oder nur selten im gleichen Projekt verwendet werden. Das gemeinsame Mosaikieren der Eingaben zur Bildung einer einzigen großen Ausdehnung von Raster-Daten eignet sich für viele Anwendungen, doch kann aus vielen Gründen ein Mosaik-Dataset erwünscht sein:
- Die Ausdehnungen der Raster-Datasets überlappen teilweise oder ganz, und die gemeinsamen Flächen sollen beibehalten werden.
- Die Raster-Datasets stellen eine Sammlung von Beobachtungen derselben Fläche zu unterschiedlichen Zeiten in einer Zeitserie dar.
- Sie möchten nur Ihr Untersuchungsgebiet und nicht die gesamte Sammlung von Bildern anzeigen.
- Sie möchten eine Sammlung von Bildern als integrierten Satz verwalten, jedoch ihren individuellen Status behalten.
- Sie möchten zusätzliche Attributspalten, die jedes Bild beschreiben, aufzeichnen und verwalten.
Raster-Datenspeichermodelle vergleichen
Raster-Dataset | Mosaik-Dataset | |
---|---|---|
Beschreibung | Ein einzelnes Bild eines Objekts oder ein nahtloses Bild, das eine räumlich kontinuierliche Fläche abdeckt. Dies kann ein einzelnes Originalbild oder das Ergebnis zahlreicher Bilder sein, die aneinander gehängt (mosaikiert) werden. | Eine als Katalog gespeicherte Gruppe von Raster-Datasets, mit der Sie Raster-Daten und LIDAR-Daten speichern, verwalten, anzeigen und abfragen können. Die Anzeige erfolgt als Mosaik-Bild, Sie können jedoch auf jedes einzelne Dataset in der Gruppe zugreifen. |
Speicherung | Als Datei auf einer Festplatte oder in einer Geodatabase. | Innerhalb einer Geodatabase, Sie können jedoch eine Referenz als Datei auf der Festplatte speichern. |
Karten-Layer | Ein Karten-Layer. | Ein Karten-Layer. |
Homogene oder heterogene Daten | Homogene Daten: ein einzelnes Format, ein einzelner Datentyp und eine einzelne Datei. | Heterogene Daten: mehrere Formate, Datentypen, Dateigrößen und Koordinatensysteme. |
Metadaten | Einmal gespeichert und auf das gesamte Dataset angewendet. | Können im Raster-Datensatz sowie als Attribute in der Attributtabelle gespeichert werden. |
Reduzierte Datasets | Eine einzelne Pyramide auf dem gesamten Raster-Dataset. | Pyramiden für jedes Raster-Dataset sowie Übersichten (z. B. eine Pyramide) für die ganze Sammlung. |
Geoverarbeitung und Bildanalyse |
|
|
Vorteile |
|
|
Nachteile | Die Aktualisierung von Raster-Datasets in File- oder Personal-Geodatabase dauert länger, da die gesamte Datei umgeschrieben werden muss. | Das Erstellen von Übersichten nimmt einige Zeit in Anspruch. |
Bereitstellung | Kann direkt als Image-Service bereitgestellt werden. | Kann direkt als Image-Service bereitgestellt werden. |
Empfehlungen | Wenn Überlappungen zwischen mosaikierten Bildern nicht beibehalten werden und große Mengen von Raster-Daten schnell angezeigt werden müssen, empfehlen sich Raster-Datasets. | Zur Verwaltung und Visualisierung von Raster- und LIDAR-Daten empfiehlt sich ein Mosaik-Dataset. Geeignet für multidimensionale Daten, Abfragen, das Speichern von Metadaten sowie überlappende Daten und bietet eine gute hybride Lösung. |
Raster-Datenspeicherung in der Geodatabase
Speichern Sie Raster-Daten in der Geodatabase, wenn Sie Raster verwalten, Verhalten hinzufügen und das Schema steuern möchten, wenn Sie einen genau definierten Satz von Raster-Datasets im DBMS verwalten möchten und wenn es für Sie möglich sein muss, den gesamten Inhalt in einer Datenarchitektur zu verwalten. Es sind drei Haupttypen von Geodatabases vorhanden: Enterprise-, Personal- und File-Geodatabases.
Die Enterprise-Geodatabase kann mehrere Vorgänge in seinem DBMS unterstützen. File-Geodatabases (wie die Personal-Geodatabase) sind für Einzelbenutzer konzipiert und bieten keine Unterstützung für Versionierung. Sie werden im Dateisystemverzeichnis gespeichert und erfordern für den Zugriff daher kein Kennwort. Für die File-Geodatabases und Enterprise-Geodatabases gilt dasselbe Basisspeicherschema.
Raster-Speicherung in File-, Enterprise- und Personal-Geodatabases vergleichen
Merkmale der Raster-Speicherung | File-Geodatabase | Enterprise-Geodatabase | Personal-Geodatabase |
---|---|---|---|
Größenbeschränkung | 1 Terabyte (TB) pro Raster-Dataset | Unbegrenzt; Beschränkung von DBMS-Einschränkungen abhängig | 2 Gigabyte (GB) pro Geodatabase (diese Einschränkung gilt für die Tabellengröße, nicht für die Größe des Raster-Datasets) |
Dateiformat für Raster-Dataset | Raster-Dataset in File-Geodatabase | Raster-Dataset in Enterprise-Geodatabase | ERDAS IMAGINE, JPEG oder JPEG 2000 |
Speicherung |
|
|
|
Im Dateisystem gespeichert | In einem RDBMS gespeichert | In Microsoft Access gespeichert | |
Komprimierung | LZ77, JPEG, JPEG 2000 oder "Kein" | LZ77, JPEG, JPEG 2000 oder "Kein" | LZ77, JPEG, JPEG 2000 oder "Kein" |
Pyramiden | Unterstützt partielle Pyramiden | Unterstützt partielle Pyramiden | Erstellt gesamte Pyramide neu |
Mosaikieren | Ermöglicht das Anhängen an ein Raster-Dataset beim Mosaikieren | Ermöglicht das Anhängen an ein Raster-Dataset beim Mosaikieren | Schreibt ein neues Dataset jedes Mal, wenn Sie in ein Raster-Dataset mosaikieren |
Wird aktualisiert | Ermöglicht inkrementelles Aktualisieren | Ermöglicht inkrementelles Aktualisieren | nicht zutreffend |
Anzahl an Benutzern | Einzelbenutzer und kleine Arbeitsgruppen; einige Benutzer mit Lesezugriff und ein Benutzer mit Schreibzugriff | Mehrere Benutzer; mehrere Benutzer mit Schreib- und/oder Lesezugriff | Einzelbenutzer und kleine Arbeitsgruppen; einige Benutzer mit Lesezugriff und ein Benutzer mit Schreibzugriff |
File-Geodatabases
Das Speichermodell der File-Geodatabase ist ein Hybrid aus der Enterprise-Geodatabase und der Personal-Geodatabase, wo verwaltete Raster-Daten dem Speichermodell der Enterprise-Geodatabase folgen und nicht verwaltete Raster-Daten dem Speichermodell der Personal-Geodatabase folgen. File-Geodatabases ähneln auch Personal-Geodatabases, da sie für die Bearbeitung durch Einzelbenutzer konzipiert sind und keine Unterstützung für die Versionierung bieten. Sie werden im Dateisystemverzeichnis gespeichert und erfordern für den Zugriff daher kein Kennwort. Für File- und Enterprise-Geodatabases gilt dasselbe Basisspeicherschema.
Bei Verwendung einer File-Geodatabase statt einer Personal-Geodatabase ergeben sich mehrere Vorteile. Wie bei der Enterprise-Geodatabase werden in der File-Geodatabase Daten in Blöcken gespeichert. Dies ermöglicht einen effizienteren Datenzugriff, insbesondere während der Mosaikierung. Bei der Mosaikierung von Daten in einer File-Geodatabase werden nur überlappende Blöcke aktualisiert. Wenn kein überlappender Block vorhanden ist, wird ein neuer Block eingefügt. Teilblöcke werden mit NoData-Pixeln aufgefüllt. Außerdem setzt das File-Geodatabase (und Enterprise)-Speichermodell Teilpyramidenaktualisierungen ein, die Zeit sparen. Da die Datenstrukturen der File-Geodatabases mit der von Enterprise-Geodatabases identisch ist, lassen sich Daten zwischen ihnen schnell kopieren und einfügen.
File-Geodatabases akzeptieren auch Konfigurationsschlüsselwörter, aber im Gegensatz zu Enterprise-Geodatabases verfügen die Konfigurationsschlüsselwörter über einen standardmäßigen vordefinierten Wert. Weitere Informationen zu Konfigurationsschlüsselwörtern finden Sie unter Konfigurationsschlüsselwörter für File-Geodatabases.
Enterprise-Geodatabases
Wenn in einer Enterprise-Geodatabase Raster-Daten gespeichert werden, sind unternehmensweite Funktionen, wie Sicherheit, Mehrbenutzerzugriff, gemeinsame Verwendung von Daten usw. verfügbar. Es gibt drei Hauptgründe für das Speichern von Raster-Daten in einer Enterprise-Geodatabase:
- Sie wird nicht regelmäßig aktualisiert (etwa alle zwei oder drei Jahre oder länger).
- Es wird schreibgeschützt darauf zugegriffen (z. B. bei der Verwendung einer Grundkarte unter Vektordaten).
- Hunderte von Benutzern (oder mehr), die sie als Grundkarte aufrufen.
Aufgrund der Speicherstruktur werden die Raster-Daten gewissermaßen von der Geodatabase verwaltet oder vollständig gesteuert. In Enterprise-Geodatabases werden sämtliche Raster-Informationen (Pixel, Raumbezüge, alle verbundenen Tabellen sowie weitere Metadaten) für Raster-Datasets und Raster-Attribute stets in der zugehörigen relationalen Datenbank gespeichert. Dies bedeutet, dass alle Informationen des Eingabe-Rasters in die Datenbank geladen und als Formatkonvertierung betrachtet werden können.
Die Enterprise-Geodatabase kachelt die Bänder entsprechend der benutzerdefinierten Bemaßung gleichmäßig in Pixelblöcke (Standardwert ist 128 x 128). Das Unterteilen der Raster-Banddaten ermöglicht ein effizientes Speichern und Abrufen der Raster-Daten. Die Pyramideninformationen werden gemäß einer zurückgehenden Auflösung gespeichert. Die Höhe der Pyramide wird durch die Anzahl der von der Anwendung oder dem Anwender angegebenen Ebenen bestimmt.
In der Raster-Blocktabelle (die größte Tabelle, in der die eigentlichen Pixelinformationen und Pyramiden gespeichert werden) wird eine Zeile pro Block (Kachel) pro Band in einem Raster-Dataset und pro Pyramidenebene gespeichert. Angenommen, ein Raster mit drei Bändern ist in 12 Blöcke unterteilt, in denen noch keine Pyramiden erstellt wurden. Dann enthält das Raster 36 Zeilen in der BLK-Tabelle: zwölf Blöcke pro Band. Die Spalte mit den Pixeldaten für den Block ist vom Typ Binary Large Object (BLOB).
Informationen zur Raster-Datenspeicherung in diesen DBMSs
DBMS | Datenspeichermodell | |
---|---|---|
DB2 | ||
Informix | ||
Oracle | ||
PostgreSQL | ||
SQL Server |
Enterprise-Geodatabases für Oracle, PostgreSQL und SQL Server
Ab ArcGIS Desktop 10.5 werden Mosaik-Datasets, die in Oracle-, PostgreSQL- oder SQL Server-Geodatabases erstellt wurden, mit dem neuen RASTER_STORAGE Schlüsselwort RASTERBLOB erstellt. Das RASTERBLOB Schlüsselwort implementiert einen effizienten Transfer der Mosaik-Dataset-Katalogelemente in das DBMS.
Mit RASTERBLOB erstellte Mosaik-Datasets können nicht mit früheren Versionen der Software geöffnet werden. Wenn Sie Mosaik-Datasets erstellen möchten, die rückwärtskompatibel mit früheren Versionen sind, müssen Sie das Konfigurationsschlüsselwort für RASTER_STORAGE in eines der folgenden kompatiblen Schlüsselwörter ändern:
- BINARY für PostgreSQL und SQL Server
- BLOB für Oracle.
Personal-Geodatabases
In einer Personal-Geodatabase wird das Raster-Dataset in eine IMAGINE-Datei (.img) konvertiert und in einem IDB-Ordner (Image Database, Bilddatenbank) gespeichert. Der IDB-Ordner befindet sich im Verzeichnis neben der Personal-Geodatabase. Durch Löschen eines Raster-Datasets wird das Raster im IDB-Ordner dauerhaft gelöscht.
Wenn Sie ein Mosaik-Dataset in einer Personal-Geodatabase speichern, stellt das Mosaik-Dataset eine Tabelle dar, die auf die darin enthaltenen gespeicherten Raster-Datasets zeigt. In einem Mosaik-Dataset werden die Raster-Datasets als nicht verwaltet gespeichert, deshalb enthalten sie den Pfad zum Speicherort der Raster-Datasets. Jede Zeile in der Business-Tabelle zeigt auf das gespeicherte Raster-Dataset. Die Vorgänge in einem Mosaik-Dataset wirken sich nicht auf die gespeicherten Raster-Dateien aus. Folglich werden beim Löschen von Raster-Datasets in einem Mosaik-Dataset die Raster-Datasets lediglich aus dem Mosaik-Dataset entfernt, aber nicht von der Festplatte gelöscht.
Beim Speichern eines Raster-Datasets als Attribut wird das Raster als IMG-Datei im systemdefinierten Speicherort oder unverändert im Dateisystem gespeichert. Dies hängt davon ab, ob es verwaltet ist oder nicht.
Komprimierung, Pyramiden und Kachelgröße
Beim Speichern und Verwalten von Raster-Daten sind auch weitere Speicherstrukturen zu berücksichtigen, einschließlich Komprimierung, reduzierte Datasets (Pyramiden und Übersichten) und Kachelgröße.
Komprimierung
Es gibt zwei Arten von Komprimierung: verlustfrei und verlustbehaftet. Verlustfreie Komprimierung bedeutet, dass sich die Werte der Pixel im Raster-Dataset nicht verändern, wohingegen eine verlustbehaftete Komprimierung zu geänderten Pixelwerten führt. Die Komprimierungsstufe hängt vom Typ der Pixeldaten ab, d. h. je homogener das Bild, desto höher die Komprimierungsrate. Daten, die zur Analyse und nicht nur zur Anzeige verwendet werden, sollten mit einer verlustfreien Komprimierung gespeichert werden. Der Hauptvorteil der Datenkomprimierung besteht im geringeren Bedarf an Speicherplatz. Wie viel eingespart wird, hängt von der Komprimierungsmethode und er Redundanz in den Daten ab. Ein weiterer Vorteil ist die wesentlich verbesserte Performance, da weniger Datenpakete übertragen werden. Wenn Sie zum Beispiel auf Raster-Daten über ein Netzwerk mit geringer Bandbreite zugreifen, wird die Performance durch die Komprimierung u. U. deutlich gesteigert, da die Menge der zu übertragenden Daten deutlich reduziert wird, sodass große, nahtlose Raster-Datasets gespeichert und dem Client schnell zur Anzeige bereitgestellt werden können.
Weitere Informationen zur Raster-Komprimierung
Mosaik-Datasets weisen ebenfalls Komprimierung auf. Diese erfolgt nicht beim Speichern des verwalteten Raster-Datasets, sondern die Komprimierung wird bei der Anzeige auf das erzeugte Bild angewendet. Dies hilft außerdem beim Zugriff auf Daten über das Netzwerk, indem die Größe der übertragenen Datei reduziert wird.
Weitere Informationen zur Eigenschaft Zulässige Komprimierungsmethode
Reduzierte Datasets
Reduzierte Datasets sind Raster, die aus den Originaldaten entweder eines Raster-Datasets oder eines Mosaik-Datasets erstellt wurden. Sie werden erzeugt, um die Anzeigegeschwindigkeit und Performance zu verbessern. Wenn sie für Raster-Datasets erstellt werden, werden sie als Pyramiden bezeichnet, und wenn sie für Mosaik-Datasets erstellt werden, werden sie als Übersichten bezeichnet.
Pyramiden und Übersichten
Pyramiden | Übersichten | |
---|---|---|
Erstellt für | Raster-Datasets | Mosaik-Datasets |
Format | Schreibt .ovr-Dateien – mit wenigen Ausnahmen. Liest Pyramiden, die extern als .ovr- oder .rrd-Datei oder intern gespeichert wurden. | Schreibt .tif-Dateien. |
Speicherung | In einer einzelnen Datei, die sich im Allgemeinen neben dem Quell-Raster-Dataset mit demselben Namen befindet. | Standardmäßig in einem Ordner neben der Geodatabase mit der Erweiterung *.overviews oder intern für Enterprise-Geodatabases. Der Speicherort kann angepasst werden. |
Speichergröße | 2 bis 10 Prozent (im Vergleich zu den Original-Raster-Datasets) | |
Reduktionsfaktor | 2 | 3 |
Ausdehnung |
|
|
Optionen beim Erstellen |
|
|
Kachelgröße
In einer Enterprise-Geodatabase werden Raster-Daten in einer Struktur gespeichert, in der die Daten gekachelt, indiziert, mit Pyramiden versehen und zumeist komprimiert sind. Aufgrund der Kachelung, Indizierung und Pyramidenerstellung werden jedes Mal, wenn die Raster-Daten abgefragt werden, statt des gesamten Datasets nur die Kacheln zurückgegeben, die für die Ausdehnung und Auflösung der Abfrage nötig sind. Die Kachelgröße legt die Anzahl der Pixel fest, die Sie in jedem Datenbank-Speicherblock speichern möchten. Diese ist als eine Anzahl von Pixeln in XY-Richtung festgelegt. Die Standard-Kachelgröße beträgt 128 x 128 Pixel, und bei den meisten Anwendungen wird bei einer Abweichung von diesen Standardwerten keine Gewährleistung übernommen. In einer Enterprise-Geodatabase werden die Kacheln von Raster-Daten komprimiert, bevor sie in der Geodatabase gespeichert werden.