Mit der Geostatistical Analyst-Lizenz verfügbar.
Die folgenden Begriffe und Konzepte treten wiederholt in Geostatistik und in Geostatistical Analyst auf.
Begriff | Beschreibung |
---|---|
Kreuzvalidierung | Eine Methode zur Beurteilung der Genauigkeit eines Interpolationsmodells. In Geostatistical Analyst lässt die Kreuzvalidierung einen Punkt aus und verwendet den Rest, um einen Wert an dieser Position vorherzusagen. Der Punkt wird dann wieder in das Dataset eingefügt und ein anderer Punkt wird entfernt. Dies erfolgt für alle Referenzpunkte im Dataset. Es werden Paare von vorhergesagten und bekannten Werten geliefert, die zur Bewertung der Performance des Modells verglichen werden können. Ergebnisse werden gewöhnlich als Mean- oder Root Mean Squared-Fehler zusammengefasst. |
Deterministische Methoden | In Geostatistical Analyst sind deterministische Methoden diejenigen, die Oberflächen aus gemessenen Punkten basierend auf einer Ausdehnung oder Ähnlichkeit (z. B. Inverse Distance Weighted) oder einem Glättungsgrad (z. B. radiale Basisfunktionen) erstellen. Sie bieten keine Messunsicherheit (Fehler) der Vorhersagen. |
Geostatistischer Layer | Vom Geostatistical Wizard gelieferte Ergebnisse und viele der Geoverarbeitungswerkzeuge in der Toolbox "Geostatistical Analyst" werden auf einer Oberfläche, dem sogenannten geostatistischen Layer, gespeichert. Geostatistische Layer können genutzt werden, um Karten der Ergebnisse zu erstellen, die Parameterwerte der Interpolationsmethode zu prüfen und zu korrigieren (durch Öffnen im Geostatistical Wizard), andere Typen von geostatistischen Layern zu erstellen (z. B. Vorhersagefehler-Karten) und die Ergebnisse in Raster- oder Vektorformate (Konturlinien, gefüllte Konturlinien und Punkte) zu exportieren. |
Geostatistische Methoden | In Geostatistical Analyst basieren geostatistische Methoden auf statistischen Modellen, die Autokorrelation (die statistischen Beziehungen zwischen den gemessenen Punkten) enthalten. Diese Methoden können vorhergesagte Oberflächen erzeugen und beinhalten auch eine gewisse, mit diesen Vorhersagen verbundene Messunsicherheit (Fehler). |
Interpolation | Ein Prozess, der an bekannten Beispielpositionen gemessene Werte verwendet, um Werte für nicht gemessene Positionen vorherzusagen (zu schätzen). Geostatistical Analyst bietet mehrere Interpolationsmethoden, die sich aufgrund ihrer zugrundeliegenden Annahmen, Datenanforderungen und Fähigkeiten zur Generierung unterschiedlicher Ausgabetypen (z. B. vorhergesagte Werte sowie damit verbundene Fehler [Unsicherheiten]) unterscheiden. |
Kernel | Eine Gewichtungsfunktion, die in mehreren Interpolationsmethoden in Geostatistical Analyst verwendet wird. In der Regel werden höhere Gewichtungen Referenzwerten zugewiesen, die sich nahe der Position befinden, an der eine Vorhersage getroffen wird. Niedrigere Gewichtungen werden weiter entfernten Referenzwerten zugewiesen. |
Kriging | Eine Sammlung von Interpolationsmethoden, die auf Semivariogramm-Modellen räumlicher Autokorrelation fußen zur Erzeugung vorhergesagter Werte, mit den Vorhersagen verbundener Fehler und anderer Informationen zur Verteilung möglicher Werte an jeder Position im Untersuchungsgebiet (durch Quantil- und Wahrscheinlichkeitskarten oder über geostatistische Simulation, die ein Set an möglichen Werten für jede Position liefert). |
Suchnachbarschaft | Die meisten Interpolationsmethoden verwenden eine lokale Teilmenge der Daten, um Vorhersagen zu treffen. Stellen Sie sich ein sich bewegendes Fenster vor: Nur die Daten im Fenster werden verwendet, um eine Vorhersage im Mittelpunkt des Fensters zu treffen. Der Grund dafür ist, dass Stichproben redundante Informationen enthalten, die weit entfernt von der Position sind, an der wir eine Vorhersage benötigen, und dass die erforderliche Berechnungszeit zur Generierung eines vorhergesagten Werts für das gesamte Untersuchungsgebiet beschleunigt wird. Die Auswahl der Nachbarschaft (Anzahl von Referenzen in der Nähe und deren räumliche Konfiguration im Fenster) beeinflusst die vorhergesagte Oberfläche und sollte mit Sorgfalt erfolgen. |
Semivariogram | Eine Funktion, die die Unterschiede (Varianz) zwischen Stichproben, getrennt durch verschiedene Entfernungen, beschreibt. In der Regel zeigt das Semivariogramm eine geringe Varianz für kleine Unterschiede und größere Varianzen für größere Trennungsabstände und weist damit darauf hin, dass die Daten räumlich autokorrelieren. Semivariogramme, die basierend auf Referenzdaten geschätzt werden, sind empirische Semivariogramme. Sie werden als Gruppe von Punkten in einem Diagramm dargestellt. Eine Funktion wird auf diese Punkte abgestimmt und ist ein sogenanntes Semivariogramm-Modell. Das Semivariogramm-Modell ist eine wesentliche Komponente beim Kriging (eine leistungsstarke Interpolationsmethode, die vorhergesagte Werte, mit den Vorhersagen verbundene Fehler sowie Informationen über die Verteilung möglicher Werte für jede Position im Untersuchungsgebiet liefern kann). |
Simulation | In der Geostatistik bezeichnet dies eine Methode, die Kriging erweitert, indem sie viele mögliche Versionen einer vorhergesagten Oberfläche erzeugt (im Unterschied zu Kriging, das nur eine Oberfläche erzeugt). Die Gruppe von vorhergesagten Oberflächen bietet eine Vielzahl an Informationen, mit denen die Unsicherheit eines vorhergesagten Werts für eine bestimmte Position, die Unsicherheit für einen Satz an vorhergesagten Werten in einem Interessenbereich oder ein Satz an vorhergesagten Werten beschrieben werden kann, die als Eingabe für ein zweites Modell (physisch, ökonomisch usw.) zur Risikobewertung und für fundiertere Entscheidungen verwendet werden kann. |
Räumliche Autokorrelation | Natürliche Phänomene stellen häufig räumliche Autokorrelationen dar – die Stichproben, die nahe beieinander genommen wurden, sind ähnlicher als Stichproben, die weiter voneinander entfernt genommen wurden. Einige Interpolationsmethoden erfordern ein explizites Modell von räumlicher Autokorrelation (z. B. Kriging), andere beruhen auf angenommenen Graden an räumlicher Autokorrelation ohne Messmöglichkeit (z. B. Inverse Distance Weighting) und wieder andere benötigen keine Vorstellung der räumlichen Autokorrelation im Dataset. Beachten Sie, dass traditionelle statistische Methoden (die auf der Unabhängigkeit von Beobachtungen beruhen) nicht zuverlässig verwendet werden können, wenn eine räumliche Autokorrelation vorhanden ist. |
Transformation | Eine Datentransformation erfolgt, wenn auf die Daten eine Funktion (log, Box-Cox, arcsin, Normalverteilung) angewendet wird, die die Form der Verteilung ändert und/oder die Varianz stabilisiert (Beziehung zwischen Mittelwert und Varianz reduziert, z. B. dass die Datenvariabilität mit höherem Mittelwert steigt). |
Überprüfung | Ähnlich der Kreuzvalidierung, aber anstelle von einem Dataset zum Erstellen und Bewerten des Modells werden zwei Datasets verwendet: eines zum Erstellen des Modells und das andere als unabhängige Prüfung der Performance. Wenn nur ein Dataset verfügbar ist, kann es mithilfe des Werkzeugs "Subset Features" nach dem Zufallsprinzip in Trainings- und Test-Teilmengen getrennt werden. |