Zusammenfassung
Dieses Werkzeug identifiziert in einem Satz gewichteter Features mithilfe der Getis-Ord Gi*-Statistik statistisch signifikante Hot-Spots und Cold-Spots.
Weitere Informationen zur Funktionsweise der Hot-Spot-Analyse (Getis-Ord Gi*)
Abbildung
Verwendung
Dieses Werkzeug identifiziert statistisch signifikante räumliche Cluster mit hohen Werten (Hot-Spots) und mit niedrigen Werten (Cold-Spots). Mit diesem Werkzeug wird eine neue Ausgabe-Feature-Class mit einem Z-Wert-, p-Wert- und Konfidenzniveau-Bin (Gi_Bin) für jedes Feature in der Eingabe-Feature-Class erstellt.
Die Z-Werte und p-Werte sind Werte von statistischer Bedeutung, die Aufschluss darüber geben, ob Sie die NULL-Hypothese auf Feature-Ebene ablehnen können oder nicht. Genau genommen geben sie an, ob die beobachtete räumliche Cluster-Bildung von hohen oder niedrigen Werten auffälliger ist als bei einer zufälligen Verteilung der gleichen Werte. Die Z-Wert- und p-Wert-Felder spiegeln keine FDR-Korrektur (False Discovery Rate) wider.
Das Feld Gi_Bin identifiziert statistisch signifikante Hot-Spots und Cold-Spots, unabhängig davon, ob die FDR-Korrektur angewendet wird. Features in +/-3-Bins geben die statistische Signifikanz mit einem Konfidenzniveau von 99 Prozent an, Features in +/-2-Bins geben ein Konfidenzniveau von 95 Prozent an, Features in +/-1-Bins spiegeln ein Konfidenzniveau von 90 Prozent wider und die Cluster-Bildung für Features in Bin 0 ist statistisch nicht signifikant. Ohne FDR-Korrektur basiert die statistische Signifikanz auf den p-Wert- und Z-Wert-Feldern. Wenn Sie den optionalen Parameter FDR-Korrektur anwenden (False Discovery Rate) aktivieren, werden die kritischen p-Werte, die das Konfidenzniveau bestimmen, reduziert, um Mehrfachtests und räumliche Abhängigkeit einzubeziehen.
Ein hoher Z-Wert und ein kleiner p-Wert für ein Feature deutet auf ein räumliches Clustering von hohen Werten hin. Ein niedriger negativer Z-Wert und ein kleiner p-Wert deuten auf ein räumliches Clustering von niedrigen Werten hin. Je größer (oder kleiner) der Z-Wert, desto höher die Intensität der Cluster-Bildung. Ein Z-Wert nahe 0 gibt an, dass anscheinend keine räumliche Cluster-Bildung zu verzeichnen ist.
-
Das Z-Ergebnis basiert auf der Berechnung per Zufalls-NULL-Hypothese. Weitere Informationen zu Z-Ergebnissen finden Sie unter Was ist ein Z-Ergebnis? Was ist ein p-Wert?
Wenn die Eingabe-Feature-Class nicht projiziert ist (d. h., wenn Koordinaten in Grad, Minuten und Sekunden angegeben werden) oder als Ausgabe-Koordinatensystem ein geographisches Koordinatensystem festgelegt wurde, werden Entfernungen mit Sehnenmesswerten berechnet. Sehnenentfernungsmesswerte werden verwendet, weil sie schnell berechnet werden können und ausgezeichnete Schätzung von echten geodätischen Entfernungen zulassen, zumindest für Punkte innerhalb von 30 Grad voneinander. Sehnenentfernungen basieren auf einem abgeplatteten Sphäroid. Im Fall von zwei beliebigen Punkten auf der Erdoberfläche ist die Sehnenentfernung zwischen diesen die Länge einer Linie, die durch die dreidimensionale Erde führt, um diese beiden Punkte zu verbinden. Sehnenentfernungen werden in Metern angegeben.
Wenn in der Analyse Sehnenentfernungen verwendet werden, sollte der Parameter Entfernungsband oder Entfernungsschwellenwert (falls angegeben) in Metern angegeben werden.
In Vorversionen von ArcGIS 10.2.1 wurde eine Warnmeldung angezeigt, wenn aufgrund der ausgewählten Parameter und Umgebungseinstellungen Berechnungen mithilfe von geographischen Koordinaten (Grad, Minuten, Sekunden) durchgeführt wurden. In dieser Warnung wurden Sie dazu aufgefordert, die Daten in ein projiziertes Koordinatensystem zu projizieren, damit die Entfernungsberechnungen richtig durchgeführt werden. Ab 10.2.1 berechnet dieses Werkzeug Sehnenentfernungen jedoch immer, wenn Berechnungen in einem geographischen Koordinatensystem erforderlich sind.
-
Für Linien- und Polygon-Features werden bei Entfernungsberechnungen Feature-Schwerpunkte verwendet. Für Multipoints, Polylinien oder Polygone mit mehreren Teilen wird der Schwerpunkt mithilfe des gewichteten arithmetischen Mittelpunkts aller Feature-Teile berechnet. Die Gewichtung für Punkt-Features ist 1, für Linien-Features "Länge" und für Polygon-Features "Fläche".
Das Eingabefeld sollte eine Vielzahl von Werten aufweisen. Für diese Statistikberechnung ist es erforderlich, dass nicht alle Variablen den gleichen Wert aufweisen; eine Berechnung ist z. B. nicht möglich, wenn alle Eingabewerte 1 lauten. Wenn Sie mit diesem Werkzeug das räumliche Muster von Ereignisdaten analysieren möchten, können Sie dazu die Ereignisdaten zusammenfassen oder das Werkzeug Optimierte Hot-Spot-Analyse verwenden.
Mit dem Werkzeug Optimierte Hot-Spot-Analyse werden die Daten abgefragt, um automatisch Parametereinstellungen zum Optimieren der Hot-Spot-Ergebnisse auszuwählen. Es fasst Ereignisdaten zusammen, wählt ein geeignetes Analysemaß aus und passt die Ergebnisse für Mehrfachtests und räumliche Abhängigkeit an. Die ausgewählten Parameteroptionen werden im Ergebnisfenster angezeigt, und diese können Sie bei der Optimierung der Parameterauswahl unterstützen, wenn Sie dieses Werkzeug verwenden. Dieses Werkzeug bietet Ihnen eine optimale Kontrolle und Flexibilität der Parametereinstellungen.
Ihre Auswahl für den Parameter Konzeptualisierung von räumlichen Beziehungen sollte inhärente Beziehungen unter den Features, die analysiert werden, widerspiegeln. Je realistischer Sie modellieren können, wie Features im Raum interagieren, desto genauer werden die Ergebnisse. Empfehlungen werden unter Auswählen einer Konzeptualisierung räumlicher Beziehungen: Empfehlungen beschrieben. Weitere Tipps:
- FIXED_DISTANCE_BAND
Die Standardeinstellung für Entfernungsband oder Entfernungsschwellenwert stellt sicher, dass jedes Feature mindestens einen Nachbarn hat, und dies ist wichtig. Häufig ist dieser Standardwert jedoch nicht die am besten geeignete Entfernung für die Analyse. Zusätzliche Strategien, mit deren Hilfe Sie einen geeigneten Maßstab (ein Entfernungsband) für die Analyse ermitteln können, werden unter Auswählen eines Wertes für ein festes Entfernungsband dargestellt.
- INVERSE_DISTANCE oder INVERSE_DISTANCE_SQUARED
Wird für den Parameter Entfernungsband oder Entfernungsschwellenwert 0 eingegeben, werden alle Features als Nachbarn aller anderen Features betrachtet. Wenn dieser Parameter leer bleibt, wird die Standardentfernung angewendet.
Gewichtungen für Entfernungen von weniger als 1 werden instabil, wenn sie umgekehrt werden. Demzufolge wird der Gewichtung für Features, deren Entfernung weniger als 1 Entfernungseinheit beträgt, ein Wert von 1 zugewiesen.
Bei den Optionen für inverse Entfernung (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED oder ZONE_OF_INDIFFERENCE) wird allen lagegleichen Punkten eine Gewichtung von 1 zugewiesen, um eine Nulldivision zu vermeiden. Damit wird sichergestellt, dass keine Features aus der Analyse ausgeschlossen werden.
- FIXED_DISTANCE_BAND
-
Zusätzliche Optionen für den Parameter Konzeptualisierung von räumlichen Beziehungen, einschließlich Raum-Zeit-Beziehungen, sind über die Werkzeuge Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerks generieren verfügbar. Um diese zusätzlichen Optionen zu nutzen, verwenden Sie eines dieser Werkzeuge zum Konstruieren der Datei mit der räumlichen Gewichtungsmatrix vor der Analyse. Wählen Sie GET_SPATIAL_WEIGHTS_FROM_FILE für den Parameter Konzeptualisierung von räumlichen Beziehungen aus, und geben Sie für den Parameter Gewichtungsmatrix-Datei den Pfad zur erstellten Datei mit der räumlichen Gewichtung an.
-
Weitere Informationen zur Raum-Zeit-Cluster-Analyse finden Sie in der Dokumentation zu Raum/Zeit-Analysen.
-
Sie können Karten-Layer verwenden, um die Eingabe-Feature-Class zu definieren. Beim Verwenden eines Layers mit einer Auswahl sind nur die ausgewählten Features in der Analyse enthalten.
Wenn Sie eine Gewichtungsmatrix-Datei mit einer .swm-Erweiterung bereitstellen, wird von diesem Werkzeug eine Datei mit räumlicher Gewichtungsmatrix erwartet, die mit den Werkzeugen Räumliche Gewichtungsmatrix erstellen oder Räumliche Gewichtung des Netzwerks generieren erstellt wird; andernfalls wird von diesem Werkzeug eine Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erwartet. Das Verhalten variiert in Abhängigkeit davon, welche Art von Datei mit der räumlichen Gewichtungsmatrix Sie verwenden:
- Dateien mit der räumlichen Gewichtungsmatrix im ASCII-Format:
- Gewichtungen werden unverändert verwendet. Fehlende Feature-zu-Feature-Beziehungen werden als Nullen behandelt.
- Die Standardgewichtung für Eigenpotenzial ist 0, es sei denn Sie geben den Wert Eigenpotenzialfeld an oder Sie beziehen Eigenpotenzialgewichtungen explizit ein.
- Asymmetrische Beziehungen werden berücksichtigt, sodass ein Feature ein benachbartes Feature aufweisen kann, das selbst keinen Nachbar hat. Dies bedeutet, dass das benachbarte Feature in die Berechnung der lokalen mittleren Abweichung des ursprünglichen Features einbezogen, das benachbarte Feature jedoch nicht in die Berechnungen für die globale mittlere Abweichung einbezogen wird.
- Wenn die Gewichtungen zeilenstandardisiert sind, sind die Ergebnisse für Analysen von Auswahlsätzen mit hoher Wahrscheinlichkeit fehlerhaft. Wenn Sie die Analyse für einen Auswahlsatz ausführen müssen, konvertieren Sie die ASCII-Datei mit den räumlichen Gewichtungen in eine SWM-Datei, indem Sie die ASCII-Daten in eine Tabelle einlesen und dann die Option CONVERT_TABLE mit dem Werkzeug Räumliche Gewichtungsmatrix erstellen verwenden.
- SWM-formatierte Matrixdatei für räumliche Gewichtung:
- Wenn die Gewichtungen reihenstandardisiert sind, werden sie für die Auswahlsätze erneut reihenstandardisiert; ansonsten werden die Gewichtungen unverändert verwendet.
- Die Standardgewichtung für Eigenpotenzial ist 1, es sei denn, Sie geben den Wert Eigenpotenzialfeld an.
- Dateien mit der räumlichen Gewichtungsmatrix im ASCII-Format:
Das Ausführen der Analyse mit einer Datei mit der räumlichen Gewichtungsmatrix im ASCII-Format erfordert mehr Arbeitsspeicher. Ziehen Sie bei Analysen für mehr als 5.000 Features die Konvertierung Ihrer ASCII-formatierten räumlichen Gewichtungsmatrix-Datei in eine SWM-formatierte Datei in Betracht. Fügen Sie als Erstes die ASCII-Gewichtungen in eine formatierte Tabelle ein (z. B. eine Excel-Tabelle). Führen Sie als Nächstes das Werkzeug Räumliche Gewichtungsmatrix erstellen mit der Option CONVERT_TABLE für den Parameter Konzeptualisierung von räumlichen Beziehungen aus. Die Ausgabe ist eine SWM-formatierte Datei mit räumlicher Gewichtungsmatrix.
-
Bei Ausführung dieses Werkzeugs in ArcMap wird dem Inhaltsverzeichnis automatisch die Ausgabe-Feature-Class mit Standard-Rendering für das Gi_Bin-Feld hinzugefügt. Das Hot-to-Cold-Rendering wird durch eine Layer-Datei in <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers definiert. Sie können das Standard-Rendering nach Bedarf erneut anwenden, indem Sie die Vorlagen-Layer-Symbolisierung importieren.
-
Die Ausgabe-Feature-Class enthält ein SOURCE_ID-Feld, das Ihnen bei Bedarf das Verbinden mit der Eingabe-Feature-Class ermöglicht.
-
Das Hilfethema Modellierungen räumlicher Beziehungen enthält weitere Informationen zu den Parametern dieses Werkzeugs.
Wenn dieses Werkzeug in Python-Skripten verwendet wird, stellt das durch die Werkzeugausführung zurückgegebene Ergebnisobjekt die folgenden Ausgaben bereit:
Position Beschreibung Datentyp 0
Ausgabe-Feature-Class
Feature-Class
1
Name des Ergebnisfeldes (GiZScore)
Feld
2
Name des Wahrscheinlichkeitsfeldes (GiPValue)
Feld
3
Name des Quellen-ID-Feldes (SOURCE_ID)
Feld
Syntax
HotSpots(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Self_Potential_Field}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction})
Parameter | Erklärung | Datentyp |
Input_Feature_Class | Die Feature-Class, für die die Hot-Spot-Analyse durchgeführt wird. | Feature Layer |
Input_Field | Das Zahlenfeld (Anzahl von Opfern, Kriminalitätsrate, Testergebnisse usw.), das ausgewertet werden soll. | Field |
Output_Feature_Class | Die Ausgabe-Feature-Class mit den Z- und p-Werten. | Feature Class |
Conceptualization_of_Spatial_Relationships | Gibt an, wie räumliche Beziehungen zwischen Features definiert werden.
| String |
Distance_Method | Gibt an, wie Entfernungen von den einzelnen Features zu benachbarten Features berechnet werden.
| String |
Standardization | Die Reihen-Standardisierung hat keine Auswirkungen auf dieses Werkzeug: Ergebnisse aus der Hot-Spot-Analyse (die Getis-Ord Gi*-Statistik) sind mit oder ohne Reihen-Standardisierung identisch. Der Parameter ist deaktiviert. Er wird nur aus Gründen der Abwärtskompatibilität als Werkzeugparameter beibehalten.
| String |
Distance_Band_or_Threshold_Distance (optional) | Gibt einen Entfernungsgrenzwert für Optionen mit inverser Entfernung und Optionen mit fester Entfernung an. Features außerhalb des angegebenen Grenzwerts für ein Ziel-Feature werden in Analysen für dieses Feature ignoriert. Mit der ZONE_OF_INDIFFERENCE wird jedoch der Einfluss von Features außerhalb der angegebenen Entfernung in Abhängigkeit der Entfernung reduziert, während die Features innerhalb des Entfernungsschwellenwerts gleichmäßig berücksichtigt werden. Der eingegebene Entfernungswert sollte dem Ausgabekoordinatensystem entsprechen. Bei Konzeptualisierungen von räumlichen Beziehungen mit inverser Entfernung gibt der Wert 0 an, dass kein Entfernungsschwellenwert angewendet wird. Wenn dieser Parameter leer gelassen wird, wird ein Standardschwellenwert berechnet und angewendet. Dieser Standardwert ist die euklidische Entfernung, bei der sichergestellt wird, dass jedes Feature mindestens einen Nachbarn hat. Dieser Parameter hat keine Auswirkungen, wenn räumliche Konzeptualisierungen vom Typ "Polygonnachbarschaft" (CONTIGUITY_EDGES_ONLY oder CONTIGUITY_EDGES_CORNERS) oder GET_SPATIAL_WEIGHTS_FROM_FILE ausgewählt werden. | Double |
Self_Potential_Field (optional) | Das Eigenpotenzialfeld: Die Entfernung oder Gewichtung zwischen einem Feature und sich selbst. | Field |
Weights_Matrix_File (optional) | Der Pfad zu einer Datei mit Gewichtungen, die räumliche und potenziell zeitliche Beziehungen unter Features definieren. | File |
Apply_False_Discovery_Rate__FDR__Correction (optional) |
| Boolean |
Abgeleitete Ausgabe
Name | Erklärung | Datentyp |
Results_Field | Der Name des Ergebnisfeldes (GiZScore). | Feld |
Probability_Field | Der Name des Wahrscheinlichkeitsfeldes (GiPValue). | Feld |
Source_ID | Der Name des Quellen-ID-Feldes (SOURCE_ID). | Feld |
Codebeispiel
HotSpots – Beispiel 1 (Python-Fenster)
Das folgende Skript veranschaulicht die Verwendung des Werkzeugs HotSpots im Python-Fenster.
import arcpy
arcpy.env.workspace = "C:/data"
arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE",
"NONE", "#", "#", "euclidean6Neighs.swm", "NO_FDR")
HotSpots – Beispiel 2 (eigenständiges Skript)
Das folgende eigenständige Python-Skript veranschaulicht, wie Sie das Werkzeug HotSpots verwenden.
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot-Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Hot Spot Analysis of 911 Calls
# Process: Hot Spot Analysis (Getis-Ord Gi*)
hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "#", "euclidean6Neighs.swm","NO_FDR")
except:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Umgebungen
Lizenzinformationen
- Basic: Ja
- Standard: Ja
- Advanced: Ja
Verwandte Themen
- Modellierung von räumlichen Beziehungen
- Was ist ein Z-Wert? Was ist ein p-Wert?
- Räumliche Gewichtungen
- Überblick über das Toolset "Cluster-Zuordnung"
- Räumliche Autokorrelation (Morans I)
- Cluster- und Ausreißeranalyse (Anselin Local Morans I)
- Funktionsweise der Hot-Spot-Analyse (Getis-Ord Gi*)
- Inkrementelle räumliche Autokorrelation
- Optimierte Hot-Spot-Analyse
- Optimierte Ausreißeranalyse