Lokale Ausreißeranalyse—Hilfe

Zusammenfassung
Abbildung
Verwendung
Syntax
Codebeispiel
Umgebungen
Lizenzinformationen

Zusammenfassung

Identifiziert statistisch signifikante Cluster und Ausreißer im Kontext von Raum und Zeit. Dieses Werkzeug stellt eine Raum-Zeit-Implementierung der Anselin Local Morans I-Statistik dar.

Weitere Informationen zur Funktionsweise des Werkzeugs Lokale Ausreißeranalyse

Abbildung

Verwendung

Dieses Werkzeug akzeptiert ausschließlich netCDF-Dateien, die mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen generiert wurden.
Jeder Abschnitt des Raum-Zeit-Würfels enthält die Werte LOCATION_ID, time_step_ID, COUNT sowie mögliche Zusammenfassungsfelder, die beim Erstellen des Würfels aggregiert wurden. Abschnitte, die demselben physischen Speicherort zugeordnet sind, besitzen dieselbe Positions-ID und stellen zusammen eine Zeitserie dar. Abschnitte, die demselben Zeitintervall zugeordnet sind, besitzen dieselbe Zeitschritt-ID und stellen ein gemeinsames Zeitintervall dar. Der Zählwert für jeden Abschnitt entspricht der Anzahl der Punkte, die innerhalb des zugeordneten Zeitintervalls an der zugeordneten Position entstanden sind.
Mit diesem Werkzeug wird eine Variable im netCDF-Eingabe-Raum-Zeit-Würfel mit einer Raum-Zeit-Implementierung der Anselin Local Morans I-Statistik analysiert.
Die Ausgabe-Features werden dem Inhaltsverzeichnis in einer Darstellung hinzugefügt, die eine Ergebniszusammenfassung der Raum-Zeit-Analyse für alle analysierten Positionen enthält. Wenn Sie eine Polygon-Analysemaske angeben, dann werden nur die Positionen analysiert, die sich innerhalb der Analysemaske befinden. Andernfalls werden diejenigen Positionen analysiert, die mindestens einen Punkt für mindestens ein Zeitintervall enthalten.
Neben den Ausgabe-Features wird im Ergebnisfenster eine Analysezusammenfassung ausgegeben. Klicken Sie im Fenster Ergebnisse mit der rechten Maustaste auf den Eintrag Meldungen und wählen Sie Anzeigen aus, um die Analysezusammenfassung in einem Meldungsdialogfeld anzuzeigen. Die Analysezusammenfassung wird auch im Statusdialogfeldfeld angezeigt.
Mit dem Werkzeug Lokale Ausreißeranalyse werden statistisch signifikante Cluster und Ausreißer im Kontext von Raum und Zeit identifiziert. Weitere Informationen zu den standardmäßigen Ausgabe-Kategoriedefinitionen und zu den verwendeten Algorithmen in diesem Analysewerkzeug finden Sie unter Weitere Informationen zur Funktionsweise des Werkzeugs "Lokale Ausreißeranalyse".
Zum Identifizieren von Clustern und Ausreißern im Raum-Zeit-Würfel nutzt dieses Werkzeug eine Raum-Zeit-Implementierung der Anselin Local Morans I-Statistik, die den Wert für jeden Abschnitt im Zusammenhang mit den Werten für benachbarte Abschnitte berücksichtigt. Ein Abschnitt gilt als Nachbar, wenn sein Schwerpunkt innerhalb der Nachbarschaftsentfernung und sein Zeitintervall innerhalb des angegebenen Nachbarschaftszeitintervalls liegt. Sollten Sie keinen Wert für die Nachbarschaftsentfernung angeben, wird anhand der räumlichen Verteilung Ihrer Punktdaten einer berechnet. Wird für das Nachbarschaftszeitintervall kein Wert vorgegeben, verwendet das Werkzeug den Standardwert 1 als Zeitintervall.
Um zu bestimmen, welche Abschnitte in der jeweiligen Analyse-Nachbarschaft einbezogen werden müssen, sucht das Werkzeug zunächst nach benachbarten Abschnitten, die innerhalb der angegebenen Nachbarschaftsentfernung liegen. Danach berücksichtigt es für jeden dieser Abschnitte an denselben Positionen befindliche Abschnitte aus N vorangegangenen Zeitintervallen, wobei N dem von Ihnen angegebenen Nachbarschaftszeitintervall entspricht.
Der Wert Nachbarschaftszeitintervall entspricht der Anzahl von Zeitintervallen, die in die Analysenachbarschaft einbezogen werden sollen. Beträgt das Zeitintervall des Würfels beispielsweise drei Monate, und Sie geben 2 als Nachbarschaftszeitintervall an, werden alle Abschnittszählungen innerhalb der Nachbarschaftsentfernung sowie alle ihnen zugeordneten Abschnitte für die vorangegangenen Zeitintervalle (die sich über einen Zeitraum von neun Monaten erstrecken) in der Nachbarschaftsanalyse erfasst.
Permutationen werden verwendet, um zu bestimmen, wie hoch die Wahrscheinlichkeit ist, die analysierten Werte tatsächlich mit der vorhandenen räumlichen Verteilung aufzufinden. Für jede Permutation werden die Nachbarschaftswerte um jeden Abschnitt zufällig neu angeordnet und der Local Morans I-Wert berechnet. Das Ergebnis ist eine Referenzverteilung von Werten, die daraufhin mit den tatsächlich beobachteten Morans I-Werten verglichen wird, um zu bestimmen, mit welcher Wahrscheinlichkeit der beobachtete Wert in der zufälligen Verteilung gefunden werden kann. Die Standardeinstellung liegt bei 499 Permutationen. Die zufällige Beispielverteilung und damit die Genauigkeit des Pseudo-p-Wertes wird jedoch durch eine zunehmende Anzahl von Permutationen verbessert.
Wenn für den Parameter Anzahl der Permutationen die Einstellung 0 festgelegt wird, ist das Ergebnis ein herkömmlicher p-Wert anstelle eines Pseudo-p-Wertes.
Die von diesem Werkzeug angewendeten Permutationen nutzen die erhöhte Performance, die Systeme mit mehreren CPUs (oder Multi-Core-CPUs) bieten. Standardmäßig wird dabei die Hälfte der maximal verfügbaren CPU-Anzahl verwendet. Die erhöhte Verarbeitungsgeschwindigkeit macht sich bei größeren Raum-Zeit-Würfeln oder Werkzeugausführungen mit einer größeren Anzahl von Permutationen am meisten bemerkbar. Die Anzahl der verwendeten CPUs kann mit der Umgebung für den Faktor für parallele Verarbeitung erhöht oder reduziert werden.
Der Feature-Layer Polygon-Analysemaske kann mindestens ein Polygon enthalten, mit dem das Analyse-Untersuchungsgebiet definiert wird. Aus diesen Polygonen sollte hervorgehen, wo Punkt-Features möglicherweise auftreten könnten, und sie sollten Flächen ausschließen, in denen Punkte unmöglich auftreten könnten. Wenn Sie beispielsweise Trends zu Wohnungseinbrüchen untersuchen, sollten Sie die Polygon-Analysemaske verwenden, um große Wasserflächen, lokale Parks oder andere Gebiete auszuschließen, die keine Wohngebiete sind.
Die Polygon-Analysemaske wird mit der Ausdehnung des Eingabe-Raum-Zeit-Würfels geschnitten und erweitert nicht die Dimensionen des Würfels.
Wenn die Polygon-Analysemaske, mit der Sie das Untersuchungsgebiet festlegen, eine Fläche abdeckt, die über die Ausdehnung der Eingabe-Features hinausgeht, die bei der ersten Erstellung des Würfels herangezogen wurden, können Sie den Würfel mithilfe dieser Polygon-Analysemaske als Ausgabeausdehnungsumgebung neu erstellen. Dadurch wird sichergestellt, dass die gesamte von der Polygon-Analysemaske abgedeckte Fläche in das Werkzeug Lokale Ausreißeranalyse einbezogen wird. Durch die Verwendung der Polygon-Analysemaske als Einstellung für die Ausgabeausdehnungsumgebung während der Würfelerstellung wird sichergestellt, dass die Ausdehnung des Würfels und die Ausdehnung der Polygon-Analysemaske übereinstimmen.
Dieses Werkzeug erstellt eine neue Ausgabe-Feature-Class mit den folgenden Attributen für jede Position im Raum-Zeit-Würfel. Diese Felder können für eine benutzerdefinierte Visualisierung der Ausgabe verwendet werden. Weitere Informationen zu den zusätzlichen Analyseergebnissen finden Sie unter Weitere Informationen zur Funktionsweise des Werkzeugs "Lokale Ausreißeranalyse".
- Anzahl der Ausreißer
- Prozentsatz der Ausreißer
- Anzahl der niedrigen Cluster
- Prozentsatz der niedrigen Cluster
- Anzahl der niedrigen Ausreißer
- Prozentsatz der niedrigen Ausreißer
- Anzahl der hohen Cluster
- Prozentsatz der hohen Cluster
- Anzahl der hohen Ausreißer
- Prozentsatz der hohen Ausreißer
- Positionen ohne räumliche Nachbarn
- Positionen mit einem Ausreißer im letzten Zeitschritt
- Cluster-Ausreißertyp
- und zusätzliche Summenstatistiken
Der Cluster-Ausreißertyp gibt immer statistisch signifikante Cluster und Ausreißer für ein Konfidenzniveau von 95 Prozent an. Nur statistisch signifikante Abschnitte verfügen über Werte in diesem Feld. Diese Signifikanz ist Ausdruck einer FDR-Korrektur (False Discovery Rate).
Das Standard-Rendering für die Ausgabe-Feature-Class basiert auf dem Feld CO_TYPE und zeigt Positionen, die statistisch signifikant waren. Es zeigt Positionen, die Teil eines signifikanten Hoch-hoch-Clusters, Hoch-niedrig-Ausreißers, Niedrig-hoch-Ausreißers oder Niedrig-niedrig-Clusters waren oder im Laufe der Zeit mit der Klassifizierung "Mehrere Typen" eingestuft wurden.
Um sicherzustellen, dass jede Position über mindestens einen zeitlichen Nachbarn verfügt, wird für das erste Zeitintervall kein Local Morans-Index berechnet. Die Abschnittswerte im ersten Zeitintervall werden jedoch in die Berechnung des globalen Durchschnitts einbezogen.

Durch die Ausführung des Werkzeugs Lokale Ausreißeranalyse werden die Analyseergebnisse wieder in den netCDF-Eingabe-Raum-Zeit-Würfel geschrieben. Jeder Abschnitt wird im Kontext benachbarter Abschnitte einer Analyse unterzogen, um die Cluster-Bildung sowohl für hohe als auch für niedrige Werte zu messen und räumliche sowie zeitliche Ausreißer in diesen Clustern zu identifizieren. Das Ergebnis dieser Analyse umfasst einen Local Morans I-Index, einen Pseudo-p-Wert (oder p-Wert, wenn keine Permutationen verwendet werden) und einen Cluster- oder Ausreißertyp (CO_TYPE) für jeden Abschnitt im Raum-Zeit-Würfel.

Es folgt eine Übersicht der zum Eingabe-Raum-Zeit-Würfel hinzugefügten Variablen:


Variablenname	Beschreibung	Bemaßung
OUTLIER_{ANALYSIS_VARIABLE}_INDEX	Der berechnete Local Morans I-Index.	Dreidimensional: ein Local Morans I-Indexwert für jeden Abschnitt des Raum-Zeit-Würfels.
OUTLIER_{ANALYSIS_VARIABLE}_PVALUE	Pseudo-p-Wert oder p-Wert der Anselin Local Morans I-Statistik, mit dem die statistische Signifikanz des Local Morans I-Wertes gemessen wird.	Dreidimensional: ein p-Wert oder Pseudo-p-Wert für jeden Abschnitt des Raum-Zeit-Würfels.
OUTLIER_{ANALYSIS_VARIABLE}_TYPE	Der Ergebniskategorietyp, bei dem zwischen einem statistisch signifikanten Cluster mit hohen Werten (Hoch-hoch), einem Cluster mit niedrigen Werten (Niedrig-niedrig), Ausreißern, bei denen ein hoher Wert von hauptsächlich niedrigen Werten umgeben ist (Hoch-niedrig), und Ausreißern, bei denen ein niedriger Wert von hauptsächlich hohen Werten umgeben ist (Hoch-niedrig), unterschieden wird.	Dreidimensional: ein Cluster- oder Ausreißertyp für jeden Abschnitt des Raum-Zeit-Würfels. Der Abschnitt basiert auf einer FDR-Korrektur.
OUTLIER_{ANALYSIS_VARIABLE} _HAS_SPATIAL_NEIGHBORS	Positionen mit räumlichen Nachbarn und Positionen, die nur auf zeitliche Nachbarn zurückgreifen können.	Zweidimensional: eine Klassifizierung für jede Position. Die Analyse von Positionen, die über keine räumlichen Nachbarn verfügen, führt zu Berechnungen, die ausschließlich auf zeitlichen Nachbarn beruhen.

Syntax

LocalOutlierAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, neighborhood_time_step, {number_of_permutations}, {polygon_mask})

Parameter	Erklärung	Datentyp
in_cube	Der zu analysierende netCDF-Würfel. Die Datei muss eine Erweiterung (.nc) haben und mit dem Werkzeug Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen erstellt worden sein.	File
analysis_variable	Die numerische Variable in der netCDF-Datei, die analysiert werden soll.	String
output_features	Die Ausgabe-Feature-Class mit Positionen, die als statistisch signifikante Cluster oder Ausreißer eingestuft wurden.	Feature Class
neighborhood_distance (optional)	Die räumliche Ausdehnung der Analysenachbarschaft. Anhand dieses Wertes wird bestimmt, welche Features zusammen analysiert werden, um lokale Raum-Zeit-Cluster-Bildung zu bewerten.	Linear Unit
neighborhood_time_step	Die Anzahl der Zeitschrittintervalle, die in die Analysenachbarschaft einbezogen werden sollen. Anhand dieses Wertes wird bestimmt, welche Features zusammen analysiert werden, um lokale Raum-Zeit-Cluster-Bildung zu bewerten.	Long
number_of_permutations (optional)	Die Anzahl der zufälligen Permutationen für die Berechnung von Pseudo-p-Werten. Die Standardanzahl der Permutationen ist 499. Bei einer Auswahl von 0 Permutationen wird der Standard-p-Wert berechnet. 0 —Es werden keine Permutationen verwendet und ein Standard-p-Wert berechnet. 99 —Bei 99 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,01 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes. 199 —Bei 199 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,005 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes. 499 —Bei 499 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,002 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes. 999 —Bei 999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,001 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes. 9999 —Bei 9999 Permutationen ist der kleinstmögliche Pseudo-p-Wert 0,0001 und alle anderen Pseudo-p-Werte sind gerade Vielfache dieses Wertes.	Long
polygon_mask (optional)	Ein Polygon-Feature-Layer mit mindestens einem Polygon, der das Analyse-Untersuchungsgebiet definiert. Eine Polygon-Analysemaske wird verwendet, um beispielsweise einen großen See aus der Analyse auszuschließen. Im Eingabe-Raum-Zeit-Würfel definierte Abschnitte, die außerhalb der Maske liegen, werden nicht in die Analyse einbezogen.	Feature Layer

Codebeispiel

LocalOutlierAnalysis – Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie das Werkzeug "LocalOutlierAnalysis" verwendet werden kann.

# LocalOutlierAnalysis of homicides in a metropolitan area
arcpy.env.workspace = r"C:\STPM"
arcpy.LocalOutlierAnalysis_stpm("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles", 2, 499, "#")

LocalOutlierAnalysis – Beispiel 2 (eigenständiges Python-Skript)

Das folgende eigenständige Skript im Python-Fenster veranschaulicht, wie das Werkzeug "LocalOutlierAnalysis" verwendet werden kann.

# Create Space Time Cube by aggregating homicide incidents in a metropolitan area
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\STPM"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace
    # Create Space Time Cube by aggregating homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube By Aggregating Points
    cube = arcpy.CreateSpaceTimeCube_stpm("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS", "HEXAGON_GRID")
    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.MinimumBoundingGeometry_management("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")
    # Local Outlier Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step with 499 permutations to detect outliers
    # Process: Local Outlier Analysis
    loa = arcpy.LocalOutlierAnalysis_stpm("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles",
                                          2, 499, "bounding.shp")
except:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Umgebungen

Aktueller Workspace
Scratch-Workspace
Ausgabe-Koordinatensystem
Geographische Transformationen
Zufallszahlengenerator
Hinweis:
Der verwendete Zufallsgeneratortyp ist stets Mersenne Twister.

Lizenzinformationen

Basic: Ja
Standard: Ja
Advanced: Ja

ArcMap

Lokale Ausreißeranalyse