Análisis de puntos calientes optimizado—Ayuda

Resumen
Ilustración
Uso
Sintaxis
Muestra de código
Entornos
Información sobre licencias

Resumen

Dados unos puntos de incidentes o unas entidades ponderadas (puntos o polígonos), crea un mapa de puntos calientes y fríos significativos en términos estadísticos mediante el uso de la estadística Gi* de Getis-Ord. Evalúa las características de la clase de entidad de entrada para producir resultados óptimos.

Obtener más información sobre cómo funciona el Análisis de puntos calientes optimizado

Ilustración

Uso

Esta herramienta identifica clusters espaciales estadísticamente significativos de valores altos (puntos calientes) y valores bajos (puntos fríos). Agrega automáticamente datos de incidentes, identifica una escala de análisis apropiada y corrige tanto las diversas pruebas como la dependencia espacial. Esta herramienta interroga los datos para determinar la configuración que producirá resultados óptimos en el análisis de puntos calientes. Si desea un control total sobre esta configuración, utilice en su lugar la herramienta Análisis de puntos calientes.
Nota:
Los datos de incidentes son puntos que representan eventos (delincuencia, accidentes de tráfico) u objetos (árboles, tiendas) donde el foco se centra en su presencia o ausencia en lugar de algún atributo de medición asociado con cada punto.
La configuración calculada que se utiliza para producir resultados óptimos en el análisis de puntos calientes se notifica en la ventana de resultados. Los flujos de trabajo y algoritmos asociados se explican en Cómo funciona el Análisis de puntos calientes optimizado.
Esta herramienta crea una nueva Clase de entidad de salida con una puntuación z, un valor P y un bin de nivel de confianza (Gi_Bin) para cada entidad en la Clase de entidad de entrada.
El campo Gi_Bin identifica estadísticamente puntos calientes y fríos significativos, corregidos para la realización de varias pruebas y para dependencia espacial utilizando el método de corrección False Discovery Rate (FDR). Las entidades en los bins +/-3 (entidades con un valor de Gi_Bin de +3 o -3) son estadísticamente significativos con un nivel de confianza del 99 por ciento; las entidades en los bins +/-2 reflejan un nivel de confianza del 95 por ciento; las entidades en los bins +/-1 reflejan un nivel de confianza del 90 por ciento; y el clustering para las entidades con 0 para el campo Gi_Bin no es estadísticamente significativo.
Los campos de puntuación z y valor p no reflejan ninguna corrección FDR (False Discovery Rate). Para obtener más información sobre las puntuaciones z y los valores P, consulte ¿Qué es una puntuación z? ¿Qué es un valor p?
Cuando la Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un Sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionar muy buenas estimaciones de verdaderas distancias geodésicas, al menos para los puntos separados unos treinta grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.
Precaución:
Asegúrese de proyectar los datos si su área de estudio se extiende más allá de los 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.
Las Entidades de entrada pueden ser puntos o polígonos. Con polígonos, se requiere un Campo de análisis.
Si se proporciona un Campo de análisis, debe contener una variedad de valores. La operación matemática para esta estadística requiere cierta variación en la variable analizada; no puede resolver si todos los valores de entrada son 1, por ejemplo.
Con un Campo de análisis, esta herramienta es apta para todos los datos (puntos o polígonos) que incluyan datos de muestreo. De hecho, esta herramienta es efectiva y fiable incluso cuando existe un exceso de muestreo. Cuando hay muchas entidades (exceso de muestreo), la herramienta tiene demasiada información para calcular resultados precisos y fiables. Cuando hay pocas entidades (falta de muestreo), la herramienta hará todo lo posible para generar resultados precisos y fiables, pero dispondrá de menos información con la que trabajar.
Puesto que la estadística Getis-Ord Gi* subyacente usada por esta herramienta es asintóticamente normal, los resultados son fiables incluso cuando el Campo de análisis contiene datos sesgados.
Con los datos de punto, en ocasiones le puede interesar analizar valores de datos asociados con cada entidad de puntos, y en consecuencia proporcionará un Campo de análisis. En otros casos, quizá solo le interese evaluar el patrón espacial (clustering) de las ubicaciones de puntos o incidentes de puntos. La decisión de proporcionar o no un Campo de análisis dependerá de la pregunta que se esté formulando.
- El análisis de entidades de puntos con un Campo de análisis le permite responder a preguntas como: ¿Dónde se agrupan los valores altos y bajos entre los puntos?
- El campo de análisis seleccionado podría representar:
  - Recuentos (como el número de accidentes de tráfico en las intersecciones de calles)
  - Tasas (como desempleo urbano, en la que cada ciudad está representada por una entidad de punto)
  - Medias (como la nota media en los exámenes de matemáticas entre escuelas)
  - Índices (como el índice de satisfacción del consumidor para concesionarios de coches del país)
- Analizar entidades de puntos cuando no existe un Campo de análisis le permite identificar dónde se da un clustering de puntos inusualmente intensa o escasa (estadísticamente significativa). Este tipo de análisis responde a preguntas como: ¿Dónde se encuentran muchos puntos? ¿Dónde se encuentran pocos puntos?
Si no proporciona un Campo de análisis, la herramienta agregará los puntos para obtener recuentos de puntos que utilizará como un campo de análisis. Hay tres esquemas de agregación posibles:
- Para COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS, se calcula un tamaño de celda de polígono apropiado y se utiliza para crear una malla de polígonos de red. La red se coloca sobre los puntos de incidentes y se realiza el recuento de los puntos dentro de cada celda de polígono. Si no se proporciona una capa de entidades Polígonos de delimitación que definen dónde es posible que se produzcan incidentes, las celdas de red con cero puntos se eliminan y solo se analizan las celdas restantes. Cuando se proporciona una capa de entidades de polígonos de delimitación, todas las celdas de red que caen dentro de los polígonos de delimitación se conservan y analizan. Los recuentos de puntos para cada celda de polígono se usan como campo de análisis.
- Para COUNT_INCIDENTS_WITHIN_AGGREGATION_POLYGONS, debe proporcionar la capa de entidades Polígonos para agregar incidentes en recuentos. Se realizará el recuento de los incidentes de punto que caigan dentro de cada polígono y se analizarán estos polígonos con sus recuentos asociados. La opción COUNT_INCIDENTS_WITHIN_AGGREGATION_POLYGONS es una estrategia de agregación apropiada cuando los puntos se asocian a unidades administrativas como distritos, condados o distritos escolares. También puede usar esta opción si desea que el área de estudio permanezca fija en los diversos análisis para optimizar la realización de comparaciones.
- Para SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS, se calcula una distancia de alineación y se usa para agregar puntos de incidentes cercanos. A cada punto agregado se le otorga un recuento que refleja el número de incidentes que se alinearon juntos. A continuación, los puntos agregados se analizan con los recuentos de incidentes sirviendo como campo de análisis. La opción SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS es una estrategia de agregación apropiada cuando se tienen muchos puntos coincidentes, o prácticamente coincidentes, y se desea mantener aspectos del patrón espacial de los datos de puntos originales. En muchos casos le convendrá probar tanto SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS como COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS y ver qué resultado refleja mejor el patrón espacial de los datos de puntos originales. Las soluciones de red pueden separar artificialmente clústeres de incidentes de punto pero, para algunas personas, la interpretación de la salida puede ser más fácil que la salida de punto ponderado.
Precaución:
El análisis de los datos de punto sin especificar un Campo de análisis solo tiene sentido cuando se disponen de todos los incidentes de puntos conocidos y cuando está seguro de que no existe ninguna influencia en la distribución de puntos que está analizando. Con los datos de muestreo casi siempre incluirá un Campo de análisis (a no ser que esté específicamente interesado en el patrón espacial del esquema de muestreo).
Cuando se selecciona COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS para el Método de agregación de datos de incidentes puede proporcionar opcionalmente una capa de entidades Polígonos de delimitación que definen dónde es posible que se produzcan incidentes. Cuando no se proporcionan polígonos de delimitación, la herramienta no puede saber si una ubicación sin un incidente debe ser un cero para indicar que es posible un incidente en esa ubicación pero no se produjo, o si la ubicación debe eliminarse del análisis porque nunca se producirían incidentes en la misma. Por consiguiente, cuando no se proporcionan polígonos de delimitación, solo las celdas de red con al menos un incidente se conservan para su análisis. Si no es este el comportamiento que desea, puede proporcionar una capa de entidades Polígonos de delimitación que definen dónde es posible que se produzcan incidentes para asegurarse de que se conserven todas las ubicaciones dentro de los polígonos de delimitación. Las celdas de red sin incidentes subyacentes recibirán un recuento cero de incidentes.
Los incidentes que caigan fuera de Polígonos de delimitación que definen dónde es posible que se produzcan incidentes o de Polígonos para agregar incidentes en recuentos se excluirán del análisis.
Si tiene ArcGIS Spatial Analyst extension, puede elegir la creación de una Superficie de densidad de las Entidades de entrada de los puntos. Con las Entidades de entrada de puntos, el parámetro Superficie de densidad se habilita cuando especifica un Campo de análisis o selecciona la opción SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS para el Método de agregación de datos de incidentes. La Superficie de densidad de salida se recortará a la máscara de análisis ráster especificada en la configuración del entorno. Si no se especifica una máscara ráster, la capa ráster de salida se recortará a una envoltura convexa alrededor de las Entidades de entrada.
Debe usar las herramientas Generar matriz de pesos espaciales y Análisis de puntos calientes (Gi* de Getis-Ord) si desea identificar puntos calientes espacio-tiempo. Se proporciona más información acerca del análisis clúster de espacio-tiempo en el tema Análisis clúster de espacio-tiempo.
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.
La capa Entidades de salida se agrega automáticamente a la tabla de contenido con la representación predeterminada aplicada al campo Gi_Bin. La representación cálida a fría está definida por un archivo de capas que se encuentra en <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers. Puede volver a aplicar la representación predeterminada, de ser necesario, al importar la simbología de capa de plantilla.

Sintaxis

OptimizedHotSpotAnalysis_stats (Input_Features, Output_Features, {Analysis_Field}, {Incident_Data_Aggregation_Method}, {Bounding_Polygons_Defining_Where_Incidents_Are_Possible}, {Polygons_For_Aggregating_Incidents_Into_Counts}, {Density_Surface})

Parámetro	Explicación	Tipo de datos
Input_Features	La clase de entidad de puntos o poligonal para la que se realizará el análisis de puntos calientes.	Feature Layer
Output_Features	La clase de entidad de salida que recibirá los resultados de puntuación z, valor P y Gi_Bin.	Feature Class
Analysis_Field (Opcional)	El campo numérico (número de incidentes, índices de delincuencia, puntuaciones de exámenes, etc.) que se va a evaluar.	Field
Incident_Data_Aggregation_Method (Opcional)	El método de agregación que se va a usar para crear entidades ponderadas para su análisis a partir de datos de puntos de incidentes. COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS —Una malla de polígono de red se superpondrá a los datos de puntos de incidentes y se realizará el recuento de los incidentes dentro de cada celda de polígono. Si no se proporciona un polígono de límite en el parámetro Bounding_Polygons_Defining_Where_Incidents_Are_Possible, solo se utilizarán en el análisis las celdas con al menos un incidente; de lo contrario, se analizarán todas las celdas dentro de los polígonos de delimitación. COUNT_INCIDENTS_WITHIN_AGGREGATION_POLYGONS —Debe proporcionar polígonos de agregación para que se superpongan los datos de puntos de incidentes en el parámetro Polygons_For_Aggregating_Incidents_Into_Counts. Se realiza el recuento de los incidentes dentro de cada polígono. SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS —Se agregarán juntos los incidentes cercanos para crear un solo punto ponderado. El peso para cada punto es el número de incidentes agregados en esa ubicación.	String
Bounding_Polygons_Defining_Where_Incidents_Are_Possible (Opcional)	Clase de entidad poligonal que define dónde podrían producirse las Input_Features de incidentes.	Feature Layer
Polygons_For_Aggregating_Incidents_Into_Counts (Opcional)	Polígonos que se usan para agregar las Input_Features de incidentes para obtener un recuento de incidentes para cada entidad poligonal.	Feature Layer
Density_Surface (Opcional)	La superficie de densidad de salida de las entidades de entrada de puntos. Este parámetro solo se habilita cuando las Input_Features son puntos y se tiene la ArcGIS Spatial Analyst extension. La superficie de salida creada se recortará a la máscara de análisis ráster especificada en la configuración del entorno. Si no se especifica una máscara ráster, la capa ráster de salida se recortará a una envoltura convexa de las entidades de entrada.	Raster Dataset

Muestra de código

Ejemplo 1 de OptimizedHotSpotAnalysis (ventana de Python)

La siguiente secuencia de comandos de la ventana de Python muestra cómo se utiliza la herramienta OptimizedHotSpotAnalysis.

import arcpy
arcpy.env.workspace = r"C:\OHSA"
arcpy.OptimizedHotSpotAnalysis_stats("911Count.shp", "911OptimizedHotSpots.shp", "#", "SNAP_NEARBY_INCIDENTS_TO_CREATE_WEIGHTED_POINTS", "#", "#", "calls911Surface.tif")

Ejemplo 2 de OptimizedHotSpotAnalysis (secuencia de comandos de Python independiente)

La siguiente secuencia de comandos de Python independiente muestra cómo se utiliza la herramienta OptimizedHotSpotAnalysis.

# Analyze the spatial distribution of 911 calls in a metropolitan area

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\OHSA\data.gdb"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of 911 call data
    arcpy.MinimumBoundingGeometry_management("Calls911", "Calls911_MBG", "CONVEX_HULL", "ALL", 
                                             "#", "NO_MBG_FIELDS")

    # Optimized Hot Spot Analysis of 911 call data using fishnet aggregation method with a bounding polygon of 911 call data
    # Process: Optimized Hot Spot Analysis 
    ohsa = arcpy.OptimizedHotSpotAnalysis_stats("Calls911", "Calls911_ohsaFishnet", "#", "COUNT_INCIDENTS_WITHIN_FISHNET_POLYGONS", 
                                                "Calls911_MBG", "#", "#") 

except:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Entornos

Sistema de coordenadas de salida
Nota:
La geometría de entidades se proyecta al Sistema de coordenadas de salida antes del análisis. Todos los cálculos matemáticos se basan en la referencia espacial del Sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan mediante distancias de cuerda.
Transformaciones geográficas
Espacio de trabajo actual
Espacio de trabajo temporal
Nombres de campos calificados
La salida tiene valores M
Resolución M
Tolerancia M
La salida tiene valores Z
Valor Z de salida predeterminado
Resolución Z
Tolerancia Z
Resolución XY
Tolerancia XY
Tamaño de celda
Máscara
Alinear ráster

Información sobre licencias

ArcGIS Desktop Basic: Sí
ArcGIS Desktop Standard: Sí
ArcGIS Desktop Advanced: Sí