Dado un conjunto de entidades (Clase de entidad de entrada) y un campo de análisis (Campo de entrada), la herramienta Análisis de cluster y de valor atípico identifica clusters espaciales de las entidades con valores altos o bajos. La herramienta también identifica los valores atípicos espaciales. Para realizar esto, la herramienta calcula un valor I de Moran local, una puntuación z, un valor P y un código que representa la entidad estadísticamente significativa. Las puntuaciones z y los valores P representan la significancia estadística de los valores de índice calculados.
Cálculos
Ver los cálculos matemáticos adicionales para la estadística de I de Moran local.
Interpretación
Un valor positivo para I indica que una entidad tiene entidades vecinas con valores de atributo altos o bajos similares; esta entidad es parte de un cluster. Un valor negativo para I indica que una entidad tiene entidades vecinas con valores diferentes; esta entidad es un valor atípico. En ambas instancias, el valor P para la entidad debe ser lo suficientemente pequeño para que el cluster o el valor atípico se consideren estadísticamente significativos. Para obtener más información sobre cómo determinar la significancia estadística, consulte¿Qué es una puntuación z? ¿Qué es un valor p? Tenga en cuenta que el índice I de Moran local (I) es una medida relativa y que solo se puede interpretar dentro del contexto de su puntuación z o valor P calculado. Las puntuaciones z y los valores p indicados en la clase de entidades de salida no están corregidos para la dependencia espacial o la realización de varias pruebas.
El campo de tipo cluster/valor atípico (COType) distingue entre un cluster de valores altos (AA), un cluster de valores bajos (BB), un valor atípico en el que un valor alto está rodeado principalmente por valores bajos (AB) y un valor atípico en el que un valor bajo está rodeado principalmente por valores altos (BA). La importancia estadística está establecida en un nivel de confianza del 95 por ciento. Cuando no se aplica la corrección FDR, las entidades con valores p inferiores a 0,05 se consideran estadísticamente significativas. La corrección FDR reduce este umbral del valor p de 0,05 a un valor que se ajusta mejor al nivel de confianza del 95 por ciento en el caso de la realización de varias pruebas.
Salida
Esta herramienta crea una nueva clase de entidad de salida con los siguientes atributos para cada entidad en la clase de entidad de entrada: índice I de Moran local, puntuación z, valor p y COType.
Cuando esta herramienta se ejecuta en ArcMap, la clase de entidad de salida se agrega automáticamente a la tabla de contenido (TOC) con una representación predeterminada aplicada al campo COType. La representación aplicada está definida por un archivo de capas en <ArcGIS>/ArcToolbox/Templates/Layers. Puede volver a aplicar la representación predeterminada, de ser necesario, al importar la simbología de capa de plantilla.
Pautas de mejores prácticas
- Los resultados son confiables solo si la clase de entidad de entrada contiene un mínimo de 30 entidades.
- Esta herramienta requiere un campo de entrada como conteo, tasa u otras medidas numéricas. Si analiza datos de punto, donde cada punto presenta un evento o un incidente único, es probable que no tenga un atributo numérico específico para evaluar (una clasificación de gravedad, un conteo u otra medida). Si está interesado en buscar ubicaciones con muchos incidentes (puntos calientes) o ubicaciones con muy pocos incidentes (puntos fríos), deberá agregar los datos de incidentes antes del análisis. La herramienta Análisis de puntos calientes (Gi* de Getis-Ord) también es efectiva para buscar puntos calientes y puntos fríos. Sin embargo, solo la herramienta Análisis de cluster y de valor atípico (I Anselin local de Moran) identificará los valores atípicos espaciales estadísticamente significativos (un valor alto rodeado por valores bajos o un valor bajo rodeado por valores altos).
- Seleccione una conceptualización de relaciones espaciales adecuada.
- Cuando selecciona la conceptualización SPACE_TIME_WINDOW, puede identificar los clusters de espacio-tiempo y los valores atípicos. Consulte Análisis espacio-tiempo para obtener más información.
- Seleccione una banda de distancia o una distancia de umbral adecuada.
- Todas las entidades deben tener al menos un vecino.
- Ninguna entidad debe tener todas las otras entidades como un vecino.
- Especialmente si los valores para el campo de entrada están sesgados, cada entidad debe tener aproximadamente ocho vecinos.
Potenciales aplicaciones
La herramienta Análisis de cluster y de valor atípico (I Anselin local de Moran) identifica concentraciones de valores altos, concentraciones de valores bajos y valores atípicos espaciales. Le puede ayudar a responder preguntas como las siguientes:
- ¿Dónde están los límites más nítidos entre prosperidad y pobreza en un área de estudio?
- ¿Existen ubicaciones en un área de estudio con patrones de gastos anómalos?
- ¿Dónde están las tasas de diabetes altas no esperadas en el área de estudio?
Las aplicaciones se pueden encontrar en muchos campos que incluyen economía, administración de recursos, biogeografía, geografía política y demografía.
Recursos adicionales
Anselin, Luc. "Local Indicators of Spatial Association—LISA," Geographical Analysis 27(2): 93–115, 1995.
Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.