El uso de la estadística espacial no implica la aplicación de métodos estadísticos tradicionales (no espaciales) a datos que son espaciales por casualidad (que tienen coordenadas x e y). La estadística espacial integra el espacio y las relaciones espaciales directamente en sus cálculos matemáticos (área, distancia, longitud, etc.). Para muchas estadísticas espaciales, estas relaciones espaciales se especifican formalmente a través de un archivo o una tabla de matriz de ponderaciones espaciales.
Una matriz de ponderaciones espaciales es una representación de la estructura espacial de los datos. Es una cuantificación de las relaciones espaciales que existen entre las entidades del dataset (o, al menos, una cuantificación del modo en el que se conceptualizan esas relaciones). Debido a que la matriz de ponderaciones espaciales impone una estructura en los datos, debe seleccionar una conceptualización que refleje lo mejor posible el modo en que las entidades realmente interactúan entre sí (teniendo en cuenta, por supuesto, qué es lo que intenta medir). Si mide el clustering de una especie de árbol en particular que se reproduce mediante la semilla en el bosque, por ejemplo, alguna forma de distancia inversa probablemente sea la más apropiada. Sin embargo, si evalúa la distribución geográfica de los viajeros de una región, el tiempo de viaje o el coste de viaje pueden ser mejores opciones.
Mientras que se implementa físicamente de diversas maneras, conceptualmente, la matriz de ponderaciones espaciales es una tabla NxN (N es el número de entidades en el dataset). Hay una fila y una columna para cada entidad. El valor de la celda para cualquier combinación de fila/columna dada es la ponderación que cuantifica la relación espacial entre dichas entidades de fila y columna.
En el nivel más básico, existen dos estrategias para crear pesos que cuantifiquen las relaciones entre las entidades de datos: ponderaciones binarias y variables. Para las estrategias binarias (distancia fija, K vecinos más próximos, Triangulación de Delaunay, contigüidad o una ventana espacio-tiempo) una entidad es un vecino (1) o no lo es (0). Para las estrategias ponderadas (distancia inversa o zona de indiferencia), las entidades vecinas tienen un impacto (o influencia) que varía y los pesos se calculan para reflejar esa variación.
En base a las especificaciones del parámetro, la herramienta Generar matriz de ponderaciones espaciales crea un archivo matriz de ponderaciones espaciales (SWM). Los valores de las relaciones espaciales en ese archivo se almacenan mediante técnicas de matriz dispersa para minimizar el espacio en disco, la memoria del equipo y la cantidad de cálculos requeridos. Estos valores de relación se utilizan en los cálculos matemáticos de varias herramientas de estadística espacial, incluidas Autocorrelación espacial (I de Moran global), Análisis de punto caliente (Gi* de Getis-Ord) y Análisis de cluster y de valor atípico (I Anselin local de Moran). Mientras que el archivo de matriz de ponderaciones espaciales puede almacenar relaciones espaciales NxN, en la mayoría de los casos, cada entidad solo debe estar relacionada con un grupo pequeño de entidades. La metodología dispersa aprovecha esta situación al almacenar solo relaciones distintas de cero.
Recursos adicionales
Getis, Arthur y Jared Aldstadt. "Constructing the Spatial Weights Matrix Using a Local Statistic." Geographical Analysis 36(2): 90–104, 2004.
Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.