Les statistiques spatiales intègrent directement l'espace et les relations spatiales dans leurs formules mathématiques (superficie, distance, longueur ou proximité, par exemple). En général, ces relations spatiales sont définies formellement par des valeurs appelées des pondérations spatiales. Les pondérations spatiales sont structurées dans une matrice de pondérations spatiales et stockées dans un fichier de matrice de pondérations spatiales.
Une matrice de pondérations spatiales quantifie les relations spatiales et temporelles qui existent entre les entités d'un jeu de données (ou du moins quantifie la conceptualisation de ces relations). Bien que le format physique du fichier de matrice de pondérations spatiales puisse connaître des variations, vous pouvez envisager le concept de matrice de pondérations spatiales comme une table comportant une ligne et une colonne pour chaque entité dans le jeu de données. La valeur de cellule pour toute combinaison ligne/colonne donnée est la pondération qui quantifie la relation spatiale entre ces entités de colonne et de ligne.
En matière de pondération, les possibilités sont nombreuses, par exemple : inverse de la distance, distance constante, fenêtre spatio-temporelle, K voisins les plus proches, contiguïté et interaction spatiale. Ces modèles conceptuels de relations spatiales sont décrits dans la rubrique Modélisation des relations spatiales. La conceptualisation que vous sélectionnez pour modéliser des relations spatiales pour une analyse particulière impose une structure à vos données. Par conséquent, il est préférable de sélectionner une conceptualisation qui reflète au mieux la façon dont les entités qui sont analysées interagissent l'une avec l'autre dans le monde réel.
A un niveau très basique, toutefois, les pondérations sont soit binaires, soit variables. La pondération binaire, par exemple, est utilisée avec les relations spatiales de type distance constante, fenêtre spatio-temporelle, K voisins les plus proches et contiguïté. Pour une entité cible particulière, la pondération binaire affecte une pondération de 1 à toutes les entités voisines et une pondération de 0 à toutes les autres entités. Pour les relations spatiales de type inverse de la distance ou du temps, les pondérations sont variables. Les pondérations variables sont comprises dans une plage allant de 0 à 1 afin que les voisins proches obtiennent des pondérations plus importantes que les voisins plus éloignés.
Les pondérations spatiales sont souvent standardisées par lignes, en particulier avec les stratégies de pondération binaires. La standardisation par lignes permet de créer des pondérations proportionnelles au cas où les entités ont un nombre de voisins différent. La standardisation par lignes implique la division de chaque pondération de voisinage pour une entité, par la somme de toutes les pondérations de voisinage pour l'entité et est recommandée quand la distribution des entités est potentiellement biaisée par la conception de l'échantillonnage ou la structure d'agrégation imposée. Dans le cas des entités surfaciques, vous voudrez pratiquement toujours appliquer la standardisation par lignes.
Rubriques connexes
- Modélisation de relations spatiales
- Générer les pondérations spatiales de réseau
- Générer la matrice de pondérations spatiales
- Agrégation élevée/faible (Getis-Ord General G)
- Autocorrélation spatiale (Global Moran's I)
- Analyse de grappes et de valeurs aberrantes (Anselin Local Morans I)
- Analyse de point chaud (Getis-Ord Gi*)
- Analyse des regroupements