Résumé
Calcule un index du voisin le plus proche en fonction de la distance moyenne de chaque entité par rapport à son entité avoisinante la plus proche.
Pour en savoir plus sur le fonctionnement de l'outil Distances moyennes du plus proche voisin
Illustration
Utilisation
L'outil Distances moyennes du plus proche voisin renvoie cinq valeurs : distance moyenne observée, distance moyenne attendue, indice de voisin le plus proche, score z et valeur p. Ces valeurs sont disponibles dans la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut. Cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message.
Les résultats de score z et de valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Notez, toutefois, que la signification sur le plan statistique de cette méthode est fortement impactée par la taille de la zone d'étude (voir ci-après). Pour la statistique Distances moyennes du plus proche voisin, l'hypothèse nulle suppose que les entités sont distribuées aléatoirement.
L'indice de voisin le plus proche est exprimé en tant que rapport de la distance moyenne observée à la distance moyenne attendue. La distance attendue est la distance moyenne entre voisins dans une distribution aléatoire hypothétique. Si l'indice est inférieur à 1, le modèle présente un phénomène d'agrégation ; si l'indice est supérieur à 1, la tendance est à la dispersion ou à la concurrence.
La méthode Distances moyennes du plus proche voisin est très sensible à la valeur Surface (d'infimes variations de la valeur du paramètre Surface peuvent provoquer des variations importantes dans les résultats du score z et de la valeur p). Par conséquent, l'outil Distances moyennes du plus proche voisin est plus efficace pour comparer des entités différentes dans une zone d'étude fixe. L'image suivante illustre la façon dont des distributions identiques d'entités peuvent être dispersées ou agrégées selon la zone d'étude spécifiée.
Si une valeur du paramètre Surface n'est pas spécifiée, c'est la superficie du rectangle d'encadrement minimum des entités en entrée qui est utilisée. Contrairement à l'étendue, un rectangle d'encadrement minimum ne s'aligne pas nécessairement sur les axes x et y.
Lorsque la Classe d'entités en entrée n'est pas projetée (c'est-à-dire, lorsque les coordonnées sont exprimées en degrés, minutes et secondes) ou lorsque le système de coordonnées en sortie est un Système de coordonnées géographiques, les distances sont calculées à l'aide des mesures à la corde. Les mesures de distance à la corde permettent de calculer rapidement et de fournir une bonne estimation de distance géodésiques réelles, du moins pour les points situés à environ trente degrés les uns des autres. Les distances de corde reposent sur un sphéroïde aplati. Si l'on prend deux points sur la surface de la Terre, la distance de corde qui les sépare est la longueur d'une ligne qui traverse la Terre en trois dimensions pour relier ces deux points. Les distances à la corde sont exprimées en mètres.
Lorsque vous utilisez des distances à la corde dans l'analyse, le paramètre Surface, s'il est spécifié, doit être exprimé en mètres.
Avant ArcGIS 10.2.1, un message d'avertissement s'affichait si les paramètres et les paramètres d'environnement sélectionnés devaient entraîner des calculs avec des coordonnées géographiques (degrés, minutes, secondes). Cet avertissement vous conseillait de projeter vos données dans un système de coordonnées projetées, de manière que les calculs de distance soient précis. Cependant, depuis la version 10.2.1, cet outil calcule les distances à la corde à chaque fois que des calculs de système de coordonnées géographiques sont nécessaires.
Dans certains cas, des rectangles d'encadrement minimum non valides (superficie nulle) sont générés pour des entités en entrée. Pour y remédier, une petite valeur dérivée de la tolérance x,y de l'entité en entrée permet de créer le rectangle d'encadrement minimum. Par exemple, si toutes les entités sont coïncidentes (toutes ont exactement les mêmes coordonnées x et y), le système utilise, dans les calculs, la superficie d'un petit polygone carré autour de l'emplacement unique. Autre exemple : si toutes les entités sont parfaitement alignées (par exemple, 3 points sur une ligne droite), le système utilise la superficie d'un polygone rectangle qui laisse un petit espace autour des entités encadrées. Quoi qu'il en soit, il vaut toujours mieux fournir une valeur de Surface avec l'outil Distances moyennes du plus proche voisin.
Bien que cet outil fonctionne avec des données surfaciques ou linéaires, il est plus adapté aux données d'événement, d'incident ou autres données d'entité ponctuelle fixe. Pour les entités linéaires et surfaciques, les calculs utilisent le centroïde géométrique vrai pour chaque entité. Pour les multi-points, les polylignes, ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
Cet outil peut également créer un fichier HTML récapitulant les résultats. Les fichiers HTML n'apparaissent pas automatiquement dans la fenêtre Catalogue. Si vous souhaitez afficher des fichiers HTML dans la fenêtre Catalogue, ouvrez l'application ArcCatalog, sélectionnez l'option de menu Personnaliser, cliquez sur Options ArcCatalog et sélectionnez l'onglet Types de fichiers. Cliquez sur le bouton Nouveau type et spécifiez HTML comme valeur du paramètre Extension de fichier.
-
Les couches peuvent permettre de définir la classe d'entités en entrée. Lorsque vous utilisez une couche avec une sélection, seules les entités sélectionnées sont comprises dans l'analyse.
Syntaxe
arcpy.stats.AverageNearestNeighbor(Input_Feature_Class, Distance_Method, {Generate_Report}, {Area})
Paramètre | Explication | Type de données |
Input_Feature_Class | Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle les distances moyennes du plus proche voisin sont calculées. | Feature Layer |
Distance_Method | Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
| String |
Generate_Report (Facultatif) | Spécifie si l'outil créera un récapitulatif graphique des résultats.
| Boolean |
Area (Facultatif) | Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie. | Double |
Exemple de code
Exemple 1 d'utilisation de l'outil AverageNearestNeighbor (fenêtre Python)
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.AverageNearestNeighbor_stats("burglaries.shp", "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
Exemple 2 de la fonction AverageNearestNeighbor (script autonome)
Le script Python autonome ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
# Analyze crime data to determine if spatial patterns are statistically significant
# Import system modules
import arcpy
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Obtain Nearest Neighbor Ratio and z-score
# Process: Average Nearest Neighbor...
nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
# Create list of Average Nearest Neighbor output values by splitting the result object
print("The nearest neighbor index is: " + nn_output[0])
print("The z-score of the nearest neighbor index is: " + nn_output[1])
print("The p-value of the nearest neighbor index is: " + nn_output[2])
print("The expected mean distance is: " + nn_output[3])
print("The observed mean distance is: " + nn_output[4])
print("The path of the HTML report: " + nn_output[5])
except arcpy.ExecuteError:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Environnements
Informations de licence
- Basic: Oui
- Standard: Oui
- Advanced: Oui
Rubriques connexes
- Présentation générale du jeu d'outils Analyse de modèles
- Modélisation de relations spatiales
- Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?
- Analyse de grappe spatiale multi-distances (fonction K de Ripley)
- Autocorrélation spatiale (Global Moran's I)
- Fonctionnement de l'outil Average Nearest Neighbor