Disponible avec une licence Spatial Analyst.
L’outil Densité de noyau calcule la densité des entités dans leur voisinage. Elle peut être calculée pour les entités ponctuelles et linéaires.
Vous pouvez utiliser cet outil notamment pour analyser la densité résidentielle ou criminelle et étudier l’impact du réseau routier et du réseau de services publics sur l’habitat de la faune. Le champ de population permet d’appliquer une pondération plus importante à certaines entités ou de représenter plusieurs observations par un seul point. Par exemple, une adresse peut représenter une copropriété de six appartements, ou certains délits peuvent être pondérés davantage que d’autres pour déterminer les taux de criminalité dans leur ensemble. Dans le cas d’entités linéaires, une autoroute à chaussées séparées peut avoir plus d’impact qu’une étroite piste en terre battue.
Méthode de calcul de la densité de noyau
Pour des entités ponctuelles
L’outil Densité de noyau calcule la densité d’entités ponctuelles autour de chaque cellule raster en sortie.
Théoriquement, une surface uniformément incurvée passe par chaque point. La valeur de la surface est maximale à l’emplacement du point et diminue à mesure que l’on s’en éloigne, pour atteindre zéro à la distance Search radius (Rayon de recherche) à partir du point. Seul un voisinage circulaire est possible. Le volume sous la surface équivaut à la valeur du champ Population pour le point, ou à la valeur 1 si le paramètre NONE (Aucun) est défini. La densité à chaque cellule raster en sortie est calculée par l’addition des valeurs de toutes les surfaces de noyau où elles se superposent au centre de la cellule raster. La fonction Densité de noyau est basée sur la fonction de noyau quartique décrite par Silverman (1986, p. 76, équation 4.5).
Si un autre paramètre que NONE (Aucun) est utilisé pour le champ de population, la valeur de chaque élément détermine le nombre de comptabilisations du point. Par exemple, avec la valeur 3, le point compte pour trois points. Les valeurs peuvent être entières ou à virgule flottante.
Par défaut, une unité est sélectionnée en fonction de l’unité linéaire de la définition de la projection des données des entités ponctuelles en entrée ou telle qu’elle est spécifiée dans le paramètre d’environnement Output Coordinate System (Système de coordonnées en sortie). Si une unité de surface est sélectionnée, la densité calculée pour la cellule est multipliée par le facteur correspondant avant d'être écrite dans le raster en sortie.
Par exemple, si les unités en entrée sont des mètres, les unités de surface en sortie sont par défaut des kilomètres carrés. La comparaison d'un facteur d'échelle d'unité de mètres aux kilomètres entraîne une différence entre les valeurs en raison de l'application d'un multiplicateur de 1 000 000 (1 000 x 1 000 mètres).
Pour des entités linéaires
L’outil Densité de noyau peut également calculer la densité d’entités linéaires dans le voisinage de chaque cellule raster en sortie.
Théoriquement, une surface uniformément incurvée passe par chaque ligne. Sa valeur est la plus élevée sur la ligne et diminue à mesure que l’on s’en éloigne, pour atteindre zéro à la distance Search radius (Rayon de recherche) définie à partir de la ligne. La surface est définie de façon que le volume sous la surface est égal au produit de la multiplication de la longueur de la ligne par la valeur du champ Population. La densité à chaque cellule raster en sortie est calculée par l’addition des valeurs de toutes les surfaces de noyau où elles se superposent au centre de la cellule raster. La fonction de noyau pour les lignes est une adaptation de la fonction de noyau quartique pour la densité de points, comme la décrit Silverman.
L’illustration ci-dessus présente un segment de ligne ainsi que la surface de noyau qui est disposée dessus. La part de ce segment de ligne dans la densité est égale à la valeur de la surface de noyau au centre de la cellule raster.
Par défaut, une unité est sélectionnée en fonction de l’unité linéaire de la définition de la projection des données des entités polylignes en entrée ou telle qu’elle est spécifiée dans le paramètre d’environnement Output Coordinate System (Système de coordonnées en sortie).
Lorsqu’un facteur Area units (Unités de surface) en sortie est spécifié, il convertit les unités de longueur et de surface. Par exemple, si l’unité linéaire est le mètre, les unités de surface en sortie sont par défaut SQUARE_KILOMETERS, et les unités de densité de lignes obtenues sont converties en kilomètres par kilomètre carré. La comparaison d'un facteur d'échelle de surface de mètres aux kilomètres se traduira par une différence des valeurs de densité en raison de l'application d'un multiplicateur de 1 000.
Vous pouvez contrôler les unités de densité en sélectionnant manuellement le facteur approprié. Pour exprimer la densité en mètres par mètre carré (et non plus par défaut en kilomètres par kilomètre carré), définissez les unités de surface sur SQUARE_METERS. De la même manière, pour obtenir les unités de densité de votre sortie en miles par mile carré, définissez les unités de surface sur SQUARE_MILES.
Reportez-vous à la rubrique suivante pour en savoir plus sur les unités de distance spécifiques.
Si un champ de population autre qu'AUCUN est utilisé, la longueur de la ligne est considérée comme sa longueur réelle multipliée par la valeur du champ de population pour cette ligne.
Formules de calcul de la densité de noyau
Les formules suivantes indiquent comment la densité de noyau est calculée pour les points et comment le rayon de recherche par défaut est déterminé dans la formule de la densité de noyau.
Prévision de la densité des points
La densité prévue à un nouvel emplacement (x, y) est déterminée par la formule suivante :
où :
- i = 1,…,n sont les points en entrée. Il convient d’inclure dans la somme uniquement des points situés dans le rayon de l’emplacement (x, y).
- popi correspond à la valeur du champ de population du point I, qui est un paramètre facultatif.
- disti désigne la distance entre le point i et l’emplacement (x, y).
La densité calculée est ensuite multipliée par le nombre de points, ou par la somme du champ de population le cas échéant. Cette correction rend l’intégrale spatiale égale au nombre de points (ou à la somme du champ de population), alors qu’elle est habituellement égale à 1. Cette implémentation utilise un noyau quartique (Silverman, 1986). La formule doit être calculée pour chaque emplacement dont vous souhaitez estimer la densité. Étant donné qu’un raster est créé, les calculs sont appliqués au centre de chaque cellule du raster en sortie.
Rayon de recherche par défaut (bande passante)
La méthode de calcul du rayon de recherche par défaut a été améliorée dans ArcGIS 10.2.1.
L'algorithme permettant de déterminer le rayon de recherche par défaut, également appelé bande passante, est le suivant :
- Calculez le centre moyen des points en entrée. Si un champ de population a été fourni, ce calcul et tous les calculs suivants sont pondérés par les valeurs de ce champ.
- Calculez la distance à partir du centre moyen (pondéré) de tous les points.
- Calculez la médiane (pondérée) de ces distances, Dm.
- Calculez la valeur de la distance standard (pondérée), SD.
Reportez-vous à la rubrique consacrée à l’outil de statistiques spatiales Distance standard pour en savoir plus.
- Appliquez la formule suivante pour calculer la bande passante :
où :
- Dm représente la distance médiane (pondérée) à partir du centre moyen (pondéré).
- n représente le nombre de points si aucun champ de population n’est utilisé, ou la somme des valeurs du champ de population si ce champ est fourni.
- SD représente la distance standard.
Il convient de préciser que la partie min de l’équation indique que des deux options, SD ou , celle qui produira la plus petite valeur sera utilisée.
Deux méthodes permettent de calculer la distance standard : non pondérée et pondérée.
Distance non pondérée
où :
- x i , y i et z i sont les coordonnées de l’entité i.
- {x̄, ȳ, z̄} représente le centre moyen des entités.
- n est égal au nombre total d’entités.
Distance pondérée
où :
- wi est la pondération à l’entité i.
- {x w, y w, z w} représente le centre moyen pondéré.
Méthodologie
Cette méthodologie de choix du rayon de recherche, qui repose sur la formule d’estimation de la bande passante selon la règle générale de Silverman, a été adaptée pour deux dimensions. Cette approche de calcul d’un rayon par défaut permet généralement d’éviter le phénomène d’« anneau autour des points » qui se produit souvent en présence de jeux de données clairsemés. Elle est également efficace contre les points spatiaux aberrants (les quelques points très éloignés des autres).
Régénération de résultats provenant de versions antérieures d'ArcGIS
Jusqu’à la version 10.2.1 de ArcGIS, le rayon de recherche par défaut était calculé en divisant par 30 la largeur et la hauteur, selon celle qui est la plus petite des deux, de l’étendue de l’entrée. Si vous souhaitez reproduire ces résultats, multipliez la valeur par défaut du paramètre Output cell size (Taille de cellule en sortie) par 25/3, ou 8,333333.
Bibliographie
Silverman, B. W. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall, 1986.