Disponible avec une licence Spatial Analyst.
Les outils de segmentation et de classification proposent des méthodes d'extraction d'entités à partir d'images, basées sur des objets. Ces objets sont créés via un processus de segmentation d'images par lequel des pixels adjacents et qui présentent des caractéristiques spectrales similaires sont regroupés dans un segment. Les segments qui présentent certaines formes et caractéristiques spectrales et spatiales peuvent être à leur tour groupés sous forme d'objets. Les objets peuvent être groupés en classes représentant des entités du monde réel au sol. Vous pouvez également procéder à la classification d'images de pixels, à savoir des images traditionnelles non segmentées, par exemple.
Le processus d'extraction d'entité orienté objet est un workflow pris en charge par des outils adaptés à trois principaux domaines fonctionnels : segmentation d'images, dérivation d'informations analytiques sur les segments et classification. Les données en sortie d'un outil constituent les données en entrée utilisées par d'autres outils, l'objectif étant de produire une carte de classes d'entités orientées objet qui présente un intérêt. Le processus orienté objet est semblable au processus de classification d'images traditionnelles basé sur des pixels qui utilise des techniques de classification assistées et non assistées. Plutôt que de classer des pixels, le processus classe des segments qui peuvent être perçus comme des super pixels. Chaque segment, ou super pixel, est représenté par un ensemble d'attributs que les outils du classificateur utilisent pour produire l'image classée.
Le modèle de géotraitement représenté ci-dessous illustre le workflow d'extraction d'entités orienté objet.
Segmentation d'image
La segmentation d'images est basée sur l'approche Décalage moyen. La technique utilise une fenêtre en mouvement qui calcule une valeur moyenne de pixel pour déterminer quels pixels doivent être inclus dans chaque segment. Au fur et à mesure que la fenêtre se déplace sur l'image, elle recalcule la valeur de manière itérative pour s'assurer que chaque segment est adapté. Il en résulte un regroupement de pixels d'images sous la forme d'un segment caractérisé par une couleur moyenne.
L'outil Décalage moyen de segment accepte tous les rasters pris en charge par Esri et produit une image couleur 8 bits, 3 canaux, segmentée dont la propriété clé est définie sur Segmenté. Les caractéristiques des segments d'images dépendent de trois paramètres : détail spectral, détail spatial et taille minimale de segment. Vous pouvez modifier la quantité de détails caractérisant une entité qui vous intéresse. Par exemple, si vous êtes davantage intéressé par des entités imperméables que par des bâtiments individuels, attribuez une valeur faible au paramètre concernant les détails spatiaux pour obtenir un résultat plus lisse et moins détaillé.
L'image ci-dessous est une scène WorldView-2 segmentée, fournie par DigitalGlobe, en couleur infrarouge. L'image segmentée affiche des surfaces semblables regroupées, sans granularité. Elle généralise la surface pour conserver toutes les entités sous la forme d'une surface continue plus importante, plutôt qu'une classification plus traditionnelle pouvant présenter de nombreux pixels aléatoires dispersés sur l'image.
Bibliographie :
- D. Comanicu, P. Meer: Mean shift: A robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 5, May 2002.
- P. Meer, B. Georgescu: Edge detection with embedded confidence. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 12, December 2001.
- C. Christoudias, B. Georgescu, P. Meer: Synergism in low level vision. 16th International Conference of Pattern Recognition, Track 1 - Computer Vision and Robotics, Quebec City, Canada, August 2001.
Données d'échantillons d'apprentissage
La collecte de données d'échantillons d'apprentissage revient à délimiter un groupe de pixels représentant des entités spécifiques, délimitées de l'image. Tous les pixels de l'image sont ensuite statistiquement comparés à la définition de classe que vous avez spécifiée et affectés à une classe d'entités spécifique. Les pixels n'appartenant pas à une classe définie ne sont pas définis. Les échantillons d'apprentissage ne doivent pas contenir de pixels indésirables n'appartenant pas à la classe qui vous intéresse. Lorsque vous choisissez les pixels appropriés pour chaque classe, les résultats sont souvent caractérisés par une distribution normale en forme de cloche. Veillez à ce que votre polygone d'échantillon d'apprentissage contienne un nombre significatif de pixels. Par exemple, un bloc de 10 x 10 pixels équivaut à 100 pixels. C'est une taille raisonnable pour un polygone d'apprentissage, laquelle est également statistiquement significative.
Un jeu de données raster segmenté diffère d'une image de pixels, car chaque segment (souvent appelé un super pixel) est représenté par une valeur de couleur moyenne. Alors qu'on peut obtenir facilement un polygone d'échantillon d'apprentissage contenant 100 pixels à partir d'une image, il est plus fastidieux d'obtenir 100 super pixels à partir d'un jeu de données raster segmenté.
Les classificateurs paramétriques, tel que le classificateur de vraisemblance maximale, requièrent un nombre statistiquement significatif d'échantillons pour produire une densité de probabilité pertinente. Pour produire des échantillons statistiquement significatifs, vous devez disposer d'au moins 20 échantillons par classe. Cela signifie que pour chaque classe, à savoir un sol nu, des arbres à feuilles caduques ou de l'asphalt, 20 segments au moins doivent être collectés pour définir chaque classe d'entités.
Le lissage affecte la taille et l'homogénéité d'un segment. Un raster segmenté utilisant un facteur de lissage élevé sera plus susceptible de contenir des segments importants et plusieurs types d'entités visibles dans l'image source. En raison de l'effet de lissage, nous recommandons la collecte d'échantillons d'apprentissage sur le jeu de données raster segmenté. Cela garantit ainsi la collecte d'échantillons d'apprentissage à partir de segments discrets distincts.
Informations analytiques
Les informations analytiques associées à la couche segmentée sont calculées par l'outil d'apprentissage du classificateur et dépendent du type de classificateur spécifié. Utilisez l'outil d'apprentissage adapté pour classer vos données :
Classificateur | Description |
---|---|
Préparer le classificateur d'agrégats ISO | Outil qui génère un fichier de définition de classificateur Esri (.ecd) à l'aide de la définition de classification de grappe Iso. |
Préparer le classificateur de vraisemblance maximale | Outil qui génère un fichier de définition de classificateur Esri (.ecd) grâce à la définition de classification du classificateur de vraisemblance maximale (MLC). |
Préparer le classificateur de machines à vecteurs de support | Outil qui génère un fichier de définition de classificateur Esri (.ecd) grâce à la définition de classification de la machine à vecteurs de support (SVM). Le classificateur de machines à vecteurs de support fournit une méthode de classification non assistée moderne et performante pour gérer une entrée de raster segmenté ou une image standard. Cette méthode de classification relativement nouvelle est couramment utilisée par les chercheurs. |
Les outils d'apprentissage intègrent l'image à classer, une couche segmentée facultative et les données surfaciques du site d'apprentissage pour générer le fichier de définition de classificateur approprié. Le fichier du site d'apprentissage est généré à partir de la barre d'outils Classificationexistante à l'aide du Gestionnaire d'échantillons d'apprentissage. Le fichier standard d'échantillons d'apprentissage est utilisé dans les classificateurs assistés.
Comme le fichier de définition de classificateur .ecd repose sur le classificateur spécifié et des attributs pertinents, il est unique pour chaque classificateur, les entrées raster et les attributs. Il peut être assimilé à un fichier de signature de classification, mais il est plus général, car il prend en charge tout classificateur. Ainsi, le fichier de définition de classificateur généré est adapté à une combinaison spécifique de données source et de classificateur.
Le fichier de définition de classificateur peut être basé sur tout raster et pas uniquement les rasters segmentés. Par exemple, un raster segmenté provient de données multispectrales IKONOS et il est possible de générer des statistiques et des données attributaires analytiques à partir d'une image WorldView-2 améliorée 6 canaux, QuickBird, GeoEye, Pleiades, RapidEye ou Landsat 8. Cette flexibilité vous permet de dériver le raster segmenté une seule fois et de générer des fichiers de définition de classificateur et les cartes d'entités classées résultantes à l'aide de plusieurs sources d'images, selon votre application.
Calculer les attributs de segments
Les outils susmentionnés sont ceux qui sont le plus souvent utilisés dans le workflow orienté objet. L'outil Calculer les attributs de segments supplémentaire permet d'intégrer et d'exporter des rasters segmentés à partir d'applications tierces et à destination de ces dernières. Cet outil intègre une image segmentée, un fichier de site d'apprentissage et un deuxième raster facultatif pour calculer les attributs de chaque segment et produit en sortie, à partir de ces informations, un fichier raster d'index avec une table attributaire associée.
Cet outil permet d'effectuer des analyses supplémentaires du raster segmenté. Les attributs peuvent être analysés dans une application graphique ou de statistiques tierce, ou utilisés en entrée dans des classificateurs supplémentaires non pris en charge par Esri. Cet outil prend également en charge l'intégration d'un raster segmenté à partir d'un package tiers et étend les fonctionnalités d'Esri en autorisant l'utilisation de données et de paquetages d'applications tiers.
Classification
L'outil Classer le raster procède à la classification d'images conformément au fichier de définition de classificateur d'Esri. Les données qui servent d'entrée à l'outil sont l'image à classer, le raster segmenté facultatif (un autre jeu de données raster ou une couche, comme un MNT) et un fichier de définition de classificateur pour générer le jeu de données raster classé. L'outil Classer le raster contient tous les classificateurs pris en charge. Le classificateur utilisé varie en fonction des propriétés et des informations figurant dans le fichier de définition de classificateur. Ainsi, le fichier de définition de classificateur généré par l'outil Préparer le classificateur d'agrégats ISO, Préparer le classificateur de vraisemblance maximale ou l'outil Préparer le classificateur de machines à vecteurs de support doit activer le classificateur correspondant lorsque vous exécutez l'outil Classer le raster.
Evaluation de la précision
L'évaluation de la précision constitue une part importante des projets de classification. Elle compare l'image classée à une autre source de données considérée comme précise ou aux données de réalité de terrain. La réalité de terrain peut être collectée sur le terrain, mais cette démarche est longue et onéreuse. Les données de réalité de terrain peuvent également être déduites de l'interprétation de l'imagerie haute résolution, de l'imagerie classée existante ou de couches de données SIG.
Le mode d'évaluation le plus répandu de la précision d'une carte classée consiste à créer un jeu de points aléatoires à partir de données de réalité de terrain et à le comparer aux données classées dans une matrice de confusion. Même si cette procédure se compose de deux étapes, vous pouvez être amené à comparer les résultats de différentes méthodes de classification ou sites d'apprentissage. Vous pouvez également ne pas disposer des données de réalité de terrain et vous appuyer sur l'imagerie utilisée pour créer la classification. Pour s'adapter à ces autres workflows, la procédure en deux étapes d'évaluation de la précision applique les outils suivants : Créer des points d'évaluation de la précision, Mettre à jour les points d’évaluation de la précision et Calculer la matrice de confusion.