Exporter les données d’apprentissage pour l'apprentissage en profondeur (Spatial Analyst)—ArcMap

Disponible avec une licence Spatial Analyst.

Résumé
Utilisation
Syntaxe
Exemple de code
Environnements
Informations de licence

Résumé

Utilise une image télédétectée pour convertir des données vectorielles ou raster étiquetées en jeux de données d’apprentissage profond. La sortie est un dossier de fragments d’image et un dossier de fichiers de métadonnées au format spécifié.

Utilisation

Cet outil crée des jeux de données d’entraînement en vue de prendre en charge les applications d’apprentissage profond tierces, telles que Google TensorFlow, PyTorch ou Microsoft CNTK.
Les échantillons d’entraînement de cours d’apprentissage profond reposent sur de petites images secondaires contenant l’entité ou la classe présentant un intérêt, nommée fragments d’image.
Utilisez vos données d’échantillon d’apprentissage de classification existantes, ou vos données de classes d’entités SIG telles qu’une couche d’emprise de bâtiment, pour gérer les fragments d’image contenant l’échantillon de classe de votre image source. Les fragments d’image sont souvent composés de lignes de 256 pixels et de colonnes de 256 pixels, sauf si la taille de l’échantillon d’apprentissage est plus importante.
La taille de cellule et l’étendue peuvent être ajustées à l’aide des paramètres d’environnement de géotraitement.

Syntaxe

ExportTrainingDataForDeepLearning(in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index}, {class_value_field}, {buffer_radius})

Paramètre	Explication	Type de données
in_raster	Imagerie source en entrée, généralement une imagerie multispectrale. Parmi les exemples de type d’imagerie source en entrée figurent l’imagerie satellite multispectrale, l’imagerie issue de drones, les images aériennes ou l’imagerie NAIP (National Agriculture Imagery Program).	Raster Dataset; Raster Layer; Mosaic Layer; Image Service; MapServer; Map Server Layer; Internet Tiled Layer
out_folder	Le dossier dans lequel stocker les fragments d’image et les métadonnées en sortie.	Folder
in_class_data	Données d’échantillon d’entraînement sous forme vectorielle ou raster. Les entrées vectorielles doivent respecter un format d’échantillon d’entraînement, tel que celui généré par la barre d’outils Image Classification (Classification des images) de ArcGIS Desktop. Les entrées raster doivent suivre un format raster classé, tel que celui généré par l’outil Classer le raster.	Feature Class; Feature Layer; Raster Dataset; Raster Layer; Mosaic Layer; Image Service
image_chip_format	Spécifie le format raster des fragments d’images en sortie. PNG et JPEG prennent en charge jusqu’à 3 canaux. TIFF —format TIFF PNG —format PNG JPEG —format JPEG MRF —MRF (Meta Raster Format)	String
tile_size_x (Facultatif)	Taille des fragments d’image pour la dimension X.	Long
tile_size_y (Facultatif)	Taille des fragments d’image pour la dimension Y.	Long
stride_x (Facultatif)	Distance de déplacement sur la direction X lors de la création des fragments d’image suivants. Si le pas est égal à la taille de tuile, il n’y a pas de superposition. Si le pas est égal à la moitié de la taille de tuile, il y a une superposition de 50 %.	Long
stride_y (Facultatif)	Distance de déplacement sur la direction Y lors de la création des fragments d’image suivants. Si le pas est égal à la taille de tuile, il n’y a pas de superposition. Si le pas est égal à la moitié de la taille de tuile, il y a une superposition de 50 %.	Long
output_nofeature_tiles (Facultatif)	Indique si les fragments d’image qui ne capturent pas d’échantillons d’entraînement sont exportés. ALL_TILES —Tous les fragments d’image, y compris ceux qui ne capturent d’échantillons d’entraînement, sont exportés. ONLY_TILES_WITH_FEATURES —Seuls les fragments d’image qui capturent des échantillons d’entraînement sont exportés. Il s’agit de l’option par défaut.	Boolean
metadata_format (Facultatif)	Spécifié le format des étiquettes de métadonnées en sortie. Il existe quatre options pour les étiquettes de métadonnées en sortie pour les données d’entraînement : rectangles KITTI, rectangles PASCAL VOC, tuiles classées (carte de classe) et masques RCNN. Si les données d’échantillons d’entraînement en entrée sont une couche de classe d’entités, telle qu’une couche d’emprise de bâtiment ou un fichier d’échantillon d’entraînement de classification standard, utilisez l’option de rectangles KITTI ou PASCAL VOC. Les métadonnées en sortie sont un fichier .txt ou un fichier .xml comportant les données d’échantillon d’apprentissage contenues dans le rectangle d’emprise minimale. Le nom du fichier de métadonnées correspond à celui de l’image source en entrée. Si les données d’échantillons d’entraînement en entrée sont une carte de classe, utilisez l’option Classified Tiles (Tuiles classées) comme format de métadonnées en sortie. KITTI_rectangles —Les métdonnées suivent le même format que celui du jeu de données Object Detection Evaluation (Vérification de la détection d’objets) du KITTI (Karlsruhe Institute of Technology and Toyota Technological Institute) . Le jeu de données KITTI est une suite de référence en matière de conception. Il s’agit de l’option par défaut.Les fichiers d’étiquettes sont des fichiers de texte brut. Toutes les valeurs, numériques ou de chaînes, sont séparées par des espaces et chaque ligne correspond à un objet. PASCAL_VOC_rectangles —Les métadonnées suivent le même format que le jeu de données PASCAL_VOC (Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes). Le jeu de données PASCAL VOC est un ensemble de données d’image standardisé pour la reconnaissance des classes d’objets.Les fichiers d’étiquettes sont au format XML et contiennent des informations sur le nom des images, la valeur de classe et les emprises. Classified_Tiles —La sortie correspond à un fragment d’image classé par fragment d’image en entrée. Aucun autre type de métadonnées pour chaque fragment d’image n’est utilisé. Seule la sortie statistique comporte plus d’informations sur les classes, telles que les noms des classes, les valeurs des classes et les statistiques en sortie. RCNN_Masks —La sortie correspond à des fragments d’image comportant un masque sur les zones dans lesquelles se trouve l’échantillon. Le modèle génère des emprises et des masques de segmentation pour chaque instance d’un objet dans l’image. Il repose sur le réseau pyramidal d’entités (Feature Pyramid Network ou FPN) et une architecture ResNet101 dans le modèle de structure d’apprentissage profond. Pour le format de métadonnées KITTI, 15 colonnes sont créées, mais seules 5 d’entre elles sont utilisées dans l’outil. La première colonne est la valeur de la classe. Les 3 colonnes suivantes sont ignorées. Les colonnes 5 à 8 définissent le rectangle d’emprise minimale comportant 4 emplacements de coordonnées d’image : pixels de gauche, en haut, de droite et en bas, respectivement. Le rectangle d’emprise minimale englobe le fragment d’apprentissage utilisé dans le classificateur d’apprentissage en profondeur. Les autres colonnes ne sont pas utilisées. Pour plus d’informations, reportez-vous à la rubrique sur le format de métadonnées KITTI. Vous trouverez ci-dessous un exemple avec l’option PASCAL VOC : `<?xml version=”1.0”?> - <layout> <image>000000000</image> <object>1</object> - <part> <class>1</class> - <bndbox> <xmin>31.85</xmin> <ymin>101.52</ymin> <xmax>256.00</xmax> <ymax>256.00</ymax> </bndbox> </part> </layout>` Pour plus d’informations, reportez-vous à la rubrique sur PASCAL VOC (PASCAL Visual Object Classes).	String
start_index (Facultatif)	Index de début de séquence de fragments d’image. Cela permet d’ajouter davantage de fragments d’image à une séquence existante. La valeur par défaut est 0.	Long
class_value_field (Facultatif)	Champ contenant les valeurs de la classe. Si aucun champ n’est spécifié, le système recherche un champ value ou classvalue. Si l’entité ne contient pas de champ de classe, le système considère que tous les enregistrements appartiennent à une même classe.	Field
buffer_radius (Facultatif)	Le rayon d’une zone tampon autour d’un échantillon d’entraînement permettant de délimiter une zone d’échantillon d’entraînement. Cette option permet de créer des échantillons d’entraînement sous forme de polygones circulaires à partir de points. L’unité linéaire de la référence spatiale pour in_class_data est utilisée.	Double

Exemple de code

Exemple 1 d'utilisation de l'outil ExportTrainingDataForDeepLearning (fenêtre Python)

Cet exemple permet de créer des échantillons d’apprentissage pour la formation en profondeur.

from arcpy.sa import *

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
                                 "c:/test/training.shp", "TIFF", "256", 
                                 "256", "128", "128", "NO", "KITTI_rectangles")

Exemple 2 d'utilisation de l'outil ExportTrainingDataForDeepLearning (script autonome)