Disponible avec une licence Spatial Analyst.
Résumé
Utilise une image télé-détectée pour convertir un vecteur étiqueté ou des données raster en jeux de données d'apprentissage en profondeur. La sortie est un dossier de fragments d’images et un dossier de fichiers de métadonnées au format spécifié.
Utilisation
Cet outil crée des jeux de données d’entraînement en vue de prendre en charge les applications d’apprentissage profond tierces, telles que Google TensorFlow, PyTorch ou Microsoft CNTK.
Les échantillons d’entraînement de cours d’apprentissage profond reposent sur de petites images secondaires contenant l’entité ou la classe présentant un intérêt, nommée fragments d’image.
Utilisez vos données d’échantillon d’apprentissage de classification existantes, ou vos données de classes d’entités SIG telles qu’une couche d’emprise de bâtiment, pour gérer les fragments d’image contenant l’échantillon de classe de votre image source. Les fragments d’image sont souvent composés de lignes de 256 pixels et de colonnes de 256 pixels, sauf si la taille de l’échantillon d’apprentissage est plus importante.
La taille de cellule et l’étendue peuvent être ajustées à l’aide des paramètres d’environnement de géotraitement.
Syntaxe
ExportTrainingDataForDeepLearning(in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index}, {class_value_field}, {buffer_radius})
Paramètre | Explication | Type de données |
in_raster | Imagerie source en entrée, généralement une imagerie multispectrale. Parmi les exemples de type d’imagerie source en entrée figurent l’imagerie satellite multispectrale, l’imagerie issue de drones, les images aériennes ou l’imagerie NAIP (National Agriculture Imagery Program). | Raster Dataset; Raster Layer; Mosaic Layer; Image Service; MapServer; Map Server Layer; Internet Tiled Layer |
out_folder | Le dossier dans lequel stocker les fragments d’image et les métadonnées en sortie. | Folder |
in_class_data | Données d’échantillon d’entraînement sous forme vectorielle ou raster. Les entrées vectorielles doivent respecter un format d’échantillon d’entraînement, tel que celui généré par la barre d’outils Image Classification (Classification des images) de ArcGIS Desktop. Les entrées raster doivent suivre un format raster classé, tel que celui généré par l’outil Classer le raster. | Feature Class; Feature Layer; Raster Dataset; Raster Layer; Mosaic Layer; Image Service |
image_chip_format | Spécifie le format raster des fragments d’images en sortie. PNG et JPEG prennent en charge jusqu’à 3 canaux.
| String |
tile_size_x (Facultatif) | Taille des fragments d’image pour la dimension X. | Long |
tile_size_y (Facultatif) | Taille des fragments d’image pour la dimension Y. | Long |
stride_x (Facultatif) | Distance de déplacement sur la direction X lors de la création des fragments d’image suivants. Lorsque le pas est égal à la taille de tuile, il n’y a pas de superposition. Lorsque le pas correspond à la moitié de la taille de tuile, il y a une superposition de 50 pour cent. | Long |
stride_y (Facultatif) | Distance de déplacement sur la direction Y lors de la création des fragments d’image suivants. Lorsque le pas est égal à la taille de tuile, il n’y a pas de superposition. Lorsque le pas correspond à la moitié de la taille de tuile, il y a une superposition de 50 pour cent. | Long |
output_nofeature_tiles (Facultatif) | Indique si les fragments d’image qui ne capturent pas d’échantillons d’entraînement sont exportés.
| Boolean |
metadata_format (Facultatif) | Spécifié le format des étiquettes de métadonnées en sortie. Il existe quatre options pour les étiquettes de métadonnées en sortie pour les données d’entraînement : rectangles KITTI, rectangles PASCAL VOC, tuiles classées (carte de classe) et masques RCNN. Si les données d’échantillons d’entraînement en entrée sont une couche de classe d’entités, telle qu’une couche d’emprise de bâtiment ou un fichier d’échantillon d’entraînement de classification standard, utilisez l’option de rectangles KITTI ou PASCAL VOC. Les métadonnées en sortie sont un fichier .txt ou un fichier .xml comportant les données d’échantillon d’apprentissage contenues dans le rectangle d’emprise minimale. Le nom du fichier de métadonnées correspond à celui de l’image source en entrée. Si les données d’échantillons d’entraînement en entrée sont une carte de classe, utilisez l’option Classified Tiles (Tuiles classées) comme format de métadonnées en sortie.
Pour le format de métadonnées KITTI, 15 colonnes sont créées, mais seules 5 d’entre elles sont utilisées dans l’outil. La première colonne est la valeur de la classe. Les 3 colonnes suivantes sont ignorées. Les colonnes 5 à 8 définissent le rectangle d’emprise minimale comportant 4 emplacements de coordonnées d’image : pixels de gauche, en haut, de droite et en bas, respectivement. Le rectangle d’emprise minimale englobe le fragment d’apprentissage utilisé dans le classificateur d’apprentissage en profondeur. Les autres colonnes ne sont pas utilisées. Pour plus d’informations, reportez-vous à la rubrique sur le format de métadonnées KITTI. Vous trouverez ci-dessous un exemple avec l’option PASCAL VOC :
Pour plus d’informations, reportez-vous à la rubrique sur PASCAL VOC (PASCAL Visual Object Classes). | String |
start_index (Facultatif) | Index de début de séquence de fragments d’image. Cela permet d’ajouter davantage de fragments d’image à une séquence existante. La valeur par défaut est 0. | Long |
class_value_field (Facultatif) | Champ contenant les valeurs de la classe. Si aucun champ n’est spécifié, le système recherche un champ value ou classvalue. Si l’entité ne contient pas de champ de classe, le système considère que tous les enregistrements appartiennent à une même classe. | Field |
buffer_radius (Facultatif) | Le rayon d’une zone tampon autour d’un échantillon d’entraînement permettant de délimiter une zone d’échantillon d’entraînement. Cette option permet de créer des échantillons d’entraînement sous forme de polygones circulaires à partir de points. L’unité linéaire de la référence spatiale pour in_class_data est utilisée. | Double |
Exemple de code
Exemple 1 d'utilisation de l'outil ExportTrainingDataForDeepLearning (fenêtre Python)
Cet exemple permet de créer des échantillons d’apprentissage pour la formation en profondeur.
from arcpy.sa import *
ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder",
"c:/test/training.shp", "TIFF", "256",
"256", "128", "128", "NO", "KITTI_rectangles")
Exemple 2 d'utilisation de l'outil ExportTrainingDataForDeepLearning (script autonome)
Cet exemple permet de créer des échantillons d’apprentissage pour la formation en profondeur.
# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *
# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"
# Execute
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training,
image_chip_format,tile_size_x, tile_size_y,
stride_x, stride_y,output_nofeature_tiles,
metadata_format)
Environnements
Informations de licence
- Basic: Requiert Spatial Analyst
- Standard: Requiert Spatial Analyst
- Advanced: Requiert Spatial Analyst