Exportar datos de formación para aprendizaje profundo—Ayuda

Disponible con una licencia de Spatial Analyst.

Resumen
Uso
Sintaxis
Muestra de código
Entornos
Información sobre licencias

Resumen

Utiliza una imagen de teledetección para convertir datos ráster o vectoriales etiquetados en datasets de formación para aprendizaje profundo. La salida es una carpeta de chips de imagen y una carpeta de archivos de metadatos en el formato especificado.

Uso

Esta herramienta crea datasets de entrenamiento para admitir aplicaciones de aprendizaje profundo de terceros como Google TensorFlow, PyTorch o Microsoft CNTK.
Las muestras de entrenamiento de aprendizaje profundo se basan en pequeñas subimágenes que contienen la entidad o clase de interés, llamadas chips de imagen.
Utilice sus datos de muestras de entrenamiento de clasificación actuales o datos de clase de entidad SIG, como por ejemplo una capa de huellas de edificios, para generar chips de imagen que contengan la muestra de clase de su imagen de origen. Los chips de imagen con frecuencia son filas de 256 píxeles por columnas de 256 píxeles, a menos que el tamaño de la muestra de entrenamiento sea más grande.
El tamaño de celda y la extensión se pueden ajustar con la configuración del entorno de geoprocesamiento.

Sintaxis

ExportTrainingDataForDeepLearning(in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index}, {class_value_field}, {buffer_radius})

Parámetro	Explicación	Tipo de datos
in_raster	Las imágenes de origen de entrada, normalmente imágenes multiespectrales. Ejemplos del tipo de imagen de origen de entrada son: satélite, tomada por drones, aérea o del Programa Nacional de Imágenes Agrícolas (NAIP), todas ellas multiespectrales.	Raster Dataset; Raster Layer; Mosaic Layer; Image Service; MapServer; Map Server Layer; Internet Tiled Layer
out_folder	La carpeta en la que se almacenarán los chips de imagen de salida y los metadatos.	Folder
in_class_data	Los datos de muestra de entrenamiento, en formato vectorial o ráster. Las entradas vectoriales deben seguir un formato de muestra de entrenamiento como el generado por la barra de herramientas Clasificación de imagen de ArcGIS Desktop. Las entradas de ráster deben seguir un formato de ráster clasificado como el generado por la herramienta Clasificar ráster.	Feature Class; Feature Layer; Raster Dataset; Raster Layer; Mosaic Layer; Image Service
image_chip_format	Especifica el formato de ráster para las salidas de chips de imagen. PNG y JPEG admiten hasta 3 bandas. TIFF —Formato TIFF PNG —Formato PNG JPEG —Formato JPEG MRF —MRF (formato de metarráster)	String
tile_size_x (Opcional)	El tamaño de los chips de imagen para la dimensión X.	Long
tile_size_y (Opcional)	El tamaño de los chips de imagen para la dimensión Y.	Long
stride_x (Opcional)	La distancia a la que se desplaza la dirección X al crear los siguientes chips de imagen. Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento.	Long
stride_y (Opcional)	La distancia a la que se desplaza la dirección Y al crear los siguientes chips de imagen. Cuando el paso equivale al tamaño de la tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de la tesela, habrá una superposición del 50 por ciento.	Long
output_nofeature_tiles (Opcional)	Especifica si se exportarán los chips de imagen que no capturen muestras de entrenamiento. ALL_TILES —Se exportarán todos los chips de imagen, incluidos aquellos que no capturen muestras de entrenamiento. ONLY_TILES_WITH_FEATURES —Solo se exportarán los chips de imagen que capturen muestras de entrenamiento. Esta es la opción predeterminada.	Boolean
metadata_format (Opcional)	Especifica el formato de las etiquetas de metadatos de salida. Existen cuatro opciones para las etiquetas de metadatos de salida de datos de entrenamiento: rectángulos KITTI, rectángulos PASCAL VOC, teselas clasificadas (un mapa de clase) y máscaras RCNN. Si los datos de muestra de entrenamiento de entrada son una capa de clase de entidad, como por ejemplo una capa de edificios o un archivo de muestra de entrenamiento de clasificación estándar, utilice la opción de rectángulos KITTI o PASCAL VOC. Los metadatos de salida son un archivo .txt o un archivo .xml que contiene los datos de muestra de entrenamiento incluidos en el rectángulo mínimo de delimitación. El nombre del archivo de metadatos coincide con el nombre de la imagen de origen de entrada. Si los datos de muestra de entrenamiento de entrada son un mapa de clase, utilice la opción Teselas clasificadas como formato de metadatos de salida. KITTI_rectangles —Los metadatos siguen el mismo formato que el dataset de evaluación de detección de objetos del Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico de Toyota (KITTI). El dataset KITTI es un conjunto de referencia de visión. Esta es la opción predeterminada.Los archivos de etiquetas son archivos de texto plano. Todos los valores, tanto numéricos como de cadena de caracteres, se separan con espacios y cada fila se corresponde con un objeto. PASCAL_VOC_rectangles —Los metadatos siguen el mismo formato que el dataset Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes (PASCAL_VOC). El dataset PASCAL VOC es un dataset de imágenes estandarizado para el reconocimiento de clases de objetos.Los archivos de etiquetas son archivos XML que contienen información sobre el nombre de la imagen, el valor de clase y cuadros de delimitación. Classified_Tiles —La salida será chip de imagen clasificado por cada chip de imagen de entrada. No se utiliza ningún otro metadato para cada chip de imagen. Solo el resultado de las estadísticas tiene más información sobre las clases, como los nombres de las clases, los valores de las clases y las estadísticas de salida. RCNN_Masks —La salida serán chips de imágenes de salida con una máscara en las áreas donde existe la muestra. El modelo genera cuadros de delimitación y máscaras de segmentación para cada instancia de un objeto de la imagen. Se basa en Feature Pyramid Network (FPN) y una base ResNet101 en el modelo de marco de aprendizaje profundo. El formato de metadatos KITTI permite 15 columnas, pero solo se utilizan 5 de ellas en la herramienta. La primera columna es el valor de clase. Las siguientes 3 columnas se omiten. Las columnas 5-8 definen el rectángulo mínimo de delimitación, que consta de 4 ubicaciones de coordenada de imagen: píxeles izquierdo, superior, derecho e inferior, respectivamente. El rectángulo mínimo de delimitación comprende el chip de formación utilizado en el clasificador de aprendizaje profundo. Las columnas restantes no se utilizan. Para obtener más información, consulte Formato de metadatos KITTI . A continuación, encontrará un ejemplo de opción PASCAL VOC: `<?xml version=”1.0”?> - <layout> <image>000000000</image> <object>1</object> - <part> <class>1</class> - <bndbox> <xmin>31.85</xmin> <ymin>101.52</ymin> <xmax>256.00</xmax> <ymax>256.00</ymax> </bndbox> </part> </layout>` Para obtener más información, consulte PASCAL Visual Object Classes.	String
start_index (Opcional)	El índice inicial para la secuencia de chips de imagen. Le permite incorporar más chips de imagen a una secuencia existente. El valor predeterminado es 0.	Long
class_value_field (Opcional)	El campo que contiene los valores de clase. Si no se especifica ningún campo, el sistema busca un campo value o classvalue. Si la entidad no contiene un campo de clase, el sistema determina que todos los registros pertenecen a una clase.	Field
buffer_radius (Opcional)	El radio para la zona de influencia alrededor de cada muestra de entrenamiento para delinear un área de muestra de entrenamiento. Le permite crear muestras de entrenamiento poligonales circulares a partir de puntos. Se utiliza la unidad lineal de la referencia espacial in_class_data.	Double

Muestra de código

Ejemplo 1 de ExportTrainingDataForDeepLearning (ventana de Python)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

from arcpy.sa import *

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
                                 "c:/test/training.shp", "TIFF", "256", 
                                 "256", "128", "128", "NO", "KITTI_rectangles")

Ejemplo 2 de ExportTrainingDataForDeepLearning (script independiente)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *

# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"

# Execute 
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training, 
                                 image_chip_format,tile_size_x, tile_size_y, 
                                 stride_x, stride_y,output_nofeature_tiles, 
                                 metadata_format)

ArcMap

Exportar datos de formación para aprendizaje profundo

Resumen

Uso

Sintaxis

Muestra de código

Ejemplo 1 de ExportTrainingDataForDeepLearning (ventana de Python)

Ejemplo 2 de ExportTrainingDataForDeepLearning (script independiente)

Entornos

Información sobre licencias

Temas relacionados