Exportar datos de formación para aprendizaje profundo—Ayuda

Disponible con una licencia de Spatial Analyst.

Resumen
Uso
Sintaxis
Muestra de código
Entornos
Información sobre licencias

Resumen

Utiliza una imagen de teledetección para convertir datos ráster o vectoriales etiquetados en datasets de formación para aprendizaje profundo. La salida es una carpeta de chips de imagen y una carpeta de archivos de metadatos en el formato especificado.

Uso

Esta herramienta crea datasets de formación para admitir aplicaciones de aprendizaje profundo de terceros, como Google TensorFlow o Microsoft CNTK.
Utilice sus datos de muestras de entrenamiento de clasificación actuales o datos de clase de entidad SIG, como por ejemplo una capa de huellas de edificios, para generar chips de imagen que contengan la muestra de clase de su imagen de origen. Los chips de imagen con frecuencia son filas de 256 píxeles por columnas de 256 píxeles, a menos que el tamaño de la muestra de entrenamiento sea más grande.
Las muestras de entrenamiento de aprendizaje profundo se basan en pequeñas subimágenes que contienen la entidad o clase de interés, llamada chip de imagen.

Sintaxis

ExportTrainingDataForDeepLearning (in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index})

Parámetro Explicación Tipo de datos

in_raster

Imágenes de origen de entrada, normalmente imágenes multiespectrales.

Algunos ejemplos del tipo de imágenes de origen de entrada son imágenes de satélite, drones, aéreas o del Programa Nacional de Imágenes Agrícolas (NAIP) multiespectrales.

Raster Dataset; Raster Layer

out_folder

Especifique una carpeta en la que se almacenarán los chips de imagen de salida y los metadatos.

Directory

in_class_data

Datos etiquetados, en formato vectorial o ráster.

Las entradas vectoriales deben seguir un formato de muestra de entrenamiento como el generado por la barra de herramientas Clasificación de imagen de ArcGIS Desktop.

Las entradas de ráster deben seguir un formato de ráster clasificado como el generado por la herramienta Clasificar ráster.

Feature Dataset; Feature Layer; Raster Dataset; Raster Layer

image_chip_format

El formato de ráster de las salidas de chips de imagen.

TIFF —Formato TIFF
PNG —Formato PNG
JPEG —Formato JPEG
MRF —MRF (formato de metarráster)

String

tile_size_x

(Opcional)

El tamaño de los chips de imagen, en la dimensión X.

Long

tile_size_y

(Opcional)

El tamaño de los chips de imagen, en la dimensión Y.

Long

stride_x

(Opcional)

La distancia a la que se desplaza la X al crear el siguiente chip de imagen.

Cuando el paso equivale al tamaño de tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de tesela, habrá una superposición del 50 %.

Long

stride_y

(Opcional)

La distancia a la que se desplaza la Y al crear el siguiente chip de imagen.

Cuando el paso equivale al tamaño de tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de tesela, habrá una superposición del 50 %.

Long

output_nofeature_tiles

(Opcional)

Elija si se exportarán los chips de imagen con datos etiquetados superpuestos.

ALL_TILES —Exporte todos los chips de imagen, incluidos los que no superponen los datos etiquetados. Esta es la opción predeterminada.
ONLY_TILES_WITH_FEATURES —Exporte solamente los chips de imagen que superponen los datos etiquetados.

Boolean

metadata_format

(Opcional)

El formato de las etiquetas de metadatos de salida. Existen 3 opciones para las etiquetas de metadatos de salida de los datos de formación: Rectángulos KITTI, rectángulos PASCAL VOC y Teselas clasificadas (un mapa de clase). Si los datos de muestra de entrenamiento de entrada son una capa de clase de entidad, como por ejemplo una capa de edificios o un archivo de muestra de entrenamiento de clasificación estándar, utilice la opción de rectángulos KITTI o PASCAL VOC. Los metadatos de salida son un archivo .txt o un archivo .xml que contiene los datos de muestra de entrenamiento incluidos en el rectángulo mínimo de delimitación. El nombre del archivo de metadatos coincide con el nombre de la imagen de origen de entrada. Si los datos de muestra de entrenamiento de entrada son un mapa de clase, utilice Teselas clasificadas como opción de formato de metadatos de salida.

KITTI_rectangles —Los metadatos siguen el mismo formato que el dataset de evaluación de detección de objetos del Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico de Toyota (KITTI). El dataset KITTI es un conjunto de referencia de visión. Esta es la opción predeterminada.Los archivos de etiquetas son archivos de texto plano. Todos los valores, tanto numéricos como de cadena de caracteres, se separan con espacios y cada fila se corresponde con un objeto.
PASCAL_VOC_rectangles —Los metadatos siguen el mismo formato que el dataset Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes (PASCAL_VOC). El dataset PASCAL VOC es un dataset de imágenes para el reconocimiento de clases de objetos.Los archivos de etiquetas son archivos XML que contienen información sobre el nombre de la imagen, el valor de clase y cuadro o cuadros de delimitación.
Classified_Tiles —Esta opción generará un chip de imagen clasificado por cada chip de imagen de entrada. Ningún otro metadato para cada chip de imagen. Solo el resultado de las estadísticas tiene más información sobre las clases, como los nombres de las clases, los valores de las clases y estadísticas de salida.

En la siguiente tabla se describen los 15 valores del formato de metadatos KITTI. En la herramienta solo se utilizan cinco de los quince valores posibles: el nombre de clase (en la columna 1) y el rectángulo mínimo de delimitación compuesto por cuatro ubicaciones de coordenadas de imagen (columnas 5-8). El rectángulo mínimo de delimitación comprende el chip de formación utilizado en el clasificador de aprendizaje profundo.


Columnas	Nombre	Descripción
1	Valor de clase	El valor de clase del objeto, recogido en el archivo stats.txt.
2	No se usa
3	No se usa
4	No se usa
5 - 8	Bbox	El cuadro de delimitación bidimensional del objeto de la imagen, basado en un índice de coordenadas de espacio de imagen de base 0. El cuadro de delimitación contiene las cuatro coordenadas de los píxeles izquierdo, superior, derecho e inferior.
9 - 11	No se usa
12 - 14	No se usa
15	No se usa

Para obtener más información, consulte Formato de metadatos KITTI .

A continuación se muestra un ejemplo de PASCAL VOC.

<?xml version=”1.0”?>
- <layout>
      <image>000000000</image>
      <object>1</object>
    - <part>
         <class>1</class>
       - <bndbox>
            <xmin>31.85</xmin>
            <ymin>101.52</ymin>
            <xmax>256.00</xmax>
            <ymax>256.00</ymax>
         </bndbox>
      </part>
  </layout>

Para obtener más información, consulte PASCAL Visual Object Classes.

String

start_index

(Opcional)

Le permite establecer el índice inicial para la secuencia de chips de imagen. De esta manera, podrá incorporar más chips de imagen a una secuencia existente. El valor predeterminado es 0.

Long

Muestra de código

Ejemplo 1 de ExportTrainingDataForDeepLearning (ventana de Python)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

from arcpy.sa import *

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
                                 "c:/test/training.shp", "TIFF", "256", 
                                 "256", "128", "128", "NO", "KITTI_rectangles")

Ejemplo 2 de ExportTrainingDataForDeepLearning (script independiente)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *

# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"

# Execute 
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training, 
                                 image_chip_format,tile_size_x, tile_size_y, 
                                 stride_x, stride_y,output_nofeature_tiles, 
                                 metadata_format)

Entornos

Extensión

Información sobre licencias

ArcGIS Desktop Basic: Requiere Spatial Analyst
ArcGIS Desktop Standard: Requiere Spatial Analyst
ArcGIS Desktop Advanced: Requiere Spatial Analyst

Temas relacionados

Descripción general del conjunto de herramientas Segmentación y clasificación