ArcGIS Desktop

  • ArcGIS Pro
  • ArcMap

  • My Profile
  • Ayuda
  • Sign Out
ArcGIS Desktop

ArcGIS Online

La plataforma de representación cartográfica para tu organización

ArcGIS Desktop

Un completo SIG profesional

ArcGIS Enterprise

SIG en tu empresa

ArcGIS for Developers

Herramientas para crear aplicaciones basadas en la ubicación

ArcGIS Solutions

Plantillas de aplicaciones y mapas gratuitas para tu sector

ArcGIS Marketplace

Obtén aplicaciones y datos para tu organización.

  • Documentación
  • Soporte
Esri
  • Iniciar sesión
user
  • Mi perfil
  • Cerrar sesión

ArcMap

  • Inicio
  • Introducción
  • Cartografiar
  • Analizar
  • Administrar datos
  • Herramientas
  • Extensiones

Exportar datos de formación para aprendizaje profundo

Disponible con una licencia de Spatial Analyst.

  • Resumen
  • Uso
  • Sintaxis
  • Muestra de código
  • Entornos
  • Información sobre licencias

Resumen

Utiliza una imagen de teledetección para convertir datos ráster o vectoriales etiquetados en datasets de formación para aprendizaje profundo. La salida es una carpeta de chips de imagen y una carpeta de archivos de metadatos en el formato especificado.

Uso

  • Esta herramienta crea datasets de formación para admitir aplicaciones de aprendizaje profundo de terceros, como Google TensorFlow o Microsoft CNTK.

  • Utilice sus datos de muestras de entrenamiento de clasificación actuales o datos de clase de entidad SIG, como por ejemplo una capa de huellas de edificios, para generar chips de imagen que contengan la muestra de clase de su imagen de origen. Los chips de imagen con frecuencia son filas de 256 píxeles por columnas de 256 píxeles, a menos que el tamaño de la muestra de entrenamiento sea más grande.

  • Las muestras de entrenamiento de aprendizaje profundo se basan en pequeñas subimágenes que contienen la entidad o clase de interés, llamada chip de imagen.

Sintaxis

ExportTrainingDataForDeepLearning (in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index})
ParámetroExplicaciónTipo de datos
in_raster

Imágenes de origen de entrada, normalmente imágenes multiespectrales.

Algunos ejemplos del tipo de imágenes de origen de entrada son imágenes de satélite, drones, aéreas o del Programa Nacional de Imágenes Agrícolas (NAIP) multiespectrales.

Raster Dataset; Raster Layer
out_folder

Especifique una carpeta en la que se almacenarán los chips de imagen de salida y los metadatos.

Directory
in_class_data

Datos etiquetados, en formato vectorial o ráster.

Las entradas vectoriales deben seguir un formato de muestra de entrenamiento como el generado por la barra de herramientas Clasificación de imagen de ArcGIS Desktop.

Las entradas de ráster deben seguir un formato de ráster clasificado como el generado por la herramienta Clasificar ráster.

Feature Dataset; Feature Layer; Raster Dataset; Raster Layer
image_chip_format

El formato de ráster de las salidas de chips de imagen.

  • TIFF —Formato TIFF
  • PNG —Formato PNG
  • JPEG —Formato JPEG
  • MRF —MRF (formato de metarráster)
String
tile_size_x
(Opcional)

El tamaño de los chips de imagen, en la dimensión X.

Long
tile_size_y
(Opcional)

El tamaño de los chips de imagen, en la dimensión Y.

Long
stride_x
(Opcional)

La distancia a la que se desplaza la X al crear el siguiente chip de imagen.

Cuando el paso equivale al tamaño de tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de tesela, habrá una superposición del 50 %.

Long
stride_y
(Opcional)

La distancia a la que se desplaza la Y al crear el siguiente chip de imagen.

Cuando el paso equivale al tamaño de tesela, no habrá ninguna superposición. Cuando el paso equivale a la mitad del tamaño de tesela, habrá una superposición del 50 %.

Long
output_nofeature_tiles
(Opcional)

Elija si se exportarán los chips de imagen con datos etiquetados superpuestos.

  • ALL_TILES —Exporte todos los chips de imagen, incluidos los que no superponen los datos etiquetados. Esta es la opción predeterminada.
  • ONLY_TILES_WITH_FEATURES —Exporte solamente los chips de imagen que superponen los datos etiquetados.
Boolean
metadata_format
(Opcional)

El formato de las etiquetas de metadatos de salida. Existen 3 opciones para las etiquetas de metadatos de salida de los datos de formación: Rectángulos KITTI, rectángulos PASCAL VOC y Teselas clasificadas (un mapa de clase). Si los datos de muestra de entrenamiento de entrada son una capa de clase de entidad, como por ejemplo una capa de edificios o un archivo de muestra de entrenamiento de clasificación estándar, utilice la opción de rectángulos KITTI o PASCAL VOC. Los metadatos de salida son un archivo .txt o un archivo .xml que contiene los datos de muestra de entrenamiento incluidos en el rectángulo mínimo de delimitación. El nombre del archivo de metadatos coincide con el nombre de la imagen de origen de entrada. Si los datos de muestra de entrenamiento de entrada son un mapa de clase, utilice Teselas clasificadas como opción de formato de metadatos de salida.

  • KITTI_rectangles —Los metadatos siguen el mismo formato que el dataset de evaluación de detección de objetos del Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico de Toyota (KITTI). El dataset KITTI es un conjunto de referencia de visión. Esta es la opción predeterminada.Los archivos de etiquetas son archivos de texto plano. Todos los valores, tanto numéricos como de cadena de caracteres, se separan con espacios y cada fila se corresponde con un objeto.
  • PASCAL_VOC_rectangles —Los metadatos siguen el mismo formato que el dataset Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes (PASCAL_VOC). El dataset PASCAL VOC es un dataset de imágenes para el reconocimiento de clases de objetos.Los archivos de etiquetas son archivos XML que contienen información sobre el nombre de la imagen, el valor de clase y cuadro o cuadros de delimitación.
  • Classified_Tiles —Esta opción generará un chip de imagen clasificado por cada chip de imagen de entrada. Ningún otro metadato para cada chip de imagen. Solo el resultado de las estadísticas tiene más información sobre las clases, como los nombres de las clases, los valores de las clases y estadísticas de salida.

En la siguiente tabla se describen los 15 valores del formato de metadatos KITTI. En la herramienta solo se utilizan cinco de los quince valores posibles: el nombre de clase (en la columna 1) y el rectángulo mínimo de delimitación compuesto por cuatro ubicaciones de coordenadas de imagen (columnas 5-8). El rectángulo mínimo de delimitación comprende el chip de formación utilizado en el clasificador de aprendizaje profundo.

ColumnasNombreDescripción

1

Valor de clase

El valor de clase del objeto, recogido en el archivo stats.txt.

2

No se usa

3

No se usa

4

No se usa

5 - 8

Bbox

El cuadro de delimitación bidimensional del objeto de la imagen, basado en un índice de coordenadas de espacio de imagen de base 0. El cuadro de delimitación contiene las cuatro coordenadas de los píxeles izquierdo, superior, derecho e inferior.

9 - 11

No se usa

12 - 14

No se usa

15

No se usa

Para obtener más información, consulte Formato de metadatos KITTI Metadatos KITTI.

A continuación se muestra un ejemplo de PASCAL VOC.

<?xml version=”1.0”?>
- <layout>
      <image>000000000</image>
      <object>1</object>
    - <part>
         <class>1</class>
       - <bndbox>
            <xmin>31.85</xmin>
            <ymin>101.52</ymin>
            <xmax>256.00</xmax>
            <ymax>256.00</ymax>
         </bndbox>
      </part>
  </layout>

Para obtener más información, consulte PASCAL Visual Object ClassesPASCAL Visual Object Classes.

String
start_index
(Opcional)

Le permite establecer el índice inicial para la secuencia de chips de imagen. De esta manera, podrá incorporar más chips de imagen a una secuencia existente. El valor predeterminado es 0.

Long

Muestra de código

Ejemplo 1 de ExportTrainingDataForDeepLearning (ventana de Python)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

from arcpy.sa import *

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
                                 "c:/test/training.shp", "TIFF", "256", 
                                 "256", "128", "128", "NO", "KITTI_rectangles")
Ejemplo 2 de ExportTrainingDataForDeepLearning (script independiente)

En este ejemplo se crean muestras de entrenamiento para aprendizaje profundo.

# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *

# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"

# Execute 
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training, 
                                 image_chip_format,tile_size_x, tile_size_y, 
                                 stride_x, stride_y,output_nofeature_tiles, 
                                 metadata_format)

Entornos

  • Extensión

Información sobre licencias

  • ArcGIS Desktop Basic: Requiere Spatial Analyst
  • ArcGIS Desktop Standard: Requiere Spatial Analyst
  • ArcGIS Desktop Advanced: Requiere Spatial Analyst

Temas relacionados

  • Descripción general del conjunto de herramientas Segmentación y clasificación

ArcGIS Desktop

  • Inicio
  • Documentación
  • Soporte

Plataforma ArcGIS

  • ArcGIS Online
  • ArcGIS Desktop
  • ArcGIS Enterprise
  • ArcGIS for Developers
  • ArcGIS Solutions
  • ArcGIS Marketplace

Acerca de Esri

  • Quiénes somos
  • Empleo
  • Blog de Esri
  • Conferencia de usuarios
  • Cumbre de desarrolladores
Esri
Díganos su opinión.
Copyright © 2019 Esri. | Privacidad | Legal