Trainingsdaten für Deep Learning exportieren—Hilfe

Mit der Spatial Analyst-Lizenz verfügbar.

Zusammenfassung
Verwendung
Syntax
Codebeispiel
Umgebungen
Lizenzinformationen

Zusammenfassung

Verwendet ein Fernerkundungsbild zum Konvertieren von beschrifteten Vektor- oder Raster-Daten in Training-Datasets für Deep Learning. Die Ausgabe ist ein Ordner mit Bild-Chips und einer mit Metadaten-Dateien im angegebenen Format.

Verwendung

Mit diesem Tool lassen sich Trainings-Datasets für die Unterstützung von Deep-Learning-Anwendungen von Drittanbietern erstellen, z. B. Google TensorFlow oder Microsoft CNTK.
Verwenden Sie vorhandene Klassifizierungs-Trainingsgebiet- oder GIS-Feature-Class-Daten wie Gebäude-Footprint-Layer, um Bildschnipsel zu erzeugen, die die Klassenstichprobe aus Ihrem Quellbild enthalten. Die Abmessungen von Bildschnipseln betragen in der Regel 256 x 256 Pixel, es sei denn, das Trainingsgebiet ist größer.
Deep-Learning-Class-Trainingsgebiete setzen sich aus kleinen Sub-Bildern mit dem Feature oder der Klasse von Interesse zusammen. Man nennt sie Bildschnipsel.

Syntax

ExportTrainingDataForDeepLearning (in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index})

Parameter Erläuterung Datentyp

in_raster

Eingabe-Quellbild, in der Regel Multispektralbild.

Beispiele für Eingabe-Quellbilder sind Multispektralsatellit-, Drohnen-, Luft- oder NAIP-Bilder (National Agriculture Imagery Program).

Raster Dataset; Raster Layer

out_folder

Geben Sie einen Ordner für die Ausgabe-Bildschnipsel und Metadaten an.

Directory

in_class_data

Beschriftete Daten in Vektor- oder Raster-Form.

Vektoreingaben sollten einem Trainingsgebiet-Format entsprechen, das mit der ArcGIS Desktop-Werkzeugleiste Bildklassifizierung erstellt wurde.

Raster-Eingaben sollten einem klassifizierten Raster-Format entsprechen, das mit dem Werkzeug Raster klassifizieren erstellt wurde.

Feature Dataset; Feature Layer; Raster Dataset; Raster Layer

image_chip_format

Das Rasterformat für die ausgegebenen Bildschnipsel.

TIFF —TIFF-Format
PNG —PNG-Format
JPEG —JPEG-Format
MRF —MRF (Meta-Raster-Format)

String

tile_size_x

(optional)

Größe der Bildschnipsel (X-Dimension).

Long

tile_size_y

(optional)

Größe der Bildschnipsel (Y-Dimension).

Long

stride_x

(optional)

Verschiebung in X-Richtung bei Erstellung des nächsten Bildschnipsel.

Wenn der Schritt der Kachelgröße entspricht, gibt es keine Überlappung. Wenn der Schritt der halben Kachelgröße entspricht, gibt es eine Überlappung von 50 %.

Long

stride_y

(optional)

Verschiebung in Y-Richtung bei Erstellung des nächsten Bildschnipsel.

Wenn der Schritt der Kachelgröße entspricht, gibt es keine Überlappung. Wenn der Schritt der halben Kachelgröße entspricht, gibt es eine Überlappung von 50 %.

Long

output_nofeature_tiles

(optional)

Wählen Sie diese Option aus, wenn Bildschnipsel mit überlappenden beschrifteten Daten exportiert werden.

ALL_TILES —Es werden alle Bildschnipsel, einschließlich solcher mit nicht überlappenden beschrifteten Daten, exportiert. Dies ist die Standardeinstellung.
ONLY_TILES_WITH_FEATURES —Es werden nur Bildschnipsel mit überlappenden Beschriftungsdaten exportiert.

Boolean

metadata_format

(optional)

Das Ausgabeformat für Metadatenbeschriftungen. Es gibt 3 Optionen der Ausgabe-Metadaten-Beschriftungen für die Trainingsdaten: KITTI-Rechtecke, PASCAL VOC-Rechtecke und Klassifizierte Kacheln (eine Class-Karte). Wenn es sich bei den Eingabedaten für das Trainingsgebiet um einen Feature-Class-Layer handelt, wie zum Beispiel eine Gebäude-Layer- oder Standardklassifizierungs-Trainingsgebiet-Datei, dann verwenden Sie die KITTI- oder PASCAL VOC-Rechtecke. Die Ausgabe-Metadaten sind eine .txt-Datei oder .xml-Datei mit den Daten für das Trainingsgebiet, die im kleinsten umgebenden Rechteck enthalten sind. Der Name der Metadatendatei stimmt mit dem Namen des Eingabequellbildes überein. Wenn es sich bei den Eingabedaten für das Trainingsgebiet um eine Class-Karte handelt, verwenden Sie als Format für die Ausgabemetadaten die Option Klassifizierte Kacheln.

KITTI_rectangles —Die Metadaten weisen dasselbe Format auf wie das Object Detection Evaluation Dataset, das vom Karlsruher Institut für Technologie gemeinsam mit dem Toyota Technological Institute (KITTI) entwickelt wurde. Das KITTI-Dataset ist eine Vision Benchmark Suite. Dies ist die Standardeinstellung.Bei den Beschriftungsdateien handelt es sich um Nur-Text-Dateien. Numerische Werte und Zeichenfolgenwerte werden durch Leerzeichen getrennt, und jede Zeile entspricht einem Objekt.
PASCAL_VOC_rectangles —Die Metadaten weisen dasselbe Format auf wie das PASCAL_VOC-Dataset (Pattern Analysis, Statistical Modeling and Computational Learning, Visual Object Classes). Das PASCAL_VOC-Dataset ist ein standardisiertes Bild-Dataset für die Erkennung von Objektklassen.Die Beschriftungsdateien enthalten Informationen zu Bildnamen, Klassenwerten und umgebenden Rechtecken.
Classified_Tiles —Bei Auswahl dieser Option wird für jeden Eingabebildschnipsel ein klassifizierter Bildschnipsel ausgegeben. Es gibt keine weiteren Metadaten für die Bildschnipsel. Weitere Informationen zu den Klassen (Klassennamen, Klassenwerte und Ausgabestatistiken) können den ausgegebenen Statistiken entnommen werden.

Die folgende Tabelle enthält eine Beschreibung der 15 Werte im KITTI-Metadatenformat. Im Werkzeug werden nur fünf der fünfzehn möglichen Werte verwendet: Der Klassenname (in Spalte 1) und das kleinste umgebende Rechteck aus vier Bildkoordinatenpositionen (Spalten 5-8). Das kleinste umgebende Rechteck umfasst den im Deep-Learning-Klassifikator verwendeten Training-Schnipsel.


Spalten	Name	Beschreibung
1	Klassenwert	Der Klassenwert des Objekts, aufgelistet in der Datei stats.txt.
2	Nicht verwendet
3	Nicht verwendet
4	Nicht verwendet
5 - 8	BBox	Das zweidimensionale umgebende Rechteck des Objekts im Bild auf der Grundlage eines 0-basierten Bildraumkoordinatenindex. Das umgebende Rechteck enthält die vier Koordinaten für das linke, obere, rechte und untere Pixel.
9 - 11	Nicht verwendet
12 - 14	Nicht verwendet
15	Nicht verwendet

Weitere Information finden Sie unter KITTI-Metadatenformat .

Nachfolgend finden Sie ein Beispiel für PASCAL VOC.

<?xml version=”1.0”?>
- <layout>
      <image>000000000</image>
      <object>1</object>
    - <part>
         <class>1</class>
       - <bndbox>
            <xmin>31.85</xmin>
            <ymin>101.52</ymin>
            <xmax>256.00</xmax>
            <ymax>256.00</ymax>
         </bndbox>
      </part>
  </layout>

Weitere Informationen finden Sie unter PASCAL Visual Object Classes.

String

start_index

(optional)

Ermöglicht das Festlegen des Startindexes für die Abfolge von Bildschnipseln. Damit können Sie mehr Bildschnipsel an eine vorhandene Sequenz anhängen. Der Standardwert ist 0.

Long

Codebeispiel

ExportTrainingDataForDeepLearning – Beispiel 1 (Python-Fenster)

In diesem Beispiel werden Trainingsgebiete für Deep Learning erstellt.

from arcpy.sa import *

ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder", 
                                 "c:/test/training.shp", "TIFF", "256", 
                                 "256", "128", "128", "NO", "KITTI_rectangles")

ExportTrainingDataForDeepLearning – Beispiel 2 (eigenständiges Skript)

In diesem Beispiel werden Trainingsgebiete für Deep Learning erstellt.

# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *

# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"

# Execute 
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training, 
                                 image_chip_format,tile_size_x, tile_size_y, 
                                 stride_x, stride_y,output_nofeature_tiles, 
                                 metadata_format)

Umgebungen

Ausdehnung

Lizenzinformationen

ArcGIS Desktop Basic: Erfordert Spatial Analyst
ArcGIS Desktop Standard: Erfordert Spatial Analyst
ArcGIS Desktop Advanced: Erfordert Spatial Analyst

ArcMap

Trainingsdaten für Deep Learning exportieren

Zusammenfassung

Verwendung

Syntax

Codebeispiel

ExportTrainingDataForDeepLearning – Beispiel 1 (Python-Fenster)

ExportTrainingDataForDeepLearning – Beispiel 2 (eigenständiges Skript)

Umgebungen

Lizenzinformationen

Verwandte Themen