Доступно с лицензией Spatial Analyst.
Сводка
Использует данные дистанционного зондирования для преобразования маркированных векторных и растровых данных в учебные наборы данных глубокого обучения. Инструмент создает папку чипов изображений и папку файлов метаданных в определенном формате.
Использование
Этот инструмент будет создавать учебные наборы данных для поддержки приложений, созданных сторонними производителями для глубокого обучения, например Google TensorFlow, PyTorch или Microsoft CNTK.
Обучающие выборки для глубокого обучения формируются на основе небольших фрагментов изображений, содержащих объект или класс интереса, который называется – кусочек изображения.
Используйте ваши собственные классификационные обучающие данные или классы пространственных объектов ГИС, например, слой контуров зданий, для создания кусочков изображений, содержащих выборки классов из вашего исходного изображения. Как правило размеры кусочка изображения составляют 256 пиксельных строк на 256 пиксельных столбцов, если обучающая выборка не больше.
Размер ячейки и экстент можно настроить с помощью параметров среды геообработки.
Синтаксис
ExportTrainingDataForDeepLearning(in_raster, out_folder, in_class_data, image_chip_format, {tile_size_x}, {tile_size_y}, {stride_x}, {stride_y}, {output_nofeature_tiles}, {metadata_format}, {start_index}, {class_value_field}, {buffer_radius})
Параметр | Объяснение | Тип данных |
in_raster | Входное исходное изображение, обычно мультиспектральный снимок. В качестве входных изображений могут быть мультиспектральные снимки, снимки с БПЛА, или снимки National Agriculture Imagery Program (NAIP). | Raster Dataset; Raster Layer; Mosaic Layer; Image Service; MapServer; Map Server Layer; Internet Tiled Layer |
out_folder | Папку для записи выходных кусочков изображений и хранения метаданных. | Folder |
in_class_data | Данные обучающей выборки, векторные или растровые. Входные векторные данные должны соответствовать формату обучающих выборок, создаваемых с помощью инструментов панели инструментов Классификация изображений ArcGIS Desktop. Входные растровые данные должны соответствовать формату классифицированного растра, создаваемого инструментом Классифицировать растр. | Feature Class; Feature Layer; Raster Dataset; Raster Layer; Mosaic Layer; Image Service |
image_chip_format | Задает формат растра для выходных кусочков изображения. PNG и JPEG поддерживают до 3 каналов.
| String |
tile_size_x (Дополнительный) | Размер кусочков изображений по измерению X. | Long |
tile_size_y (Дополнительный) | Размер кусочков изображений по измерению Y. | Long |
stride_x (Дополнительный) | Расстояние для смещения по направлению X, при создании следующих кусочков изображения. Когда шаг равен размеру листа, наложения (перекрытия) не будет. Если шаг равен половине размера листа, величина перекрытия будет равна 50. | Long |
stride_y (Дополнительный) | Расстояние для смещения по направлению Y, при создании следующих кусочков изображения. Когда шаг равен размеру листа, наложения (перекрытия) не будет. Если шаг равен половине размера листа, величина перекрытия будет равна 50. | Long |
output_nofeature_tiles (Дополнительный) | Определяет, будут ли экспортироваться кусочки изображения, не захватывающие обучающие выборки.
| Boolean |
metadata_format (Дополнительный) | Задает формат надписей выходных метаданных. Есть четыре опции меток выходных метаданных для обучающих данных: Прямоугольники KITTI, Прямоугольники PASCAL VOC, Классифицированные листы (карта классов) и Маски RCNN. Если ваши обучающие данные представляют собой векторный слой, например слой зданий или стандартный файл классификации обучающих выборок, используйте опции прямоугольников KITTI или PASCAL VOC. Выходные метаданные – это файл .txt или .xml, содержащий обучающие выборки данных, которые попадают в минимально ограничивающий прямоугольник. Имя файла метаданных соответствует имени входного изображения. Если ваши входные данные обучающих выборок – карта классов используйте Классифицированные листы в качестве выходного формата метаданных.
Для формата метаданных KITTI создается 15 столбцов, но только 5 из них будут использованы инструментом. Первый столбец – значение класса. Следующие 3 столбца пропускаются. Столбцы 5-8 определяют минимальный ограничивающий прямоугольник, состоящий из 4 местоположений координат изображения: левого, верхнего, правого и нижнего пикселов соответственно. Минимальный ограничивающий прямоугольник определяет обучающий кусочек изображения, который используется классификатором глубокого обучения. Остальные столбцы не используются. Для дополнительной информации см. формат метаданных KITTI . Ниже приведен пример использования опции PASCAL VOC:
Для дополнительной информации см. Визуальные объектные классы PASCAL. | String |
start_index (Дополнительный) | Начальный индекс для последовательности фрагментов изображений. Дает возможность добавлять больше фрагментов изображений к существующей последовательности. По умолчанию значение равно 0. | Long |
class_value_field (Дополнительный) | Поле, содержащее значения классов. Если поле не указано, система ищет поле value или classvalue. Если объект не содержит поле класса, система определяет, что все записи относятся к одному классу. | Field |
buffer_radius (Дополнительный) | Радиус буфера вокруг каждой обучающей выборки для разграничения областей обучающих выборок. Это позволяет создавать круглые полигоны обучающих выборок для точек. Используются линейные единицы измерения пространственной привязки in_class_data. | Double |
Пример кода
ExportTrainingDataForDeepLearning, пример 1 (окно Python)
В этом примере создаются обучающие выборки для глубокого обучения.
from arcpy.sa import *
ExportTrainingDataForDeepLearning("c:/test/image.tif", "c:/test/outfolder",
"c:/test/training.shp", "TIFF", "256",
"256", "128", "128", "NO", "KITTI_rectangles")
ExportTrainingDataForDeepLearning, пример 2 (автономный скрипт)
В этом примере создаются обучающие выборки для глубокого обучения.
# Import system modules and check out ArcGIS Spatial Analyst extension license
import arcpy
arcpy.CheckOutExtension("Spatial")
from arcpy.sa import *
# Set local variables
inRaster = "c:/test/image.tif"
out_folder = "c:/test/outfolder"
in_training = "c:/test/training.shp"
image_chip_format = "TIFF"
tile_size_x = "256"
tile_size_y = "256"
stride_x="128"
stride_y="128"
output_nofeature_tiles="NO"
metadata_format="KITTI_rectangles"
# Execute
ExportTrainingDataForDeepLearning(inRaster, out_folder, in_training,
image_chip_format,tile_size_x, tile_size_y,
stride_x, stride_y,output_nofeature_tiles,
metadata_format)
Параметры среды
Информация о лицензиях
- Basic: Требуется Spatial Analyst
- Standard: Требуется Spatial Analyst
- Advanced: Требуется Spatial Analyst