Cómo se almacenan y administran los datos ráster—ArcMap

Estructuras de datos ráster y modelos de almacenamiento
Comparar modelos de almacenamiento de datos ráster
Almacenamiento de datos ráster en la geodatabase
Compresión, pirámides y tamaño de tesela

Estructuras de datos ráster y modelos de almacenamiento

Los datos ráster y de imagen se almacenan normalmente en su forma original. Rara vez editará los valores de un píxel individual como podría editar una entidad en un dataset vectorial. Con frecuencia estos datos se pueden procesar para crear nuevas formas que pueden ser procesadas al vuelo o guardadas como otra versión. Estos datasets, y los conjuntos de datasets, suelen ser muy grandes, de modo que contar con buenas capacidades de administración es importante y ArcGIS Desktop está diseñado para ello.

Hay tres métodos para almacenar imágenes y datos ráster: como archivos en un sistema de archivos, en una geodatabase o administrados desde la geodatabase pero almacenados en un sistema de archivos. Esta decisión también implica determinar si se almacenan todos los datos en un dataset único o en un catálogo con la posibilidad de tener muchos datasets. Si elige almacenar los datos en un sistema de archivos, está eligiendo almacenar datasets ráster, mientras que una geodatabase puede almacenar tanto datasets ráster como datasets de mosaico. Una tercera opción de geodatabase es el catálogo de rásteres; esta opción no se describe a continuación porque ha sido reemplazada por el dataset de mosaico, que tiene muchas más capacidades, usos y funciones.

Datasets ráster

La mayoría de los datos ráster y de imágenes (tales como una ortoimagen o DEM) se proporcionan como un dataset ráster. El término dataset ráster hace referencia a cualquier modelo ráster que se almacena en el disco o es accesible como ráster único almacenado en la nube. También se puede almacenar en una geodatabase, pero no se recomienda almacenar rásteres dentro de una base de datos. Un dataset ráster es el modelo de almacenamiento de datos ráster más básico sobre el que se crea el resto: los datasets de mosaico administran los datasets ráster. También es la salida de muchas herramientas de geoprocesamiento que procesan datos ráster. A continuación se muestra un ejemplo de un dataset ráster.

Un dataset ráster es cualquier formato ráster válido organizado en una o más bandas. Cada banda está compuesta de un vector de píxeles (celdas) y cada píxel tiene un valor. Un dataset ráster tiene por lo menos una banda. ArcGIS Desktop admite más de 70 formatos de archivo diferentes para datasets ráster, incluidos TIFF, JPEG 2000, Cuadrícula de Esri y MrSid.

Más información sobre los formatos de archivo de dataset ráster admitidos

Datasets de mosaico

Un dataset de mosaico es una colección de datasets ráster (imágenes) almacenada como un catálogo y visualizada o accedida como una imagen en mosaico única o como imágenes individuales (rásteres). Estos conjuntos pueden ser extremadamente grandes tanto en tamaño de archivo total como en la cantidad de datasets. Los datasets ráster de un dataset de mosaico pueden permanecer en su formato nativo en el disco o existir en la geodatabase. Los metadatos se pueden administrar en el registro del ráster, así como los atributos de la tabla de atributos. El almacenamiento de metadatos como atributos permite administrar más fácilmente parámetros como, por ejemplo, los datos de orientación de sensor, además de realizar consultas rápidas para habilitar selecciones.

Diagrama del dataset de mosaico — Los rásteres individuales y los metadatos integran los datasets de mosaico.

Los datos en un dataset de mosaico no tienen que estar adyacentes o superpuestos, pero pueden existir como datasets discontinuos no conectados. Por ejemplo, puede tener imágenes que cubran completamente un área o puede tener muchas tiras de imágenes que pueden no unirse para formar una imagen continua (como ocurre a lo largo de las conducciones).

Cobertura de datos discontinuos — Cobertura de datos continuos

Los datos incluso pueden superponerse completa o parcialmente, pero capturarse en fechas diferentes. El dataset de mosaico es un dataset ideal para almacenar datos temporales. Puede consultar el dataset de mosaico para ver las imágenes que necesita en función de la hora o la fecha, y utilizar un método de mosaico para mostrar la imagen en mosaico de acuerdo con un atributo de hora o fecha.

Los datasets de mosaico no están limitados a un tipo determinado de datos ráster. Puede agregar datos ráster desde distintos sistemas de sensores en distintas proyecciones, resoluciones, profundidades de píxel y cantidad de bandas. Se pueden generar vistas generales (como pirámides) para el conjunto completo de datos. Esto permite ver más rápidamente los datos y proporcionar rápidamente estos datasets. También hay muchas propiedades adicionales para la vista, incluido el establecimiento de un método de creación de mosaicos, que convierten estos datasets en únicos y funcionales en muchas situaciones. También puede consultar un dataset de mosaico sobre la base de restricciones de consulta espaciales y no espaciales. Los resultados de esa consulta podrían ser un conjunto de imágenes que podría procesar una por una o podrían ser una imagen en mosaico generada dinámicamente.

Además de los datos ráster, puede almacenar y administrar datos LIDAR en un dataset de mosaico de la misma manera que lo hace con los datasets ráster, e incluso junto con los datasets ráster. Los datos LIDAR se pueden almacenar en el sistema de archivos como archivos LAS o datasets LAS, o también en una geodatabase como datasets de terreno.

Más información sobre el dataset de mosaico

Comparar modelos de almacenamiento de datos ráster

Almacenar los datasets ráster individualmente suele ser el mejor método cuando los datasets no son adyacentes entre sí o se utilizan raramente en los mismos proyectos. La creación de mosaicos de las entradas para formar una gran extensión única de archivo de datos ráster es adecuada para muchas aplicaciones, pero puede que desee un dataset de mosaico por muchos motivos:

La extensión de los datasets ráster se superpone parcial o totalmente y se desea conservar las áreas comunes.
Los datasets ráster representan una colección de observaciones de la misma área en diferentes momentos de una serie temporal.
Solo desea visualizar el área de estudio, no todo el conjunto de imágenes.
Desea administrar una colección de imágenes como un conjunto integrado, pero mantener sus estados individuales.
Desea registrar y administrar columnas de atributos adicionales que describen cada imagen.

Comparar los modelos de almacenamiento de datos ráster

Comparación de los modelos de almacenamiento de datos ráster
	Dataset ráster	Dataset de mosaico
Descripción	Una imagen única de un objeto o una imagen sin fisuras que cubre un área espacialmente continua. Puede ser una imagen original única o el resultado de muchas imágenes fusionadas (en mosaico) entre sí.	Una colección de datasets ráster almacenada como un catálogo que permite almacenar, administrar, ver y consultar colecciones de ráster y datos LIDAR. Se ve como una imagen en mosaico, pero se tiene acceso a cada dataset como un elemento de la colección.
Almacenamiento	Como un archivo en el disco o en una geodatabase.	Dentro de una geodatabase, pero puede hacer referencia a los datos de origen almacenados como un archivo en el disco.
Capas del mapa	Una capa de mapa.	Una capa de mapa.
Datos homogéneos o heterogéneos	Datos homogéneos: un único formato, tipo de datos y archivo.	Datos heterogéneos: varios formatos, tipos de datos, tamaños de archivo y sistemas de coordenadas.
Metadatos	Se almacenan una vez y se aplican al dataset completo.	Se puede almacenar dentro del registro ráster y como atributos en la tabla de atributos.
Datasets submuestreados	Descripciones generales de todo el dataset ráster.	Pirámides para cada dataset ráster, así como vistas generales (como una pirámide) para el conjunto completo.
Geoprocesamiento y análisis de la imagen	Se puede utilizar como fuente de datos en muchas herramientas de análisis y geoprocesamiento. Se puede utilizar en la ventana Análisis de imagen.	Se puede utilizar como fuente de datos en muchas herramientas de análisis y geoprocesamiento. Se puede utilizar en la ventana Análisis de imagen.
Ventajas	Visualización rápida a cualquier escala. Un archivo individual ahorra espacio, puesto que no hay datos que se superpongan.	Administra grandes colecciones de datos ráster. Visualización rápida a cualquier escala. No hay pérdida de datos para crear el mosaico. El usuario tiene el acceso al contenido completo de la colección. Se puede establecer propiedades para controlar la visualización del mosaico. Procesamiento al vuelo ("on the fly").
Desventajas	Los datasets ráster de geodatabases personales y de archivos son más lentos de actualizar porque hay que reescribir el archivo completo.	Las vistas generales pueden tardar tiempo en generarse.
Servicio	Se puede servir directamente como un servicio de imágenes.	Se puede servir directamente como un servicio de imágenes.
Recomendaciones	Utilice datasets ráster cuando no sea necesario conservar la superposición entre imágenes en mosaico, y para la visualización rápida de grandes cantidades de datos ráster.	Utilice un dataset de mosaico para administrar y visualizar datos LIDAR y ráster. Bueno para datos multidimensionales, consulta, almacenamiento de metadatos y superposición de datos, y proporciona una buena solución híbrida.

Almacenamiento de datos ráster en la geodatabase

Almacene los datos ráster en la geodatabase cuando desee administrar los rásteres, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del DBMS; y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay tres tipos principales de geodatabases: corporativa, personal y de archivos.

La geodatabase corporativa puede admitir varias operaciones en su DBMS. Las geodatabases de archivos (como las geodatabases personales) están diseñadas para ser editadas por un único usuario y no admiten el versionado. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.

Comparar el almacenamiento de rásteres en geodatabases de archivos, corporativas y personales

Geodatabases de archivos, personales y corporativas
Característica de almacenamiento de ráster	Geodatabase de archivos	Geodatabase corporativa	Geodatabase personal
Límite de tamaño	1 TB para cada dataset ráster	Sin límite; el límite depende de los límites del DBMS	2 gigabytes (GB) por geodatabase (éste es un límite de tamaño de tabla, no un límite de tamaño de dataset ráster)
Formato de archivo de dataset ráster	Dataset ráster de geodatabase de archivos	Dataset ráster de geodatabase corporativa	ERDAS IMAGINE, JPEG o JPEG 2000
Almacenamiento	Dataset ráster: administrado Dataset de mosaico: relacionado Ráster como atributo: administrado o relacionado	Dataset ráster: administrado Dataset de mosaico: relacionado Ráster como atributo: administrado	Dataset ráster: administrado Dataset de mosaico: relacionado Ráster como atributo: administrado o relacionado
Almacenamiento	Se almacena en el sistema de archivos	Se almacena en un RDBMS	Se almacena en Microsoft Access
Compresión	LZ77, JPEG, JPEG 2000 o ninguna	LZ77, JPEG, JPEG 2000 o ninguna	LZ77, JPEG, JPEG 2000 o ninguna
Pirámides	Admite la piramidación parcial	Admite la piramidación parcial	Regenera la pirámide completa
Realizar mosaicos	Permite anexar a un dataset ráster al disponer en mosaico	Permite anexar a un dataset ráster al disponer en mosaico	Reescribe un nuevo dataset cada vez que se dispone en mosaico a un dataset ráster
Actualizando	Permite la actualización incremental	Permite la actualización incremental	n/d
Cantidad de usuarios	Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor	Multiusuario; muchos usuarios y muchos escritores	Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor

Geodatabases de archivo

El modelo de almacenamiento de las geodatabases de archivos es un híbrido entre la geodatabase corporativa y la geodatabase personal, donde los datos ráster administrados siguen el modelo de almacenamiento de la geodatabase corporativa y los datos de ráster no administrados siguen el modelo de almacenamiento de la geodatabase personal. Las geodatabases de archivos también se asemejan a las personales, porque están diseñadas para ser editadas por un solo usuario y no son compatibles con el control de versiones. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.

Una geodatabase de archivos tiene varias ventajas sobre el uso de una geodatabase personal. Al igual que la geodatabase corporativa, la geodatabase de archivos almacena datos en bloques. Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de la geodatabase de archivos (y corporativa) emplea actualizaciones de pirámide parciales, lo que ahorra tiempo. También las estructuras de los datos de las geodatabases de archivos y corporativas son las mismas, lo que permite utilizar tecnología de copiado rápido para copiar y pegar datos entre ellas.

Las geodatabases de archivos también aceptan palabras clave de configuración pero, a diferencia de las geodatabases corporativas, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.

Geodatabases corporativas

Cuando se almacenan datos ráster en una geodatabase corporativa, es posible ofrecer un nivel de funcionalidad corporativo como, por ejemplo, seguridad, acceso multiusuario y uso compartido de datos. Existen tres motivos principales para almacenar los datos ráster como una geodatabase corporativa:

No se actualizarán con mucha regularidad (por ejemplo, cada dos o tres años o más).
Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
Cientos de usuarios (o más) accederán a ellos como un mapa base.

Debido a su estructura de almacenamiento, se dice que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases corporativas almacenan siempre toda la información del ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) para los datasets ráster y los atributos de ráster en la base de datos relacional asociada. Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.

La geodatabase corporativa divide uniformemente las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.

La tabla de bloques de ráster (la tabla más grande y la que almacena la información real de píxel y las pirámides) almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, un ráster de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).

Geodatabases corporativas para Oracle, PostgreSQL y SQL Server

A partir de ArcGIS Desktop 10.5, los datasets de mosaico creados en geodatabases de Oracle, PostgreSQL o SQL Server se crearán con la nueva palabra clave RASTER_STORAGE llamada RASTERBLOB. La palabra clave RASTERBLOB implementa una transferencia eficaz de los elementos del catálogo del dataset de mosaico en el DBMS.

Los datasets de mosaico creados con RASTERBLOB no se podrán abrir con versiones anteriores del software. Si desea crear datasets de mosaico compatibles con versiones anteriores, deberá cambiar la palabra clave de configuración para RASTER_STORAGE a una de las siguientes palabras clave compatibles:

BINARY para PostgreSQL y SQL Server
BLOB para Oracle.

Geodatabases personales

En una geodatabase personal, el dataset ráster se convierte en un archivo IMAGINE (.img) y se almacena dentro de una carpeta de base de datos de imágenes (IDB). La carpeta IDB se encuentra en el directorio situado junto a la geodatabase personal. Al eliminar un dataset ráster, el ráster de la carpeta IDB se elimina de forma permanente.

Cuando se almacena un dataset de mosaico en una geodatabase personal, el dataset de mosaico es una tabla que apunta a los datasets ráster almacenados que contiene. En un dataset de mosaico, los datasets ráster se almacenan como no administrados; por lo tanto, contiene la ubicación a la ruta donde están almacenados los datasets ráster. Cada fila en la tabla de negocios apunta al dataset ráster almacenado. Las operaciones en un dataset de mosaico no afectan a los archivos ráster almacenados; por lo tanto, si elimina los datasets ráster de un dataset de mosaico, solo se eliminan del dataset de mosaico y no de los datos de origen del disco.

Al almacenar un dataset ráster como un atributo, el ráster se almacena como un archivo IMG en la ubicación definida por el sistema o tal cual en el sistema de archivos; esto depende de si está administrado o no.

Compresión, pirámides y tamaño de tesela

Hay otras estructuras de almacenamiento a considerar al almacenar y administrar datos ráster, como la compresión, los datasets submuestreados (pirámides y vistas generales) y el tamaño de tesela.

Compresión

Hay dos tipos de compresión: sin pérdida y con pérdida. Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la impresionante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, cuando se accede a datos ráster a través de una red con ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce considerablemente, lo que permite almacenar datasets ráster grandes, sin interrupciones, y proporcionarlos rápidamente a un cliente para su visualización.

Más información sobre compresión de ráster

Los datasets de mosaico también tienen compresión. No se usa para el almacenamiento del dataset ráster que se va a administrar sino para la compresión que se aplica a la imagen que genera cuando se visualiza. Esto también es útil al acceder a los datos a través de la red, porque se reduce el tamaño del archivo que se transfiere.

Más información sobre la propiedad Método de compresión permitido

Datasets submuestreados

Los datasets submuestreados son rásteres creados a partir de los datos originales para datasets ráster o datasets de mosaico. Se generan para mejorar la velocidad de visualización y el rendimiento. Cuando se crean para los datasets ráster, se denominan pirámides, y cuando se crean para los datasets de mosaico, se denominan vistas generales.

Pirámides y vistas generales

Pirámides y vistas generales
	Pirámides	Vistas generales
Se crean para:	Datasets ráster	Datasets de mosaico
Formato	Escribe archivos .ovr, con algunas excepciones. Lee pirámides almacenadas externamente como .ovr o .rrd, o almacenadas internamente.	Escribe archivos .tif.
Almacenamiento	En un único archivo que generalmente se encuentra junto al dataset ráster de origen utilizando el mismo nombre.	De manera predeterminada, en una carpeta situada junto a la geodatabase con la extensión *.overviews o internamente para geodatabases corporativas. La ubicación de almacenamiento se puede personalizar.
Tamaño de almacenamiento	Del 2 al 10% (en comparación con los datasets ráster originales)
Factor de submuestreo	2	3
Extensión	Cada nivel de pirámide cubre todo el dataset ráster. Puede especificar el número de niveles a generar.	Puede cubrir parte o la totalidad del dataset de mosaico. Cada nivel puede estar compuesto de una o varias imágenes.
Opciones para la creación	Cantidad de niveles a crear Método de remuestreo Método de compresión y calidad	Cantidad de niveles a crear Tamaño de tesela Tamaño de píxel base Método de remuestreo Método de compresión y calidad Ubicación de salida Factor de muestreo de vista general

Más información sobre pirámides de ráster

Más información sobre las vistas generales del dataset de mosaico

Tamaño de tesela

En una geodatabase corporativa, los datos ráster se almacenan en una estructura donde son divididos en teselas, indexados, estructurados en pirámides y muy frecuentemente comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Se especifica como un número de píxeles en X e Y. El tamaño de tesela predeterminado es 128 por 128 píxeles y la mayoría de las aplicaciones no garantiza la desviación de estos valores predeterminados. En una geodatabase corporativa, las teselas de datos ráster se comprimen antes de su almacenamiento en la geodatabase.