Estructuras de datos ráster y modelos de almacenamiento
Los datos ráster y de imagen se almacenan normalmente en su forma original. Rara vez editará los valores de un píxel individual como podría editar una entidad en un dataset vectorial. Con frecuencia estos datos se pueden procesar para crear nuevas formas que pueden ser procesadas al vuelo o guardadas como otra versión. Estos datasets, y los conjuntos de datasets, suelen ser muy grandes, de modo que contar con buenas capacidades de administración es importante y ArcGIS Desktop está diseñado para ello.
Hay tres métodos para almacenar imágenes y datos ráster: como archivos en un sistema de archivos, en una geodatabase o administrados desde la geodatabase pero almacenados en un sistema de archivos. Esta decisión también implica determinar si se almacenan todos los datos en un dataset único o en un catálogo con la posibilidad de tener muchos datasets. Si elige almacenar los datos en un sistema de archivos, está eligiendo almacenar datasets ráster, mientras que una geodatabase puede almacenar tanto datasets ráster como datasets de mosaico. Una tercera opción de geodatabase es el catálogo de rásteres; esta opción no se describe a continuación porque ha sido reemplazada por el dataset de mosaico, que tiene muchas más capacidades, usos y funciones.
Datasets ráster
La mayoría de los datos ráster y de imágenes (tales como una ortoimagen o DEM) se proporcionan como un dataset ráster. El término dataset ráster hace referencia a cualquier modelo ráster que se almacena en el disco o es accesible como ráster único almacenado en la nube. También se puede almacenar en una geodatabase, pero no se recomienda almacenar rásteres dentro de una base de datos. Un dataset ráster es el modelo de almacenamiento de datos ráster más básico sobre el que se crea el resto: los datasets de mosaico administran los datasets ráster. También es la salida de muchas herramientas de geoprocesamiento que procesan datos ráster. A continuación se muestra un ejemplo de un dataset ráster.
Un dataset ráster es cualquier formato ráster válido organizado en una o más bandas. Cada banda está compuesta de un vector de píxeles (celdas) y cada píxel tiene un valor. Un dataset ráster tiene por lo menos una banda. ArcGIS Desktop admite más de 70 formatos de archivo diferentes para datasets ráster, incluidos TIFF, JPEG 2000, Cuadrícula de Esri y MrSid.
Más información sobre los formatos de archivo de dataset ráster admitidos
Datasets de mosaico
Un dataset de mosaico es una colección de datasets ráster (imágenes) almacenada como un catálogo y visualizada o accedida como una imagen en mosaico única o como imágenes individuales (rásteres). Estos conjuntos pueden ser extremadamente grandes tanto en tamaño de archivo total como en la cantidad de datasets. Los datasets ráster de un dataset de mosaico pueden permanecer en su formato nativo en el disco o existir en la geodatabase. Los metadatos se pueden administrar en el registro del ráster, así como los atributos de la tabla de atributos. El almacenamiento de metadatos como atributos permite administrar más fácilmente parámetros como, por ejemplo, los datos de orientación de sensor, además de realizar consultas rápidas para habilitar selecciones.
Los datos en un dataset de mosaico no tienen que estar adyacentes o superpuestos, pero pueden existir como datasets discontinuos no conectados. Por ejemplo, puede tener imágenes que cubran completamente un área o puede tener muchas tiras de imágenes que pueden no unirse para formar una imagen continua (como ocurre a lo largo de las conducciones).
Los datos incluso pueden superponerse completa o parcialmente, pero capturarse en fechas diferentes. El dataset de mosaico es un dataset ideal para almacenar datos temporales. Puede consultar el dataset de mosaico para ver las imágenes que necesita en función de la hora o la fecha, y utilizar un método de mosaico para mostrar la imagen en mosaico de acuerdo con un atributo de hora o fecha.
Los datasets de mosaico no están limitados a un tipo determinado de datos ráster. Puede agregar datos ráster desde distintos sistemas de sensores en distintas proyecciones, resoluciones, profundidades de píxel y cantidad de bandas. Se pueden generar vistas generales (como pirámides) para el conjunto completo de datos. Esto permite ver más rápidamente los datos y proporcionar rápidamente estos datasets. También hay muchas propiedades adicionales para la vista, incluido el establecimiento de un método de creación de mosaicos, que convierten estos datasets en únicos y funcionales en muchas situaciones. También puede consultar un dataset de mosaico sobre la base de restricciones de consulta espaciales y no espaciales. Los resultados de esa consulta podrían ser un conjunto de imágenes que podría procesar una por una o podrían ser una imagen en mosaico generada dinámicamente.
Además de los datos ráster, puede almacenar y administrar datos LIDAR en un dataset de mosaico de la misma manera que lo hace con los datasets ráster, e incluso junto con los datasets ráster. Los datos LIDAR se pueden almacenar en el sistema de archivos como archivos LAS o datasets LAS, o también en una geodatabase como datasets de terreno.
Comparar modelos de almacenamiento de datos ráster
Almacenar los datasets ráster individualmente suele ser el mejor método cuando los datasets no son adyacentes entre sí o se utilizan raramente en los mismos proyectos. La creación de mosaicos de las entradas para formar una gran extensión única de archivo de datos ráster es adecuada para muchas aplicaciones, pero puede que desee un dataset de mosaico por muchos motivos:
- La extensión de los datasets ráster se superpone parcial o totalmente y se desea conservar las áreas comunes.
- Los datasets ráster representan una colección de observaciones de la misma área en diferentes momentos de una serie temporal.
- Solo desea visualizar el área de estudio, no todo el conjunto de imágenes.
- Desea administrar una colección de imágenes como un conjunto integrado, pero mantener sus estados individuales.
- Desea registrar y administrar columnas de atributos adicionales que describen cada imagen.
Comparar los modelos de almacenamiento de datos ráster
Dataset ráster | Dataset de mosaico | |
---|---|---|
Descripción | Una imagen única de un objeto o una imagen sin fisuras que cubre un área espacialmente continua. Puede ser una imagen original única o el resultado de muchas imágenes fusionadas (en mosaico) entre sí. | Una colección de datasets ráster almacenada como un catálogo que permite almacenar, administrar, ver y consultar colecciones de ráster y datos LIDAR. Se ve como una imagen en mosaico, pero se tiene acceso a cada dataset como un elemento de la colección. |
Almacenamiento | Como un archivo en el disco o en una geodatabase. | Dentro de una geodatabase, pero puede hacer referencia a los datos de origen almacenados como un archivo en el disco. |
Capas del mapa | Una capa de mapa. | Una capa de mapa. |
Datos homogéneos o heterogéneos | Datos homogéneos: un único formato, tipo de datos y archivo. | Datos heterogéneos: varios formatos, tipos de datos, tamaños de archivo y sistemas de coordenadas. |
Metadatos | Se almacenan una vez y se aplican al dataset completo. | Se puede almacenar dentro del registro ráster y como atributos en la tabla de atributos. |
Datasets submuestreados | Descripciones generales de todo el dataset ráster. | Pirámides para cada dataset ráster, así como vistas generales (como una pirámide) para el conjunto completo. |
Geoprocesamiento y análisis de la imagen |
|
|
Ventajas |
|
|
Desventajas | Los datasets ráster de geodatabases personales y de archivos son más lentos de actualizar porque hay que reescribir el archivo completo. | Las vistas generales pueden tardar tiempo en generarse. |
Servicio | Se puede servir directamente como un servicio de imágenes. | Se puede servir directamente como un servicio de imágenes. |
Recomendaciones | Utilice datasets ráster cuando no sea necesario conservar la superposición entre imágenes en mosaico, y para la visualización rápida de grandes cantidades de datos ráster. | Utilice un dataset de mosaico para administrar y visualizar datos LIDAR y ráster. Bueno para datos multidimensionales, consulta, almacenamiento de metadatos y superposición de datos, y proporciona una buena solución híbrida. |
Almacenamiento de datos ráster en la geodatabase
Almacene los datos ráster en la geodatabase cuando desee administrar los rásteres, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del DBMS; y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay tres tipos principales de geodatabases: corporativa, personal y de archivos.
La geodatabase corporativa puede admitir varias operaciones en su DBMS. Las geodatabases de archivos (como las geodatabases personales) están diseñadas para ser editadas por un único usuario y no admiten el versionado. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.
Comparar el almacenamiento de rásteres en geodatabases de archivos, corporativas y personales
Característica de almacenamiento de ráster | Geodatabase de archivos | Geodatabase corporativa | Geodatabase personal |
---|---|---|---|
Límite de tamaño | 1 TB para cada dataset ráster | Sin límite; el límite depende de los límites del DBMS | 2 gigabytes (GB) por geodatabase (éste es un límite de tamaño de tabla, no un límite de tamaño de dataset ráster) |
Formato de archivo de dataset ráster | Dataset ráster de geodatabase de archivos | Dataset ráster de geodatabase corporativa | ERDAS IMAGINE, JPEG o JPEG 2000 |
Almacenamiento |
|
|
|
Se almacena en el sistema de archivos | Se almacena en un RDBMS | Se almacena en Microsoft Access | |
Compresión | LZ77, JPEG, JPEG 2000 o ninguna | LZ77, JPEG, JPEG 2000 o ninguna | LZ77, JPEG, JPEG 2000 o ninguna |
Pirámides | Admite la piramidación parcial | Admite la piramidación parcial | Regenera la pirámide completa |
Realizar mosaicos | Permite anexar a un dataset ráster al disponer en mosaico | Permite anexar a un dataset ráster al disponer en mosaico | Reescribe un nuevo dataset cada vez que se dispone en mosaico a un dataset ráster |
Actualizando | Permite la actualización incremental | Permite la actualización incremental | n/d |
Cantidad de usuarios | Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor | Multiusuario; muchos usuarios y muchos escritores | Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor |
Geodatabases de archivo
El modelo de almacenamiento de las geodatabases de archivos es un híbrido entre la geodatabase corporativa y la geodatabase personal, donde los datos ráster administrados siguen el modelo de almacenamiento de la geodatabase corporativa y los datos de ráster no administrados siguen el modelo de almacenamiento de la geodatabase personal. Las geodatabases de archivos también se asemejan a las personales, porque están diseñadas para ser editadas por un solo usuario y no son compatibles con el control de versiones. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.
Una geodatabase de archivos tiene varias ventajas sobre el uso de una geodatabase personal. Al igual que la geodatabase corporativa, la geodatabase de archivos almacena datos en bloques. Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de la geodatabase de archivos (y corporativa) emplea actualizaciones de pirámide parciales, lo que ahorra tiempo. También las estructuras de los datos de las geodatabases de archivos y corporativas son las mismas, lo que permite utilizar tecnología de copiado rápido para copiar y pegar datos entre ellas.
Las geodatabases de archivos también aceptan palabras clave de configuración pero, a diferencia de las geodatabases corporativas, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.
Geodatabases corporativas
Cuando se almacenan datos ráster en una geodatabase corporativa, es posible ofrecer un nivel de funcionalidad corporativo como, por ejemplo, seguridad, acceso multiusuario y uso compartido de datos. Existen tres motivos principales para almacenar los datos ráster como una geodatabase corporativa:
- No se actualizarán con mucha regularidad (por ejemplo, cada dos o tres años o más).
- Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
- Cientos de usuarios (o más) accederán a ellos como un mapa base.
Debido a su estructura de almacenamiento, se dice que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases corporativas almacenan siempre toda la información del ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) para los datasets ráster y los atributos de ráster en la base de datos relacional asociada. Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.
La geodatabase corporativa divide uniformemente las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.
La tabla de bloques de ráster (la tabla más grande y la que almacena la información real de píxel y las pirámides) almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, un ráster de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).
Geodatabases corporativas para Oracle, PostgreSQL y SQL Server
A partir de ArcGIS Desktop 10.5, los datasets de mosaico creados en geodatabases de Oracle, PostgreSQL o SQL Server se crearán con la nueva palabra clave RASTER_STORAGE llamada RASTERBLOB. La palabra clave RASTERBLOB implementa una transferencia eficaz de los elementos del catálogo del dataset de mosaico en el DBMS.
Los datasets de mosaico creados con RASTERBLOB no se podrán abrir con versiones anteriores del software. Si desea crear datasets de mosaico compatibles con versiones anteriores, deberá cambiar la palabra clave de configuración para RASTER_STORAGE a una de las siguientes palabras clave compatibles:
- BINARY para PostgreSQL y SQL Server
- BLOB para Oracle.
Geodatabases personales
En una geodatabase personal, el dataset ráster se convierte en un archivo IMAGINE (.img) y se almacena dentro de una carpeta de base de datos de imágenes (IDB). La carpeta IDB se encuentra en el directorio situado junto a la geodatabase personal. Al eliminar un dataset ráster, el ráster de la carpeta IDB se elimina de forma permanente.
Cuando se almacena un dataset de mosaico en una geodatabase personal, el dataset de mosaico es una tabla que apunta a los datasets ráster almacenados que contiene. En un dataset de mosaico, los datasets ráster se almacenan como no administrados; por lo tanto, contiene la ubicación a la ruta donde están almacenados los datasets ráster. Cada fila en la tabla de negocios apunta al dataset ráster almacenado. Las operaciones en un dataset de mosaico no afectan a los archivos ráster almacenados; por lo tanto, si elimina los datasets ráster de un dataset de mosaico, solo se eliminan del dataset de mosaico y no de los datos de origen del disco.
Al almacenar un dataset ráster como un atributo, el ráster se almacena como un archivo IMG en la ubicación definida por el sistema o tal cual en el sistema de archivos; esto depende de si está administrado o no.
Compresión, pirámides y tamaño de tesela
Hay otras estructuras de almacenamiento a considerar al almacenar y administrar datos ráster, como la compresión, los datasets submuestreados (pirámides y vistas generales) y el tamaño de tesela.
Compresión
Hay dos tipos de compresión: sin pérdida y con pérdida. Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la impresionante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, cuando se accede a datos ráster a través de una red con ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce considerablemente, lo que permite almacenar datasets ráster grandes, sin interrupciones, y proporcionarlos rápidamente a un cliente para su visualización.
Más información sobre compresión de ráster
Los datasets de mosaico también tienen compresión. No se usa para el almacenamiento del dataset ráster que se va a administrar sino para la compresión que se aplica a la imagen que genera cuando se visualiza. Esto también es útil al acceder a los datos a través de la red, porque se reduce el tamaño del archivo que se transfiere.
Más información sobre la propiedad Método de compresión permitido
Datasets submuestreados
Los datasets submuestreados son rásteres creados a partir de los datos originales para datasets ráster o datasets de mosaico. Se generan para mejorar la velocidad de visualización y el rendimiento. Cuando se crean para los datasets ráster, se denominan pirámides, y cuando se crean para los datasets de mosaico, se denominan vistas generales.
Pirámides y vistas generales
Pirámides | Vistas generales | |
---|---|---|
Se crean para: | Datasets ráster | Datasets de mosaico |
Formato | Escribe archivos .ovr, con algunas excepciones. Lee pirámides almacenadas externamente como .ovr o .rrd, o almacenadas internamente. | Escribe archivos .tif. |
Almacenamiento | En un único archivo que generalmente se encuentra junto al dataset ráster de origen utilizando el mismo nombre. | De manera predeterminada, en una carpeta situada junto a la geodatabase con la extensión *.overviews o internamente para geodatabases corporativas. La ubicación de almacenamiento se puede personalizar. |
Tamaño de almacenamiento | Del 2 al 10% (en comparación con los datasets ráster originales) | |
Factor de submuestreo | 2 | 3 |
Extensión |
|
|
Opciones para la creación |
|
|
Más información sobre pirámides de ráster
Más información sobre las vistas generales del dataset de mosaico
Tamaño de tesela
En una geodatabase corporativa, los datos ráster se almacenan en una estructura donde son divididos en teselas, indexados, estructurados en pirámides y muy frecuentemente comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Se especifica como un número de píxeles en X e Y. El tamaño de tesela predeterminado es 128 por 128 píxeles y la mayoría de las aplicaciones no garantiza la desviación de estos valores predeterminados. En una geodatabase corporativa, las teselas de datos ráster se comprimen antes de su almacenamiento en la geodatabase.