Disponible con una licencia de Spatial Analyst.
Las herramientas de Segmentación y clasificación proporcionan un enfoque para extraer entidades de imágenes basadas en objetos. Estos objetos se crean mediante un proceso de segmentación de imágenes en el que aquellos píxeles que están cerca y que tienen características espectrales similares se agrupan en un segmento. Los segmentos que tienen determinadas formas y características espectrales y espaciales se pueden agrupar en objetos. A continuación, los objetos se pueden agrupar en clases que representan entidades del mundo real sobre el terreno. También es posible realizar la clasificación de imágenes en las imágenes de píxeles, por ejemplo, las imágenes no segmentadas tradicionales.
El proceso de extracción de entidades orientado a objetos es un flujo de trabajo que se utiliza en las herramientas y que abarca tres áreas funcionales principales: la segmentación de imágenes, la derivación de información analítica sobre los segmentos y la clasificación. La salida de datos de una herramienta se convierte en la entrada para otras herramientas, donde el objetivo es obtener un mapa de clase de entidades orientado a objetos significativo. El proceso orientado a los objetos es similar a un proceso tradicional de clasificación de imágenes basado en píxeles, en el que se utilizan técnicas de clasificación supervisadas y no supervisadas. En lugar de clasificar los píxeles, el proceso clasifica segmentos, que se pueden interpretar como superpíxeles. Cada segmento, o superpíxel, se representa mediante un conjunto de atributos que se utiliza en las herramientas del clasificador para obtener la imagen clasificada.
A continuación se muestra un modelo de geoprocesamiento en el que se incluye un flujo de trabajo de extracción de entidades orientado a objetos.
Segmentación de imágenes
La segmentación de imágenes se basa en el enfoque de desplazamiento medio. La técnica utiliza una ventana móvil que calcula un valor medio de píxeles para determinar los píxeles que deben incluirse en cada segmento. A medida que la ventana se mueve por la imagen, vuelve a calcular de forma iterativa el valor para asegurarse de cada uno de los segmentos sea adecuado. El resultado es una agrupación de los píxeles de la imagen en un segmento caracterizado por un color medio.
La herramienta Segmentación (desplazamiento medio) acepta cualquiera de los rásteres que se admiten en Esri y genera una imagen segmentada de 3 bandas y colores de 8 bits con una propiedad clave establecida en Segmentada. Las características de los segmentos de la imagen dependen de tres parámetros: detalle espectral, detalle espacial y tamaño mínimo de segmento. Puede variar el nivel de detalle que caracteriza una entidad de interés. Por ejemplo, si está más interesado en entidades impermeables que en edificios concretos, puede ajustar el parámetro de detalle espacial a un número más bajo, de este modo obtendrá más suavizado y menos detalle.
La imagen de abajo corresponde a una escena segmentada de WorldView-2, cortesía de DigitalGlobe, en infrarrojos de color. En la imagen segmentada se muestran áreas similares agrupadas en objetos sin demasiadas motas. Generaliza el área para mantener todas las entidades como un área continua más grande.
Referencias:
- D. Comanicu, P. Meer: Mean shift: A robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, nº 5, May 2002.
- P. Meer, B. Georgescu: Edge detection with embedded confidence. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, nº 12, December 2001.
- C. Christoudias, B. Georgescu, P. Meer: Synergism in low level vision. 16th International Conference of Pattern Recognition, Track 1 - Computer Vision and Robotics, Quebec City, Canada, August 2001.
Preparar datos de muestra
La recopilación de datos de muestra de referencia significa delinear un grupo de píxeles que representan entidades concretas y que se delinean a partir de la imagen. A continuación, todos los píxeles de la imagen se comparan estadísticamente con la definición de clase especificada y asignada a una clase concreta. Las muestras de formación no deben contener píxeles no deseados que no pertenezcan a la clase de interés. Al elegir los píxeles correctos para cada clase, normalmente los resultados se caracterizan por una distribución normal en forma de campana. Asegúrese de que el polígono de muestra de referencia contenga un número considerable de píxeles, especialmente cuando utilice el clasificador de máxima verosimilitud. Por ejemplo, un bloque de 10 x 10 píxeles es igual a 100 píxeles, un tamaño razonable para un polígono de referencia y significativo desde el punto de vista estadístico.
Un dataset ráster segmentado es diferente de una imagen de píxeles en que cada segmento (denominado a veces superpíxel) se representa mediante un conjunto de valores. Aunque resulta sencillo obtener un polígono de muestra de referencia que contenga 100 píxeles de una imagen, es mucho más complicado obtener 100 segmentos a partir de un dataset ráster segmentado.
Los clasificadores paramétricos, como el clasificador de máxima verosimilitud, necesita un número de muestras significativo desde el punto de vista estadístico para poder generar una función de densidad de probabilidad que resulte de interés. Para conseguir muestras que sean significativas desde el punto de vista estadístico, debe tener 20 muestras por clase como mínimo. Esto significa que cada clase, como el terreno desnudo, los árboles de hoja caduca o el asfalto, deben tener al menos 20 segmentos recopilados para poder definir cada clase de entidad.
El suavizado afectará al tamaño y a la homogeneidad de un segmento. Un ráster segmentado que ha utilizando un factor de suavizado alto probablemente contendrá segmentos grandes y varios tipos de entidades visibles en la imagen de origen. Debido al efecto del suavizado, se recomienda recopilar las muestras de referencia en el dataset ráster segmentado. De esta forma se asegurará de que las muestras de referencia se recopilan de segmentos discretos independientes.
Información analítica
La información analítica asociada a la capa segmentada se calcula mediante la herramienta de preparación del clasificador y depende del tipo de clasificador especificado. Utilice la herramienta de preparación adecuada para clasificar sus datos:
Clasificador | Descripción |
---|---|
Preparar clasificador de cluster ISO | Genera un archivo de definición de clasificador de Esri (.ecd) utilizando la definición de clasificación de Cluster ISO. |
Preparar clasificador de máxima verosimilitud | Genera un archivo de definición de clasificador de Esri (.ecd) utilizando la definición de clasificación del Clasificador de máxima verosimilitud (MLC). El clasificador de máxima verosimilitud se basa en el teorema de Bayes Presupone que las muestras de cada clase siguen la distribución normal y calcula las probabilidades de todas las clases para cada muestra. A continuación, asigna la clase con la máxima probabilidad a esa muestra. |
Preparar clasificador de máquina de vectores de soporte | Genera un archivo de definición de clasificador de Esri (.ecd) utilizando la definición de clasificación de Máquina de vectores de soporte (SVM). El clasificador SVM intenta encontrar los vectores de soporte y el hiperplano de separación de cada par de clases para maximizar el margen entre las clases. Proporciona un método de clasificación supervisado moderno y eficaz que necesita muchas menos muestras que el clasificador de máxima verosimilitud y no presupone que sigan la distribución normal. Es lo que suele ocurrir en las entradas ráster de clasificación basada en segmentos o en las imágenes estándar. El uso del clasificador SVM está muy extendido entre los investigadores. |
Clasificador de árboles aleatorios de tren | Genera un archivo de definición de clasificador de Esri (.ecd) utilizando el método de clasificación de árboles aleatorios. El Clasificador de árboles aleatorios es el conjunto de clasificadores de árboles de decisión, que supera la vulnerabilidad de los árboles de decisión individuales al exceso de ajuste. Al igual que el SVM, el clasificador de árboles aleatorios no necesita muchas muestras de referencia ni presupone la distribución normal. Es un método de clasificación relativamente nuevo cuyo uso está muy extendido entre los investigadores. |
Las herramientas de preparación introducen la imagen que se va a clasificar, una capa segmentada opcional y los datos de los polígonos del sitio de referencia para generar el archivo de definición de clasificador adecuado. El archivo del sitio de referencia se genera a partir de la barra de herramientas Clasificaciónexistente utilizando el Administrador de muestras de referencia. En los clasificadores supervisados se utiliza el archivo de muestra de referencia estándar.
El archivo de definición de clasificador .ecd se basa en el clasificador especificado y en los atributos de interés para que el archivo de definición de clasificador sea único para cada clasificador, entradas de ráster y atributos. Es similar a un archivo de firmas de clasificación, aunque más general, dado que será compatible con cualquier clasificador y el archivo de definición de clasificador que se genere se adapta a una combinación específica de datos de origen y clasificador.
El archivo de definición de clasificador puede estar basado en cualquier ráster, no solamente en rásteres segmentados. Por ejemplo, un ráster segmentado se deriva de los datos multiespectrales de IKONOS, mientras que los datos de atributos de estadísticas y análisis se pueden generar a partir de una imagen WorldView-2 de 6 bandas con desplazamiento panorámico o de una imagen de QuickBird, GeoEye, Pleiades, RapidEye o Landsat 8. Esta flexibilidad le permite derivar el ráster segmentado una vez y generar archivos de definición de clasificador y mapas de entidades clasificados utilizando muchos orígenes de imágenes, dependiendo de la aplicación.
Calcular atributos de segmento
Las herramientas indicas anteriormente son las que se utilizan con más frecuencia en el flujo de trabajo orientado a objetos. Existe una herramienta adicional, Calcular atributos de segmento, que admite la introducción y exportación de rásteres segmentados desde aplicaciones de terceros y hasta estas. La herramienta toma una imagen segmentada y un ráster adicional para calcular los atributos de cada segmento y, con esta información, genera un archivo ráster de índice con una tabla de atributos asociada.
La finalidad de esta herramienta es realizar análisis más detallados del ráster segmentado. Los atributos se pueden analizar mediante una aplicación de estadísticas o gráficos de terceros o bien se pueden utilizar como entrada para clasificadores adicionales que no son compatibles con Esri. Esta herramienta también permite introducir un ráster segmentado desde un paquete de terceros y, por lo tanto, amplía las funcionalidades de Esri, aportando flexibilidad para utilizar datos y paquetes de aplicaciones de terceros.
Clasificación
La herramienta Clasificar ráster realiza una clasificación de la imagen tal y como se especifica en el archivo de definición de clasificador de Esri. Entre las entradas de la herramienta se incluyen la imagen que se va a clasificar, el segundo ráster opcional (ráster segmentado u otra capa ráster, como un DEM) y un archivo de definición de clasificador para generar el dataset ráster clasificado. La herramienta Clasificar ráster espera las mismas entradas que la herramienta de referencia. Tenga en cuenta que la herramienta Clasificar ráster contiene todos los clasificadores compatibles. Se utiliza el clasificador adecuado dependiendo de las propiedades y de la información incluidas en el archivo de definición de clasificador. De este modo, el archivo de definición de clasificador generado mediante la herramienta Preparar clasificador de cluster ISO, Preparar clasificador de máxima verosimilitud, Preparar clasificador de máquina de vectores de soporte o Preparar clasificador de árboles aleatorios activará el clasificador correspondiente cuando se ejecute Clasificar ráster.
Evaluación de exactitud
La evaluación de exactitud es una parte importante de cualquier proyecto de clasificación. Compara la imagen clasificada con otro origen de datos que se considera exacto o con datos de referencia. Los datos de referencia se pueden capturar in situ (esto se conoce como datos de realidad del terreno); sin embargo, si se hace así el proceso es lento y costoso. Los datos de referencia también se pueden derivar de la interpretación de imágenes en alta resolución, de imágenes clasificadas con anterioridad o de capas de datos SIG.
La forma más habitual de evaluar la exactitud de un mapa clasificado es crear un conjunto de puntos aleatorios a partir de los datos de referencia y compararlos con los datos clasificados de una matriz de confusión. Aunque se trata de un proceso de dos pasos, es posible que tenga que comparar los resultados de diferentes métodos de clasificación o sitios de referencia, o que no disponga de datos de referencia y se base en las mismas imágenes que utilizó para crear la clasificación. Para dar cabida a estos otros flujos de trabajo, el proceso de dos pasos para la evaluación de exactitud aplica las siguientes herramientas: Crear puntos de evaluación de la exactitud, Actualizar puntos de evaluación de la exactitud y Calcular matriz de confusión.