En este tema se describe la compatibilidad de ArcGIS for Desktop con los estándares ISO TC 211 asociados a los metadatos geoespaciales. Con independencia de que conozca los metadatos y los estándares de metadatos ISO, o de que haya trabajado con los metadatos ISO, este tema le ayudará a entender cómo ArcGIS for Desktop genera documentos XML de metadatos ISO válidos.
estándares de metadatos ISO
Los metadatos ISO no son una sola norma. Son una serie de estándares que abarcan distintos aspectos del contenido de los metadatos y la manera en que se almacena esa información. Antes de analizar el nivel de compatibilidad que ofrece ArcGIS for Desktop para estos estándares, es fundamental conocer a fondo los nombres y los números de los distintos estándares y el aspecto de los metadatos de un elemento que controlan.
Normas de contenido
Algunas normas ISO son de contenido, de la misma manera que la Norma de contenido para los metadatos geoespaciales digitales (Content Standard for Digital Geospatial Metadata, CSDGM) del Comité federal de datos geográficos (Federal Geographic Data Committee, FGDC) es una norma de contenido. Una norma de contenido determina qué información debe proporcionarse en los metadatos de un elemento. Indican, por ejemplo, que puede proporcionar un título y una fecha (en el caso de que sean obligatorios), así como indicar qué contenido es necesario en el caso de que cambien las condiciones. También se puede hacer referencia a los estándares de contenido como estándares de definición.
Los estándares para metadatos geoespaciales abarcan muchos conceptos. Expertos en áreas específicas colaboran para definir una forma de articular estos conceptos. El resultado es que se han creado muchos estándares de metadatos ISO compatibles con el trabajo de otros grupos. Los dos estándares de compatibilidad más importantes se indican a continuación, aunque existen muchos otros que proporcionan el marco para describir datos espaciales y sus propiedades temporales. Todos los estándares de metadatos ISO se desarrollan y mantienen de forma independiente.
- ISO 19110:2005 Información geográfica -- Metodología para el catálogo de entidades e ISO 19110:2011 Corrección 1
Define una forma de clasificar tipos de entidades geográficas. La información sobre el tipo, los atributos y las asociaciones de una entidad se recopila en un catálogo de entidades y se registra como un dataset o como un documento de texto. Esta información es esencial para comprender y utilizar los datos de entidad.
- ISO 19157:2013 Información geográfica -- Calidad de los datos
Define procedimientos generales para evaluar la calidad de los datos geoespaciales y comunicar el resultado. Por ejemplo, una forma de evaluar la calidad es basándose en la especificación de un producto de datos. El estándar revisado sustituye el conjunto previo de estándares de calidad de los datos que contribuyó a ISO 19115:2003 y que se indican a continuación:
- ISO 19113:2002 Información geográfica -- Principios de calidad
- ISO 19114:2003 Información geográfica -- Procedimientos de evaluación de la calidad
- ISO 19138:2006 Información geográfica -- Mediciones de la calidad de los datos
Esta es la lista de los principales estándares de metadatos ISO:
- ISO 19115:2003 Información geográfica -- Metadatos e ISO 19115:2006 Corrección técnica 1
Proporciona una estructura para describir y detectar datos geoespaciales, incluido cuándo y cómo se ubicarán, una visión general del contenido, las propiedades, la calidad, los usos adecuados, el mecanismo de distribución, puntos de contacto para información, etcétera. Se puede utilizar para describir todos los tipos de recursos geoespaciales, incluidos documentos de texto e información no geográfica. Este estándar incluye el contenido definido en los estándares de calidad de los datos ISO 19113:2002, ISO 19114:2003 e ISO 19138:2006. Este estándar solo puede hacer referencia a un documento ISO 19110:2005 externo que describa atributos de entidad. Este estándar se ha sustituido por ISO 19115-1:2014.
- ISO 19119:2005 Información geográfica -- Servicios e ISO 19119:2008 Corrección 1
Proporciona una forma de describir servicios para admitir la detección cuando la información se ponga a disposición en un catálogo. También define conceptos para especificar las relaciones entre servicios, sus interfaces y operaciones, así como el modo en que se pueden combinar para llevar a cabo tareas más grandes. La parte de contenido de metadatos de este estándar se ha sustituido por ISO 19115-1:2014.
- ISO 19115-2:2009 Información geográfica -- Metadatos --
Parte 2: extensiones para imágenes y datos cuadriculados
Amplía ISO 19115:2003 al agregar los conceptos necesarios para describir los sensores que se utilizan para recopilar datos geoespaciales y los datos que recopila, incluidos los modos de transformar los datos sin procesar.
- ISO 19115-1:2014 Información geográfica -- Metadatos --
Parte 1: fundamentos
Una revisión de ISO 19115:2003 que incluye conceptos de metadatos para describir los servicios tal y como se definen en ISO 19119:2005. Se han agregado algunos elementos nuevos y se han ampliado muchas listas de códigos. Entre los valores de las listas de códigos nuevas se incluyen los definidos en el perfil norteamericano de ISO 19115:2003.
Los conceptos para describir la calidad de los datos se han transferido a ISO 19157:2013; no obstante, este estándar admite la inclusión de estos conceptos en un documento de metadatos ISO 19115-1. Este estándar también admite la inclusión de los conceptos del catálogo de entidades definido en ISO 19110, en un documento de metadatos ISO 19115-1. ISO 19115-1:2014 es compatible con el anterior ISO 19115:2003. Los metadatos creados con la versión anterior del estándar pueden permanecer tal cual y los metadatos nuevos se crean con la especificación.
Especificaciones de la implementación
El formato de intercambio de contenido de metadatos lo determina una especificación de la implementación. También se conoce como estándar de codificación o formato de serialización.
Cada estándar de contenido de metadatos ISO está asociado a una especificación de implementación (un documento y un conjunto de esquemas XML que describen el formato XML del contenido). XML es el único formato compatible. Algunas especificaciones de implementación se publican como estándares aparte, con su propio número, mientras que otras se proporcionan como apéndice al estándar de contenido y comparten el mismo número.
Los estándares de contenido descritos anteriormente están asociados a las siguientes especificaciones de implementación, tal y como se ilustra en los diagramas a continuación:
- ISO 19136:2007 Información geográfica-- Representación de lenguaje de marcado geográfico (Geography Markup Language, GML)
Define cómo se especifican con formato XML los conceptos asociados a muchos estándares de contenido de metadatos ISO, incluidos los que se indican a continuación. Igual que ocurre con el marco para describir conceptos geoespaciales básicos, este estándar se utiliza en muchas otras especificaciones de implementación.
- ISO 19103:2005 Información geográfica -- Lenguaje de esquema conceptual: define las unidades de medida y los tipos de datos básicos
- ISO 19107:2003 Información geográfica -- Esquema espacial: define la geometría espacial y el contenido de topología
- ISO 19108:2002 Información geográfica -- Esquema temporal: define la geometría temporal, la topología y sistemas de referencia
- ISO 19109:2005 Información geográfica -- Reglas para esquema de aplicación: define el modo en que se especifican las entidades
- ISO 19111:2007 Información geográfica -- Referencia espacial mediante coordenadas: define el modo de documentar sistemas de referencia de coordenadas
- ISO 19123:2005 Información geográfica -- Esquema para geometría y funciones de cobertura: define el modo de documentar ráster
- ISO 19139:2007 Información geográfica -- Metadatos -- Implementación de esquema XML
Se ha modificado contenido y se ha definido el formato XML para la Corrección técnica 1 de ISO 19115:2003 y 19115:2006. Este estándar también define reglas generales para la creación de esquemas XML a partir de los diagramas UML que se suministran en los estándares de contenido. La parte de este estándar que proporciona la especificación de implementación de ISO 19115:2003 se sustituirá por ISO 19115-3.
- Especificación de implementación del servicio de catálogo OpenGIS
Define el formato XML para la Corrección 1 de ISO 19119:2008. Si bien ISO 19119 es un estándar de contenido metadatos ISO y se desarrolló un Esquema XML para implementar ese estándar, los esquemas solo se publicaron como parte del Servicio de catálogo OGC para la especificación web (CSW). No se publicaron a través de ninguno de los repositorios de Esquema XML de ISO. Dado que ISO 19115-1:2014 incluye contenido definido mediante ISO 19119:2008, la parte de este estándar que proporciona la especificación de implementación de ISO 19119 se sustituirá por ISO 19115-3.
- ISO 19139-2:2012 Información geográfica -- Metadatos -- Implementación de esquema XML -- Parte 2: extensiones para imágenes y datos cuadriculados
Define el formato XML para ISO 19115-2:2009. Los esquemas XML que proporciona se crearon a partir de modelos UML de ISO 19115-2 utilizando las reglas de codificación definidas en ISO 19139. Aunque para esta especificación se requiere el uso de definiciones de tipo de datos que proporciona ISO 19139:2007, un documento de metadatos basado en ISO 19139-2 no es compatible con un documento de metadatos de ISO 19139.
- ISO 19110:2011 Información geográfica -- Metodología para el catálogo de entidades Corrección 1, Anexo E
Define el formato XML para ISO 19110:2005. Cuando se revisó ISO 19110, los esquemas XML se incluyeron como un apéndice al estándar original. Aunque a cierto contenido definido mediante ISO 19110:2005 se le ha aplicado formato basado en las especificaciones de ISO 19139:2007 e ISO 19136:2007, esto no significa que el contenido de ISO 19119:2005 se pueda incluir directamente en un documento XML de ISO 19139:2007.
Dado que estos estándares se crean y revisan de forma independiente, pueden producirse problemas cuando en las especificaciones de la implementación de metadatos principales se incluyen las especificaciones para los estándares compatibles. Si la información de un estándar compatible se incluye directamente en otro estándar, las revisiones que se realicen en el estándar compatible no se actualizarán automáticamente en el otro estándar, sino que este último se deberá revisar de forma independiente para incluir los mismos cambios, y esto se ejecutará en un momento aparte. Por ejemplo, los metadatos creados según ISO 19139:2007 siempre representarán la información de calidad de los datos de acuerdo con lo descrito en ISO 19115:2003 cuando el modelo de información de calidad de los datos se revise en una versión nueva de los estándares y especificaciones para la calidad de los datos.
Si en una especificación de implementación se utilizan los tipos de datos definidos en otra especificación de implementación, se considera un flujo de información unidireccional. Por ejemplo, ISO 19115-2:2009 se amplía a ISO 19115:2003. Sin embargo, la especificación de implementación para ISO 19139-2:2012 incorpora los tipos de datos de ISO 19139:2007 de modo que los documentos asociados a los formatos XML diferentes pasan a ser incompatibles entre sí.
A la hora de desarrollar las últimas especificaciones de implementación nos hemos esforzado para que sean compatibles entre sí a fin de limitar las posibles interrupciones en futuras revisiones de los estándares y las especificaciones.
Relación entre CSDGM y los estándares de contenido de ISO
Si no conoce los estándares de metadatos ISO pero sí conoce el estándar CSDGM del FGDC, aquí le explicamos la relación entre los anteriores estándares de contenido de metadatos ISO y las distintas secciones de la CSDGM. La mayoría del contenido definido en CSDGM se corresponde directamente con el que está definido en el estándar ISO 19115:2003, aunque la sección Entidad y atributo del CSDGM se corresponde con el estándar ISO 19110:2005.
El perfil norteamericano de ISO 19115:2003 es un perfil regional que modifica ISO 19115:2003. Uno de sus roles es agregar valores a las listas de códigos de ISO 19115:2003 que se corresponden con valores de elementos definidos en el CSDGM. El CSDGM se basa en escribir contenido en un documento de texto y sugiere valores estandarizados en algunos elementos, como el audio, a la hora de describir el formato de un recurso, posiblemente para registrar los sonidos de la fauna. ISO 19115:2003 incorpora la idea de vocabularios controlados, donde se debe seleccionar un valor de una lista de códigos predefinida. La lista de códigos de metadatos ISO para describir el formato de un elemento no tiene un valor para los recursos de audio. El perfil norteamericano agrega valores a varias listas de códigos de ISO para facilitar la transición entre los dos estándares de contenido, incluida la agregación de valores a la lista de códigos de formato para los recursos de audio.
Los ajustes de contenido definidos en el perfil norteamericano normalmente se incorporaban cuando se revisaba el estándar como ISO 19115-1:2014. Por lo tanto, el CSDGM se corresponde mejor con ISO 19115-1:2014.
Para los metadatos del estándar CSDGM del FGDC, la utilidad para el análisis de metadatos, o mp, define las especificaciones de implementación para el estándar. Se aceptan tres formatos de serialización como entradas para la utilidad de mp: XML, SGML y de texto estructurado. Estos tres formatos también se generan como salida en la utilidad junto con dos formatos HTML diferentes.
Si solo se plantea el formato XML para los metadatos del CSDGM, existen tres especificaciones aparte. Además de la utilidad de mp, en el sitio web hay disponibles una DTD XML y un esquema XML. Aunque por lo general son iguales, existen ligeras diferencias entre cada una de ellas.
Cada estándar de contenido de metadatos ISO está asociado solamente a una especificación de implementación y a un formato de serialización.
Novedades en las normas de metadatos ISO
Las normas de metadatos ISO se revisan periódicamente para garantizar su viabilidad permanente. Una vez que hayan finalizado las revisiones de una norma de contenido, deberá actualizarse su correspondiente especificación de implementación. Actualmente se están revisando o desarrollando los siguientes estándares de contenido de metadatos y especificaciones de implementación:
- ISO 19115-3 Información geográfica -- Metadatos -- Parte 3: implementación de esquema XML de los fundamentos de metadatos
Se definirá el formato XML para ISO 19115-1:2014. ISO 19115-3 no proporcionará la especificación para los estándares de contenido compatibles con ISO 19115-1:2014. En lugar de ello, ISO 19115-3 proporciona una forma de incluir contenido con formato acorde a otras especificaciones de implementación, según proceda. De este modo, los metadatos de un elemento pueden incluir información sobre la calidad de los datos y sobre el catálogo de entidades aunque las especificaciones para esos conceptos se proporcionen por separado. Los estándares de contenido compatibles se pueden revisar de forma independiente sin que afecten a ISO 19115-3. Los conceptos geoespaciales básicos se serializan según los tipos de datos definidos en ISO 19136:2007.
Este estándar sustituirá a la parte de ISO 19139:2007 que proporciona la especificación de implementación para ISO 19115:2003, así como a la parte de la especificación CSW de OGC que proporciona la especificación de implementación para ISO 19119:2005. Esta especificación finalizará en breve.
- ISO 19157-2 Información geográfica -- Calidad de los datos -- Parte 2: implementación de esquema XML
Se definirá el formato XML para ISO 19157:2013. Algunos conceptos de ISO 19157:2013 se describen basándose en los conceptos incluidos en ISO 19115-1:2003, por ejemplo, el modo en que se definen los puntos de contacto y cómo se citan los recursos. La especificación de implementación para estos tipos de datos se proporcionará en ISO 19115-3.
- ISO 19139-1 Información geográfica -- Metadatos -- Implementación de esquema XML
ISO 19139:2007 se revisará para que solo se definan las reglas para generar esquemas XML a partir de los modelos UML que se proporcionan con los estándares de contenido de metadatos.
-
ISO 19110 Información geográfica -- Metodología para el catálogo de entidades
El estándar actual de catálogo de entidades se está sometiendo a una revisión como parte del mantenimiento normal. Una vez que se haya revisado el estándar de contenido, deberá actualizarse también la especificación de implementación. Dado que ambos elementos se incluyen en el mismo documento, se pueden actualizar a la vez o bien la especificación de implementación se puede transferir a otro documento con otro número.
- ISO 19115-2 Información geográfica -- Metadatos --
Parte 2: extensiones para imágenes y datos cuadriculados
Este estándar está en proceso de revisión como parte del mantenimiento habitual. Se actualizará, junto con la especificación de implementación correspondiente, de acuerdo con ISO 19115-1:2014 e ISO 19115-3.
Estándares compatibles con ArcGIS for Desktop
Los metadatos creados y exportados cuando se utiliza el estilo de metadatos de la Especificación de implementación de metadatos ISO 19139 en ArcGIS for Desktop son válidos de conformidad con el estándar de contenido ISO 19115:2003 con la Corrección técnica de 2006 y la especificación de implementación de ISO 19139:2007.
Cuando se utiliza el estilo de metadatos de la Directiva de metadatos INSPIRE o el estilo de metadatos de perfil norteamericano de ISO19115 2003 en ArcGIS for Desktop, los metadatos que se crean son válidos de conformidad con el estándar de contenido ISO 19115:2003 con la Corrección técnica de 2006. Para el estilo INSPIRE, el contenido de metadatos también es válido de conformidad con Reglas de implementación de metadatos INSPIRE: guía técnica basada en EN ISO 19115 y EN ISO 19119 v1.2 de la Comunidad Europea. Para el estilo North American Profile, el contenido de metadatos también es válido de conformidad con North American Profile de ISO 19115:2003 - Información geográfica - Metadatos (NAP - Metadatos, versión 1.2).
Cuando se utiliza el estilo de metadatos de la Directiva de metadatos INSPIRE o el estilo de metadatos North American Profile de ISO19115 2003 y se exportan los metadatos que describen los datos, el archivo XML resultante es válido de conformidad con la especificación de implementación ISO 19139:2007. Cuando se exportan metadatos que describen un servicio, son válidos de conformidad con la especificación de implementación de Servicio de catálogo OGC para la Web (CSW); esta especificación incluye esquemas XML que pueden validar un documento de metadatos ISO 19139 que incluya descripciones de metadatos de servicio.
La práctica que utiliza ArcGIS for Desktop para almacenar contenido de metadatos en el formato de metadatos interno de ArcGIS y exportar ese contenido al formato XML correspondiente al estilo de metadatos de ArcGIS actual es un método flexible que se adapta rápidamente a medida que surgen nuevos estándares de metadatos. A medida que cambien las normas de contenido de metadatos, podrán agregarse nuevos elementos y páginas de metadatos para la edición al editor de metadatos de ArcGIS para capturar contenido adicional. Los nuevos estilos de metadatos pueden aprovechar las páginas nuevas y utilizar las transformaciones XSLT nuevas para generar archivos XML que cumplan las especificaciones de implementación nuevas.
El personal de Esri ha participado en las revisiones de las normas de metadatos ISO descritas anteriormente y está supervisando de cerca los cambios que se están realizando en ellas. Cuando hay un nuevo estilo de metadatos disponible, puede definir ArcGIS for Desktop para que lo utilice; el contenido de metadatos actual de ArcGIS permanecerá sin cambios.
Validar documentos de metadatos ISO
Lamentablemente, la mera existencia de una especificación de implementación como una norma no significa que validar documentos XML que correspondan a esas especificaciones sea una operación directa. En esta sección se examina la anatomía de un documento XML, cómo validar un archivo XML, cómo se publican los esquemas XML y qué significa validar los documentos XML de metadatos ISO.
Introducción a XML
El lenguaje de marcado extensible (Extensible markup language, XML) se diseñó como un mecanismo flexible para almacenar y transportar datos. Por el contrario, el HTML se diseñó para mostrar datos. Ni XML ni HTML hacen nada. XML simplemente agrupa los datos en etiquetas. HTML agrupa los datos en un conjunto de etiquetas predefinidas que los navegadores saben cómo mostrar. Una hoja de estilos de lenguaje de transformación basado en hojas de estilo (extensible stylesheet language transformations, XSLT) proporciona instrucciones para transformar los datos de un documento XML en otra cosa, como un documento HTML que se puede visualizar en un navegador.
Todos los documentos XML deben seguir un conjunto de reglas básicas y tener el formato correcto. Un documento XML con formato correcto tiene una sintaxis XML correcta. Por ejemplo, un documento XML debe tener un elemento raíz, las etiquetas deben estar cerradas y debidamente anidadas, y los valores de atributos deben estar entrecomillados.
Un documento XML puede ser opcionalmente válido. Un documento XML válido es un documento XML con formato correcto que, además, se ajusta a las reglas de un esquema. Un esquema define la estructura de un documento XML. Por ejemplo, puede especificar qué elementos pueden existir en el documento, qué elementos pueden contener qué otros elementos, qué elementos contienen determinados tipos de datos, qué elementos son obligatorios y en qué orden deben aparecer los elementos. Un esquema XML puede ser una definición de tipo de documento (Document Type Definition, DTD) XML o bien un esquema XML (XML Schema, XSD). Una especificación de implementación de metadatos ISO proporciona un conjunto de documentos de esquema XML (XSD).
Algunos caracteres tienen un significado especial en un documento XML. Por ejemplo, los caracteres "mayor que" (>) y "menor que" (<) se utilizan para colocar etiquetas antes y después del texto, y crear un elemento XML. Si el texto de un elemento incluye el carácter "mayor que" simple, se produce un error porque se interpreta como el inicio de una nueva etiqueta de elemento XML. La presencia de un signo & en el texto de un elemento también produce un error porque este signo se utiliza para indicar referencias de caracteres especiales. Todos los caracteres especiales que se describen aquí, incluido el apóstrofe (') y la comilla ("), deben sustituirse por la referencia de entidad que corresponda: > para mayor que, < para menor que, & para el signo &, ' para un apóstrofe y " para una comilla. Tenga en cuenta que muchas referencias de entidad compatibles en documentos HTML no son compatibles en documentos XML.
Un documento XML puede tener una declaración XML en la primera línea que define la versión de XML y la codificación utilizada en el elemento. Si no hay ninguna declaración, la versión XML predeterminada es 1.0. Si no se especifica ninguna codificación, se supone que es UTF-8 o UTF-16 según lo determine la marca de orden de bytes del documento XML. El editor de metadatos de ArcGIS for Desktop y las herramientas de geoprocesamiento de metadatos siempre generan un documento XML con codificación UTF-8.
Para obtener más información sobre XML y la sintaxis de un documento XML, consulte http://www.w3schools.com/xml.
Espacios de nombres XML
Dos esquemas XML pueden definir elementos con el mismo nombre pero distinto significado. Los espacios de nombre de XML se utilizan para evitar los conflictos de nombres de elementos cuando aparecen elementos de distintos Esquemas XML en el mismo documento XML, donde se asocia un espacio de nombre diferente a cada Esquema XML.
Un espacio de nombre es un prefijo que se agrega al nombre de un elemento XML, separado del nombre por el símbolo de dos puntos, como por ejemplo <prefix:name>. Un espacio de nombre se define proporcionando un atributo xmlns y asociando un identificador de recurso uniforme (uniform resource identifier, URI) a una cadena de caracteres que se utilizará como prefijo, como por ejemplo xmlns:prefix=URI. Los espacios de nombre deben declararse en la etiqueta de apertura de un elemento XML en el cual se utilizará el prefijo. Sin embargo, todos los espacios de nombre utilizados en un documento suelen declararse en la etiqueta de apertura del elemento raíz del documento. En el ejemplo siguiente, se definen dos espacios de nombre, a y b, para distinguir la información interna de la externa:
<a:order xmlns:a="http://store.com/inventory" xmlns:b="http://store.com/customers">
<a:name>patio table</a:name>
<a:cost>650.00</a:cost>
<a:email>shipping@store.com</a:email>
<b:name>Jane Smith</b:name>
<b:email>customer@gmail.com</b:email>
</a:order>
No se espera que el URI de un espacio de nombre sea una ubicación de Internet válida. Incluso si el URI se parece a un localizador de recurso uniforme (uniform resource locator, URL), su única finalidad es identificar un conjunto de nombres de elementos XML.
Si hay otro espacio de nombre que se utilice más que los demás espacios de nombre, puede especificar un espacio de nombre predeterminado para un documento XML, como xmlns=URI. Especificar un valor predeterminado evita tener que proporcionar el mismo prefijo para todos los elementos asociados a ese espacio de nombre. Todo elemento XML del documento que no tenga prefijo pertenecerá al espacio de nombre predeterminado. El ejemplo anterior se repite a continuación, pero esta vez con el URI del espacio de nombre "a" asignado como espacio de nombre predeterminado:
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers">
<name>patio table</name>
<cost>650.00</cost>
<email>shipping@store.com</email>
<b:name>Jane Smith</b:name>
<b:email>customer@gmail.com</b:email>
</order>
En ambos ejemplos, el coste del elemento XML está asociado al URI http://store.com/inventory del espacio de nombre. Si tiene una hoja de estilos XSLT que transforma las órdenes especificadas en este formato en un documento que se puede imprimir, el mismo XSLT procesará ambos ejemplos anteriores de la misma manera y generará el mismo resultado. Si se identifican los Esquemas XML que definen ambos conjuntos de elementos, los ejemplos anteriores de documentos XML pueden validarse: ambos ejemplos anteriores se consideran válidos.
En las especificaciones de implementación de metadatos ISO, cada conjunto de esquemas XML está asociado a una cadena de caracteres de tres letras y a un URI de espacio de nombre específico. Por convención, la cadena de caracteres de tres letras se utiliza siempre como prefijo de los elementos XML definidos en los Esquemas XML asociados. Por ejemplo, casi todos los elementos de metadatos definidos en ISO 19115 están asociados al URI de espacio de nombre http://www.isotc211.org/2005/gmd, tal y como se especifica en el documento ISO 19139; estos elementos utilizarán el prefijo gmd si no se especifica un espacio de nombre predeterminado en un documento XML para este URI.
Las especificaciones de implementación de metadatos ISO proporcionan muchos Esquemas XML y, por lo tanto, definen muchos espacios de nombres y prefijos que podrían utilizarse en un documento XML. Solo es preciso incluir las declaraciones de espacio de nombre y prefijo de los elementos que aparecerán en un documento XML.
Validar un documento XML
Un documento XML debe tener el formato correcto. Un documento XML puede ser opcionalmente válido. Un documento XML válido es un documento XML con formato correcto que, además, se ajusta a las reglas de un esquema. Para validar un documento XML debe agregarse una referencia de esquema al mismo.
Se puede agregar una referencia a una DTD de XML siguiendo la declaración XML que se ilustra a continuación:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE order SYSTEM "http://store.com/order-format.dtd">
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers">
…
</order>
Se declara el elemento raíz del documento XML, seguido del lugar en el cual se almacena la DTD.
Una referencia a un Esquema XML se agrega utilizando los atributos de la etiqueta de apertura para el elemento raíz del documento, como se ilustra a continuación:
<?xml version="1.0" encoding="UTF-8"?>
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://store.com/order-format.xsd">
…
</order>
En primer lugar se declara el espacio de nombre de la instancia XMLSchema. A continuación, el atributo schemaLocation especifica el lugar en el cual se almacena el Esquema XML.
Para procesar los documentos XML se precisan varias herramientas de software. Para realizar la transformación definida en una hoja de estilos XSLT se precisa un motor o procesador XSLT. Para agregar, eliminar, leer elementos y atributos y sus valores, y realizar otras operaciones en la estructura de un documento XML se utiliza un analizador de XML. Un analizador de XML sin validación puede comprobar que un documento XML tenga el formato correcto. Además de las otras operaciones, un analizador de XML con validación también puede utilizar un esquema XML referenciado para determinar si el documento XML es válido de acuerdo con las reglas especificadas en ese esquema.
Una vez incluida una referencia de esquema XML en un documento XML, un analizador de XML con validación puede comprobar la validez del documento.
Los Esquemas XML se pueden escribir para que tengan en cuenta a la mayoría de las reglas definidas en las normas de contenido de metadatos. Sin embargo, no tienen la capacidad para valorar todas las reglas definidas en los modelos UML de las normas de contenido de metadatos ISO. Por ejemplo, con un Esquema XML, el valor de un elemento no puede controlar el valor de su elemento hermano.
Schematron es un lenguaje basado en reglas que se utiliza para evaluar un documento XML con consultas XPath y presenta errores en lenguaje simple si descubre problemas. Schematron se puede utilizar como complemento de la validación de esquema XML para determinar si en un documento XML se han seguido las reglas definidas en una norma de contenido, pero que el esquema no puede evaluar. Como los Schematron son documentos XML, normalmente se transforman en una transformación XSLT; el XSLT obtenido podrá utilizarse para validar un documento XML utilizando un procesador XSLT. ISO 19115-3 proporcionará Schematron y Esquemas XML para la validación.
ArcGIS for Desktop utiliza el analizador Microsoft .NET Framework XML y el procesador XSLT para gestionar los metadatos. Esta tecnología solo es compatible con XSLT 1.0. Por consiguiente, solo se pueden ejecutar hojas de estilos XSLT basadas en XSLT 1.0 con el software ArcGIS for Desktop. Los Schematron creados a partir de XSLT 2.0 no se pueden transformar en una hoja de estilos XSLT que se ejecute en ArcGIS for Desktop.
Validar metadatos con ArcGIS for Desktop
El editor de metadatos de ArcGIS for Desktop valida los metadatos de forma interna analizando el contenido de metadatos gestionado por una página específica. Las pruebas se basan en las reglas especificadas por la norma de contenido y la especificación de implementación asociadas al estilo de metadatos actual de ArcGIS. Se tienen en cuenta todas las reglas de los estándares de contenido, incluso las reglas que van más allá de las que se pueden analizar en el esquema XML de la especificación de implementación. La tabla de contenido del editor de metadatos ilustra rápidamente qué páginas tienen contenido que se puede considerar no válido para el estilo de los metadatos.
Crear un buen contenido de metadatos lleva tiempo. El editor de metadatos de ArcGIS le permite guardar el contenido sin retoques para que pueda modificarlo más tarde, incluso si los metadatos se consideran no válidos en el momento que necesita dejar de trabajar en ellos.
ArcGIS for Desktop es compatible con una amplia variedad de clientes con distintos requisitos. Casi todas las organizaciones prefieren crear metadatos que sigan una norma comunitaria. Sin embargo, algunas organizaciones tienen requisitos internos diferentes y sus documentos de metadatos podrían considerarse no válidos de acuerdo con un esquema XML de un estándar de metadatos. ArcGIS permite a estas organizaciones generar los metadatos de acuerdo con sus propios requisitos. De esa manera, cuando se exporta el contenido de metadatos de un elemento al formato XML de una norma, el archivo XML generado no incluirá una referencia al esquema XML.
Una vez finalizado el contenido de metadatos de un elemento, de forma opcional se puede comprobar su validez de acuerdo con el esquema XML de la norma de metadatos asociada al estilo de metadatos. Esto se puede hacer con el botón Validar de la pestaña Descripción, que ejecuta la herramienta de geoprocesamiento Validar metadatos. Los parámetros de la herramienta se definen correctamente para el estilo actual de los metadatos cuando se abre el cuadro de diálogo. La configuración asociada al estilo de metadatos ISO 19139 se ilustra en la siguiente captura de pantalla:
Esta herramienta primero exporta el contenido de metadatos ArcGIS del elemento a un formato XML de la norma de metadatos; en este ejemplo, utilizamos el formato XML ISO 19139. A continuación, se inserta una referencia a un esquema XML en el documento XML exportado basado en la información proporcionada en los parámetros de la herramienta. En el siguiente ejemplo se muestra cómo se genera el atributo xsi:schemaLocation basado en la información proporcionada en el ejemplo anterior:
<?xml version="1.0" encoding="UTF-8"?>
<MD_Metadata xmlns="http://www.isotc211.org/2005/gmd"
xmlns:gco="http://www.isotc211.org/2005/gco"
xmlns:gts="http://www.isotc211.org/2005/gts"
xmlns:srv="http://www.isotc211.org/2005/srv"
xmlns:gml="http://www.opengis.net/gml"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.isotc211.org/2005/gmd
http://www.isotc211.org/schemas/2005/metadataEntity.xsd">
…
</MD_Metadata>
Si corresponde, debe declararse el espacio de nombre objetivo en el atributo xsi:schemaLocation para que se corresponda con el espacio de nombre objetivo del Esquema XML. El espacio de nombre objetivo indica qué elementos del documento XML son conformes con el esquema XML y se validará. Otros Esquemas XML, como los esquemas CSDGM de FGDC, pueden no precisar que se especifique un espacio de nombre objetivo.
Por último, el archivo XML exportado con el atributo xsi:schemaLocation se valida con el analizador .NET Framework XML. Las advertencias o los mensajes de error proporcionados por .NET Framework se notifican en los mensajes de la herramienta. ArcGIS for Desktop notifica los mensajes de error tal y como se generan.
Repositorios de Esquemas XML de metadatos ISO
Existe numerosas ubicaciones o repositorios oficiales que publican diferentes esquemas XML de especificaciones de implementación de metadatos ISO. No todas las especificaciones se publican en todos los lugares. Esto dificulta la tarea de determinar qué esquemas se deben utilizar para validar un documento XML que supuestamente cumple una norma específica. Este dilema se describe en el documento Reglas de implementación de metadatos INSPIRE v1.2 en la sección 2.1.2, "Ubicación de los Esquemas ISO".
Durante el período de desarrollo de las diferentes especificaciones de implementación, GML ha evolucionado de una norma OGC a una norma ISO. El contenido GML solamente se utiliza en los documentos XML de metadatos ISO para registrar horas y formas geométricas cuando sea necesario. La versión anterior de GML originalmente se utilizaba en los Esquemas XML de metadatos ISO, como también se utilizaba un espacio de nombre en los Esquemas XML de metadatos ISO y GML para esta versión. La versión más reciente de GML tiene un espacio de nombre diferente.
Si bien los cambios en la norma GML prácticamente no afectan a los documentos XML de metadatos generados de acuerdo con las normas de contenido de metadatos ISO, el cambio realizado en el espacio de nombre GML complica la manera de validar estos documentos XML. Un Esquema XML especifica los espacios de nombre objetivo que se validarán. Si un documento XML utiliza el espacio de nombre G1 y un Esquema XML selecciona como objetivo de validación el espacio de nombre G1, el documento se validará si su contenido y estructura son correctos. Si el documento XML utiliza el espacio de nombre G1 y un Esquema XML selecciona como objetivo de validación el espacio de nombre G2, el documento no se validará aunque el contenido y la estructura del documento sean correctos. Por lo general, si el espacio de nombre del documento XML se altera de G1 a G2, el documento se validará correctamente siempre y cuando el contenido que utilice sea el mismo para G1 y G2.
Los diferentes Esquemas XML de metadatos ISO publicados en distintas ubicaciones hacen referencia a versiones diferentes de los Esquemas XML de GML y, por consiguiente, seleccionan como objetivo a diferentes espacios de nombre de GML. A la hora de decidir qué Esquemas XML utilizar para la validación, un factor importante es el espacio de nombre de GML que el Esquema XML selecciona como objetivo. A continuación se ofrece una lista de los distintos repositorios en los que se pueden encontrar Esquemas XML de metadatos ISO; también se indica el espacio de nombre de GML que utilizan.
- http://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19139_Schemas/
Esta es la ubicación de esquemas que se proporciona como conjunto oficial de esquemas XML en el documento del estándar 19139:2007. Estos esquemas se actualizaron para que utilicen el nuevo espacio de nombre GML 3.2.1: http://www.opengis.net/gml/3.2. Hacen referencia directa a la versión ISO 19136 de los esquemas GML 3.2.1 disponibles en este mismo repositorio de esquemas ISO, en http://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19136_Schemas/.
Esta ubicación no incluye los esquemas XML de otros estándares de metadatos ISO publicados, como ISO 19119, ISO 19110 o ISO 19139-2. Los únicos otros Esquemas XML TC 211 publicados en esta ubicación corresponden a ISO 19135-2 Información geográfica - Procedimientos para el registro de elementos -- Parte 2 implementación de esquemas XML. Solo se podrán validar con estos esquemas XML los documentos XML de metadatos geoespaciales basados en ISO 19115 que utilicen el nuevo espacio de nombre GML.
http://standards.iso.org/ittf/PubliclyAvailableStandards/es el repositorio ISO oficial de todos los estándares disponibles al público. Aunque los esquemas XML de ISO 19135-2, ISO 19136 e ISO 19139 siguen estando disponibles en esta ubicación, ya no aparecen en la lista de estándares suministrados en este repositorio.
- http://schemas.opengis.net/iso/19139/20070417/
Esta es una de las ubicaciones donde los esquemas ISO 19139 están disponibles en el repositorio oficial de esquemas de OGC. Se actualizaron para que utilicen el nuevo espacio de nombre de GML 3.2.1. Son los mismos Esquemas XML publicados en el repositorio nº 1; sin embargo, hacen referencia directa a los esquemas de GML 3.2.1 disponibles en este mismo repositorio de esquemas de OGC en lugar de a los que están disponibles en el repositorio nº 1.
Esta ubicación no incluye los esquemas XML de ninguna otra norma de metadatos ISO publicada, como ISO 19119, ISO 19110, o ISO 19139-2. Por consiguiente, solo se podrá validar con estos Esquemas XML un documento XML que incluya contenido de metadatos ISO 19115 y utilice el nuevo espacio de nombre GML.
- http://schemas.opengis.net/iso/19139/20060504/
Esta es otra ubicación donde los esquemas ISO 19139 están disponibles en el repositorio oficial de Esquemas de OGC. Estos esquemas utilizan el espacio de nombre GML más antiguo 3.2.0: http://www.opengis.net/gml. Son los mismos Esquemas XML publicados en los repositorios nº 4 y 5. Estos esquemas hacen referencia a una copia de los Esquemas XML de GML más antiguos que se proporcionan en esta misma ubicación.
Esta ubicación también incluye esquemas XML para ISO 19119. Por consiguiente, solo se podrán validar con estos Esquemas XML los documentos que incluyan contenido de metadatos ISO 19115 e ISO 19119 y que utilicen el antiguo espacio de nombre GML.
- http://www.isotc211.org/schemas/2005/
Esta es la ubicación original donde se publicaron los Esquemas XML de la norma ISO 19139 antes de que estuvieran disponibles en el repositorio ISO oficial descrito en el N.º1. La página HTML que se proporciona en esta ubicación contiene vínculos a los Esquemas XML de metadatos ISO que llevan al repositorio nº 5, aunque los esquemas XML estén disponibles en esta misma ubicación.
Aunque en esta ubicación no se vea un directorio de esquemas XML, los esquemas XML originales que se proporcionan aquí permanecerán disponibles si se indica la ruta completa a los archivos de Esquemas XML. Estos esquemas utilizan el espacio de nombre GML más antiguo 3.2.0. Son los mismos esquemas ISO 19139 publicados en los repositorios nº 3 y 5. Estos esquemas hacen referencia a una copia de los Esquemas XML de GML más antiguos que se proporcionan en esta misma ubicación.
Esta ubicación no incluye los esquemas XML de ninguna otra norma de metadatos ISO publicada, como ISO 19119, ISO 19110, o ISO 19139-2. Por consiguiente, solo se podrá validar con estos Esquemas XML un documento XML que incluya contenido de metadatos ISO 19115 y utilice el antiguo espacio de nombre GML.
- http://www.isotc211.org/2005/
Esta es otra ubicación donde los Esquemas XML de metadatos ISO se pueden obtener de los comités TC 211. Mientras que el repositorio nº 1 es el repositorio oficial, la página HTML disponible en la dirección URL asociada al repositorio nº 4 remite a esta ubicación.
Los Esquemas XML de ISO 19139 se publicaron en esta ubicación cuando se consideró una buena idea ofrecer los esquemas en la misma dirección URL asociada a los URI del espacio de nombre. Los esquemas XML de ISO 19139 que están disponibles aquí utilizan el espacio de nombre GML 3.2.0 más antiguo. Son los mismos esquemas ISO 19139 publicados en los repositorios nº 3 y 4. Estos esquemas hacen referencia a una copia de los Esquemas XML de GML más antiguos que se proporcionan en esta misma ubicación.
Esta ubicación se utilizó como repositorio para los Esquemas XML que estaban en curso para varias especificaciones de implementación. Por lo tanto, proporciona Esquemas XML para otros estándares de metadatos ISO, entre ellos: dos versiones diferentes de los Esquemas XML ISO 19110 y esquemas XML para ISO 19135-2, ISO 19139-2 e ISO 19145 Información geográfica -- Registro de representaciones de ubicación de puntos geográficos. No se proporcionan Esquemas XML compatibles con ISO 19119.
Algunos de los Esquemas XML de esta ubicación, como ISO 19110, utilizan el espacio de nombre GML más antiguo y hacen referencia a los esquemas GML de esta ubicación. Otros, como ISO 19139-2, hacen referencia a la versión de los Esquemas XML de ISO 19139 publicados en el repositorio nº 1 y utilizan el espacio de nombre GML 3.2.1 más reciente en su lugar.
- https://github.com/ISO-TC211/XML
Se trata del nuevo repositorio para los Esquemas XML que están en curso para diferentes especificaciones de implementación TC 211.
- http://standards.iso.org/iso
Es un repositorio oficial nuevo de ISO de todos los estándares disponibles para el público. En esta ubicación hay disponibles varias especificaciones de implementación TC 211, como ISO 19110, ISO 19136 e ISO 19139; no hay disponibles Esquemas XML para ISO 19119. No obstante, en este momento, existen dificultades técnicas que impiden utilizar al menos algunos de los Esquemas XML de ISO 19139, y posiblemente otros también.
Dada la amplia variedad de posibilidades, todavía no está claro qué conjunto oficial de esquemas XML debe utilizarse para validar los metadatos.
Muchos perfiles de metadatos ISO internacionales asocian su contenido a diferentes repositorios de cuantos se enumeran aquí. La única diferencia real entre ellos es la versión del espacio de nombre GML que utilizan. Por lo demás, el contenido real de los esquemas es idéntico. El documento INSPIRE sugiere que los metadatos se validen utilizando el conjunto de esquemas basados en la versión específica de GML adecuada para cada situación particular. Este enfoque holístico aplicado a la validación de metadatos es muy acertado.
Un Comité de gestión de XML TC 211 ha estado intentando solucionar los problemas de coherencia que presentan los distintos repositorios de esquemas XML descritos anteriormente. Esperamos que el nuevo repositorio, el nº 7, proporcione un conjunto coherente de Esquemas XML oficiales para todos los estándares ISO TC 211.
Esquemas XML y ArcGIS for Desktop
El sistema de metadatos de ArcGIS for Desktop se diseñó para validar metadatos utilizando los esquemas oficiales alojados en la web por las organizaciones de estándares, porque esos son los esquemas oficiales. Los esquemas no están integrados en el software ni se distribuyen con este porque entonces no serían los esquemas oficiales.
Cuando se utiliza el estilo de metadatos de la Especificación de implementación de metadatos ISO 19139, ArcGIS for Desktop utiliza los Esquemas XML del repositorio nº 4 para validar los documentos de metadatos ISO 19139. Este repositorio se seleccionó por ser el primero en proporcionar acceso a un conjunto estable de Esquemas XML oficiales, por ser anterior al repositorio descrito en nº 1 y porque estos esquemas están asociados al estándar CSW. Como ArcGIS for Desktop ha estado utilizando los esquemas XML del repositorio nº 4 para validar los metadatos, los clientes de ArcGIS for Desktop han podido crear metadatos conformes con el estándar ISO 19139 en un entorno estable. Los metadatos exportados con este estilo utilizan el espacio de nombre GML 3.2.0 más antiguo (http://www.opengis.net/gml) y se validarán correctamente con cualquiera de los Esquemas XML de ISO 19139 que utilice el espacio de nombre GML 3.2.0 (nº 3, nº 4 y nº 5).
Cuando se utiliza el estilo de metadatos GML 3.2 de la Especificación de implementación de metadatos ISO 19139, se utilizan los Esquemas XML del repositorio nº 1 para validar los documentos de metadatos ISO 19139. En su lugar, utilice este estilo de metadatos si es importante exportar los metadatos que utilicen el espacio de nombre GML 3.2, y valide los metadatos con este conjunto alternativo de Esquemas XML. Los metadatos exportados con este estilo utilizan el espacio de nombre GML 3.2.1 más reciente (http://www.opengis.net/gml/3.2) y se validarán correctamente con cualquiera de los Esquemas XML de ISO 19139 que utilice el espacio de nombre GML 3.2.1 (nº 1 y nº 2; y esperamos que nº 7 en el futuro).
Cuando se abre el cuadro de diálogo de la herramienta Validar metadatos, puede cambiar la configuración que utiliza para validar los metadatos de un elemento y usar un conjunto diferente de Esquemas XML en lugar de los esquemas asociados al actual estilo de metadatos. También puede hacer permanente este cambio creando un estilo de metadatos personalizado que utilice siempre la configuración preferida. Por ejemplo, puede validar los metadatos utilizando un conjunto de Esquemas XML disponible en la red interna de la organización en lugar de los esquemas que el comité TC 211 proporciona en Internet. En el Kit de herramientas de metadatos de ArcGIS, que se puede descargar en el sitio de soporte de Esri, encontrará la información necesaria para crear un estilo de metadatos personalizado.
Si opta por validar los documentos XML exportados por ArcGIS for Desktop con el conjunto erróneo de Esquemas XML de ISO 19139, la validación fallará. Si cambia la declaración de espacio de nombre GML en los documentos XML exportados agregando o eliminando /3.2 al final de la declaración, los archivos se validarán correctamente con el otro conjunto de Esquemas XML.
ArcGIS for Desktop se actualizará para exportar y validar los documentos XML de ISO 19139 de un repositorio diferente de Esquemas XML cuando el Comité de gestión de XML TC 211 cree un repositorio nuevo y estable.
Una última observación sobre XLinks
XLink es una recomendación W3C compatible con las partes de consulta y referencia de un documento XML. Los Esquemas XML de XLink se han incorporado a las normas ISO TC 211. Sin embargo, la comunidad de software nunca lo ha adoptado de forma generalizada. Las aplicaciones de navegación en Internet no ofrecen compatibilidad nativa con el mismo. El software XML de Microsoft es compatible salvo en la manera en que es compatible con cualquier Esquema XML.
Aunque los Esquemas XML de la norma ISO 19139 permiten los XLinks, estos son totalmente opcionales. Por consiguiente, no existe ningún requisito que obligue a utilizar XLinks en un archivo XML que cumpla la norma ISO 19139.
Los XLinks son útiles cuando el usuario interactúa con un documento XML porque facilitan la interpretación y comprensión del significado de una asociación entre dos secciones de un documento XML. Si se crean documentos XML desde cero introduciendo los datos XML, los XLinks pueden resultar muy útiles ya que ahorran tiempo, reducen los costes de mantenimiento y previenen los errores de introducción de datos más comunes.
ArcGIS for Desktop utiliza un método diferente para solucionar estos mismos problemas de mantenimiento de los metadatos. Las secciones de un documento de metadatos que se reutilizan varias veces se guardan en un archivo XML independiente. Estos fragmentos de XML se pueden cargar en los metadatos de un elemento más tarde, cuando se precisen. Esta prestación de hecho ofrece la misma ventaja que los XLinks, pero de otra manera.
Cuando los metadatos se exportan al formato ISO 19139, siempre se genera un documento ISO 19139 completo. Este resultado forma parte del diseño: garantiza la disponibilidad de un documento de metadatos completo que se puede leer y validar de modo inequívoco fuera de la organización sin depender de ningún software especializado. Los archivos XML de metadatos ISO 19139 exportados desde ArcGIS for Desktop utilizan los XLinks con moderación, solo cuando es preciso, y cuando este es el mejor método para gestionar el contenido.