В этом разделе рассматривается, каким образом ArcGIS Desktop поддерживает стандарты технического комитета 211 (TC 211) ISO, относящиеся к геопространственным метаданным. Независимо от того, работали ли вы уже с метаданными и стандартами метаданных ISO или нет, этот раздел поможет вам разобраться в том, как ArcGIS Desktop создает корректные XML-документы метаданных ISO.
ISO стандарты метаданных
Метаданные ISO – не один единственный стандарт. Это – совокупность стандартов, каждый из которых охватывает различные аспекты содержимого метаданных и способы хранения этой информации. Перед тем, как перейти к вопросу о том, насколько эти стандарты поддерживаются в ArcGIS Desktop, разберемся с названиями, номерами и содержанием различных стандартов метаданных.
Стандарты содержания
Некоторые стандарты ISO являются стандартами содержания, подобными стандарту содержания FGDC Стандарт содержания для цифровых геопространственных метаданных (CSDGM). Стандарт содержания определяет, какая информация будет включена в метаданные элемента. Например, в них может регламентироваться возможность и необходимость указания заголовка и даты, а в случае изменения условий – необходимое содержание. Стандарты содержания иначе могут называться определительными стандартами.
Стандарты геопространственных метаданных охватывают разные понятия. Эксперты в различных областях совместно работают над определением способа сформулировать эти понятия. В результате создается множество стандартов метаданных ISO, которые поддерживают работу других групп. Ниже указаны два наиболее важных из действующих стандартов, но имеются и другие стандарты, обеспечивающие основу для описания пространственных данных и их временных свойств. Все стандарты метаданных ISO разрабатываются и поддерживаются независимо.
- ISO 19110:2005 Географическая информация – Методология каталогизации пространственных объектов и ISO 19110:Изменение 1, 2011
Определяет способ классификации географических объектов по типам. Информация о типе объекта, его атрибутах и связях собирается в каталоге пространственных объектов и записывается в виде набора данных или текстового документа. Эта информация имеет важное значение для понимания и использования векторных данных.
- ISO 19157:2013 Географическая информация – Качество данных
Определяет общие процедуры для оценки качества геопространственных данных и передачи результата. Так, один из способов оценки качества основывается на спецификации продукта данных. Этот пересмотренный стандарт заменяет несколько предыдущих перечисленных ниже стандартов качества данных ISO 19115:2003:
- ISO 19113:2002 Географическая информация – Принципы управления качеством
- ISO 19114:2003 Географическая информация – Процедуры оценки качества
- ISO 19138:2006 Географическая информация – Меры качества данных
Основные стандарты метаданных ISO перечислены ниже:
- ISO 19115:2003 Географическая информация – Метаданные и ISO 19115:2006 Tехническая поправка 1
Обеспечивает структуру для описания и обнаружения геопространственных данных, в том числе сведения о месте и времени их местонахождения, их содержимом, свойствах, качестве, надлежащем использовании, механизме распространения, а также контактные данные для получения информации и т.д. Они могут использоваться для описания всех типов геопространственных ресурсов, включая текстовые документы и негеографическую информацию. В этот стандарт включено содержимое стандартов качества данных ISO 19113:2002, ISO 19114:2003 и ISO 19138:2006. Этот стандарт может только ссылаться на внешний документ ISO 19110:2005, в котором описываются атрибуты объектов. Этот стандарт заменен ISO 19115-1:2014.
- ISO 19119:2005 Географическая система – Сервисы и ISO 19119:2008 Изменение 1
Обеспечивает описание сервисов, чтобы поддержать обнаружение, когда информация становится доступной в каталоге. Также определяет понятия, устанавливающие отношения между сервисами, их интерфейсы и операции, а также возможность их совместного использования для выполнения более крупных задач. Часть контента метаданных этого стандарта заменена ISO 19115-1:2014.
- ISO 19115-2:2009 Географическая информация -- Метаданные --
Часть 2: Расширения для растровых изображений и данных с регулярной структурой
Расширяет ISO 19115:2003, добавляя понятия, необходимые для описания сенсоров, используемых для сбора геопространственных данных, и собираемых ими данных, включая средства для преобразования необработанных данных.
- ISO 19115-1:2014 Географическая информация -- Метаданные --
Часть 1: Основы
Пересмотр ISO 19115: 2003, включающего понятия метаданных для описания сервисов, как определено в ISO 19119:2005. Были добавлены некоторые новые элементы и расширены многие списки кодов; новые значения списков кодов включают значения, обозначенные в Североамериканском профиле стандарта ISO 19115:2003.
Понятия для описания качества данных переместились в ISO 19157:2013; однако, этот стандарт поддерживает включение этих понятий в документе метаданных ISO 19115-1. Этот стандарт также поддерживает включение понятий каталогов пространственных объектов по ISO 19110 в документ метаданных ISO 19115-1. ISO 19115-1: 2014 обратно совместим с ISO 19115: 2003. Метаданные, созданные с помощью более ранней версии этого стандарта, могут оставаться "как есть", а в обновленной версии могут создаваться новые метаданные.
Спецификации реализации
Формат, в котором осуществляется обмен содержанием метаданных, определяется спецификацией реализации. Это может также называться стандартом кодировки или форматом сериализации.
Для каждого стандарта содержания метаданных ISO имеется связанная с ним спецификация реализации – документ и набор XML-схем, которые описывают XML-формат содержания. Единственным поддерживаемым форматом является XML. Некоторые спецификации реализации публикуются как отдельные стандарты под своим собственным номером; другие публикуются как приложение к стандарту содержания и имеют одинаковый с ним номер.
На схемах ниже показано, как вышеупомянутые стандарты содержания соотносятся со спецификациями реализации.
- ISO 19136:2007 Географическая информация – Язык географической разметки (GML)
Определяет, как понятия, связанные с несколькими стандартами содержания метаданных ИСО, включая перечисленные ниже стандарты, будут указываться в формате XML. Будучи основой для описания основных геопространственных понятий, этот стандарт используется большинством других спецификаций реализации.
- ISO 19103:2005 Географическая информация -- Язык концептуальной схемы: определяет единицы измерения и основные типы данных
- ISO 19107:2003 Географическая информация -- Пространственная схема: определяет содержание пространственной геометрии и топологии
- ISO 19108:2002 Географическая информация -- Временная схема: определяет временную геометрию, топологию и системы пространственной привязки
- ISO 19109:2005 Географическая информация -- Правила для схемы применения: Определяет, как задаются пространственные объекты
- ISO 19111:2007 Географическая информация -- Пространственная привязка по координатам: Определяет, как будут документироваться базовые системы координат
- ISO 19123:2005 Географическая информация -- Схема для геометрии покрытия и функций: Определяет, как будут документироваться растровые данные
- ISO 19139:2007 Географическая информация – Mетаданные – Реализация в языке XML Schema
Вносит изменения в содержание и определяет формат XML для ISO 19115:2003 и 19115:2006 Tехническая поправка 1. Этот стандарт также определяет общие правила создания XML-схем по диаграммам UML, представленным в стандартах содержания. Часть этого стандарта, в которой представлена спецификация реализации для ISO 19115:2003, будет заменена ISO 19115-3.
- Спецификация реализации сервиса каталога OpenGIS
Определяет XML-формат для Изменения 1 к ISO 19119:2008. Несмотря на разработку стандарта содержания метаданных ISO 19119 и XML-схемы для реализации этого стандарта, эти схемы были опубликованы лишь как часть OGC сервиса каталога для Веб (CSW) спецификации. Они не были опубликованы через какие-либо репозитории XML-схем ISO. Поскольку ISO 19115-1:2014 включает содержание ISO 19119:2008, часть этого стандарта, в которой представлена спецификация реализации для ISO 19119, будет заменена стандартом ISO 19115-3.
- ISO 19139-2:2012 Географическая информация -- Метаданные -- Реализация XML-схемы -- Часть 2: Расширения для растровых изображений и данных в форме сеточных моделей
Определяет XML-формат для ISO 19115-2:2009. Представленная им XML-схема была создана на основе моделей UML ISO 19115-2 с помощью правил кодировки по ISO 19139. Несмотря на то, что эта спецификация предполагает использование определений типов данных, представленных в ISO 19139:2007, документ метаданных на основе ISO 19139-2 несовместим с документом метаданных ISO 19139.
- ISO 19110:2011 Географическая информация – Методология каталогизации пространственных объектов Изменение 1, Приложение E
Определяет XML-формат для ISO 19110:2005. При пересмотре ISO 19110 эти XML-схемы были включены в исходный стандарт в качестве приложения. Хотя некоторые компоненты ISO 19110:2005 имеют формат на основе спецификаций ISO 19139:2007 и ISO 19136:2007, это не означает что содержание ISO 19119:2005 может быть непосредственно включено в XML -документ ISO 19139:2007.
Поскольку эти стандарты создаются и пересматриваются независимо друг от друга, если основные спецификации реализации метаданных содержат спецификации для действующих стандартов, возникают проблемы. Если информацию поддерживающего стандарта включить непосредственно в другой стандарт, то при изменении этого поддерживающего стандарта другой стандарт не изменится автоматически – для того, чтобы этот другой стандарт получил соответствующие изменения, он должен быть изменен независимо от поддерживающего стандарта; изменение этого другого стандарта произойдет по отдельному графику. Так, метаданные, созданные в соответствии с ISO 19139:2007, всегда будут отображать информацию о качестве данных так, как это описывалось в ISO 19115:2003, когда была пересмотрена модель информации о качестве данных в новой версии стандартов и спецификаций качества данных.
Если в спецификации реализации используются типы данных, заданные в другой спецификации реализации, то это – односторонний поток информации. Например, ISO 19115-2:2009 дополняет ISO 19115:2003. Однако, спецификация реализации для ISO 19139-2:2012 включает в себя типы данных из ISO 19139:2007 таким образом, что делает взаимно несовместимыми документы, связанные с двумя различными XML-форматами.
При разработке последних спецификаций реализации были приложены определенные усилия, чтобы сделать их более совместимыми, и чтобы ограничить этот разрыв при пересмотре спецификаций и стандартов в будущем.
Отношения между CSDGM и стандартами содержания ISO.
Если вы не знакомы со стандартами метаданных ISO, но знаете стандарт FGDC CSDGM, посмотрите, как стандарты содержания метаданных ISO соотносятся с различными разделами CSDGM. Большая часть содержимого в CSDGM непосредственно соответствует содержанию стандарта ISO 19115:2003, хотя раздел Элементы и атрибуты CSDGM соответствует стандарту ISO 19110:2005.
Североамериканский профиль стандарта ISO 19115:2003 является региональным профилем, который изменяет ISO 19115. Одной из его функций является добавление значений в списки кодов ISO 19115:2003, которые соответствуют значениям элементов, установленных в CSDGM. Стандарт CSDGM основывается на печати содержимого в текстовый документ и предлагает стандартизированные значения в некоторых элементах, в том числе audio при описании ресурса такого формата, как звуки живой природы. ISO 19115:2003 включает в себя идею управляемых словарей, когда из предварительно заданного списка кодов должно быть выбрано одно из значений. Список кодов метаданных ИСО для описания формата элемента не содержит значений для аудио-ресурсов. Северо-американский профиль содержит дополнительные значения для различных списков кодов ИСО, которые облегчают переход из одного стандарта содержания в другой, в том числе для списка кодов для аудио-ресурсов.
Поправки к содержанию, установленные в Северо-американском профиле, были включены в ISO 19115-1:2014 при пересмотре этого стандарта. В результате стандарт CSDGM в большей степени соответствует ISO 19115-1:2014.
Для метаданных FGDC CSDGM имеется утилита анализатора метаданных, mp, которая определяет спецификации реализации для данного стандарта. Для входных данных утилиты mp допустимы следующие три формата: XML, SGML и структурированный текст. Эти три формата наряду с двумя различными форматами HTML используются и на выходе.
Если рассматривать только формат XML для метаданных CSDGM, то имеется три отдельные спецификации. Помимо утилиты mp на веб-сайте доступны XML DTD и схема XML. Несмотря на общую схожесть, имеются все же несущественные различия между этими спецификациями.
Каждый стандарт содержания метаданных ИСО связан только с одной спецификацией реализации и одним форматом сериализации.
Ожидаются ли изменения в стандартах метаданных ISO
Стандарты метаданных ISO периодически пересматриваются для сохранения их актуальности. После пересмотра стандарта содержания должна быть соответствующим образом изменена связанная с ним спецификация реализации. В настоящее время в стадии пересмотра или разработки находятся следующие стандарты содержания метаданных и спецификации реализации:
- ISO 19115-3 Географическая информация -- Метаданные -- Часть 3: Основы реализации метаданных в XML-схеме
Определяет XML-формат для ISO 19115-1:2014. ISO 19115-3 не содержит спецификации для стандартов содержания, поддерживающих ISO 19115-1:2014. Вместо этого ISO 19115-3 обеспечивает возможность для включения содержимого в формате, соответствующем другим спецификациям реализации в тех случаях, когда это необходимо. Таким образом, метаданные элемента могут содержать информацию о качестве данных и информацию каталогов объектов даже несмотря на то, что спецификации для этих понятий обеспечиваются по отдельности. Поддерживающие стандарты содержания могут изменяться независимо, не затрагивая ISO 19115-3. Основные геопространственные понятия подразделяются на серии по типам данных, которые определены в ISO 19136:2007.
Этот стандарт заменит ту часть стандарта ISO 19139:2007, в которой содержится спецификация реализации для ISO 19115:2003, а также часть спецификации OGC CSW, которая обеспечивает спецификацию реализации для ISO 19119:2005. Эта спецификация будет завершена в ближайшее время.
- ISO 19157-2 Географическая информация -- Качество данных -- Часть 2: Реализация XML-схемы
Определяет XML-формат для ISO 19157:2013. Некоторые понятия (например, как определяются точки контакта и как происходит ссылка на ресурсы) в ISO 19157:2013 описываются на основе понятий, представленных в ISO 19115-1:2003. Спецификация реализации для этого типа данных будет представлена в ISO 19115-3.
- ISO 19139-1 Географическая информация – Mетаданные – Реализация в языке XML Schema
ISO 19139:2007 будет изменен таким образом, что он будет только определять правила создания XML-схем на основе моделей UML, представленных в стандартах содержания метаданных.
-
ISO 19110 Географическая информация – Методология каталогизации пространственных объектов
Существующий стандарт каталогизации пространственных объектов в настоящее время пересматривается в рамках обычной практики обслуживания существующих стандартов. После изменения стандарта содержания спецификация реализации должна быть обновлена. Поскольку они обе представлены в одном документе, они могут быть либо обновлены одновременно, либо спецификация реализации может быть перемещена в отдельный документ под другим номером.
- ISO 19115-2 Географическая информация -- Метаданные --
Часть 2: Расширения для растровых изображений и данных с регулярной структурой
Существующий стандарт в настоящее время пересматривается в рамках обычной практики обслуживания. Он будет обновлен вместе со своей спецификацией реализации в соответствии с ISO 19115-1:2014 и ISO 19115-3.
Стандарты, поддерживаемые ArcGIS Desktop
Метаданные, созданные и экспортированные с применением стиля метаданных Спецификация реализации метаданных ISO 19139 в ArcGIS Desktop, соответствуют стандарту содержания ISO 19115:2003 с Технической поправкой 2006 года и спецификации реализации ISO 19139:2007.
При использовании стиля метаданных INSPIRE Metadata Directive или Североамериканского профиля стиля метаданных ISO19115 2003 в ArcGIS Desktop, созданные метаданные соответствуют стандарту содержания ISO 19115:2003 с Технической поправкой 2006. Стиль INSPIRE также обеспечивает соответствие содержания метаданных документу Правила реализации метаданных INSPIRE: Техническое руководство на основе EN ISO 19115 и EN ISO 19119 v1.2 Европейского Сообщества. Стиль Североамериканский профиль обеспечивает также соответствие содержания метаданных Североамериканскому профилю стандарта ISO 19115:2003 – Географическая информация – Метаданные (NAP – Метаданные, версия 1.2).
Если вы используете стиль метаданных INSPIRE Metadata Directive или Североамериканский профиль стиля метаданных ISO19115 2003 и экспортируете метаданные, описывающие данные, итоговый XML-файл будет соответствовать спецификации реализации ISO 19139:2007. Если вы экспортируете метаданные, описывающие сервис, они соответствуют спецификации реализации OGC Веб-сервис каталога (CSW); эта спецификация включает XML-схемы, позволяющие проверить документ метаданных ISO 19139, включающий описания метаданных сервисов.
Система, используемая ArcGIS Desktop для хранения содержимого метаданных во внутреннем формате метаданных ArcGIS и его экспорта в нужный XML-формат, соответствующий текущему стилю метаданных ArcGIS, обладает достаточной гибкостью, позволяющей адаптировать ее к новым стандартам метаданных. По мере изменения стандартов содержания метаданных в редактор метаданных ArcGIS могут добавляться новые элементы метаданных и страницы, позволяющие собрать дополнительные данные. В новых стилях метаданных могут использоваться новые страницы и новые XSLT-преобразования для создания XML-файлов, соответствующих новым спецификациям реализации.
Специалисты Esri принимали участие в пересмотре вышеописанных стандартов метаданных ISO и отслеживают все их изменения. При появлении нового стиля метаданных вы сможете его использовать после выполнения необходимых настроек ArcGIS Desktop; при этом содержание существующих метаданных ArcGIS останется неизменным.
Проверка документов метаданных ISO.
К сожалению, наличие спецификации реализации, оформленной в виде стандарта, еще не означает, что ее можно использовать для проверки XML-документов на соответствие этой спецификации. В этом разделе мы выполним разбор XML-документа, рассмотрим, как проверяются XML-файлы, как публикуются XML-схемы и что означает проверка XML-документов метаданных ISO.
Введение в XML
Расширяемый язык разметки (XML) – это гибкий механизм, предназначенный для хранения и передачи данных. В отличие от него, HTML предназначен для отображения данных. Ни XML, ни HTML сами по себе ничего не производят. XML просто заключает данные в теги. HTML заключает данные в набор предопределенных тегов, сообщающих браузерам, как их следует отобразить. Лист стиля расширяемого языка преобразований XML-документов (XSLT) обеспечивает инструкции по преобразованию данных в XML-документе в нечто другое, например HTML-документ, который может быть отображен в браузере.
Все XML-документы должны отвечать базовому набору правил – они должны быть правильно оформленными. Правильно оформленный XML-документ имеет корректный XML-синтаксис. Например, XML-документ должен иметь корневой элемент, теги должны быть закрыты и корректно вложены, для атрибутов должны быть указаны значения.
XML-документ может также быть действительным. Действительный XML-документ – это правильно оформленный XML-документ, в котором, помимо того, соблюдены правила схемы. Схема определяет структуру XML-документа. Например, она может определять, какие элементы являются допустимыми, какие элементы могут входить в другие элементы, какие типы данных могут содержать те или иные элементы, какие элементы обязательны, и в каком порядке элементы должны появляться в документе. XML-схема может представлять собой Определение типа XML-документа (DTD) или документ XML Schema (XSD). Спецификация реализации метаданных ISO содержит набор документов XML Schema (XSD).
Некоторые символы имеют в XML-документе специальное значение. Например, символы "больше" (>) и "меньше" (<) используются для заключения части текста в теги и создания XML-элемента. Если текст элемента содержит символ "больше", анализатор выдает ошибку, поскольку интерпретирует этот символ как тег нового элемента XML. Наличие в тексте элемента амперсанда (&) также вызывает ошибку, поскольку амперсанд используется для записи специальных символов. Все специальные символы, описанные здесь, в том числе апостроф (') и кавычки ("), должны быть заменены соответствующей записью: > для "больше", < для "меньше", & для амперсанда, ' для апострофа и " для кавычек. Следует иметь ввиду, что многие ссылки на объекты, которые работают в документах HTML, в XML-документах не поддерживаются.
XML-документ может содержать в первой строке объявление XML, определяющее версию XML и используемую в документе кодировку. Если объявление отсутствует, используется версия по умолчанию, ХML 1.0. Если кодировка не указана, то в зависимости от отметки порядка байтов XML-документа используется кодировка UTF-8 или UTF-16. Редактор метаданных ArcGIS Desktop и инструменты геообработки метаданных создают XML-документы в кодировке UTF-8.
Дополнительные сведения о XML и синтаксисе XML-документа см. в https://www.w3schools.com/xml.
Пространства имен XML
Две XML-схемы могут определять элементы с одинаковым именем, но разными значениями. Пространства имен XML используются для того, чтобы избежать конфликтов имен элементов в том случае, когда в одном XML-документе содержатся одноименные элементы из различных XML-схем.
Пространство имен задается префиксом имени XML-элемента, отделенным от имени двоеточием: <prefix:name>. Пространство имен определяется атрибутом xmlns и сопоставлением унифицированного идентификатора ресурса (URI) со строкой, которая используется в качестве префикса: xmlns:prefix=URI. Пространства имен должны объявляться в начальном теге XML-элемента, в котором используется префикс. Однако все пространства имен, используемые в документе, обычно объявляются в начальном теге корневого элемента документа. В примере ниже определены пространства имен a и b, которые позволяют отличить внутреннюю информацию от внешней:
<a:order xmlns:a="http://store.com/inventory" xmlns:b="http://store.com/customers">
<a:name>patio table</a:name>
<a:cost>650.00</a:cost>
<a:email>shipping@store.com</a:email>
<b:name>Jane Smith</b:name>
<b:email>customer@gmail.com</b:email>
</a:order>
URI пространства имен не предназначен для указания реального Интернет-адреса. Несмотря на то, что URI похож на единый локатор ресурсов (URL), его единственным предназначением является идентификация набора имен XML-элементов.
Если одно пространство имен используется больше, чем другие, вы можете указать в XML-документе пространство имен по умолчанию, например: xmlns=URI. Указав пространство имен по умолчанию, вы избавитесь от необходимости вводить один и тот же префикс для всех элементов, связанных с этим пространством имен. Все XML-элементы документа, не имеющие префикса, относятся к пространству имен по умолчанию. предыдущий пример повторен ниже, но на этот раз с URI для пространства имен "a" , являющегося пространством имен по умолчанию:
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers">
<name>patio table</name>
<cost>650.00</cost>
<email>shipping@store.com</email>
<b:name>Jane Smith</b:name>
<b:email>customer@gmail.com</b:email>
</order>
В обоих примерах стоимость XML-элемента связана с URI пространства имен http://store.com/inventory. Если у вас есть лист стиля XSLT, преобразующий порядки, указанные в этом формате, в готовый для печати документ, оба вышеуказанных примера будут обработаны одинаковым образом, и результат будет таким же. При наличии XML-схем, определяющих оба набора элементов, вышеприведенные примеры XML-документа могли бы успешно пройти проверку – оба документа являлись бы действительными.
В спецификациях реализации метаданных ISO каждому набору XML-схем сопоставлены трехбуквенная строка и отдельный URI пространства имен. Трехбуквенная строка по определению используется в качестве префикса имен XML-элементов в связанных XML-схемах. Например, большинство элементов метаданных, определенных в ISO 19115, связаны с URI пространства имен http://www.isotc211.org/2005/gmd, согласно документу ISO 19139; если в XML-документе для этого URI не определено пространство имен по умолчанию, имена этих элементов будут иметь префикс gmd.
Спецификации реализации метаданных ISO содержат много XML-схем и, соответственно, много пространств имен и префиксов, которые могут использоваться в XML-документе. Необходимо только объявить пространства имен и префиксы для элементов, которые будут фактически присутствовать в XML-документе.
Проверка XML-документа
XML-документ должен быть правильно оформленным. XML-документ может также быть действительным. Действительный XML-документ – это правильно оформленный XML-документ, в котором, помимо того, соблюдены правила схемы. Проверяемый XML-документ должен содержать ссылку на схему.
Ссылка на DTD XML-документа может быть добавлена к объявлению XML, как показано ниже:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE order SYSTEM "http://store.com/order-format.dtd">
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers">
…
</order>
После объявления корневого элемента XML-документа указывается местонахождение DTD.
Ссылка на XML-схему добавляется с помощью атрибутов в начальном теге корневого элемента документа, как показано ниже:
<?xml version="1.0" encoding="UTF-8"?>
<order xmlns="http://store.com/inventory" xmlns:b="http://store.com/customers"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://store.com/order-format.xsd">
…
</order>
Сначала объявляется пространство имен экземпляра XMLSchema. Затем с помощью атрибута schemaLocation указывается местонахождение XML-схемы.
Для обработки XML-документов требуются различные программные инструменты. Для выполнения преобразования, определенного листом стиля XSLT, требуется XSLT-движок или процессор. XML-анализатор позволяет добавлять, удалять, считывать элементы, атрибуты и их значения, а также выполнять различные операции над структурой XML-документа. Непроверяющий XML-анализатор может определить, является ли XML-документ правильно оформленным. Проверяющий XML-анализатор может, помимо прочего, определить, является ли XML-документ действительным, используя XML-схему, на которую имеется ссылка в этом документе.
Для проверки действительности XML-документа проверяющим XML-анализатором документ должен содержать ссылку на XML-схему.
С помощью XML-схем можно реализовать большинство правил, определенных в стандартах содержания метаданных. Однако они не позволяют полностью учесть правила, определенные в UML-моделях стандартов содержания метаданных ISO. Например, в XML-схеме нельзя управлять значением элемента через значения родственных элементов того же уровня.
Schematron – основанный на правилах язык, который позволяет оценить правильность XML-документа с помощью запросов XPath и получить информацию об ошибках в случае обнаружения проблем. Schematron можно использовать дополнительно к XML-схеме, чтобы проверить, удовлетворяет ли XML-документ тем требованиям стандарта содержания, которые нельзя учесть с помощью схемы. Поскольку документы Schematron – это XML-документы, они обычно подвергаются XSLT-преобразованию: итоговый XSLT можно затем использовать для проверки XML-документа с помощью XSLT-процессора. Для выполнения проверки в ISO 19115-3 предусмотрены документы Schematrons и XML-схемы.
ArcGIS DesktopВ метаданные обрабатываются с помощью XSLT-процессора и XML-анализатора Microsoft .NET Framework. Это программное обеспечение поддерживает исключительно XSLT 1.0. Поэтому в ПО ArcGIS Desktopможно использовать только таблицы стилей XSLT 1.0. Документы Schematron, созданные на основе XSLT 2.0, нельзя преобразовать в лист стиля XSLT, пригодный для работы в ArcGIS Desktop.
Проверка метаданных в ArcGIS Desktop
Редактор метаданных ArcGIS Desktop осуществляет внутреннюю проверку содержания метаданных, управляемого определенной страницей. Проверочные тесты основаны на правилах, установленных в стандарте содержания и спецификации реализации, которым соответствует текущий стиль метаданных ArcGIS. Они включают все правила стандарта содержания, даже те, которые не могут быть проверены с помощью XML-схемы спецификации реализации. В таблице содержания редактора метаданных сразу показываются страницы с содержанием, недопустимым для данного стиля метаданных.
Создание хороших метаданных требует времени. Редактор метаданных ArcGIS позволяет сохранить содержимое метаданных, чтобы вернуться к работе над ним позже, даже если текущая версия является недопустимой.
ArcGIS Desktop используется множеством клиентов с самыми различными требованиями. Большинство организаций предпочитает создавать метаданные, отвечающие отраслевому стандарту. Однако в некоторых организациях существует ряд дополнительных внутренних требований, вследствие чего их документы метаданных считаются не соответствующими XML-схеме стандарта метаданных. ArcGIS позволяет таким организациям создавать метаданные, отвечающие их собственным требованиям. При экспорте метаданных элемента в XML-формат стандарта создаваемый XML-файл в этом случае не будет содержать ссылку на XML-схему.
По завершении создания метаданных элемента вы можете по своему усмотрению проверить их на соответствие XML-схеме стандарта метаданных, определяющего стиль метаданных. Это можно сделать, нажав на вкладке Описание кнопку Проверить, которая запускает инструмент геообработки Проверить метаданные. Значения параметров инструмента в его диалоговом окне установлены в соответствии с текущим стилем метаданных Настройки, соответствующие стилю метаданных ISO 19139, показаны ниже на снимке экрана:
Этот инструмент сначала экспортирует содержание метаданных ArcGIS элемента в XML-формат стандарта метаданных – в данном случае XML-формат ISO 19139. Затем, в соответствии со значениями параметров инструмента, в экспортированный XML-документ добавляется ссылка на XML-схему. В следующем примере показано, как на основе информации из предыдущего примера создается атрибут xsi:schemaLocation.
<?xml version="1.0" encoding="UTF-8"?>
<MD_Metadata xmlns="http://www.isotc211.org/2005/gmd"
xmlns:gco="http://www.isotc211.org/2005/gco"
xmlns:gts="http://www.isotc211.org/2005/gts"
xmlns:srv="http://www.isotc211.org/2005/srv"
xmlns:gml="http://www.opengis.net/gml"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.isotc211.org/2005/gmd
http://www.isotc211.org/schemas/2005/metadataEntity.xsd">
…
</MD_Metadata>
Если это возможно, целевое пространство имен должно быть объявлено в атрибуте xsi:schemaLocation, чтобы оно соответствовало целевому пространству имен XML-схемы. Целевое пространство имен показывает, какие элементы в XML-документе соответствуют заданной XML-схеме и будут проверены. Для других XML-схем, таких как схемы FGDC CSDGM, целевое пространство имен указывать не нужно.
Заключительный этап – это проверка экспортированного XML-файла с атрибутом xsi:schemaLocation с помощью XML-анализатора .NET Framework. Все предупреждения и сообщения об ошибках, выдаваемые .NET Framework, показываются в окне сообщений инструмента. ArcGIS Desktop выводит сообщения об ошибках в их первоначальном виде.
Репозитории XML-схем метаданных ISO
Есть несколько официальных сайтов или репозиториев, где публикуются XML-схемы различных спецификаций реализации метаданных ISO. При этом ни один из репозиториев не содержит полное собрание спецификаций. Из-за этого иногда непросто определить, какие схемы следует использовать для проверки XML-документа на соответствие данному стандарту. Эта проблема описана в документе Правила реализации метаданных INSPIRE v1.2, в разделе 2.1.2, "Местонахождение схем ISO".
Пока разрабатывались различные спецификации реализации, GML превратился из стандарта OGC в стандарт ISO. GML-содержание используется в XML-документах метаданных ISO только для записи информации о времени и геометрических формах, когда это требуется. Первоначально в XML-схемах метаданных ISO использовалась старая версия GML с тем же пространством имен, что и у XML-схем метаданных ISO. Новая версия GML имеет другое пространство имен.
Хотя изменения в стандарте GML практически не коснулись XML-документов метаданных, созданных в соответствии со стандартами содержания метаданных ISO, изменение в пространстве имен GML усложнило процедуру проверки этих XML-документов. В XML-схеме указываются целевые пространства имен для проверки. Если в XML-документе используется пространство имен G1, и в XML-схеме пространство имен G1 указано в качестве целевого, документ будет признан действительным при условии, что его содержание и структура корректны. Если в XML-документе используется пространство имен G1, а в XML-схеме указано целевое пространство имен G2, документ будет признан недействительным, даже если его содержание и структура корректны. Обычно, при изменении пространства имен XML-документа с G1 на G2, документ признается действительным, поскольку используемое в нем содержание одинаково и в G1 и в G2.
Различные XML-схемы метаданных ISO, опубликованные на разных сайтах, ссылаются на различные версии XML-схем GML и поэтому определяют различные целевые пространства имен GML. При выборе XML-схемы для проверки необходимо учитывать, какое целевое пространство имен GML определяет XML-схема. Ниже приводится список различных репозиториев, в которых можно найти XML-схемы метаданных ISO; указаны также пространства имен GML, которые они используют.
- https://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19139_Schemas/
Это – местоположение схемы, представленное в документе стандарта ISO 19139:2007 как официальный набор XML-схем. Эти схемы были обновлены в связи с переходом на новое пространство имен GML 3.2.1: http://www.opengis.net/gml/3.2.
На этом сайте нет XML-схем для других опубликованных стандартов метаданных ISO, таких как ISO 19119, ISO 19110 или ISO 19139-2. Из других XML-схем для стандартов комитета TC 211, на этом сайте опубликованы только схемы для ISO 19135-2 Географическая информация - Процедуры регистрации элементов -- Часть 2 Реализация XML-схемы. С помощью этих XML-схем могут быть проверены только XML-документы геопространственных метаданных на основе ISO 19115:2003 с новым пространством имен GML.
https://standards.iso.org/ittf/PubliclyAvailableStandards/– это официальный репозиторий ISO для всех открытых стандартов. Несмотря на доступность в этом местоположении XML-схем ISO 19135-2, ISO 19136 и ISO 19139, в списке стандартов данного репозитория их больше нет.
- http://schemas.opengis.net/iso/19139/20070417/
Это – одно из мест, где схемы ISO 19139 доступны с официального репозитория схем OGC. Они были обновлены в связи с переходом на новое пространство имен GML 3.2.1. Это – те же XML-схемы, которые опубликованы в репозитории #1; однако, они прямо ссылаются на схемы GML 3.2.1, которые доступны в этом же репозитории схем OGC, вместо тех, которые доступны в репозитории #1.
На этом сайте нет XML-схем для других опубликованных стандартов метаданных ISO, таких как ISO 19119, ISO 19110 или ISO 19139-2. Поэтому этим XML-схемам будут соответствовать только XML-документы с метаданными ISO 19115 и новым пространством имен GML.
- http://schemas.opengis.net/iso/19139/20060504/
Это еще одно местоположение, в котором схемы ISO 19139 доступны с официального репозитороия схем OGC. В этих схемах используется старое пространство имен GML 3.2.0: http://www.opengis.net/gml. Это те же XML-схемы, которые опубликованы в репозиториях #4 и #5. Эти схемы ссылаются на копии старых XML-схем GML, имеющихся на этом же сайте.
Здесь же находятся XML-схемы для ISO 19119. Поэтому c помощью этих XML-схем можно выполнить проверку XML-документов с метаданными ISO 19115 и ISO 19119, в содержимом которых используется более раннее пространство имен GML.
- https://www.iso.org/standard/67253.html
Здесь были первоначально опубликованы XML-схемы ISO 19139, до того как они стали доступны в официальном репозитории ISO, описанном в #1. Эта HTML-страница содержит ссылки на XML-схемы метаданных ISO репозитория #5, даже несмотря на то, что эти XML-схемы доступны в том же самом местоположении.
Хотя на этом сайте нет каталога XML-схем, первоначально опубликованные здесь XML-схемам по-прежнему доступны, если указать полный путь к файлам этих XML-схем. В этих схемах используется старое пространство имен GML 3.2.0. Это те же схемы ISO 19139, которые были опубликованы в репозиториях #3 и #5. Эти схемы ссылаются на копии старых XML-схем GML, имеющиеся на этом же сайте.
На этом сайте нет XML-схем для других опубликованных стандартов метаданных ISO, таких как ISO 19119, ISO 19110 или ISO 19139-2. Поэтому c помощью этих XML-схем можно выполнить проверку XML-документа с метаданными ISO 19115, в содержимом которых используется более раннее пространство имен GML..
- http://www.isotc211.org/2005/
Это еще один сайт с XML-схемами метаданных ISO от комитетов TC 211. Несмотря на то, что репозиторий #1 является официальным репозиторием, HTML-страница, доступная по URL-адресу репозитория #4, направляет пользователей именно в это местоположение.
XML-схемы ISO 19139 были опубликованы в этом местоположении тогда, когда посчитали целесообразным сделать эти схемы доступными по URL-адресу, связанному с URL-адресами пространства имен. Доступные здесь XML-схемы ISO 19139 используют более раннее пространство имен GML 3.2.0. Это те же схемы ISO 19139, которые были опубликованы в репозиториях #3 и #4. Эти схемы ссылаются на копии старых XML-схем GML, имеющихся на этом же сайте.
Это местоположение использовалось в качестве репозитория для XML-схем для различных спецификаций реализации. Как следствие, оно содержит XML-схемы для других стандартов метаданных ИСО, в том числе следующие: две различные версии XML-схем ISO 19110 и XML-схемы для ISO 19135-2, ISO 19139-2 и ISO 19145 Географическая информация -- Реестр представлений географического местоположения. XML-схем для работы с ISO 19119 не предусмотрено.
Некоторые из XML-схем в этом местоположении и, в частности, ISO 19110 используют более раннее пространство имен GML и ссылаются на GML-схемы в этом местоположении. Другие, в том числе ISO 19139-2, ссылаются на версию XML-схем ISO 19139, опубликованную в репозитории #1, и используют более позднее пространство имен GML 3.2.1.
- https://github.com/ISO-TC211/XML
Это – новый репозиторий для XML-схем, использующихся для различных спецификаций реализации TC 211.
- https://standards.iso.org/iso
Это – новый официальный репозиторий для публично доступных стандартов ИСО. В этом местоположении доступны несколько спецификаций реализации TC 211, включая ISO 19110, ISO 19136 и ISO 19139; XML-схемы для ISO 19119 недоступны. Однако, на этот раз имеются технические сложности, которые препятствуют использовать по крайней мере некоторые из XML-схем ISO 19139, а возможно также и другие.
Учитывая такое разнообразие вариантов, не ясно, какой из официальных наборов XML-схем следует использовать для проверки метаданных.
Во многих международных профилях метаданных ISO содержание связывается с различными репозиториями, перечисленными выше. Единственным реальным различием между ними является используемая версия пространства имен GML. Во всех других отношениях фактическое содержание схем идентично. В документе INSPIRE рекомендовано проверять метаданные с помощью набора схем, основанного на версии GML, наиболее подходящей для конкретной ситуации. Такой подход к проверке метаданных дает много преимуществ.
Вопросы согласованного использования различных репозиториев XML-схем, упомянутых выше, решаются Комитетом управления XML TC 211. Предполагается, что в будущем новый репозиторий №7 с успехом обеспечит согласованный набор официальных XML-схем для всех стандартов ISO TC 211.
XML схемы и ArcGIS Desktop
Система метаданных ArcGIS Desktop предназначена для проверки метаданных с помощью официальных схем, размещенных в Интернете организациями стандартизации, потому что эти схемы – официальные. Поскольку это официальные схемы, они не упаковываются и не распространяются вместе с программным обеспечением.
Когда используется стиль метаданных Спецификация реализации метаданных ISO 19139, ArcGIS Desktop использует для проверки документов метаданных ISO 19139 XML-схемы из репозитория #4. Этот репозиторий был выбран, поскольку явился первым репозиторием, предложившим доступ к постоянному набору официальных XML-схем (он был предшественником репозитория #1), а также потому, что эти схемы связаны со стандартом CSW. Поскольку ArcGIS Desktop использует для проверки метаданных XML-схемы из репозитория #4, пользователи ArcGIS Desktop получили возможность создавать метаданные, отвечающие требованиям ISO 19139, в стабильной среде. В метаданных, экспортированных с этим стилем, используется более раннее пространство имен GML 3.2.0 – http://www.opengis.net/gml/19139 – поэтому для их проверки может использоваться любая из XML-схем ISO 19139, в которой используется пространство имен GML 3.2.0 (#3, #4 и #5).
Когда используется стиль метаданных GML 3.2 Спецификации реализации метаданных ISO 19139, для проверки документов метаданных ISO 19139 используются XML-схемы из репозитория #1. Используйте этот стиль метаданных, если нужно экспортировать метаданные с пространством имен GML 3.2, и проверяйте метаданные с помощью этого альтернативного набора XML-схем. В метаданных, экспортированных с этим стилем, используется более новое пространство имен GML 3.2.1 – http://www.opengis.net/gml/3.2 – поэтому для их проверки может использоваться любая из XML-схем ISO 19139, в которой используется пространство имен GML 3.2.1 (#1, #2 и в будущем, возможно, #7.
В диалоговом окне инструмента Проверить метаданные можно изменить настройки проверки метаданных элемента, и использовать другой набор XML-схем вместо схем, связанных с текущем стилем метаданных. Вы можете также сделать эти изменения постоянными, создав пользовательский стиль метаданных, учитывающий ваши предпочтения. Например, вы можете проверять метаданные с помощью набора XML-схем, имеющегося во внутренней сети вашей организации, а не схем, размещенных в Интернете комитетом TC 211. Справка по созданию пользовательского стиля метаданных имеется в модуле ArcGIS Metadata Toolkit, который можно загрузить с сайта поддержки Esri.
Выполнить проверку не удастся, если для проверки XML-документов, экспортированных ArcGIS Desktop, будет выбран другой, не предназначенный для этого набор XML-схем ISO 19139. Если вы измените объявление пространства имен GML в экспортированных XML-документах, добавив или удалив /3.2 в конце объявления, файлы будут успешно проверены с помощью другого набора XML-схем.
ArcGIS Desktop будет обновлен и сможет экспортировать и выполнять проверку XML-документов ISO 19139 для другого репозитория XML-схем, когда Комитет управления XML TC 211 создаст новый, постоянный репозиторий.
В заключение несколько слов о XLinks
XLink – это рекомендация W3C для поддержки запросов и ссылок на части XML-документа. XML-схемы XLink включены в стандарты ISO TC 211. Однако, они не получили широкого распространения в программном сообществе. Интернет-браузеры их не поддерживают. Программы Microsoft для работы с XML поддерживают их лишь в той мере, в какой они поддерживают любую другую XML-схему.
Хотя XLinks допускаются XML-схемами ISO 19139, их использование совершенно необязательно. Требование использовать XLinks в XML-файле, совместимом с ISO 19139, отсутствует.
XLinks удобны при работе с XML-документом, поскольку позволяют легко интерпретировать и уяснять связь между двумя разделами XML-документа. При создании XML-документов с чистого листа, путем ввода XML-данных, использование XLinks позволяет сэкономить время, сократить эксплуатационные расходы и избежать грубых ошибок ввода данных.
ArcGIS DesktopВ используется другой метод для решения подобных вопросов обслуживания метаданных. Разделы документа метаданных, которые используются многократно, сохраняются в отдельном XML-файле. Фрагменты XML могут быть загружены в метаданные элемента позднее, когда понадобятся. Эта функциональность предоставляет те же преимущества, что и XLinks, но другим способом.
Когда метаданные экспортируются в формат ISO 19139, всегда создается полный документ ISO 19139. Это сделано намеренно – полный документ метаданных для чтения и проверки за пределами организации без всякого специального программного обеспечения. В XML-файлах метаданных ISO 19139, экспортированных из ArcGIS Desktop, XLinks используются рационально, только при необходимости и когда это является наилучшим средством для работы с содержимым.