Доступно с лицензией Geostatistical Analyst.
В этой главе подробно описывается генерализованный рабочий процесс для геостатических исследований и объясняются его основные шаги. Как уже упоминалось в главе Что такое геостатистика, геостатистика – это класс статистических данных, использующихся для анализа и прогнозирования значений, связанных с пространственным или пространственно-временным явлением. Geostatistical Analyst предоставляет набор инструментов, позволяющих создавать модели, использующие эти пространственные координаты. Эти модели могут быть применены в широком ряде сценариев, обычно они используются для интерполяции значений внеопорных местоположениях и измерения неопределенности этой интерполяции.
Первый шаг, как и почти в любом исследовании, – это тщательное изучение данных. Этот процесс начинается с картографирования набора данных с использованием классификации и цветовой схемы, позволяющих ясно отобразить важные характеристики, которые может содержать набор данных, например, сильное возрастание значений с севера на юг (Тренд – см. Анализ тренда); сочетание высоких и низких значений вне определенного порядка (это может означать, что данные были отобраны в масштабе, не отображающем пространственную корреляцию, – см. Изучение пространственной структуры и направленной вариации); или более плотно отобранные зоны (преференциальная выборка), что может привести к решению использовать веса декластеризации в анализе данных – см. Выполнение декластеризации для настройки преференциальной выборки. Более подробно о картографировании и схемах классификации см. раздел Картографирование данных.
Вторая стадия – это построение геостатистической модели. Этот процесс может включать несколько шагов в зависимости от целей изучения (то есть типы информации, которую предположительно предоставляет модель) и от характеристик набора данных, которые считались достаточно важными для включения. На этой стадии информация, собранная во время тщательного исследования набора данных, и первичные знания о явлении, определяют уровень сложности модели и степень точности интерполируемых значений и мер неопределенности. На рисунке выше построение модели может включать предварительную обработку данных для удаления пространственных трендов, которые моделируются отдельно и добавляются обратно на финальном шаге процесса интерполяции (см. Анализ тренда); преобразование данных для большего соответствия Гауссову распределению (требуется для нескольких методов и выходных данных модели – см. Изучение распределения данных); и декластеризацию набора данных для компенсации преференциальной выборки. Тогда как большое количество информации можно получить, тщательно исследуя набор данных, тем не менее важно включить любые сведения, которые у вас могут быть об этом явлении. Разработчик не может полагаться только на набор данных, чтобы показать все важные характеристики. Те характеристики, которые не отобразятся, все еще могут быть включены в модель путем настройки значений параметров для отображения ожидаемого итога. Очень важно, чтобы модель была реалистичной, насколько это возможно, для точного представления интерполируемых значений и связанных с ними неопределенностей в качестве характеристики реального явления.
Кроме предварительной обработки данных, в наборе данных может быть необходимо смоделировать пространственную структуру (пространственную корреляцию). Некоторые методы, например, кригинг, требуют тщательного моделирования с использованием функций вариограммы или ковариации (см. Функции вариограммы и ковариации), тогда как другие методы, такие как метод обратных взвешенных расстояний, опираются только на предполагаемую степень пространственной структуры, информацию о которой проектировщик должен предоставить на основе предварительных сведений об явлении.
Итоговым компонентом модели является поиск стратегии. Стратегия определяет, как много точек данных будет использоваться для вычисления значения для неопорного местоположения. Также можно задать их пространственную конфигурацию (положение относительно друг друга и неопорного местоположения). Оба фактора влияют на интерполируемое значение и связанную с ним неопределенность. Для многих методов задаётся эллипс поиска наряду с количеством секторов эллипса и количеством точек, взятых из каждого сектора для построения прогноза (см. Окрестности поиска).
После того как модель будет полностью задана, она будет использована вместе с набором данных для создания интерполируемых значений для всех неопорных местоположений, находящихся в области интереса. Итогом обычно является создание карты, показывающей значения моделируемой переменной. Итог выпадающих значений может быть исследован на этой стадии, поскольку эти значения, возможно, изменят значения параметра модели, и таким образом изменится интерполяция карты. В зависимости от метода интерполяции, также можно использовать похожую модель для вычисления мер неопределенности интерполируемых значений. Не все модели имеют эту возможность, поэтому важно вначале задать, необходимы ли измерения неопределенности. Это в свою очередь определит, какая из моделей является подходящей (см. Дерево классификации).
Поскольку используются все типы моделирования, результат моделирования необходимо проверить, то есть убедиться, что интерполируемые значения и связанные с ними меры неопределенности являются значимыми и соответствуют ожиданиям.
После построения соответствующей модели, ее настройки и проверки результата, полученные результаты могут быть использованы в анализе рисков и принятия решений.