Доступно с лицензией Geostatistical Analyst.
Все модели интерполяции являются методами прогнозирования, основной целью которых является создание поверхности прогнозированных значений между измеренными значениями. Часто бывает также необходимо узнать, насколько прогноз точен и надежен, поэтому Geostatistical Analyst предлагает несколько различных типов выходных поверхностей, которые помогают интерпретировать интерполированную поверхность, имея в виду естественную вариабельность прогнозов. В следующих разделах описываются различные типы выходных поверхностей, а в таблице внизу указано, какие типы доступны для каждого метода интерполяции.
Вы всех выходных картах предполагается, что вы выбрали правильный метод и параметры интерполяции. На практике, если данные не соответствуют требованиям метода интерполяции или использованы неверные параметры, такие поверхности могут неправильно предсказывать истинные значения данных.
Поверхность интерполяции
Все методы интерполяции (кроме индикаторного и вероятностного кригинга) могут создавать поверхности интерполяции, которые по умолчанию являются выходными данными все методов. На поверхности отображаются прогнозируемые значения данных во всех местоположениях между измеренными значениями.
Поверхность стандартной ошибки прогнозирования
Поверхность стандартной ошибки прогнозирования является картой стандартных ошибок интерполированных значений в каждом местоположении. Стандартная ошибка – это стандартное отклонение от вычисленного значения в каждом местоположении, чем больше стандартная ошибка, тем ниже точность прогнозируемого значения. Стандартные ошибки чаще всего используются для создания интервалов, которые вероятнее всего содержат истинные значения в каждом интерполируемом местоположении.
Правило 68-95-99.7
Если данные показывают многомерное нормальное распределение, можно применить простое общее правило для создания доверительных интервалов для истинных значений в каждом проинтерполированном местоположении. Правило означает, что 68 процентов (примерно две трети) истинных значений укладываются в одну стандартную ошибку вычисленного значения, 95 процентов укладываются в две стандартных ошибки, а 99.7 процентов (почти все) – в три стандартных ошибки. Например, если местоположение получает прогнозируемое значение 100 со стандартной ошибкой 5, вы можете быть на 68 процентов уверены, что истинное значение находится в диапазоне от 95 до 105. Так же, вы можете быть на 95 процентов уверены, что истинное значение находится в диапазоне от 90 до 110, и практически точно (99.7 процентов), что оно в диапазоне от 85 до 115. Чтобы создать доверительные интервалы с другими процентными соотношениями, вы можете рассмотреть критические значения в Z-таблицах, которые широко представлены в статистической литературе и в сети Интернет.
Очень трудно проверить, действительно ли данные следуют многомерному нормальному распределению, и на практике обычно проверяется только одномерная нормальность. Изучить одномерная нормальность можно с помощью исследовательских инструментов Нормальный график КК и Гистограмма.
Неравенство Чебышева
Если данные не соответствуют условиям правила 68-95-99.7, или вы не уверены, что они им соответствуют, можно создать более консервативный доверительный интервал, основанный на неравенстве Чебышева. Это неравенство означает, что для любого распределения, имеющего отчетливое среднее и дисперсию, как минимум (1-1/k2)·100 процентов истинных значений будет укладываться в k стандартных ошибок интерполированного значения, где k>1. Зададим k=2, это неравенство означает, что как минимум 75 процентов истинных значений будет укладываться в диапазон двух стандартных ошибок интерполированного значения. Таким же образом, с k=3, это как минимум 88.9 процентов истинных значений будет укладываться в диапазон трех стандартных ошибок интерполированного значения. Другие значения k могут использоваться для создания интервалов с различными процентными значениями.
Как интерпретировать стандартные ошибки
Значения стандартных ошибок должны интерпретироваться с учетом значений и диапазона входных данных. Например, если значения входных данных находятся в диапазоне от 10000 до 12000, значение стандартной ошибки 100 скорее всего будет означать высокую точность интерполяции, поскольку стандартная ошибка много меньше значений и диапазона входных данных. Однако если значения данных находятся в пределах от 50 до 200, та же стандартная ошибка 100 будет означать низкую точность интерполяции, поскольку дисперсия прогнозируемых значений так же велика, как значения и диапазон входных данных.
Поверхность вероятности
Карты вероятности в основном используются при изучении некоего критического значения, например, национального стандарта уровня загрязнения. Критическое значение называется порогом, в выходной карте отображается вероятность превышения или не превышения этого порогового значения. Эти карты удобны для определения областей, где с большей или меньшей вероятностью возможно превышение или отсутствие превышения критического порога.
Поверхность квантиля
Карты квантиля отображают распределение указанного квантиля вероятности в каждом местоположении. Карты квантиля в основном используются для подготовки наихудших или наилучших сценариев. Например, вместо создания карты интерполированных значений, можно создать карту 95-х квантилей интерполированных значений. В этом случае, только 5 процентов истинных значений будут превышать значение поверхности квантиля. Сходным образом, если вы создаете карту 10-го квантиля, только 10 процентов истинных значений будут меньше значений поверхности квантиля.
Стандартные ошибки индикаторной поверхности
Индикаторная переменная – это двоичная переменная, которая принимает значения только 0 и 1. Индикатор, вероятность и дизъюнктивный кригинг вычисляют карты вероятности с помощью переклассификации входных данных на 0 или 1, в зависимости от порогового значения; значения меньше порога классифицируются как 0, значения выше порога – как 1. После интерполяции индикаторной переменной, на карте интерполированных значений вычисляется ожидаемое значение индикаторной переменной, и это ожидаемое значение может быть интерпретировано как вероятность того, что индикаторная переменная равняется единице (другими словами, превышено пороговое значение). Поэтому, стандартные ошибки индикаторной выходной карты являются поверхностью стандартных ошибок ожидаемого значения индикаторной переменной, другими словами, это стандартная ошибка вероятности превышения порогового значения.
Поскольку индикаторные переменные не могут обладать нормальным распределением, правило 68-95-99.7 с индикаторными переменными использовать нельзя. Чтобы создать доверительный интервал для вероятности превышения порогового значения, можно использовать неравенство Чебышева.
Поверхность числа обусловленности
Поверхность числа обусловленности – это дополнительные выходные данные интерполяции по методу локальных полиномов, эта поверхность используется для определения стабильности предполагаемого значения в каждом вычисляемом местоположении. Числа обусловленности трудно интерпретировать буквально, но, чем больше число обусловленности, тем больше нестабильность результатов интерполяции. В этом случае, стабильность означает количество интерполированных значений, которое изменится при минимальном изменении входных данных или параметров интерполяции. Стандартное правило для чисел обусловленности в интерполяции по методу локальных полиномов состоит в том, что для полиномов первого порядка числа обусловленности не должны превышать 10. Для полиномов второго порядка числа обусловленности не должны превышать 100, а для полиномов третьего порядка – 1000. Использовать полиномы выше третьего порядка не рекомендуется.
Какие типы выходных поверхностей доступны для каждого метода интерполяции?
В следующей таблице представлены типы выходных поверхностей, доступные для каждого метода интерполяции.
Метод интерполяции | Проинтерполированные значения | Стандартные ошибки интерполяции | Карты квантилей | Карты вероятности | Стандартные ошибки индикаторов | Номер условия |
---|---|---|---|---|---|---|
Ординарный кригинг |
| 1 | 1 | |||
Универсальный кригинг | 1 | 1 | ||||
Простой кригинг | 1 | 1 | ||||
Индикаторный кригинг | ||||||
Вероятностный кригинг | ||||||
Дизъюнктивный кригинг | 2 | 2 | 2 | 2 | ||
Эмпирический байесовский кригинг | 1 | 1 | ||||
Интерполяция по площади | ||||||
Интерполяция диффузии с барьерами | ||||||
Интерполяция по методу глобального полинома | ||||||
ОВР | ||||||
Интерполяция ядра с барьерами | 3 | |||||
Интерполяция по методу локального полинома | 4 | 4 | ||||
Радиальные базисные функции |
1 Требуется допущение многомерного нормального распределения.
2 Требуется допущение попарного двумерного нормального распределения.
3 Порядок полиномов должен равняться 1.
4 Необходимо использовать порог числа пространственных условий.