Доступно с лицензией Geostatistical Analyst.
Введение
В этом упражнении демонстрируется, как использовать площадную интерполяцию для использования данных, собранных в одном наборе полигонов (исходные полигоны) и прогнозирования значений данных для нового набора полигонов (целевые полигоны). Данные в этом упражнении отображают уровни ожирения среди пятиклассников г. Лос-Анджелеса (в целях конфиденциальности исходные данные были изменены). В каждом школьном округе был измерен каждый пятиклассник, после чего было зарегистрировано количество учащихся, страдающих и не страдающих от ожирения (обратите внимание, что данные недоступны для 14 школьных округов). Целью этого упражнения является использование данных о степени ожирения на уровне школьного округа и прогнозирования уровней ожирения для участков переписи в школьных округах. Кроме того, необходимо будет интерполировать степени ожирения в 14 школьных округах, данные по которым отсутствуют.
На приведенном ниже графике показаны школьные округа Лос-Анджелеса, отмеченные по степени ожирения пятиклассников. Округи с низкой степенью ожирения пятиклассников отмечены синим цветом (уровень ниже 22,5%), а округи с высокой степенью ожирения (более 44,7%) — красным; в середине находятся округи, отмеченные зеленым, желтым и оранжевым цветом. Черные полигоны — это зоны с отсутствующими данными. Справа располагаются участки переписи в Лос-Анджелесе, для которых следует прогнозировать степень ожирения пятиклассников.
Площадная интерполяция представляет собой двухэтапный процесс. В первую очередь на основе полигонов-источников создается поверхность интерполяции, затем эта поверхность усредняется в рамках целевых полигонов.
Создание поверхности интерполяции для степеней ожирения
Первым этапом рабочего процесса площадной интерполяции является создание поверхности интерполяции на основе степеней ожирения в школьных округах. Так как для площадной интерполяции необходимо интерактивное использование модели поверхность интерполяции следует создать в мастере операций геостатистики.
Откройте мастер операций геостатистики.
- Запустите ArcMap, включите ArcGIS Geostatistical Analyst extension, затем добавьте панель инструментов Geostatistical Analyst. Эти действия описаны в начале упражнении для обучения 1.
- Щёлкните стрелку раскрывающегося меню Geostatistical Analyst на панели инструментов Geostatistical Analyst и выберите мастер операций геостатистики.
Появится диалоговое окно мастера Geostatistical Wizard.
Выбор метода и идентификация входных данных
- В разделе Геостатистические методы щелкните Площадная интерполяция.
- Рядом с полем Тип (Type), выберите пункт Скорость (биноминальная) (Rate (binomial)), так как нас больше интересует прогнозирование степени ожирения (а не численность населения, к примеру).
- Рядом с пунктом Исходный набор данных (Source Dataset) выберите child_obesity для определения класса полигональных объектов, содержащих степени ожирения в школьных округах.
- Рядом с полем счета (Count Field) выберите 5th_obese.
Это поле содержит количество пятиклассников, страдающих ожирением.
- Рядом с полем численности (Population Field) выберите 5th_total.
Это поле содержит общее количество пятиклассников, страдающих ожирением.
- Оставьте значение по умолчанию для параметра Набор данных 2 (Dataset 2), так как в этом упражнении не будет использоваться второстепенная переменная.
- Нажмите Далее (Next), чтобы начать создавать модель площадной интерполяции.
Изменение вариографии
Теперь в мастере отображается панель вариографии. Во всем рабочем процессе площадной интерполяции этот этап отнимает больше всего времени и является самым критически важным для получения точной интерполяции. Целью является изменение параметров справа, чтобы самые эмпирические ковариации (синие кресты) не выходили за пределы доверительных интервалов (красные полосы). Если модель указана верно, можно ожидать попадания в доверительные интервалы 90% эмпирических ковариаций.
На приведенном ниже графике видно, что модель по умолчанию не является адекватной: большинство эмпирических ковариаций не попадают в пределы доверительных интервалов. Необходимо внести некоторые изменения, чтобы моделью можно было пользоваться.
- Здесь видно, что эмпирические ковариации становятся отрицательные на расстоянии приблизительно 12 000 метров. Это означает, что следует начать с изменения размера лага (Lag Size), задав для него значение 1000, и сохранив значение Количество лагов (Number of Lags) равным 12. (Результат этих двух параметров должен приблизительно равняться расстоянию, на котором эмпирические ковариации впервые становятся отрицательными.)
Кривая ковариаций, приведенная ниже, выглядит лучше, если модель можно улучшить. Большая эмпирическая ковариация на оси y является поводом для беспокойства.
- Чтобы улучшить этот результат, в области Модель (Model) измените тип (Type) на K-Бесселя (K-Bessel).
Похоже, что эта модель очень хорошо подходит для данных; большинство эмпирических ковариаций не выходят за пределы доверительных интервалов, и лишь некоторые располагаются чуть за границами интервалов. Тем не менее, прежде чем считать эту модель надежной, следует выполнить перекрестную проверку.
- Щелкните Далее (Next) для просмотра панели Поиск окрестности (Searching Neighborhood).
Изменение поиска окрестности
Панель Поиск окрестности (Searching Neighborhood) отображает предварительный просмотр поверхности для степеней ожирения пятиклассников. Щелкнув точку на поверхности предварительного просмотра можно получить проинтерполированную степень ожирения для этой точки. Например, на приведенном ниже графике точка (1974946, 540966,7) имеет проинтерполированное значение 0,3331771. Это означает, что в рамках этого моделирования вероятность того, что пятиклассник в этом районе страдает от ожирения, составляет 33%:
- Щёлкните нДалее (Next) для просмотра панели перекрестной проверки.
Просмотр перекрестной проверки
- Перейдите на вкладку Нормальный график КК (Normal QQPlot) под графиком на правой панели мастера.
Можно заметить, что значение Среднеквадратичн. нормированная (Root-Mean-Square Standardized) составляет 1,147508. Это хорошо, так как в идеале это число должно быть близким к 1. Нормальный график КК также должен показывать, что распределение стандартных ошибок близко к нормальному, так как все точки располагаются вблизи линии, проведенной из точки к точке. Это модель, которую вы будете использовать для интерполяции.
- Нажмите Готово (Finish), затем OK в диалоговом окне Отчет метода (Method Report).
Поверхность интерполяции для степеней ожирения отображается в ArcMap. В зависимости от анализа эта поверхность степеней ожирения может являться исчерпывающей. В этом случае рабочий процесс завершается на этом этапе. Однако вам необходимо интерполировать степени ожирения пятиклассников на уровне участков переписи, поэтому следует перейти к второй части рабочего процесса площадной интерполяции.
Интерполяция степеней ожирения по участкам переписи
После создания надлежащей поверхности площадной интерполяции эту поверхность можно использовать для прогнозирования степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе, используя Слой площадной интерполяции в полигоны (Areal Interpolation Layer To Polygons).
- Щелкните правой кнопкой мыши слой 5th grade obesity в таблице содержания ArcMap, затем щелкните Интерполяция в полигоны для открытия диалогового окна инструмента Слой площадной интерполяции в полигоны.
- Убедитесь, что для параметра Входной геостатистический слой пространственной интерполяции (Input areal interpolation geostatistical layer) задано значение 5th grade obesity.
- Щелкните раскрывающийся список Входные полигональные объекты (Input polygon features), затем щелкните LA_blocks для определения участков переписи Лос-Анджелеса.
- Нажмите кнопку обзора Выходной класс полигональных объектов (Output polygon feature class), перейдите в место, где следует сохранять выходные данные, затем введите LA_blocks_obesity в качестве имени выходного класса полигональных объектов.
- Убедитесь, что установлен флажок Присоединить все поля из входных объектов (Append all fields from input features), так как необходимо перенести все поля из класс объектов LA_blocks.
- Щелкните OK, чтобы запустить инструмент.
Класс полигональных объектов, содержащий интерполяции для степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе, добавляется в ArcMap. Поле с интерполированными степенями ожирения помечается как Проинтерполированное (Predicted). Кроме того, стандартные ошибки интерполяции сохраняются в поле с именем StdError.
- Можно также присвоить символы участкам переписи на основе стандартной ошибки для проинтерполированных степеней ожирения. Стандартные ошибки сохраняются в поле StdError параметра LA_blocks_obesity. Это позволяет создавать допустимые величины ошибки для проинтерполированных степеней ожирения.
Небольшие стандартные ошибки обозначены более светлыми оттенками красного. Как правило, большие участки переписи характеризуются более незначительными стандартными ошибками, так как с крупными районами связано больше информации, поэтому низка степень неопределенности в прогнозах.
Этот этап завершается рабочий процесс интерполяции степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе на основе степеней, полученных после выборки по школьным округам.
Интерполяция степеней ожирения в школьных округах, данные по которым отсутствуют
Чтобы прогнозировать степени ожирения в школьных округах, данные по которым отсутствуют, необходимо снова воспользоваться инструментом Слой площадной интерполяции в полигоны (Areal Interpolation Layer To Polygons).
- Щелкните правой кнопкой мыши слой поверхности степеней в таблице содержания ArcMap, затем щелкните Интерполяция в полигоны для открытия диалогового окна инструмента Слой площадной интерполяции в полигоны.
- Убедитесь, что для параметра Входной геостатистический слой пространственной интерполяции (Input areal interpolation geostatistical layer) задано значение 5th grade obesity.
- Щелкните раскрывающийся список Входные полигональные объекты (Input polygon features), затем щелкните Missing_zones для класса полигональных объектов для школьных округов с отсутствующими данными.
- Нажмите кнопку обзора Выходной класс полигональных объектов (Output polygon feature class), перейдите в место, где следует сохранять выходные данные, затем введите Missing_zones_obesity в качестве имени выходного класса полигональных объектов.
- Убедитесь, что установлен флажок Присоединить все поля из входных объектов (Append all fields from input features), так как необходимо перенести все поля из класс объектов Missing_zones.
- Щелкните OK, чтобы запустить инструмент.
Класс полигональных объектов, содержащий интерполяции для степеней ожирения пятиклассников в школьных округах Лос-Анджелеса с отсутствующими данными, добавляется в ArcMap. Поле с интерполированными степенями ожирения помечается как Проинтерполированное (Predicted). Кроме того, стандартные ошибки интерполяции сохраняются в поле с именем StdError.
Вы завершили рабочий процесс интерполяции степеней ожирения пятиклассников в школьных округах Лос-Анджелеса, данные по которым отсутствовали.
Вы можете закрыть ArcMap, не сохраняя результаты.
Ссылка на данные
- Розеншейн, Л. (Rosenshein, L.) "The Local Nature of a National Epidemic: Childhood Overweight and the Accessibility of Healthy Food." диссертация магистра наук, университет Джорджа Мейсона, кафедра географии и геоинформационной науки, Фэйрфакс, Вирджиния, США, 2010 г.