Доступно с лицензией Geostatistical Analyst.
Введение
В этом упражнении демонстрируется, как использовать площадную интерполяцию для использования данных, собранных в одном наборе полигонов (исходные полигоны) и прогнозирования значений данных для нового набора полигонов (целевые полигоны). Данные в этом упражнении отображают уровни ожирения среди пятиклассников г. Лос-Анджелеса (в целях конфиденциальности исходные данные были изменены). В каждом школьном округе был измерен каждый пятиклассник, после чего было зарегистрировано количество учащихся, страдающих и не страдающих от ожирения (обратите внимание, что данные недоступны для 14 школьных округов). Целью этого упражнения является использование данных о степени ожирения на уровне школьного округа и прогнозирования уровней ожирения для участков переписи в школьных округах. Кроме того, необходимо будет интерполировать степени ожирения в 14 школьных округах, данные по которым отсутствуют.
На приведенном ниже графике показаны школьные округа Лос-Анджелеса, отмеченные по степени ожирения пятиклассников. Округи с низкой степенью ожирения пятиклассников отмечены синим цветом (уровень ниже 22,5 процентов), а округи с высокой степенью ожирения (более 44,7 процентов) – красным; в середине находятся округи, отмеченные зеленым, желтым и оранжевым цветом. Черные полигоны — это зоны с отсутствующими данными. Справа располагаются участки переписи в Лос-Анджелесе, для которых следует прогнозировать степень ожирения пятиклассников.
Площадная интерполяция представляет собой двухэтапный процесс. В первую очередь на основе полигонов-источников создается поверхность интерполяции, затем эта поверхность усредняется в рамках целевых полигонов.
Создание поверхности интерполяции для степеней ожирения
Первым этапом рабочего процесса площадной интерполяции является создание поверхности интерполяции на основе степеней ожирения в школьных округах. Так как для площадной интерполяции необходимо интерактивное использование модели поверхность интерполяции следует создать в мастере операций геостатистики.
Откройте мастер операций геостатистики.
- Запустите ArcMap, включите дополнительный модуль ArcGIS Geostatistical Analyst и добавьте панель инструментов Geostatistical Analyst. Эти действия описаны в начале упражнении для обучения 1.
- Щёлкните стрелку раскрывающегося меню Geostatistical Analyst на панели инструментов Geostatistical Analyst и выберите мастер операций геостатистики.
Появится диалоговое окно мастера Geostatistical Wizard.
Выбор метода и идентификация входных данных
- В разделе Геостатистические методы щелкните Площадная интерполяция.
- Рядом с полем Тип, выберите пункт Скорость, так как нас больше интересует прогнозирование степени ожирения (а не численность населения, к примеру).
- Рядом с пунктом Исходный набор данных выберите child_obesity для определения класса полигональных объектов, содержащих степени ожирения в школьных округах.
- Рядом с полем счета выберите 5th_obese.
Это поле содержит количество пятиклассников, страдающих ожирением.
- Рядом с полем численности выберите 5th_total.
Это поле содержит общее количество пятиклассников, страдающих ожирением.
- Оставьте значение по умолчанию для второго набора данных, так как в этом упражнении не будет использоваться второстепенная переменная.
- Нажмите Далее, чтобы начать создавать модель площадной интерполяции.
Изменение вариографии
Теперь в мастере отображается страница вариографии. Во всем рабочем процессе площадной интерполяции этот этап отнимает больше всего времени и является самым критически важным для получения точной интерполяции. Целью является изменение параметров справа, чтобы самые эмпирические ковариации (синие кресты) не выходили за пределы доверительных интервалов (красные полосы). Если модель указана верно, можно ожидать попадания в доверительные интервалы 90% эмпирических ковариаций.
На приведенном ниже графике видно, что модель по умолчанию не является адекватной: большинство эмпирических ковариаций не попадают в пределы доверительных интервалов. Необходимо внести некоторые изменения, чтобы моделью можно было пользоваться.
- Здесь видно, что эмпирические ковариации становятся отрицательные на расстоянии приблизительно 12 000 метров. Это означает, что следует начать с изменения размера лага, задав для него значение 1000, и сохранив значение Количество лагов равным 12. (Результат этих двух параметров должен приблизительно равняться расстоянию, на котором эмпирические ковариации впервые становятся отрицательными.)
Кривая ковариаций, приведенная ниже, выглядит лучше, если модель можно улучшить. Большая эмпирическая ковариация на оси y является поводом для беспокойства.
- Чтобы улучшить этот результат, в разделе Модель измените ее тип на K-Бесселя.
Похоже, что эта модель очень хорошо подходит для данных; большинство эмпирических ковариаций не выходят за пределы доверительных интервалов, и лишь некоторые располагаются чуть за границами интервалов. Тем не менее, прежде чем считать эту модель надежной, следует выполнить перекрестную проверку.
- Щелкните Далее для просмотра панели Поиск окрестности.
Изменение поиска окрестности
На панели Поиск окрестности отображается предварительный просмотр поверхности для степеней ожирения пятиклассников. Щелкнув точку на поверхности предварительного просмотра можно получить проинтерполированную степень ожирения для этой точки. Например, на приведенном ниже графике отмеченное местоположение имеет прогнозируемое значение 0,333177. Это означает, что в рамках этого моделирования вероятность того, что пятиклассник в этом районе страдает от ожирения, составляет 33%:
- Щелкните Далее для просмотра панели Перекрестная проверка.
Изучение статистических данных перекрестной проверки
- Щелкните вкладку Нормальный график КК.
Можно заметить, что значение Среднеквадратичн. нормированная составляет 1,1475. Это хорошо, т.к. в идеале это значение должно быть близко к 1. Нормальный график КК также должен показывать, что распределение стандартных ошибок близко к нормальному, так как все точки располагаются вблизи линии, проведенной из точки к точке. Это модель, которую вы будете использовать для интерполяции.
- Щелкните Готово, затем OK в диалоговом окне Отчет метода.
Поверхность интерполяции для степеней ожирения отображается на карте. В зависимости от анализа эта поверхность степеней ожирения может являться исчерпывающей. В этом случае рабочий процесс завершается на этом этапе. Однако вам необходимо интерполировать степени ожирения пятиклассников на уровне участков переписи, поэтому следует перейти к второй части рабочего процесса площадной интерполяции.
Интерполяция степеней ожирения по участкам переписи
После создания надлежащей поверхности площадной интерполяции эту поверхность можно использовать для прогнозирования степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе, используя инструмент геообработки Слой площадной интерполяции в полигоны.
- Щелкните правой кнопкой мыши слой 5th grade obesity в таблице содержания ArcMap и выберите Интерполяция в полигоны, чтобы открыть диалоговое окно инструмента Слой площадной интерполяции в полигоны.
- Убедитесь, что для параметра Входной геостатистический слой пространственной интерполяции задано значение 5th grade obesity.
- Щелкните раскрывающийся список Входные полигональные объекты, затем щелкните LA_blocks для определения участков переписи Лос-Анджелеса.
- Щелкните кнопку обзора Выходной класс полигональных объектов, выберите место, в которое следует сохранить выходные данные и введите LA_blocks_obesity в качестве имени выходного класса полигональных объектов.
- Убедитесь, что установлен флажок Присоединить все поля из входных объектов, так как необходимо перенести все поля из класс объектов LA_blocks.
- Щелкните OK, чтобы запустить инструмент.
Класс полигональных объектов, содержащий интерполяции для степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе, добавляется на карту. Поле с интерполированными степенями ожирения помечается как Проинтерполированное. Кроме того, стандартные ошибки интерполяции сохраняются в поле с именем StdError.
- Можно также присвоить символы участкам переписи на основе стандартной ошибки для проинтерполированных степеней ожирения. Стандартные ошибки сохраняются в поле StdError параметра LA_blocks_obesity. Это позволяет создавать допустимые величины ошибки для проинтерполированных степеней ожирения.
Небольшие стандартные ошибки обозначены более светлыми оттенками красного. Как правило, большие участки переписи характеризуются более незначительными стандартными ошибками, так как с крупными районами связано больше информации, поэтому низка степень неопределенности в прогнозах.
Этот этап завершается рабочий процесс интерполяции степеней ожирения пятиклассников на участках переписи в Лос-Анджелесе на основе степеней, полученных после выборки по школьным округам.
Интерполяция степеней ожирения в школьных округах, данные по которым отсутствуют
Чтобы прогнозировать степени ожирения в школьных округах, данные по которым отсутствуют, необходимо снова воспользоваться инструментом геообработки Слой площадной интерполяции в полигоны.
- Щелкните правой кнопкой мыши слой 5th grade obesity в таблице содержания ArcMap и выберите Интерполяция в полигоны, чтобы открыть диалоговое окно инструмента Слой площадной интерполяции в полигоны.
- Убедитесь, что для параметра Входной геостатистический слой пространственной интерполяции задано значение 5th grade obesity.
- Щелкните раскрывающийся список Входные полигональные объекты, затем щелкните Missing_zones для класса полигональных объектов для школьных округов с отсутствующими данными.
- Щелкните кнопку обзора Выходной класс полигональных объектов, выберите место, в котором следует сохранить выходные данные и введите Missing_zones_obesity в качестве имени выходного класса полигональных объектов.
- Убедитесь, что установлен флажок Присоединить все поля из входных объектов, так как необходимо перенести все поля из класс объектов Missing_zones.
- Щелкните OK, чтобы запустить инструмент.
Класс полигональных объектов, содержащий интерполяции для степеней ожирения пятиклассников в школьных округах Лос-Анджелеса с отсутствующими данными, добавляется на карту. Поле с интерполированными степенями ожирения помечается как Проинтерполированное. Кроме того, стандартные ошибки интерполяции сохраняются в поле с именем StdError.
Вы завершили рабочий процесс интерполяции степеней ожирения пятиклассников в школьных округах Лос-Анджелеса, данные по которым отсутствовали.
Вы можете закрыть ArcMap, не сохраняя результаты.
Ссылка на данные
- Розеншейн, Л. (Rosenshein, L.) "The Local Nature of a National Epidemic: Childhood Overweight and the Accessibility of Healthy Food." диссертация магистра наук, университет Джорджа Мейсона, кафедра географии и геоинформационной науки, Фэйрфакс, Вирджиния, США, 2010 г.