При большом объеме анализируемых пространственных данных очень важен масштаб анализа. По умолчанию Определение пространственных взаимоотношений для, например, инструмента Анализ горячих точек, это FIXED_DISTANCE_BAND, при этом требуется указать значение расстояния. Многие инструменты обработки плотностей требуют значения радиуса. Выбранное расстояние должно быть связано с масштабом вопроса, на который вы пытаетесь ответить, или масштабом устранения последствий. Предположим, что вы хотите проанализировать степень ожирения среди детей. Каков масштаб вашего анализа? Это отдельные семьи или целые районы? В этом случае расстояние, используемое для определения масштаба анализа, будет небольшим, чтобы охватить дома в одном или двух кварталах друг от друга. Или же, каким будет масштаб устранения последствий? Возможно, рассматриваемый вопрос учитывает наличие фитнес-программ после школы для сокращения ожирения детей. В этом случае расстояние должно отражать школьные зоны. Иногда определить нужный масштаб довольно легко. Если вы изучаете закономерности ежедневных поездок в город из пригородов и знаете, что среднее расстояние поездки составляет 15 км, вы можете использовать для анализа фиксированное расстояние в 15 км. В других ситуациях обосновать расстояние анализа сложнее. В этом случае инструмент Пошаговая пространственная автокорреляция очень полезен.
Когда вы видите пространственную кластеризацию в ландшафте, вы видите доказательства работы внутренних пространственных процессов. Знание о пространственном масштабе, в котором будут работать базовые процессы, может помочь вам выбрать необходимое расстояние анализа. Инструмент Пошаговая пространственная автокорреляция запускает инструмент Пространственная автокорреляция (Глобальный индекс Морана I) с последовательностью увеличивающимися расстояниями для измерения интенсивности пространственной кластеризации для каждого расстояния. Интенсивность кластеризации определяется z-оценкой. Обычно при увеличении расстояния растет и z-оценка, что указывает на повышенную интенсивность кластеризации. Однако на определенном расстоянии возникает пик z-оценки. Иногда пиков несколько.
Пиковые z-оценки соответствует расстояниям, при которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Цвет каждой точки на графике соответствует статистической значимости значений z-оценок.
Одна из стратегий для определения необходимого масштаба анализа – выбор расстояния, связанного со статистически значимым пиком, которое лучше всего отражает масштаб анализа. Зачастую это первый статистически значимый пик.
Как выбрать начальное расстояние и приращение расстояния?
Все измерения расстояния основываются на центроидах объектов, а значение параметра Начальное расстояние по умолчанию является наименьшим расстоянием, которое гарантирует, что у каждого объекта есть хотя бы один соседний объект. Обычно это хороший вариант, если набор данных не содержит выбросы по местоположению. Определите, есть ли у вас выбросы по местоположению, а затем выберите все объекты, кроме объектов с выбросами, и запустите инструмент Пошаговая пространственная автокорреляция. Если вы нашли пиковое расстояние для выбранного набора объектов, используйте это расстояние для создания файла матрицы пространственных весов на основе всех ваших объектов (даже выбросов). При запуске инструмента Построить матрицу пространственных весов для создания файла матрицы пространственных весов установите для параметра Количество соседей определенное значение, чтобы у всех объектов было такое число соседних объектов.
Значение параметра Приращение расстояния – это среднее расстояние от каждого объекта до ближайшего к нему соседнего объекта. Если вы определили нужное начальное расстояние, используя стратегии, описанные выше, но не нашли пиковое расстояние, можно поэкспериментировать с меньшими или большими приращениями расстояния.
Что если на графике совсем нет пиков?
В некоторых случаях вы используете инструмент Пошаговая пространственная автокорреляция и получаете график с z-оценкой, которая постоянно растет при увеличении расстояний; пикового значения нет. Это чаще всего происходит, когда данные были объединены, а масштаб процессов, влияющих на переменную Входное поле, меньше схемы агрегации. Вы можете попробовать уменьшить приращение расстояние и посмотреть, появятся ли более выраженные пики. Иногда пики не возникают из-за наличия в области изучения нескольких пространственных процессов, каждый из которых работает на разном расстоянии. Это часто происходит при работе с большими точечными наборами данных с множеством помех (без четкого пространственного шаблона для анализируемых данных). В этом случае нужно обосновать масштаб анализа с помощью других критериев.
Интерпретация результатов
При запуске инструмента Пошаговая пространственная автокорреляция на переднем плане результаты z-оценки для каждого расстояния записываются в окно Ход процесса. Результаты работы инструмента также отображаются в окне Результаты. Если щелкнуть правой кнопкой мыши запись Сообщения в окне Результаты и выбрать Вид, результаты можно будет просмотреть в диалоговом окне сообщений. Если вы указываете путь для дополнительного параметра Выходная таблица, создается таблица с полями Distance, Morans I, Expected I, variance, z_score и p_value.
Изучив значения z-оценок в окне Ход процесса, в диалоговом окне сообщения или в Выходной таблице, можно определить наличие пиковых расстояний.Однако чаще пиковые расстояния определяются по графику в дополнительном файле Выходного отчета. Этот отчет состоит из трех страниц. Пример первой страницы отчета приведен ниже. Учтите, что на этом графике три пиковые z-оценки, связанные с расстояниями 5000, 9000 и 13000 футов. Гало отображается для выделения первого пикового расстояния и максимального пикового расстояния, но все пики представляют расстояния, где процессы, обеспечивающие пространственную кластеризацию, наиболее очевидны. Можно выбрать пик, который лучше всего отражает масштаб анализа. В некоторых случаях показывается только одно гало, так как первый и максимальный пики находятся на одном расстоянии. Если ни один из пиков z-оценок не является статистически значимым, то ни для одного из них не будет отображаться светло-синее гало. Учтите, что цвет нарисованной z-оценки соответствует критическим значениям статистической значимости.
На второй странице отчета расстояния и z-оценки представлены в формате таблицы. На последней странице отчета показаны все настройки параметров, использованные при запуске инструмента. Чтобы получить файл отчета, укажите путь в параметре Выходной отчет (Output Report).
Дополнительные ресурсы
- Видео с рекомендациями по анализу горячих точек:
- Учебное руководство Анализ пространственных структурных закономерностей описан рабочий процесс анализа данных по лихорадке денге с использованием инструмента Пошаговая пространственная.
- См. Выбор фиксированного диапазона расстояний в Моделировании пространственных взаимоотношений.
- В статье Как работает инструмент Анализ горячих точек описывается выбор соответствующего масштаба для анализа.
- Актуальный список всех доступных ресурсов по пространственной статистике см. на странице http://esriurl.com/spatialstats