Краткая информация
Приведенный набор взвешенных объектов, определяет статистическую значимость "горячих" точек и "холодных" точек на основе статистического показателя Getis-Ord Gi*.
Подробнее, как работает Анализ горячих точек (Getis-Ord Gi*)
Иллюстрация
Использование
Этот инструмент идентифицирует статистически значимые пространственные кластеры высоких значений (горячих точек) и низких значений (холодных точек). Он создает новый Выходной класс объектов с z-оценкой, p-значением и уровнем достоверности (Gi_Bin) для каждого объекта во Входном классе объектов.
Z-оценки и р-значения являются измерениями статистической значимости, которая говорит вам, можно ли отклонить нулевую гипотезу. В действительности, они измеряют, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений. Поля p-значений и z-оценки не отражают коррекцию FDR (False Discovery Rate).
Поле Gi_Bin определяет статистическую значимость "горячих" и "холодных" точек, вне зависимости от применения коррекции FDR. Объекты с +/-3 bins отражают статистическую значимость с уровнем достоверности 99 процентов; объекты с +/-2 bins отражают статистическую значимость с уровнем достоверности 95 процентов; объекты с +/-1 bins отражают статистическую значимость с уровнем достоверности 90 процентов; а кластеризация для объектов в bin 0 не имеет статистической значимости. Без коррекции FDR статистическая значимость основывается на полях p-значения и z-оценки. При включении дополнительного параметра Применить коррекцию FDR, критические p-значения, определяющие уровни достоверности, уменьшаются в соответствии с множественным тестированием и пространственной зависимостью.
Высокая z-оценка и низкое р-значение для объекта свидетельствует о пространственной кластеризации высоких значений. Низкая негативная z-оценка и низкое р-значение для объекта свидетельствуют о пространственной кластеризации низких значений. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка, стремящаяся к нулю, указывает на отсутствие очевидного объединения в кластеры.
-
z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?
Когда Входной класс объектов не имеет проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают очень хорошие оценки истинных геодезических расстояний, по крайней мере, для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипсоиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.
Когда при анализе используются хордовые расстояния, параметр Диапазон расстояний или пороговое расстояние, если он указывается, должен быть выражен в метрах.
В более ранних версиях, чем ArcGIS 10.2.1, вы бы увидели предупреждение о том, что выбранные вами параметры и системные настройки предполагают проведение вычислений на основе географических координат (градусы, минуты, секунды). Увидев это предупреждение, необходимо было произвести проецирование данных в Систему координат проекции для того, чтобы вычисление расстояний было точным. Однако, начиная с версии 10.2.1, этот инструмент рассчитывает хордовые расстояния для всех случаев, когда требуются вычисления в географической системе координат.
-
Для линейных или полигональных объектов, при расчете расстояний используются центроиды. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.
Входное поле должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Если вы хотите использовать данный инструмент для анализа пространственных закономерностей случайных данных, попробуйте агрегировать данные или используйте инструмент Оптимизированный анализ горячих точек.
Инструмент Оптимизированный анализ "горячих точек" обрабатывает данные и автоматически выбирает настройки параметров для оптимизации "горячих точек". Он агрегирует случайные данные, выбирает соответствующий масштаб анализа и настраивает результаты для множественного тестирования и пространственной зависимости. Выбранные опции параметров отображаются в окне Результаты и могут быть полезны для более точной настройки параметров. Инструмент обеспечивает полный контроль и гибкую настройку параметров.
Выбор параметра Определение пространственных взаимоотношений должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Рекомендации см. в разделе Выбор определения пространственных отношений: рекомендации. Ниже приводится несколько дополнительных советов:
- FIXED_DISTANCE_BAND
Значение по умолчанию для параметра Диапазон расстояний или пороговое расстояние гарантирует, что каждый объект имеет, по крайней мере, одного соседа, и это важно. Но часто значение, заданное по умолчанию, не будет наиболее подходящим расстоянием для вашего анализа. В разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.
- INVERSE_DISTANCE или INVERSE_DISTANCE_SQUARED
Когда для параметра Диапазон расстояний или пороговое расстояние указано значение 0, все объекты считаются соседями всех других объектов. Когда этот параметр остается пустым, применяется пороговое значение по умолчанию.
Веса для расстояний менее 1 становятся не стабильны после обращения. Следовательно, при взвешивании для объектов, разделенных менее чем одной единицей расстояния, получают вес 1.
При использовании опции обратного расстояния (INVERSE_DISTANCEINVERSE_DISTANCE_SQUARED или ZONE_OF_INDIFFERENCE) любым двум совпадающим точкам придается значение веса 1 во избежание деления на 0. Это будет гарантировать, что объекты не исключены из анализа.
- FIXED_DISTANCE_BAND
-
Для параметра Определение пространственных взаимоотношений при использовании инструментов Построить матрицу пространственных весов или Построить матрицу пространственных весов для сети доступны дополнительные опции, в том числе пространственно-временные отношения. Чтобы эффективно применять дополнительные опции, с помощью одного из этих инструментов создайте файл матрицы пространственных весов до выполнения анализа, выберите значение GET_SPATIAL_WEIGHTS_FROM_FILE для параметра Определение пространственных взаимоотношений, а для параметра Файл матрицы весов укажите путь к файлу с пространственными весами, который вы создали.
-
Дополнительные сведения о пространственно-временном кластерном анализе см. в документе Пространственно-временной анализ.
-
Слои карты можно использовать для определения Входного класса объектов. Если в слое есть выборка, только выбранные объекты будут включены в анализ.
Если предоставлен Файл матрицы весов с расширением .swm, то этот инструмент ожидает получения файла матрицы весов, который создается с помощью инструментов Построить матрицу пространственных весов или Построить матрицу пространственных весов для сети; в противном случае инструмент ожидает файл матрицы весов в формате ASCII. В некоторых случаях, поведение различно в зависимости от типа использованной матрицы весов:
- ASCII-файлы с матрицей пространственных весов:
- Веса используются без изменений. Отсутствующие отношения объект к объекту рассматриваются как нули.
- Вес по умолчанию для собственного потенциала равен 0, если не указать значение поля Собственный потенциал или точно указать веса собственного потенциала.
- Применяются асимметричные отношения, допуская, что у объекта может быть сосед, у которого соседей нет. Это означает, что соседний объект включается в локальные вычисления среднего значения для исходного объекта, но не включается в вычисления глобального среднего.
- Если веса нормализованы, то вероятнее всего, что результаты будут непригодны для анализа выбранного набора. Если вам нужно выполнить анализ выбранного набора данных, конвертируйте ASCII-файл с матрицей весов в SWM-файл, считав данные ASCII-файла в таблицу, затем используйте опцию CONVERT_TABLE с инструментом Построить матрицу пространственных весов.
- Матрица пространственных весов в формате SWM:
- Если веса уже были нормализованы, то они будут нормализованы вновь для выбранного набора данных. В противном случае они будут использоваться без изменений.
- Вес по умолчанию для Собственного потенциала – 1, если не указать значение поля Собственного потенциала.
- ASCII-файлы с матрицей пространственных весов:
Для выполнения анализа с ASCII-файлом с матрицей пространственных весов требуется большой объем памяти. При анализе более 5000 объектов ASCII-файл с матрицей пространственных весов следует конвертировать в SWM-файл. Сначала вы вставляете ваш ASCII-файл с весами в форматированную таблицу (например, с помощью Excel). Затем запустите инструмент Построить матрицу пространственных весов с CONVERT_TABLE для параметра Определение пространственных взаимоотношений. В результате будет создан SWM-файл с матрицей пространственных весов.
-
При запуске инструмента в ArcMap, Выходной класс объектов автоматически добавляется к таблице содержания с методом отображения по умолчанию, примененным к полю Gi_Bin. Применяемое отображение со шкалой «от горячего к холодному» определяется файлом слоя в <ArcGIS>/Desktop10.x/ArcToolbox/Templates/Layers. Метод отображения по умолчанию, если это необходимо, можно применить заново путем импорта символов слоя шаблона.
-
Выходной класс объектов включает поле SOURCE_ID, которое позволяет Присоединить его к Входному классу объектов, если необходимо.
-
Дополнительную информацию о параметрах инструмента см. в справочной статье Моделирование пространственных отношений.
При использовании этого инструмента в скрипте Python, объект-результат, возвращенный инструментом, содержит следующие выходные данные:
Положение Описание Тип данных 0
Выходной класс объектов
Класс объектов
1
Имя поля результатов (GiZScore)
Поле
2
Имя поля вероятности (GiPValue)
Поле
3
Имя поля ID источника (SOURCE_ID)
Поле
Синтаксис
HotSpots(Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Self_Potential_Field}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction})
Параметр | Объяснение | Тип данных |
Input_Feature_Class | Это класс объектов, по которому будет выполняться анализ горячих точек. | Feature Layer |
Input_Field | Числовое поле (количество жертв, тяжесть преступления и т.д.), которое должно быть оценено. | Field |
Output_Feature_Class | Выходной класс объектов для получения результирующих z-оценки и р-значения. | Feature Class |
Conceptualization_of_Spatial_Relationships | Определяет, как заданы пространственные отношения между объектами.
| String |
Distance_Method | Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.
| String |
Standardization | Стандартизация строк не влияет на этот инструмент. Результаты выполнения инструмента Анализ горячих точек (Getis-Ord Gi*) будут совпадать при запуске со стандартизацией строк и без нее. Этот параметр отключен. Он используется только для обеспечения обратной совместимости инструмента.
| String |
Distance_Band_or_Threshold_Distance (Дополнительный) | Задает пороговое значение расстояния для параметров Обратное расстояние и Фиксированное расстояние. Объекты, расположенные вне указанной области, игнорируются при анализе этого объекта. Однако, для ZONE_OF_INDIFFERENCE влияние объектов, расположенных за пределами данного расстояния, сокращается с расстоянием, в то время как влияние тех объектов, которые располагаются в пределах порогового расстояния, распределяется равномерно. Введенное значение расстояния должно совпадать с расстоянием по выходной системе координат. При использовании обратного расстояния для определения пространственных взаимоотношений значение 0 обозначает, что пороговое расстояние не применялось; когда данный параметр остается пустым, при анализе рассчитывается и применяется пороговое значение по умолчанию. Значение по умолчанию – это Евклидово расстояние, которое гарантирует каждому объекту как минимум 1 соседа. Этот параметр не оказывает никакого влияния, если выбраны смежные полигоны (CONTIGUITY_EDGES_ONLY или CONTIGUITY_EDGES_CORNERS) либо пространственные взаимоотношения – GET_SPATIAL_WEIGHTS_FROM_FILE. | Double |
Self_Potential_Field (Дополнительный) | Поле, представляющее собственный потенциал – это расстояние или вес между одним и тем же объектом. | Field |
Weights_Matrix_File (Дополнительный) | Путь к файлу, который содержит веса, определяющие пространственные и, возможно, временные отношения между объектами. | File |
Apply_False_Discovery_Rate__FDR__Correction (Дополнительный) |
| Boolean |
Производные выходные данные
Имя | Объяснение | Тип данных |
Results_Field | Имя поля результатов (GiZScore). | Поле |
Probability_Field | Имя поля вероятности (GiPValue). | Поле |
Source_ID | Имя поля ID источника (SOURCE_ID). | Поле |
Пример кода
HotSpots, пример 1 (окно Python)
Следующий скрипт окна Python демонстрирует, как использовать инструмент HotSpots.
import arcpy
arcpy.env.workspace = "C:/data"
arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE", "EUCLIDEAN_DISTANCE",
"NONE", "#", "#", "euclidean6Neighs.swm", "NO_FDR")
HotSpots, пример 2 (автономный скрипт)
Следующий автономный Python скрипт демонстрирует, как использовать инструмент HotSpots.
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Hot-Spot Analysis Tool (Local Gi*)
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = "C:/Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Hot Spot Analysis of 911 Calls
# Process: Hot Spot Analysis (Getis-Ord Gi*)
hs = arcpy.HotSpots_stats("911Count.shp", "ICOUNT", "911HotSpots.shp",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "#", "euclidean6Neighs.swm","NO_FDR")
except:
# If an error occurred when running the tool, print out the error message.
print(arcpy.GetMessages())
Параметры среды
Информация о лицензиях
- Basic: Да
- Standard: Да
- Advanced: Да
Связанные разделы
- Моделирование пространственных отношений
- Что такое z-оценка? Что такое p-значение?
- Пространственные веса
- Обзор группы инструментов Картографирование кластеров
- Пространственная автокорреляция (Глобальный индекс Морана I)
- Анализ кластеров и выбросов (Anselin Локальный индекс Морана I)
- Как работает инструмент Анализ горячих точек
- Пошаговая пространственная автокорреляция
- Оптимизированный анализ горячих точек
- Оптимизированный анализ выбросов