Анализ локальных выбросов—Справка

Краткая информация
Иллюстрация
Использование
Синтаксис
Пример кода
Параметры среды
Информация о лицензиях

Краткая информация

Идентифицирует статистически значимые кластеры и выбросы в контексте пространства и времени. Инструмент является пространственно-временным исполнением статистики Локальный индекс I Морана.

Подробнее о том, как работает инструмент Анализ возникновения горячих точек

Иллюстрация

Использование

Для этого инструмента необходим файл netCDF, созданный инструментом Создать куб Пространство-Время по агрегации точек.
Каждый бин в кубе Пространство-Время содержит значение LOCATION_ID, time_step_ID, COUNT и любое из Полей суммирования, агрегированных при создании куба. Набор бинов, связанный с одним и тем же местоположением, имеет одинаковый идентификатор местоположения и представляет собой временной ряд. Набор бинов, связанный с одним и тем же временным интервалом, имеет одинаковый идентификатор шага времени и представляет собой временной срез. Значение количество в каждом бине представляет число точек, которые присутствуют в определенном местоположении и определенном временном интервале.
Данный инструмент анализирует вариабельность во Входном кубе пространства-времени netCDF, используя пространственно-временную интерпретацию статистики Anselin Локальный индекс Морана I.
Выходные объекты добавляются к Таблице содержания и представляют обобщенный результат анализа пространства-времени для всех проанализированных местоположений. Если вы укажете Полигональную маску анализа, будут проанализированы только те местоположения, которые попадают в пределы маски анализа; в ином случае будут проанализированы местоположения, которые имеют как минимум одну точку в как минимум одном временном интервале.
Кроме создания класса Выходных объектов, сводные результаты анализа записываются в окно Результаты . Если щелкнуть правой кнопкой мыши запись Сообщения в окне Результаты и выбрать Вид, отчет анализа можно будет просмотреть в диалоговом окне Сообщение. Сводные результаты анализа также будут показаны в диалоговом окне работы инструмента.
Инструмент Анализ локальных выбросов идентифицирует статистически значимые кластеры и выбросы в контексте пространства и времени. См. раздел Более подробно о работе инструмента Анализ локальных выбросов, чтобы получить дополнительные сведения об определениях выходных категорий по умолчанию и об алгоритмах, использующихся в этом инструменте анализа.
Для идентификации кластеров и выбросов в кубе пространства-времени, инструмент использует пространственно-временную интерпретацию статистики Anselin Локальный индекс Морана I, при этом значение каждого бина сопоставляется со значениями в соседних бинах. Бин считается соседним, если его центроид попадает в указанные вами пределы Расстояния окрестности, а его временной интервал попадает в пределы Временного шага окрестности. Если вы не указываете Расстояние окрестности, оно будет рассчитано по умолчанию на основании пространственного распределения ваших данных. Если вы не указываете Интервал временного шага, то инструмент будет использовать значение по умолчанию, которое составляет 1 интервал временного шага.
Чтобы идентифицировать бины, которые будут включены в каждую окрестность анализа, инструмент сначала выявляет бины, которые попадают в заданное Расстояние окрестности. Затем для каждого бина определяются бины, расположенные в том же местоположении, но в пределах N предшествующих временных шагов, где N – Временной шаг окрестности, указанный во входных параметрах.
Значение Временного шага окрестности – это количество интервалов временных шагов, включенных в окрестность анализа. Если интервал временного шага в вашем кубе составляет 3 месяца, и вы указали значение 2 для параметра Временной шаг окрестности – все бины, расположенные в пределах Расстояния окрестности и все связанные с ними бины в двух предшествующих интервалах временных шагов (в совокупности 9 месяцев) буду включены в окрестность анализа.
Перестановки используются для определения вероятности нахождения актуального пространственного распределения анализируемых значений. Для каждой перестановки, значения, окружающие каждый бин, перераспределяются в случайном порядке, затем вычисляется значение локального индекса Морана I. Результат референсного распределения значений затем сравнивается с наблюдаемым индексом Морана I для определения вероятного нахождения наблюдаемого значения в случайном распределении. По умолчанию используется 499 перестановок; однако распределение случайной выборки улучшается при увеличении числа перестановок, что повышает точность псевдо p-значений.
Если параметр Число перестановок имеет значение 0, в результате получается обычное p-значение, вместо псевдо p-значения.
Перестановки, используемые этим инструментом, пользуются преимуществом увеличения производительности, доступным в системе, использующей несколько CPU (или многоядерные CPU). По умолчанию инструмент будет использовать половину от максимального количества доступных CPU. Увеличение скорости обработки особенно заметно в больших кубах пространство-время или при запуске инструмента с большим количеством перестановок. Количество используемых CPU можно изменить при помощи параметра среды Коэффициент параллельной обработки.
Слой Полигональной маски анализа может содержать один или несколько полигонов, определяющих область анализа. Эти полигоны определяют область, в которой могут встретиться анализируемые точки, и исключают области, в которых точки для анализа не встречаются. Например, если вы анализируете ограбления в жилых кварталах, вы можете использовать Полигональную маску анализа чтобы исключить крупные водоемы, парки и другие области, где нет жилых домов.
Полигон маски для анализа пересекается с экстентом Входного куба Пространство-Время, но не выходит за пределы куба.
Если Полигональная маска анализа, которую вы используете для задания области изучения, покрывает область, выходящую за границы экстента входных объектов, которые были использованы для первоначального создания куба, может потребоваться заново создать куб, используя эту Полигональную маску анализа как параметр среды Выходной экстент. Это позволит гарантировать, что вся область, покрываемая Полигональной маской анализа, будет включена в инструмент Анализ локальных выбросов. Используя Полигональную маску анализа как параметр среды Выходной экстент во время создания куба, можно гарантировать, что куб будет соответствовать экстенту Полигональной маски анализа.
Этот инструмент создает новый выходной класс объектов со следующими атрибутами для каждого местоположения в кубе пространства-времени. Эти поля могут использоваться для пользовательской визуализации выходных данных. Подробные сведения о дополнительных результатах анализа см. в разделе Более подробно о работе инструмента Анализ локальных выбросов.
- Число выбросов
- Процент выбросов
- Число кластеров с низкими значениями
- Процент кластеров с низкими значениями
- Число низких выбросов
- Процент низких выбросов
- Число кластеров с высокими значениями
- Процент кластеров с высокими значениями
- Число высоких выбросов
- Процент высоких выбросов
- местоположения со значением Нет пространственных соседей
- местоположения со значением Выброс в самом последнем временном шаге
- Тип кластерных выбросов
- и дополнительная суммарная статистика
Тип кластерных выбросов будет всегда обозначать статистически значимые кластеры и выбросы для 95-процентного доверительного интервала, а значения в этом поле будут приведены только для статистически значимых бинов. Эта значимость отражает Коррекцию FDR.
По умолчанию метод отображения Выходного класса пространственных объектов основывается на значениях в поле CO_TYPE и показывает статистически значимые местоположения. Он будет отображать местоположения, которые являются частью значимых кластеров HH, HL, выбросов HL и LH, или классифицированных во времени как Несколько типов.
Чтобы обеспечить наличие по крайней мере 1 временного соседства для каждого местоположения, Локальный индекс Морана не вычисляется для первого временного среза. Значения бинов в первом временном срезе, тем не менее, включаются в вычисление глобального среднего.

Запуск инструмента Анализ локальных выбросов позволяет добавить результаты обратно в файл netCDF, представляющий Входной куб Пространство-Время. Каждый бин анализируется совместно с бинами в ближайшей окрестности для измерения кластеризации как высокого, так и низкого значений, и для определения пространственных и временных выбросов в этих кластерах. В результате этого анализа получается локальный индекс Морана I, псевдо p-значение (или p-значение, если не используются перестановки), и кластер или тип выброса (CO_TYPE) для каждого бина в кубе Пространство-Время.

Сводные расчеты по переменным, которые добавляются ко Входному кубу Пространство-Время , перечислены ниже:


Имя переменной	Описание	Измерение
OUTLIER_{ANALYSIS_VARIABLE}_INDEX	Вычисленный локальный индекс I Морана.	Три измерения: одно значение локального индекса I Морана для каждого бина в кубе пространство-время.
OUTLIER_{ANALYSIS_VARIABLE}_PVALUE	Статистика Anselin Локальный индекс I Морана псевдо p-значение или p-значение, измеряющее статистическую значимость значения локального индекса Морана I.	Три измерения: одно p-значение или псевдо p-значение для каждого бина в кубе пространство-время.
OUTLIER_{ANALYSIS_VARIABLE}_TYPE	Полученный тип категории, позволяющий различить статистически значимый кластер высоких значений (HH), кластер низких значений (LL), выброс, в котором высокое значение окружено в основном низкими значениями (HL) и выброс, в котором низкое значение окружено в основном высокими значениями (LH).	Три измерения: один кластер или тип выброса для каждого бина в кубе пространство-время. Бины классифицируются с применением коррекции FDR.
OUTLIER_{ANALYSIS_VARIABLE} _HAS_SPATIAL_NEIGHBORS	Обозначает местоположения, не имеющие пространственных соседей, а также те, которые основываются только на временных соседях.	Два измерения: одна классификация для каждого местоположения. Анализ местоположений, не имеющих пространственных соседей, проводит к вычислениям, основанных только на временных соседях.

Синтаксис

LocalOutlierAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, neighborhood_time_step, {number_of_permutations}, {polygon_mask})

Параметр	Объяснение	Тип данных
in_cube	Куб netCDF для анализа. Файл должен иметь расширение (.nc) и должен быть создан с помощью инструмента Создать куб Пространство-Время по агрегации точек.	File
analysis_variable	Имя числовой переменной в файле netCDF, которую вы хотите проанализировать.	String
output_features	Выходной класс объектов, содержащий местоположения, которые рассматриваются как статистически значимые кластеры или выбросы.	Feature Class
neighborhood_distance (Дополнительный)	Пространственный экстент окрестности анализа. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.	Linear Unit
neighborhood_time_step	Количество интервалов временных шагов для включения в окрестность анализа. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальное группирование в модели пространство-время.	Long
number_of_permutations (Дополнительный)	Число случайных перестановок для вычисления псевдо p-значений. По умолчанию число перестановок равно 499. Если выбрано 0 перестановок, будет вычислено стандартное p-значение. 0 —Перестановки не используются, вычисляется стандартное p-значение. 99 —С 99 перестановками, минимально возможное псевдо p-значение равно 0.01, а все остальные псевдо p-значения будут четным произведением этого значения. 199 —С 199 перестановками, минимально возможное псевдо p-значение равно 0.005, а все остальные псевдо p-значения будут четным произведением этого значения. 499 —С 499 перестановками, минимально возможное псевдо p-значение равно 0.002, а все остальные псевдо p-значения будут четным произведением этого значения. 999 —С 999 перестановками, минимально возможное псевдо p-значение равно 0.001, а все остальные псевдо p-значения будут четным произведением этого значения. 9999 —С 9999 перестановками, минимально возможное псевдо p-значение равно 0.0001, а все остальные псевдо p-значения будут четным произведением этого значения.	Long
polygon_mask (Дополнительный)	Полигональный класс объектов с одним или несколькими полигонами, определяющими область анализа. Вы можете использовать полигональную маску анализа, например, для того, чтобы исключить из анализа большое озеро. Все бины во Входном кубе Пространство-Время, находящиеся вне пределов маски, не будут участвовать в анализе.	Feature Layer

Пример кода

LocalOutlierAnalysis, пример 1 (окно Python)

Пример окна Python, демонстрирующий использование инструмента LocalOutlierAnalysis.

# LocalOutlierAnalysis of homicides in a metropolitan area
arcpy.env.workspace = r"C:\STPM"
arcpy.LocalOutlierAnalysis_stpm("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles", 2, 499, "#")

LocalOutlierAnalysis, пример 2 (автономный скрипт Python)

В следующем автономном скрипте Python показано, как используется инструмент LocalOutlierAnalysis.

# Create Space Time Cube by aggregating homicide incidents in a metropolitan area
# Import system modules
import arcpy
# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\STPM"
try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace
    # Create Space Time Cube by aggregating homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube By Aggregating Points
    cube = arcpy.CreateSpaceTimeCube_stpm("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS", "HEXAGON_GRID")
    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.MinimumBoundingGeometry_management("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")
    # Local Outlier Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step with 499 permutations to detect outliers
    # Process: Local Outlier Analysis
    loa = arcpy.LocalOutlierAnalysis_stpm("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles",
                                          2, 499, "bounding.shp")
except:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())

Параметры среды

Текущая рабочая область
Временная рабочая область
Выходная система координат
Географические преобразования
Генератор случайных чисел
Примечание:
В этом инструменте поддерживается только один тип генератора случайных чисел – Mersenne Twister.

Информация о лицензиях

Basic: Да
Standard: Да
Advanced: Да

ArcMap

Анализ локальных выбросов