Пространственная статистика не подразумевает применение традиционных (непространственных) статистических методов для анализа данных, которые оказались пространственными, т.е. имеют х и у координаты. Пространственная статистика интегрирует пространство и пространственные отношения непосредственно в математическое представление (площадь, расстояние, длина или т.д.). Для многих пространственных статистических показателей, эти пространственные отношения формально задаются через файл матрицы пространственных весов или таблицу.
Матрица пространственных весов – это представление пространственной структуры ваших данных. Это количественное выражение пространственных отношений, которые существуют между объектами в вашем наборе данных (по крайней мере, пути представления этих отношений). Поскольку матрица пространственных весов оказывает влияние на структуру ваших данных, вы должны выбрать концептуализацию, наилучшим образом отражающую, как объекты в действительности взаимодействуют друг с другом (понимая, конечно, что вообще вы собираетесь измерять). Если вы, например, измеряете кластеризацию определённых видов деревьев в лесу, то некоторые формы обратных расстояний подойдут наилучшим образом. Однако, если вы оцениваете географическое распространение жителей пригородов, приезжающих на работу в город, время пути и стоимость пути будут лучше всего описывать пространственные отношения.
В то время как, физически матрица весов может быть представлена множеством способов, на концептуальном уровне она представляет собой таблицу размером N*N (N – количество объектов в наборе данных). Имеется 1 строка и 1 столбец для каждого объекта. Значение ячейки для любой комбинации строка/колонка – это вес, который количественно описывает пространственные отношения между объектами, записи о которых представлены в этих строках и колонках.
На самом базовом уровне, существует 2 стратегии создания весов для количественного описания отношений среди объектов: бинарное или переменное взвешивание. При бинарном взвешивании (фиксированное расстояние, K ближайших соседей, триангуляция Делоне, примыкание или пространственно-временное окно) объект либо является соседом (1) либо нет (0). Для стратегий взвешивания (обратные расстояния или зоны индифферентности), соседние объекты оказывают различное влияние, и веса создаются так, чтобы уловить данные дисперсии.
Основываясь на указанных параметрах, инструмент Построить матрицу пространственных весов создает файл Матрицы пространственных весов (SWM). Значения, описывающие пространственные отношения, сохранены в данном файле с использованием технологии разреженной матрицы для минимизации места на диске, компьютерной памяти и количества требуемых вычислений. Эти значения, описывающие пространственные отношения, используются в математических расчетах нескольких инструментов пространственной статистики, включая Пространственная автокорреляция (Глобальный индекс Морана I), Анализ горячих точек (Getis-Ord Gi*) и Анализ кластеров и выбросов (Anselin Локальный индекс Морана I). В то время как файл Матрицы пространственных весов может хранить пространственные отношения в количестве NxN, в большинстве случаев, каждый объект должен быть связан лишь с небольшим количеством других. Методология разреженной матрицы имеет преимущества в этом, поскольку сохраняет только не нулевые отношения.
Дополнительные ресурсы
Getis, Arthur, and Jared Aldstadt. "Constructing the Spatial Weights Matrix Using a Local Statistic" (Создание матрицы пространственных весов с использованием локальных статистических показателей) Geographical Analysis 36(2): 90–104, 2004.
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.