空間統計とは、伝統的な (非空間的) 統計手法を、たまたま空間的である (X 座標と Y 座標を持つ) データに適用することではありません。空間統計は、空間と空間リレーションシップを直接、数式に組み込みます (面積、距離、長さなど)。多くの空間統計では、このような空間リレーションシップは空間ウェイト マトリックス ファイルまたはテーブルを介して形式的に指定されます。
空間ウェイト マトリックスは、データの空間構造を表しています。データセットのフィーチャ間に存在する空間リレーションシップを定量化したものです (少なくとも、そのようなリレーションシップを概念化した方法の定量化です)。空間ウェイト マトリックスは、データに構造をもたらすため、フィーチャ相互の実際の関係を最もよく反映したコンセプトを選択する必要があります (もちろん、計測対象も考慮します)。たとえば、森の中において種で増える特定の種類の樹木のクラスタリングを計測する場合は、何らかの形の逆距離がおそらく最適です。しかし、地域の通勤客の地理的分布を評価する場合は、通勤時間または通勤費用を選択するほうが優れています。
物理的にはさまざまな方法で実装されますが、概念的には空間ウェイト マトリックスは NxN のテーブルです (N はデータセットのフィーチャ数)。フィーチャごとに 1 行、フィーチャごとに 1 列が割り当てられます。ある行と列を組み合わせたセルの値は、その行と列のフィーチャの間の空間リレーションシップを定量化したウェイトです。
最も基本的なレベルで、データ フィーチャ間のリレーションシップを定量化するウェイトを作成する方法は、二値加重と可変加重の 2 種類があります。二値加重の場合 (固定距離、K 近傍、ドローネ三角分割、近接性、時空間ウィンドウ)、フィーチャは近傍であるか (1)、近傍でないか (0) のどちらかです。可変加重の場合 (逆距離、無関心領域)、近傍フィーチャは異なる量のインパクト (影響) を与え、ウェイトはその変動を反映するように計算されます。
指定したパラメーターに基づいて、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールは空間ウェイト マトリックス(SWM) ファイルを作成します。そのファイルの空間リレーションシップ値は、使用するディスク容量とメモリ、必要な計算の数を最小限に抑えるために、疎行列の手法によって格納されます。このような関係の値は、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))]、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))]、[クラスター/外れ値分析 (Cluster and Outlier Analysis (Anselin Local Morans I))] など、いくつかの空間統計ツールの数式で活用されます。空間ウェイト マトリックス ファイルは、理論上、N x N の空間リレーションシップを格納できますが、ほとんどの場合、各フィーチャはごく一部のフィーチャとだけ関連しています。疎行列の手法はこの点を利用して、非ゼロのリレーションシップだけを格納します。
参考資料
Getis、Arthur、および Jared Aldstadt「Constructing the Spatial Weights Matrix Using a Local Statistic」Geographical Analysis 36 (2) : 90–104, 2004.
Mitchell, Andy『The ESRI Guide to GIS Analysis,Volume 2』ESRI Press, 2005.