Ripley の K 関数法 (Multi-Distance Spatial Cluster Analysis (Ripleys K-function)) ツールの詳細—ヘルプ

演算
重み付けされていない K 関数の結果の解釈
重み付けされている K 関数の結果の解釈
参考資料

Ripley の K 関数を基盤とする [Ripley の K 関数法 (Multi-Distance Spatial Cluster Analysis (Ripleys K-function))] ツールは、インシデントポイントデータの空間パターンを分析するためのもう 1 つの方法です。このツールセットの他のツール ([空間的自己相関分析 (Spatial Autocorrelation (Morans I))] および [ホットスポット分析 (Hot Spot Analysis (Getis-Ord Gi*))]) と異なる点は、このツールは一定範囲の距離にわたる空間依存 (フィーチャのクラスタリングまたはフィーチャの分散) を集計することです。多くのフィーチャパターン分析において、分析に適切な尺度を選択する必要があります。たとえば、分析において [距離バンドまたは距離の閾値] の指定が必要とされることがよくあります。複数の距離および空間尺度で空間パターンを調べているとき、パターンは変化し、多くの場合、特定のアクティブな空間プロセスの優勢状態を反映します。Ripley の K 関数は、フィーチャの重心の空間クラスタリングまたは分散が、近傍のサイズが変化するとどのように変化するかを示します。

このツールを使用するとき、評価する距離の数を指定し、必要に応じて開始距離または距離増分を指定します。このツールは、この情報を使用して、各フィーチャに関連付けられている隣接フィーチャ (評価対象の距離よりも近いフィーチャ) の平均数を計算します。一般的に、評価距離が長くなると、各フィーチャの隣接フィーチャは増えます。特定の評価距離の隣接フィーチャの平均数がスタディエリア全体のフィーチャの平均濃度よりも高い場合、その距離での分布はクラスタリングと見なされます。

このツールは、フィーチャのクラスタリングまたは分散が異なる距離では (異なる分析尺度では) どのように変化するかを調べるときに使用します。

演算

Ripley の元の K 関数から数多くのバリエーションが派生しています。次に、一般的に「L(d)」と呼ばれる K 関数の最もよく使用されるバリエーションの実装を示します。

[開始距離] と [距離の増分] のデフォルト値は、以下のようにして計算されます。

[距離バンド数] の値は、必ずわかっています (デフォルト値は 10)。[距離の増分] が指定されていない場合、この反復回数を使用してデフォルト値が計算されます。
最初に、入力フィーチャを囲む最小外接矩形の最大範囲の長さの 25% として、最大距離の値が計算されます。[分析境界付近の補正方法] が REDUCE_ANALYSIS_AREA である場合、最大距離は、最小外接矩形の最大範囲の長さの 25% または最小範囲の長さの 50% のいずれか大きい方に設定されます。
[開始距離] を指定した場合、[距離の増分] は、(最大距離 - 開始距離)/反復回数になります。
[開始距離] を指定しない場合、[距離の増分] は最大距離/反復回数になり、[開始距離] は、[距離の増分] の値に設定されます。

重み付けされていない K 関数の結果の解釈

特定の距離で観測された K 値が期待される K 値より大きい場合、その距離 (分析のスケール) におけるランダム分布よりクラスタリングされた分布になります。観測された K 値が期待される K 値より小さい場合、その距離におけるランダム分布より分散された分布になります。観測された K 値が上側の信頼度エンベロープ (HiConfEnv) の値より大きい場合、その距離の空間クラスタリングは統計的に有意です。観測された K 値が下側の信頼度エンベロープ (LwConfEnv) の値より小さい場合、その距離の空間クラスタリングは統計的に有意です。

[ウェイトフィールド] が指定されていない場合、ポイントをスタディエリアでランダムに分布させ、その分布の K を算出することで、信頼度エンベロープが生成されます。ポイントのランダム分布はそれぞれ「順列」と呼ばれます。たとえば 99 個の順列を選択した場合、ポイント集合は繰り返し実行ごとに 99 回ランダムに配置されます。たとえば 99_PERMUTATIONS を選択した場合、ポイント集合は繰り返し実行ごとに 99 回ランダムに配置されます。ポイント集合が 99 回配置された後、距離ごとに、期待される K 値より上下に最も大きくずれた K 値が選択されます。これらの値が信頼区間になります。信頼度エンベロープは、重み付けされていない K の青色の必要とされる K ラインに沿って (同じ形状および場所で) 生成されます。

重み付けされている K 関数の結果の解釈

K 関数は、[ウェイトフィールド] が指定されている場合でも、常に CSR (Complete Spatial Randomness: 空間完全ランダム性) を基準としてフィーチャの空間分布を評価します。重みは、フィーチャの各ロケーションで一致するフィーチャの数を表すものと考えることができます。たとえば、重みが 3 に設定されているフィーチャには、一致するフィーチャが 3 つあると解釈できます。ただし、違いが 1 つあります。それは、フィーチャは独自の隣接フィーチャになることができないことです。したがって、重みが 1 に設定されている個別の一致するポイントが 3 つある (すべてのフィーチャが互いの隣接フィーチャとしてカウントされる) データセットと、重みが 3 に設定されている単一のポイントを持つ (フィーチャがその隣接フィーチャとしてカウントされない) データセットでは、結果が異なります。重み付けされている K 関数の結果は、常に、重み付けされているフィールドのない結果よりもクラスタリングしています。これは、重み付けされてないポイントで K 関数を実行して、どれほどのクラスタリングがフィーチャのロケーションだけに関連付けられているかを示すベースラインを取得するときに便利です。これを行うことで、ベースラインを重み付けされている結果と比較して、重みが考慮された場合にどれほどのクラスタリングまたは分散が追加されるかを把握できます。重み付けされている K 関数は、重み付けされていないパターンから取得するクラスタリング (分散) の上 (下) のクラスタリング (分散) を示します。CSR の代わりに、重み付けされていない K 関数による結果を使用して、必要とされるパターンを (その信頼度エンベロープとともに) 表すことができます。この場合、考えられる帰無仮説には 2 つあります。

重み付けされているフィーチャのパターンは、これらのフィーチャの基になるパターンと比較して、それほどクラスタリングしていません。観測された重み付けされている結果が重み付けされていない結果の信頼度エンベロープ外である場合は、帰無仮説を棄却します。
重み付けされているポイントのパターンは、重み付けされていないポイントのパターンよりクラスタリング (分散) しています。観測された重み付けされていない結果が重み付けされている K 関数の結果の信頼度エンベロープ内である場合は、帰無仮説を棄却します。

[ウェイトフィールド] を指定した場合は、ウェイト値だけがランダムに再配置されて、信頼度エンベロープが計算されます。ポイント位置は固定です。基本的に、[ウェイトフィールド] を指定した場合、位置は固定されたままで、空間におけるフィーチャ値のクラスタリングが評価されます。フィーチャのロケーションが固定されたままであると、結果が厳密に構造化されるため、重み付けされている K の分析の場合、信頼度エンベロープは赤色の観測された K ラインに沿って生成される傾向があります。

参考資料

Bailey, T. C., and A. C. Gatrell. Interactive Spatial Data AnalysisLongman Scientific & Technical, Harlow, U.K. 395 pp 1995.

Boots, B., and A. Getis. Point Pattern AnalysisSage University Paper Series on Quantitative Applications in the Social Sciences, series no. 07–001. Sage Publications. 1988

Getis, A. Interactive Modeling Using Second-Order AnalysisEnvironment and Planning A, 16: 173–183. 1984

Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年