[高/低クラスター分析 (High/Low Clustering)] ツールでは、指定された分析範囲について、集中の度合いの高/低が計測されます。
演算
分子と分母の違いは加重 (wij) だけであることに注目してください。高/低クラスター分析は正の値にしか使用できません。このため、ウェイトがバイナリ (0/1) の場合や常に 1 未満の場合は、General G の範囲が 0 ~ 1 になります。この統計には、二値加重方式を推奨します。[空間リレーションシップのコンセプト] パラメーターでは、固定距離バンド (固定距離バンド)、ポリゴン隣接、K 近傍、またはドローネ三角網を選択します。[標準化] パラメーターには [なし] を選択します。
解釈
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールは推測統計です。つまり、分析結果が、帰無仮説との関係で解釈されます。高/低クラスター (General G) 統計の帰無仮説は、フィーチャ値に空間クラスターが存在しないというものです。このツールから返される p 値が小さく、統計的に有意である場合は、帰無仮説を棄却することができます (「Z スコアとは、p 値とは」をご参照ください)。帰無仮説が棄却されると、Z スコアの符号が重要になります。Z スコアの値が正の場合、観測 General G インデックスが期待 General G インデックスよりも大きく、分析範囲内で高い値で属性がクラスタリングしていることを示します。Z スコアの値が負の場合、観測された General G インデックスが期待される General G インデックスよりも小さく、分析範囲内で低い値で属性クラスタリングしていることを示します。
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールが最適なのは、値がほとんど等しく分布しているときに、高い値で空間的に予期せぬ急上昇を特定する場合です。残念ながら、高い値と低い値の両方がクラスターとなっている場合は、互いに相殺する傾向にあります。高い値と低い値の両方がクラスタリングしているときに空間クラスターを計測する場合は、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールを使用します。
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールと [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの帰無仮説はどちらも、まったくのランダム空間 (CSR) です。つまり、対象の空間的プロセスがランダムであることを反映して、値がデータセット内のフィーチャ間でランダムに分布している状態です。ただし、[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールの Z スコアの解釈は、[空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールの Z スコアの解釈とは大きく異なります。
結果 | 高/低クラスター分析 (High/Low Clustering) | 空間的自己相関分析 |
---|---|---|
p 値が統計的に有意ではない。 | 帰無仮説を否定できません。フィーチャ属性値の空間分布は、かなり高い確率でランダムな空間プロセスの結果です。つまり、観測された空間パターンの値は、完全に空間的に偶発的な場合にとり得る場合の 1 つにすぎない可能性が十分にあります。 | |
p 値が統計的に有意であり、Z スコアが正の値である。 | 帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。 | 帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値や低い値の空間分布は、期待されるよりも空間的にクラスタリングしています。 |
p 値が統計的に有意であり、Z スコアが負の値である。 | 帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の低い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。 | 帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセットの高い値や低い値の空間分布は、期待されるよりも空間的に分散しています。空間的に分散したパターンは、ある種の競合プロセスを反映していることが少なくありません。高い値をもつフィーチャは、高い値をもつ他のフィーチャに反発し、同様に、低い値をもつフィーチャは低い値をもつ他のフィーチャに反発します。 |
出力
[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールは 4 つの値を返します。観測された一般 G、期待される一般 G、Z スコア、p 値です。これらの値は、[結果] ウィンドウからアクセス可能であり、モデルまたはスクリプトでの潜在的な用途のために、出力値としても渡されます。オプションとして、このツールは結果の概要図を持つ HTML ファイルを作成します。[結果] ウィンドウで HTML ファイルをダブルクリックすると、デフォルトのインターネット ブラウザーに HTML ファイルが開きます。[結果] ウィンドウでメッセージ エントリを右クリックして [表示] を選択すると、[メッセージ] ダイアログ ボックスに結果が表示されます。
よくあるご質問 (FAQ)
Q: [ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールの結果は統計的に有意なホット スポットを示しています。[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールからの結果が統計的に有意になっていないのはなぜですか?
A: [高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールのようなグローバル統計では、対象データの全体的なパターンと傾向が評価されます。グローバル統計は、分析範囲全体で空間パターンにばらつきがないときに最も有効です。ローカル統計 (ホット スポット分析など) では、各フィーチャが、近隣のフィーチャとの関係で評価され、ローカルな状況がグローバルの状況と比較されます。ここで、1 つの例を検証します。1 組の値の平均値を計算するとき、これはグローバル統計値の計算でもあります。すべての値が 20 に近い場合、平均値も 20 に近くなり、その結果はデータセット全体を非常によく表すまとめとなります。一方、値の半数が 1 付近であり、残りの半数が 100 付近である場合の平均値は 50 付近になります。50 付近のデータ値が存在しない可能性があるため、平均値はデータセット全体を適切に表したサマリーとはいえません。ただし、データ値のヒストグラムを作成すると、二山分布になっていることがわかります。同様に、[高/低クラスター (High/Low Clustering (Getis-Ord General G))] ツールなどのグローバル統計は、分析範囲全体にわたって計測対象の空間プロセスが一貫している場合に最も効果的です。その場合、結果は空間パターン全体をよく表すまとめになります。詳細については、以下に引用した Getis と Ord (1992 年) のものと、彼らの提示する SIDS の分析をご参照ください。
Q: [高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] ツールからの結果と [空間的自己相関分析 (Spatial Autocorrelation (Morans I))] ツールからの結果が異なるのはなぜですか?
A: 上の表をご参照ください。これらのツールは、別の空間パターンを計測するものです。
Q: このツールで得た Z スコアや p 値を別の分析範囲の分析結果と比較することはできますか?
A: 結果を比較できるのは、分析範囲と分析に使用するパラメーターが固定されている (比較の対象となるすべての分析で同一である) 場合だけです。ただし、分析範囲が一式の固定されたポリゴンで構成されており、分析パラメーターが固定されている場合は、特定の属性について時間の経過に伴う Z スコアの変化を比較できます。たとえば、特定の国の地域レベルで市販薬 (OTC) 購入のクラスターについて傾向分析する場合を考えてみます。この場合、各期間について [高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] を実行してから、結果を線グラフにまとめることができます。Z スコアが統計的に有意であり、上昇している場合、高い OTC 購入の空間クラスターの程度が上昇していると結論付けることができます。
Q: フィーチャのサイズは分析に影響を与えますか?
A: フィーチャのサイズは結果に影響することがあります。たとえば、大きいポリゴンが低い値をもつ傾向にあり、小さいポリゴンが高い値をもつ傾向にある場合は、高低の集中が同等であっても、指定した距離の範囲内により多くの小さいポリゴンのペアがあるために、観測 General G インデックスが、期待 General G インデックスよりも高くなることがあります。
適用例
- 救急外来数に、ローカルなまたは地域的な健康問題が発生している可能性を示す、予期せぬ急上昇がないか検索します。
- 市内の各種小売店の空間パターンを比較して、比較購買 (自動車ディーラーなど) を利用するために競合とクラスタリングしているタイプや競合に反発しているタイプ (フィットネス センター/ジムなど) を確認します。
- 空間現象がクラスタリングするレベルをまとめて、異なる時間や位置での変化を確認します。たとえば、都市と人口がクラスターになることがわかっています。[高/低クラスター分析 (High/Low Clustering (Getis-Ord General G))] 分析を使用すれば、ある市内の人口レベルの時間の経過に伴う変化を比較 (都市の発達と密度の分析) できます。
参考資料
Getis, Arthur および J. K. Ord『The Analysis of Spatial Association by Use of Distance Statistics』Geographical Analysis 24、no. 3、1992 年
Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年