ここでは、ツールのパラメーターに関する追加情報を提供するだけではなく、[空間統計] のツールを使用してデータを分析するときに重要な基本的な用語および概念も紹介します。ツールのパラメーターの詳細については、このトピックをご参照ください。
空間リレーションシップのコンセプト
空間統計と従来の (非空間的な) 統計の重要な違いは、空間統計では空間と空間リレーションシップが直接その算術演算に統合されることです。したがって、[空間統計] ツールボックスのツールの多くで、ユーザーが分析を実行する前に [空間リレーションシップのコンセプト] パラメーターの値を選択する必要があります。一般的なコンセプトには、逆距離、走行時間、固定距離、K 近傍、近接性などがあります。使用する空間リレーションシップのコンセプトは、計測する内容によって決定されます。たとえば、ある特定の種子植物の群生状態を計測する場合は、逆距離が最も適切です。しかし、地域の通勤客の地理的分布を評価する場合は、通勤時間または通勤費用を選択するほうが、空間リレーションシップをよりよく説明できます。分析によっては、空間と時間が、親近度 (あるものをよく知っていれば知っているほど、それは機能的により近くにある) や空間相互作用 (たとえば、東京都と大阪市の間の電話通話数が大阪市と京都市の間の電話通話数よりも多い場合、東京都と大阪市は機能的により近くにある) などのより抽象的なコンセプトよりも重要ではない場合があります。
[グループ分析 (Grouping Analysis)] ツールは、空間的制限というパラメーターを含んでおり、パラメーター オプションは [空間リレーションシップのコンセプト] パラメーターで説明されているものと同様ですが、使用方法が異なります。空間的制限を適用すると、少なくとも 1 つの近隣 (隣接、最近隣リレーション、または三角形分割法により定義) を共有しているフィーチャのみが同じグループに属することができます。その他の詳細および例については、「グループ分析 (Grouping Analysis) ツールの詳細」をご参照ください。
[空間リレーションシップのコンセプト] パラメーターのオプションについては、後で説明します。選択するオプションによって、隣接フィーチャのコンテキスト内の各フィーチャを評価するツールの隣接リレーションシップが決定されます。これらのツールには、[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツール、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツール、および [クラスター/外れ値分析 (Cluster and Outlier Analysis (Anselin Local Moran's I))] ツールがあります。これらのオプションの一部は、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用する場合にのみ使用できることに注意してください。
逆距離と距離の逆二乗 (インピーダンス)
[逆距離] のオプションを使用する場合、その空間リレーションシップの概念モデルは、インピーダンスの 1 つ (距離減衰) です。すべてのフィーチャがその他のすべてのフィーチャに影響をおよぼしますが、距離が遠ければ遠いほど、影響は小さくなります。一般的に、逆距離のコンセプトを使用して必要な計算の数を減らすには (特に大規模なデータセットの場合)、[距離バンドまたは距離の閾値] を指定します。距離バンドまたは距離の閾値が指定されていなければ、デフォルトの閾値が自動的に計算されます。[距離バンドまたは距離の閾値] を 0 に設定することで、強制的にすべてのフィーチャをその他のすべてのフィーチャの隣接フィーチャにすることができます。
[逆ユークリッド] 距離は、気温の変化などの連続的なデータをモデリングするために適切です。[逆マンハッタン] 距離は、道路網データが使用できないときに、ホームセンターなどの固定されている都市施設のロケーションが分析で使用される場合に最適です。[距離の逆二乗] オプションを使用する場合の概念モデルは、[逆距離] を使用する場合と同じですが、[距離の逆二乗] オプションを使用する場合は、傾斜がより急であるため、隣接フィーチャの影響がより急激に低下し、ターゲット フィーチャに最も近い隣接フィーチャのみがそのフィーチャの計算に多大な影響をおよぼします。
距離バンド (影響圏)
[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールなどの一部のツールでは、固定距離バンドはデフォルトの空間リレーションシップのコンセプトです。[固定距離バンド] オプションを使用して、「影響圏」 (データに対する空間相互作用の変動ウィンドウ形式の概念モデル) を適用します。各フィーチャは、[距離バンドまたは距離の閾値] で指定した距離内にある隣接フィーチャのコンテキスト内で分析されます。指定した距離内の隣接フィーチャは、均等に重み付けされます。指定した距離外のフィーチャは、計算に影響をおよぼしません (その重みは 0 です)。[固定距離バンド] オプションは、特定の (固定された) 空間尺度のデータの統計的なプロパティを評価するときに使用します。たとえば、通勤パターンを調査しているときに、職場までの平均移動距離が 15 km であることが判明している場合は、15 km の固定距離を分析に使用します。分析に適切な尺度距離を特定するために役立つガイドラインについては、下記の固定距離の選択に関するセクションをご参照ください。
無関心領域
[空間リレーションシップのコンセプト] パラメーターの [無関心領域] オプションは、逆距離モデルと固定距離バンド モデルを組み合わせたものです。距離バンド内または距離の閾値内のフィーチャは、ターゲット フィーチャの分析に含まれます。臨界距離を超えると、影響のレベル (重み付け) が急激に低下します。就職先を探しているときに、5 km 先の会社と 6 km 先の会社のどちらかを選ぶとします。この場合、通勤距離を重視して会社を選ぶことはないでしょう。ここで、5 km 先の会社と 20 km 先の会社のどちらかを選ぶとします。この場合、通勤距離は一種のインピーダンスとなり、会社を選ぶうえで考慮する必要があるでしょう。このオプションは、分析の尺度を固定したままにすると同時に、ターゲット フィーチャの計算に含まれる隣接フィーチャに明確な境界を適用したくない場合に使用します。
ポリゴン隣接 (一次)
ポリゴン フィーチャクラスの場合は、CONTIGUITY_EDGES_ONLY (Rook's Case とも呼ばれます)、または CONTIGUITY_EDGES_CORNERS (Queen's Case とも呼ばれます) を選択できます。CONTIGUITY_EDGES_ONLY の場合、エッジを共有する (一致する境界線を持つ) ポリゴンは、ターゲット ポリゴンの計算に含まれます。エッジを共有しないポリゴンは、ターゲット フィーチャの計算から除外されます。CONTIGUITY_EDGES_CORNERS の場合、エッジとコーナーまたはそのいずれかを共有するポリゴンは、ターゲット ポリゴンの計算に含まれます。2 つのポリゴンのいずれかの部分が重なっている場合、これらは近接と見なされ、互いの計算に含まれます。ある種の伝播プロセスをモデリングする場合、またはポリゴンとして表される連続的なデータを処理する場合に、ポリゴン フィーチャでこれらの隣接コンセプトのいずれかを使用します。
K 最近隣内挿法
各フィーチャがそれに最も近い指定された定数の隣接フィーチャの空間的な関連性内で評価されるようにするために、隣接リレーションシップが構成されることもあります。K (隣接フィーチャの数) が 8 であれば、ターゲット フィーチャに最も近い 8 つの隣接フィーチャがそのフィーチャの計算に含められます。フィーチャ密度が高いロケーションでは、分析の空間的な関連性は小さくなります。フィーチャ密度が高いロケーションでは、分析の空間的な関連性は小さくなります。この空間リレーションシップのモデルの利点は、フィーチャ密度がスタディ エリア全体でロケーションによって大幅に異なる場合でも、すべてのターゲット フィーチャに必ずいくつかの隣接フィーチャが存在するようになることです。このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用する場合に使用することができます。[近傍数] が 8 の K_NEAREST_NEIGHBORS オプションは回帰残差を評価するために 予備回帰分析 (Exploratory Regression)で使用されるデフォルトのコンセプトです。
ドローネ三角形分割 (Natural Neighbors)
[ドローネ三角形分割 (Delaunay Triangulation)] オプションは、ポイント フィーチャまたはフィーチャの重心から各ポイントまたは重心が三角形ノードになるようにボロノイ三角形を作成することで、隣接フィーチャを構成します。三角形のエッジで接続されているノードは、隣接フィーチャと見なされます。[ドローネ三角形分割 (Delaunay Triangulation)] を使用すると、データにアイランドや大幅に異なるフィーチャ密度が含まれていても、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在することが確保されます。一致するフィーチャがあるときは、[ドローネ三角形分割 (Delaunay Triangulation)] オプションを使用しないでください。このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用する場合に使用することができます。
時空間ウィンドウ
このオプションを使用して、空間 (固定距離) と時間 (固定時間間隔) の両方についてフィーチャの関係を定義します。このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して空間ウェイト マトリックス ファイルを作成するときに使用できます。SPACE_TIME_WINDOW を選択した場合、[日付/時間フィールド]、[日付/時間の間隔タイプ] (例、HOURS、DAYS、または MONTHS)、および [日付/時間の間隔値] も指定する必要があります。間隔値は整数です。間隔のタイプに HOURS を選択し、間隔値に 3 を選択すると、2 つのフィーチャの日付/時間フィールドの値が互いに 3 時間以内である場合、これらのフィーチャは近接と見なされます。このコンセプトの場合、フィーチャが指定された距離内にあり、かつターゲット フィーチャの指定された時間内に収まっている場合、これらのフィーチャは近接フィーチャです。可能性のある 1 つの例を挙げると、時空間ホット スポットを特定するために、[ホット スポット分析 (Hot_Spot_Analysis)] で使用する空間ウェイト マトリックス ファイルを作成したい場合は、SPACE_TIME_WINDOW [空間リレーションシップのコンセプト] を選択します。結果を表示する方法などの詳細については、「時空間分析」をご参照ください。その他の機会は、3D の netCDF 時空間キューブで可視化するときに使用できます。
空間ウェイトをファイルから取得 (ユーザー定義の空間リレーションシップ)
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは[ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して、フィーチャの近接関係を格納するファイルを作成できます。ネットワーク データセットから派生した移動時間または移動コストを使用して空間リレーションシップを定義する場合は、[ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して空間ウェイト マトリックス ファイルを作成し、結果として生成される SWM ファイルを分析に使用します。フィーチャの空間リレーションシップがテーブルで定義されている場合は、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して、そのテーブルを空間ウェイト マトリックス (*.swm) ファイルに変換できます。SWM ファイルを使用するために CONVERT_TABLE オプションを使用するには、テーブルに特定のフィールドを含める必要があります。独自の空間リレーションシップのカスタム コンセプトを定義する (たとえば、空間相互作用に基づいて)書式設定された ASCII テキスト ファイルへのパスを指定することもできます。
空間リレーションシップのコンセプトの選択: ベスト プラクティス
フィーチャの空間相互作用をより現実的にモデリングできればできるほど、結果はより正確になります。[空間リレーションシップのコンセプト] パラメーターの選択には、解析対象のフィーチャ間の固有のリレーションシップが反映されている必要があります。データの特性に考慮して選択する必要がある場合もあります。
たとえば、逆距離を使用する方法 (INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED) は、連続的なデータを使用する場合や、2 つのフィーチャが空間内で近ければ近いほど相互に作用する確率が高くなるプロセスをモデリングする場合に最適です。この空間リレーションシップのコンセプトを使用する場合、すべてのフィーチャがその他のすべてのフィーチャの隣接フィーチャとなる可能性があり、大規模なデータセットを使用する場合、実行される計算の数は膨大になります。逆距離のコンセプトを使用する場合は、常に [距離バンドまたは距離の閾値] の値を含めるようにしてください。これは、大規模なデータセットを使用する場合は特に重要です。[距離バンドまたは距離の閾値] パラメーターを空白のままにしておくと、距離の閾値は自動的に計算されますが、これは分析に最も適した距離ではない可能性があります。デフォルトの距離の閾値は最短距離になるため、すべてのフィーチャにそれぞれ少なくとも 1 つの隣接フィーチャが存在するようになります。
この FIXED_DISTANCE_BAND 方法は、ポイント データに最適です。 これは、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールで使用されるデフォルトのオプションです。多くの場合、これは、大幅にサイズが異なるポリゴンが存在する (たとえば、スタディ エリアの周縁部ではポリゴンが非常に大きく、スタディ エリアの中央ではポリゴンが非常に小さいなど) 場合や、一貫した尺度の分析を確保したい場合のポリゴン データに適したオプションです。分析に適切な距離バンド値を決定するために役立つガイドラインについては、下記の固定距離の選択に関するセクションをご参照ください。
ZONE_OF_INDIFFERENCE コンセプトは、固定距離を使用することが適切であっても、近傍リレーションシップに明確な境界が設定されるとデータが正確に表現されない場合に適しています。無関心領域の概念モデルは、すべてのフィーチャをその他のすべてのフィーチャの隣接フィーチャと見なすことに注意してください。このため、このオプションは大規模なデータセットには適切ではありません。[距離バンドまたは距離の閾値] に指定された値は、隣接フィーチャの数を制限せず、空間リレーションシップの濃度の減衰が始まる場所を指定するのみです。
ポリゴン隣接のコンセプト (CONTIGUITY_EDGES_ONLY、CONTIGUITY_EDGES_CORNERS) は、ポリゴンのサイズと分布が似ており、空間リレーションシップがポリゴンの近接の関数である (2 つのポリゴンが境界を共有する場合、その空間相互作用が増加する) 場合に効果的です。 ポリゴン隣接のコンセプトを選択する場合、一般的に、[行の標準化] パラメーターを持つツールの行の標準化を選択する必要があります。
K_NEAREST_NEIGHBORS オプションは、分析に最小数の隣接フィーチャが必要である場合に効果的です。 特に、フィーチャに関連付けられている値が歪んでいる (正規分布していない) 場合は、各フィーチャが少なくとも 8 つほどの隣接フィーチャのコンテキスト内で評価されることが重要です (これは一般的な方法です)。データの分布がスタディ エリア全体で大幅に異なるため、一部のフィーチャがその他のすべてのフィーチャから遠くに離れている場合に、この方法は最適です。ただし、分析の空間コンテキストは、フィーチャの分散度または密度の値変動に応じて変化することに注意してください。K 最近隣内挿は、分析の尺度を固定することが隣接フィーチャの数を固定することよりも重要ではない場合に適しています。
DELAUNAY_TRIANGULATION は、一部の分析では、一連のフィーチャの Natural Neighbors を指定する方法として使用されます。この方法は、データにアイランド ポリゴン (他のポリゴンと境界を共有しない分離したポリゴン) が含まれる場合、またはフィーチャの空間分布が非常に不均一である場合に適しています。ただし、一致しているフィーチャがある場合には適切ではありません。ドローネ三角形分割は、K 近傍と似ており、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在することを確保しますが、データの分布そのものを使用して、各フィーチャに割り当てられる隣接フィーチャの数を決定します。
SPACE_TIME_WINDOW オプションを使用すると、空間的近接と時間的近接の両方についてフィーチャ リレーションシップを定義できます。 時空間ホット スポットを特定したい場合、または空間および時間の近接性によりメンバーシップを低減したグループを構築したい場合はこのオプションを使用します。時空間分析、およびこの種の分析により得られた結果の効果的なレンダリング方法の例については、「時空間分析」をご参照ください。
空間相互作用を移動時間または移動距離の観点からモデリングすると最も効果的である場合があります。たとえば、都市サービスへのアクセス性をモデリングしたり、都市犯罪のホット スポットを見つけたりするには、ネットワークの観点から空間リレーションシップをモデリングすると効果的です。分析の前に、[ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して空間ウェイト マトリックス ファイル (*.swm) を作成します。[空間リレーションシップのコンセプト] の値に GET_SPATIAL_WEIGHTS_FROM_FILE を選択してから、[ウェイト マトリックス ファイル] パラメーターとして、作成した SWM ファイルへの絶対パスを指定します。
[空間リレーションシップのコンセプト] パラメーターのどのオプションも分析に適切ではない場合は、フィーチャ間のリレーションシップを定義する ASCII テキスト ファイルまたはテーブルを作成し、これらのファイルを使用して空間ウェイト マトリックス ファイルを作成することができます。いずれかのオプションが目的に近いが完全ではない場合は、[空間ウェイト マトリックスの生成 (Generate_Spatial_Weights_Matrix)] ツールを使用して基本的な SWM ファイルを作成し、空間ウェイト マトリックス ファイルを編集します。
固定距離バンドの値の選択
固定距離バンドは、一時的に各フィーチャ上に固定され、そのフィーチャをその隣接フィーチャのコンテキスト内で調べる変動ウィンドウと考えることができます。分析に適切な距離バンドを特定するために役立つガイドラインのいくつかを以下に示します。
- 調査対象の空間的現象について、既知のことに基づいた距離を選択します。この情報を把握していることはまれですが、把握している場合は、その知識を使用して距離の値を選択するようにしてください。たとえば、平均通勤距離が 15 km であることがわかっているとします。この場合、距離バンドを 15 km に設定すると、通勤データが適切に分析されるでしょう。
- すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在することを確保するために十分な距離バンドを使用します。そうでない場合、結果が無効になります。特に、入力データに歪みがある (値をヒストグラムとしてプロットした場合に適切な釣鐘曲線が生成されない) 場合は、距離バンドが小さすぎないか (ほとんどのフィーチャに 1 つか 2 つの隣接フィーチャしかない)、大きすぎないか (いくつかのフィーチャにその他のすべてのフィーチャが隣接フィーチャとして含まれている) を確認します。小さすぎる場合、または大きすぎる場合は、結果として生成される Z スコアが信頼性の低いものになるためです。Z スコアは、距離バンドが各フィーチャにいくつかの (およそ 8 つの) 隣接フィーチャが存在することを確保するために十分な大きさである限り、信頼できます。フィーチャが数千個の近傍を持つ距離バンドを作成した場合、どのフィーチャも他のすべてのフィーチャを近傍として持たない場合でも、パフォーマンスの問題やメモリの制限を招く可能性があります。
- すべてのフィーチャが少なくとも 1 つの近傍を持つようにすると、数千もの近傍を持ついくつかのフィーチャが作成される場合があり、これは理想的ではありません。これは、一部のフィーチャが空間的な外れ値である場合に発生することがあります。この問題を解決するには、空間的な外れ値以外のすべてについて適切な距離バンドを決定し、[空間ウェイト マトリックスの生成 (Generate_Spatial_Weights_Matrix)] ツールを使用し、その距離を使用して空間ウェイト マトリックス ファイルを作成します。ただし、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを実行するときに、[近傍数] パラメーターに最小近傍数を指定してください。例: 国勢調査データを使用してロサンゼルス カウンティの健康的な食品へのアクセス性を評価しているとします。買い物ができる場所の 3 マイル以内に人口の 90 % 以上が住んでいることがわかっています。国勢統計区の分析により、中心エリアの (国勢統計区の重心に基づく) 統計区間の距離は約 1,000 メートルですが、中心を離れたエリアの統計区間の距離は 18,000 メートル以上であることがわかります。すべてのフィーチャが少なくとも 1 つの近傍を持つようにするには、18,000 メートルを超える距離バンドを設定する必要がありますが、この分析規模 (距離) では、求める情報は得られません。この解決策として、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して国勢調査地区フィーチャクラスの空間ウェイト マトリックス ファイルを作成します。約 4800 メートル (約 3 マイル) の [閾値距離] を指定し、近傍数パラメーターに最小近傍数値 (ここでは 2) を指定します。これにより、この距離を使用して少なくとも 2 つの近傍を持たないフィーチャを除くすべてのフィーチャに 4,800 メートルの固定距離近傍を適用します。外れ値フィーチャの場合 (外れ値フィーチャのみ)、すべてのフィーチャが少なくとも 2 つの近傍を持つように距離を拡大します。
- 最大空間的自己相関を反映する距離バンドを使用します。地形上に空間クラスタリングが見られる場合は、内在する空間プロセスがアクティブであることを示します。[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールで測定される最大のクラスタリングを示す距離バンドは、これらの空間プロセスが最もアクティブであるか、最も明確な距離です。インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)ツールを実行し、得られる Z スコアがピークを示す場所を確認します。ピーク値に関連付けられている距離を分析に使用します。
- 各ピークは、空間クラスタリングを促進するプロセスが顕著である距離を表します。通常、ピークは複数あります。一般的に、より長い距離に関連付けられているピークは、広範なトレンド (たとえば、西が巨大なホット スポットであり、東が巨大なコールド スポットである広範な東から西へのトレンド) を反映するため、より短い距離に関連付けられているピーク (多くの場合、最初のピーク) のほうが重要です。
- 目立たないピークは、多くの場合、多数の異なる空間プロセスがさまざまな空間尺度で作用していることを意味します。この場合、分析にどの固定距離を使用するかを判断するためには、一般的に、他の基準を使用します (通常は、改善のために最も効果的な距離)。
- 集約データ (たとえば、郡など) を使用している場合に、Z スコアのピークがない (つまり、増え続けている) 場合は、集約スキーマが粗すぎることを意味します。つまり、対象の空間プロセスは、集約単位の尺度よりも小さい尺度で作用しています。分析をより小さい尺度に変更できる場合は (たとえば、郡から区域に移行するなど)、ピーク距離を見つけることができる場合があります。ポイント データでの作業中に Z スコアにピークが生じない場合は、多様な空間尺度で多数の異なる空間プロセスが実行されており、分析で使用する固定距離を決定するための別の基準を考えなければならないことを示しています。また、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを実行するときの [開始距離] が大きすぎないか確認する必要もあります。
- 開始距離を指定しない場合、インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)ツールはすべてのフィーチャが少なくとも 1 つの近傍を持つようにする距離を使用します。ところが、データに空間的な外れ値が含まれていると、その距離は分析の目的とは不釣合いに膨れ上がる可能性があります。これが [出力レポート ファイル] に明らかなピークが表示されない理由である可能性があります。解決するには、一時的にすべての空間的な外れ値を除外する選択セットを [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールで実行します。外れ値を除外してピークが見つかった場合は、すべてのフィーチャ (空間的な外れ値を含む) にそのピーク距離を適用して先に示した方法を使用し、各フィーチャが少なくとも 1 つまたは 2 つの近傍を持つようにします。いずれかのフィーチャが空間的な外れ値であるかどうか不明な場合:
- ポリゴン データの場合は、標準偏差レンダリング方式を使用してポリゴン エリアをレンダリングし、3 標準偏差よりも大きいエリアを持つポリゴンを空間的な外れ値と見なします。まだフィールドがない場合は、[フィールド演算 (Calculate Field)] を使用してポリゴン エリアのフィールドを作成します。
- ポイント データの場合は、[最近接] ツールを使用して各フィーチャの最近隣距離を計算します。これを行うには、ポイント データセットに対して [入力フィーチャ] と [最近接フィーチャ] の両方を設定します。最近隣距離のフィールドを準備したら、標準偏差レンダリング方式を使用してこれらの値をレンダリングし、3 標準偏差よりも大きい距離を空間的な外れ値と見なします。
クラスタリングを促進するプロセスが最も顕著である距離を特定します。 - 正しい距離バンドは 1 つしかないということに固執しないようにしてください。現実は、それほどシンプルではありません。ほとんどの場合、観測されたクラスタリングを促進する空間プロセスは複数あり、相互に作用しています。1 つの距離バンドが必要であると考えるよりも、パターン分析ツールは複数の空間尺度で空間リレーションシップを調べるための効果的な方法であると考えるようにしてください。尺度を変更すると (距離バンドの値を変更すると)、分析の目的が変わることがあることに注意してください。たとえば、所得データを処理しているとします。距離バンドが小さいと、近傍の所得パターンを調べることができ、距離の尺度が中程度であれば、1 つのコミュニティまたは都市の所得パターンが反映され、最大距離バンドの場合は、広範な領域の所得パターンが示されます。
距離計算の方法
[空間統計] ツールボックスの多くのツールが、その計算に「距離」を使用します。これらのツールを使用するとき、[ユークリッド距離] または [マンハッタン距離] のどちらかを選択できます。
- ユークリッド距離は、次のように算出されます。
D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]
ここで、(x1, y1) はポイント A の座標、(x2, y2) はポイント B の座標であり、D はポイント A とポイント B の間の直線距離です。
- マンハッタン距離は、次のように算出されます。
D = abs(x1–x2) + abs(y1–y2)
ここで、(x1, y1) はポイント A の座標、(x2, y2) はポイント B の座標であり、D はポイント A とポイント B の垂直距離および水平距離の和です。これは、東西方向および南北方向の移動のみに制限されている場合に、移動する必要がある距離です。この方法は、一般的に、移動が道路網に制限されており、実際の道路網の移動コストがわからない場合は、ユークリッド距離よりも適切です。
入力フィーチャが投影されない場合 (つまり、座標が度、分、および秒で与えられる場合) や出力座標系が地理座標系に設定された場合、または地理座標系の空間参照を持つフィーチャ データセットへの出力フィーチャクラスのパスを指定した場合、弦の測定値を使用して距離が計算され、[距離計算の方法] パラメーターが無効になります。少なくとも互いに約 30°の範囲内のポイントに対して、素早く計算することができ、真の測地距離の非常に優れた推定値が得られるため、弦距離の測定値が使用されます。弦距離は、地球の真の扁平楕円体形状ではなく、球体に基づいて計算されます。地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。弦距離は、メートル単位でレポートされます。
セルフ ポテンシャル (間帯重みを付けるフィールド)
[空間統計] ツールボックスの一部のツールでは、セルフ ポテンシャルに使用する重みを表すフィールドを指定できます。セルフ ポテンシャルは、フィーチャとそれ自身の間の距離またはウェイトです。この重みは、通常は 0 ですが、必要に応じて別の固定値またはフィーチャごとに異なる値を指定します。たとえば、空間リレーションシップのコンセプトが国勢調査区域内または国勢調査区域間で移動する距離に基づいている場合は、ポリゴンのサイズに基づいて平均間帯移動コストを反映するようにセルフ ポテンシャルをモデリングします。
dii = 0.5*[(Ai / π)**0.5]
ここで、dii はポリゴン フィーチャ i の間帯移動に関連付けられている移動コストであり、Ai はポリゴン フィーチャ i に関連付けられているエリアです。
標準化
行の標準化が推奨されるのは、サンプリングの設計や指定された集約方式によってフィーチャの分布が偏る可能性があるときです。[行の標準化] が選択されていると、それぞれの重みがその行の合計 (すべての隣接フィーチャの重みの合計) で分割されます。行の標準化による重み付けは、固定距離の近傍でよく使用され、ポリゴン隣接に基づく近傍にはほぼ常に使用されます。これは、フィーチャに異なる数の隣接フィーチャがあるために生じるバイアスを抑止するために行われます。[行の標準化] は、すべての重みを 0 と 1 の間になるようにスケーリングして、絶対的ではなく相対的な重み付けスキーマを作成します。行政区域を表すポリゴン フィーチャを操作するときは、ほぼいつも、[行の標準化] オプションを選択します。
例:
- すべての犯罪事件に関する情報があるとします。調査区域のいくつかの部分には、犯罪が多発するために多数のポイントがあります。他の部分には、犯罪があまり発生しないためにわずかなポイントしかありません。ポイントの密度は、理解したい内容 (犯罪空間パターン) を非常によく反映しています (表現しています)。おそらく、空間ウェイトの行の標準化は必要ないでしょう。
- 土壌サンプルを採取したとします。何らかの理由 (天候がよかったか、フェンスに登ったり、沼地を泳いだり、山の頂上に登る必要がなかったなど) により、調査区域の一部の部分で多数のサンプルを採取し、他の区域ではあまり採取しませんでした。つまり、ポイントの密度は慎重に計画されたランダム サンプルの忠実な結果ではありません。ユーザー独自の偏りがいくらか導入された可能性があります。さらに、多くのポイントがある場所は分析しているデータの基盤の空間分布を必ずしも反映していません。サンプリング プロセス中に導入された可能性がある偏りを最小化するために、空間ウェイトの行の標準化を行います。行の標準化を行うときは、あるフィーチャが 2 個の近傍を持ち、別のフィーチャが 18 個の近傍を持っていても結果に大きな影響を及ぼしません。すべてのウェイトの合計は 1 になります。
- データを集約するときはいつでも、そのデータに構造を適用しています。分析しているデータおよび質問の内容をその構造が適切に反映することはまれです。たとえば、国勢調査ポリゴン (国勢統計区など) は人口に基づいて設計されており、分析に人口関連の質問が関係している場合でも、これらのポリゴンは可能な多数の描画方法のうちの 1 つを採用した結果にすぎないため、ウェイトの行の標準化を実行するのが適切です。ポリゴン データの場合、ほぼ必ず空間ウェイトの行の標準化が必要になります。
距離バンドまたは距離の閾値
[距離バンドまたは距離の閾値] では、ほとんどの空間リレーションシップのコンセプト (たとえば、INVERSE_DISTANCE、FIXED_DISTANCE_BAND など) の分析の尺度を設定できます。これは、カットオフ距離を表す正の数値です。ターゲット フィーチャに対して指定したカットオフ外のフィーチャは、そのフィーチャの分析において無視されます。ただし、ZONE_OF_INDIFFERENCE を使用する場合、指定した距離外のフィーチャの影響は近接度に比例して弱くなりますが、距離の閾値内のフィーチャは同等に考慮されます。
適切な距離を選択することは重要です。一部の空間統計では、分析を信頼できるものにするために、各フィーチャに少なくとも 1 つの隣接フィーチャが必要です。[距離バンドまたは距離の閾値] に設定した値が小さすぎると (一部のフィーチャに隣接フィーチャが存在しなくなる)、距離をより大きい値に設定して再試行することを提案する警告メッセージが表示されます。[近接フィーチャへの距離を計算 (Calculate Distance Band from Neighbor Count)] ツールは、指定した数の隣接フィーチャへの最短、平均、および最長距離を評価します。これに基づいて、分析に使用する適切な距離バンドの値を決定できます。詳細については、「固定距離バンドの値の選択」のセクションをご参照ください。
この値を指定しなければ、デフォルトの距離の閾値が計算されます。次の表は、3 つの使用可能な入力タイプごとに、[空間リレーションシップのコンセプト] の動作が指定する値によってどのように異なるかを示しています (負の値は無効です)。
逆距離、距離の逆二乗 | 固定距離バンド、無関心領域 | ポリゴン隣接、ドローネ三角形分割、K 近傍 | |
---|---|---|---|
0 | 閾値またはカットオフは適用されず、すべてのフィーチャがその他のすべてのフィーチャの隣接フィーチャになります。 | 無効です。実行時エラーが生成されます。 | 無視されます。 |
空白 | デフォルトの距離が計算されます。このデフォルトの距離は最短距離であるため、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在するようになります。 | デフォルトの距離が計算されます。このデフォルトの距離は最短距離であるため、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在するようになります。 | 無視されます。 |
正の値 | 指定された 0 より大きい正の値がカットオフ距離として使用され、隣接リレーションシップはこの距離内のフィーチャ間にのみ存在するようになります。 | 固定距離バンドを使用する場合、この指定されたカットオフ内のフィーチャのみが相互に隣接フィーチャになります。[無関心領域] を使用する場合、この指定されたカットオフ内のフィーチャは相互に隣接フィーチャになり、カットオフ外のフィーチャも隣接フィーチャになりますが、これらには、距離が長くなるにつれ、より小さい重み (影響) が割り当てられます。 | 無視されます。 |
隣接フィーチャの数
各ターゲット フィーチャの分析に含める隣接フィーチャの数を表すには、正の整数を指定します。[空間リレーションシップのコンセプト] パラメーターに選択した値が [K 近傍] であれば、各ターゲット フィーチャは最も近い K 個のフィーチャ (「K」は指定した隣接フィーチャの数) のコンテキスト内で評価されます。[逆距離] または [固定距離バンド] を使用する場合、[空間ウェイト マトリックスの生成 (Generate_Spatial_Weights_Matrix)] ツールを実行するときに[近傍数] パラメーターの値を指定することで、各フィーチャに少なくとも K 個の隣接フィーチャが存在することが確保されます。ポリゴン隣接の方法の場合、[近傍数] が指定されていないフィーチャは、フィーチャの重心への近さに基づいて隣接フィーチャが追加されます。[ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールの場合、[最大近傍数] パラメーターに値を指定すると、指定した値よりも多いフィーチャが含まれなくなります。[グループ分析 (Grouping Analysis)] ツールでは、[近傍数] の値を指定することにより、各グループ内のフィーチャの近接を特定しやすくします。たとえば、近傍数に 6 を指定すると、グループ内の他のフィーチャ群に対する 6 個の最も近い近傍のうちの少なくとも 1 つを共有しているフィーチャ群にグループが制限されます。
ウェイト マトリックス ファイル
いくつかのツールでは、空間ウェイト マトリックス ファイルへのパスを指定することで、空間フィーチャ間の空間リレーションシップを定義できます。空間ウェイトとは、データセットの各フィーチャとその他のすべてのフィーチャの間にある距離、時間、またはその他のコストを反映する数字です。[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して空間ウェイト マトリックス ファイルを作成することも、単純な ASCII ファイルを使用することもできます。
空間ウェイト マトリックス ファイルが単純な ASCII テキスト ファイルである場合、最初の行は一意な ID フィールドの名前である必要があります。これにより、このファイルを生成するときに、データセット内の任意の数値フィールドを ID として使用できます。ただし、この ID フィールドは、整数タイプ (Long または Short) である必要があり、すべてのフィーチャに対して一意な値である必要があります。空間ウェイト ファイルの最初の行の後に続く内容は、3 つの列で構成される必要があります。
- ターゲット フィーチャ ID
- 隣接フィーチャ ID
- 重み付け
たとえば、3 軒のガソリンスタンドを所有しているとします。ID フィールドとして使用するフィールドを StationID とし、フィーチャ ID を 1、2、および 3 として、 これらの 3 軒のガソリンスタンドの空間リレーションシップを分単位の移動時間を使用してモデリングするとします。この場合、次のような ASCII ファイルを作成できます。
一般的に、重みが距離または時間を表す場合、より近いフィーチャに、より遠いフィーチャよりも大きい重みが割り当てられるように重みが転化されます (たとえば、距離が 10 km または 10 分であれば 1/10)。上記の重みから、ガソリンスタンド 1 はガソリンスタンド 2 から 10 分の距離にあることがわかり、 この例では、移動時間は対称的ではないこともわかります (ガソリンスタンド 1 からガソリンスタンド 3 までの移動時間は 7 分ですが、ガソリンスタンド 3 からガソリンスタンド 1 までの移動時間は 6 分です)。ガソリンスタンド 1 とそれ自身の間の重みは 0 であり、ガソリンスタンド 2 とそれ自身の間についてはエントリがありません。エントリがなければ、重みは 0 であると想定されます。
空間ウェイト マトリックス ファイルの値を入力することは、データセットが小規模であっても、面倒な作業です。[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用するか、このタスクを自動的に実行する Python スクリプトを記述するほうが効率的な方法です。
空間ウェイト マトリックス ファイル (*.swm)
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールまたは [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールは、指定されたパラメーターに基づいてデータセット内のすべてのフィーチャの空間リレーションシップを定義するバイナリ形式の空間ウェイト マトリックス ファイル (*.swm) を作成します。このファイルはバイナリ ファイル形式で作成されるため、ファイル内の各値を直接表示することはできません。SWM ファイルのフィーチャ リレーションシップを表示または編集するには、[空間ウェイト マトリックス → テーブル (Convert Spatial Weights Matrix to Table)] ツールを使用します。
フィーチャ間の空間リレーションシップをテーブルに保存したら、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して、そのテーブルを空間ウェイト マトリックス ファイル (*.swm) に変換できます。このテーブルには、以下のフィールドが必要です。
フィールド名 | 説明 |
---|---|
<一意な ID フィールド名> | フィーチャごとに一意な ID がある入力フィーチャクラス内の整数フィールド。これがターゲット フィーチャ ID です。 |
NID | 隣接フィーチャの ID を含んでいる整数フィールド。これが隣接フィーチャ ID です。 |
WEIGHT | 対象フィーチャと隣接フィーチャの空間リレーションシップを数量化する数値の重み。値が大きければ大きいほど、2 つのフィーチャ間の重みも大きくなり、相互作用も強くなります。 |
空間ウェイト マトリックス ファイルの共有
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールと [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールの出力は、SWM ファイルです。このファイルは、入力フィーチャクラス、一意の ID フィールド、および SWM ファイルが作成されたときの [出力データの座標系] の設定と関連付けられます。他のユーザーは、作成された SWM ファイル、同じ入力フィーチャクラス、または一致する[一意の ID] フィールドにフィーチャ群のすべてまたは一部を関連付けているフィーチャクラスを使用して、分析用に定義された空間リレーションシップを複製できます。特に、SWM ファイルを他のユーザーと共有する場合、出力データの座標系が入力フィーチャクラスに関連付けられている空間参照と異なる状況は回避するようにしてください。入力フィーチャクラスを投影してから、空間ウェイト マトリックス ファイルを作成する前に [出力データの座標系] を [入力フィーチャクラスに一致] に設定するほうが、複製よりも効果的な方法です。