地理加权回归 (GWR) 是若干空间回归技术中的一种,越来越多地用于地理及其他学科。通过使回归方程适合数据集中的每个要素,GWR 可为您要尝试了解/预测的变量或过程提供局部模型。GWR 构建这些独立方程的方法是:将落在每个目标要素的带宽范围内的要素的因变量和解释变量进行合并。带宽的形状和大小取决于用户输入的核类型、带宽方法、距离以及相邻点的数目参数。
实现方法注释与提示
在全局回归模型中(如 OLS),当两个或更多变量具有多重共线性时(当存在两个或更多冗余变量或者这些变量共同提供同一“信息”时),结果并不可靠。GWR 为数据集中的各要素构建了局部回归方程。如果用于特定解释变量的值出现空间聚类,则很可能存在局部多重共线性问题。输出要素类中的条件数指明结果由于局部多重共线性出现不稳定性的时期。一般来说,如果要素的条件数大于 30、等于“空”或者等于 -1.7976931348623158e+308(对于 shapefile 来说),则结果是不可靠的。
严重模型设计错误通常表示存在全局或局部共线性问题。要确定出现问题的位置,使用 OLS 运行模型,然后检查每个解释变量的 VIF 值。如果某些 VIF 值较大(例如,大于 7.5),则全局多重共线性会阻止 GWR 解决问题。但是,更有可能是局部多重共线性所导致的问题。请尝试为各解释变量创建一个专题地图。如果在地图上出现相同值的空间聚类,考虑将这些变量从模型中移除,或将这些变量与其他解释变量合并以便加大值的变化性。例如,如果要对家庭值进行建模且具有卧室和浴室两个变量,则可能需要将其合并以加大值的变化性,或将其表示为浴室/卧室的建筑面积。在构建 GWR 模型时,避免使用空间组织哑元/二进制变量、空间聚类名目/数值变量或几乎不可能具有值的变量。
局部共线性问题还可阻止 AIC 和 CV 带宽方法求解最佳距离/相邻点的数目。尝试指定特定的距离或相邻点数,然后检查输出要素类中的条件数,以查看与局部共线性问题相关联的要素(条件数大于 30)。在您找到最佳距离/相邻点的数目后,最好临时移除这些问题要素。请注意,与大于 30 的“条件数”相关联的结果不可靠。
条件数表示线性方程的解对于矩阵系数的微小变化的敏感程度。条件数大于 30 时,参数估计的方差不包括单个要素结果;这会影响标准误差诊断、全局 sigma 和标准化残差。
通过重置以下注册表,用户可更改此条件数阈值:
[HKEY_CURRENT_USER\Software\ESRI\GeoStatisticalExtension\DefaultParams\GWR]
"ConditionNumberThreshold"="40"
使用以下空间加权函数计算 GWR 的参数估计和预测值:exp(-d^2/b^2)。在各种 GWR 软件实现中,此加权函数可能各有不同。因此,ESRI GWR 工具的结果与其他 GWR 软件包的结果可能并不完全一致。
其他资源
有多种优质资源可帮助您了解有关 OLS 回归和地理加权回归的详细信息。可从阅读回归分析基础知识文档和/或观看一小时的免费 ESRI 虚拟校园回归分析 Web 研讨会开始。然后,通读回归分析教程。开始创建自己的回归模型后,最好参阅解释 OLS 回归结果和解释 GWR 回归结果文档,来帮助您了解回归输出和诊断。
其他资源
Fotheringham, Stewart A.、Chris Brunsdon 和 Martin Charlton。Geographically Weighted Regression:the analysis of spatially varying relationships.John Wiley & Sons, 2002。
Mitchell, Andy.The ESRI Guide to GIS Analysis,第 2 卷。ESRI 出版社,2005。