Die geographisch gewichtete Regression (GWR) ist eine von mehreren räumlichen Regressionstechniken, die zunehmend in der Geographie und anderen Disziplinen eingesetzt wird. GWR bietet ein lokales Modell der Variablen oder des Prozesses, die bzw. den Sie zu verstehen oder vorherzusagen versuchen, indem eine Regressionsgleichung an jedes Feature im Dataset angepasst wird. Das GWR-Werkzeug erstellt diese separaten Gleichungen durch Einbeziehung der abhängigen und erklärenden Variablen von Features, die in die Bandbreite der einzelnen Ziel-Features fallen. Die Form und Größe der Bandbreite hängt von der Benutzereingabe für die Parameter Kernel-Typ, Bandbreitenmethode, Entfernung und Anzahl der Nachbarn ab.
Hinweise und Tipps zur Implementierung
In globalen Regressionsmodellen wie OLS führt Multikollinearität zu unzuverlässigen Ergebnissen. Multikollinearität tritt auf, wenn zwei oder mehr Variablen redundant sind (das bedeutet, dass sie das gleiche oder fast das gleiche aussagen). GWR erstellt eine lokale Regressionsgleichung für jedes Feature im Dataset. Wenn die Werte für eine bestimmte erklärende Variable zur räumlichen Cluster-Bildung neigen, treten sehr wahrscheinlich Probleme mit lokaler Multikollinearität auf. Der Bedingungswert in der Ausgabe-Feature-Class gibt an, wann Ergebnisse aufgrund von lokaler Multikollinearität instabil sind. Als allgemeine Faustregel gilt: Vertrauen Sie Ergebnissen für Features mit einem Bedingungswert größer als 30, gleich NULL oder (für Shapefiles) gleich -1.7976931348623158e+308 nicht.
Schwere Modellentwurfsfehler weisen oft auf globale oder lokale Multikollinearität hin. Um die Problemursache zu ermitteln, führen Sie das Modell mit OLS aus, und untersuchen Sie den VIF-Wert für jede erklärende Variable. Wenn einige der VIF-Werte sehr groß sind (z. B. größer als 7,5), verhindert die globale Multikollinearität die Berechnung mit dem GWR-Werkzeug. Jedoch ist wahrscheinlich eher lokale Multikollinearität das Hauptproblem. Versuchen Sie, eine thematische Karte für jede erklärende Variable zu erstellen. Wenn die Karte räumliche Cluster-Bildung von identischen Werten erkennen lässt, entfernen Sie diese Variablen aus dem Modell, oder kombinieren Sie diese Variablen mit anderen erklärenden Variablen, um die Wertvariation zu erhöhen. Wenn Sie beispielsweise Wohnungswerte modellieren und sowohl für Schlafzimmer als auch für Badezimmer über Variablen verfügen, ist es möglicherweise sinnvoll, diese zu kombinieren, um die Wertvariation zu erhöhen oder sie als kombinierte Größe darzustellen. Vermeiden Sie beim Erstellen von GWR-Modellen die Verwendung von Dummy-/binären Variablen (räumliche Ordnung), von kategorialen/nominalen Variablen (räumliche Cluster-Bildung) oder von Variablen mit sehr wenigen möglichen Werten.
Durch Probleme mit lokaler Multikollinearität kann auch verhindert werden, dass mit den Bandbreitenmethoden AIC und CV die optimale Entfernung bzw. die optimale Anzahl von Nachbarn berechnet wird. Geben Sie eine bestimmte Entfernung oder Anzahl von Nachbarn an, und überprüfen Sie dann die Bedingungswerte in der Ausgabe-Feature-Class, um zu ermitteln, bei welchen Features Probleme aufgrund von lokaler Multikollinearität vorliegen (Bedingungswerte größer als 30). Sie können diese Problem-Features bei einer optimalen Entfernung bzw. optimaler Anzahl von Nachbarn vorübergehend entfernen. Beachten Sie, dass Ergebnisse, die mit Bedingungswerten von größer als 30 verknüpft sind, nicht zuverlässig sind.
Bedingungswerte geben an, wie empfindlich die Lösung einer linearen Gleichung gegenüber kleineren Änderungen in Matrixkoeffizienten ist. Wenn der Bedingungswert größer als 30 ist, sind einzelne Feature-Ergebnisse nicht in der Varianz der Parameterschätzungen enthalten; dies hat Auswirkungen auf Standardfehlerdiagnosen, globales Sigma und standardisierte Residuen.
Der Benutzer kann diese Bedingungswertgrenze durch Zurücksetzen der Registrierung ändern:
[HKEY_CURRENT_USER\Software\ESRI\GeoStatisticalExtension\DefaultParams\GWR]
"ConditionNumberThreshold"="40"
Parameterschätzungen und vorhergesagte Werte für GWR werden anhand der folgenden Funktion für räumliche Gewichtung berechnet: exp(-d^2/b^2). Diese Gewichtungsfunktion kann bei verschiedenen GWR-Softwareimplementierungen unterschiedlich sein. Demzufolge stimmen Ergebnisse des Werkzeugs GWR von Esri möglicherweise nicht exakt mit den Ergebnissen anderer GWR-Softwarepakete überein.
Zusätzliche Quellen
Es gibt zahlreiche gute Ressourcen, mit denen Sie mehr über die OLS-Regression und die geographisch gewichtete Regression erfahren können. Beginnen Sie, indem Sie die Dokumentation Grundlagen zur Regressionsanalyse lesen und/oder das kostenlose einstündige Webseminar des Esri Virtual Campus zum Thema Regressionsanalyse anschauen. Arbeiten Sie dann ein Lernprogramm zur Regressionsanalyse durch. Sobald Sie beginnen, eigene Regressionsmodelle zu erstellen, können Sie die Dokumentation Interpretieren von OLS-Regressionsergebnissen und Interpretieren der Ergebnisse der GWR-Regression lesen, um weitere Informationen zur Regressions-Ausgabe und zu Regressions-Diagnosen zu erhalten.
Andere Ressourcen
Fotheringham, Stewart A., Chris Brunsdon, and Martin Charlton. Geographically Weighted Regression: the analysis of spatially varying relationships. John Wiley & Sons, 2002.
Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005.