Disponible con una licencia de Geostatistical Analyst.
Los siguientes términos y conceptos se repiten en las geoestadísticas y en Geostatistical Analyst.
| Término | Descripción |
|---|---|
Validación cruzada | Técnica empleada para valorar la precisión de un modelo de interpolación. En Geostatistical Analyst, la validación cruzada excluye un punto y usa el resto para predecir un valor en esa ubicación. El punto se agrega de nuevo al dataset y se elimina otro diferente. Esto se repite para todas las muestras del dataset y proporciona pares de valores predichos y conocidos que se pueden comparar para valorar el rendimiento del modelo. Los resultados se suelen resumir como errores Medios y de Raíz cuadrática media. |
Métodos determinísticos | En Geostatistical Analyst, los métodos determinísticos son aquellos que crean superficies a partir de los puntos medidos basándose en una extensión de similitud (por ejemplo la ponderación por el inverso de la distancia) o un grado de suavizado (por ejemplo, las funciones de base radial). No proporcionan una medida de la incertidumbre (error) de las predicciones. |
Capa de estadísticas geográficas | Los resultados generados por el Asistente de estadísticas geográficas y muchas de las herramientas de geoprocesamiento de la caja de herramientas de Geostatistical Analyst se almacenan en una superficie denominada capa de estadísticas geográficas. Las capas de estadísticas geográficas se pueden usar para crear mapas de los resultados, ver y revisar los valores de los parámetros del método de interpolación (abriéndolos en el Asistente de estadísticas geográficas), crear otros tipos de capas de estadísticas geográficas (como los mapas de errores de predicción) y exportar los resultados a los formatos ráster o vectorial (curva de nivel, curva de nivel rellena y puntos). |
Métodos de estadísticas geográficas | En Geostatistical Analyst, los métodos de estadísticas geográficas son aquellos basados en modelos estadísticos que incluyen la autocorrelación (las relaciones estadísticas entre los puntos medidos). Estas técnicas tienen la capacidad de producir superficies de predicción y, además, dan una medida de la incertidumbre (el error) que se asocia con estas predicciones. |
Interpolación | Proceso que usa los valores medidos en ubicaciones de muestra conocidas para predecir (estimar) los valores de las ubicaciones que no se han muestreado. Geostatistical Analyst ofrece varios métodos de interpolación que se diferencian en las suposiciones subyacentes, los requisitos de datos y la capacidad de generar distintos tipos de salida (por ejemplo, los valores predichos y los errores [incertidumbres] asociados con ellos). |
Kernel | Función de ponderación empleada en varios de los métodos de interpolación que se ofrecen en Geostatistical Analyst. Normalmente, se asignan pesos más altos a los valores de muestra que están cerca de la ubicación en la que se desea realizar una predicción y se asignan pesos más bajos a los valores de muestra más alejados. |
Kriging | Conjunto de métodos de interpolación que utilizan los modelos de semivariogramas de la autocorrelación espacial para generar valores predichos, errores asociados con las predicciones y otros datos relacionados con la distribución de los posibles valores de cada ubicación en el área de estudio (por medio de mapas cuantiles y de probabilidad o de la simulación de estadísticas geográficas, que proporciona un conjunto de posibles valores para cada ubicación). |
Vecindad de búsqueda | La mayoría de los métodos de interpolación usa un subconjunto local de los datos para hacer predicciones. Imagine una ventana en movimiento: solo los datos de la ventana se usan para hacer predicciones en el centro de la ventana. Esto es así porque hay información redundante en las muestras que están alejadas de la ubicación en la que necesitamos hacer una predicción y también para reducir el tiempo de cálculo requerido para generar el valor predicho para toda el área de estudio. La elección de la vecindad (número de muestras cercanas y su configuración espacial dentro de la ventana) afectará a la superficie de predicción, por lo que se debe elegir con cuidado. |
Semivariograma | Función que describe las diferencias (varianza) entre las muestras separadas por diferentes distancias. Normalmente, el semivariograma mostrará una varianza baja para las diferencias pequeñas y varianzas más grandes para distancias de separación mayores, lo que indica que hay autocorrelación espacial en los datos. Los semivariogramas estimados a partir de los datos de muestra son semivariogramas empíricos. Se representan como un conjunto de puntos en un gráfico. Se ajusta a esos puntos una función que se conoce como modelo de semivariograma. El modelo de semivariograma es un componente esencial en el kriging (un eficaz método de interpolación que puede proporcionar los valores predichos, los errores asociados con las predicciones e información sobre la distribución de los posibles valores para cada ubicación del área de estudio. |
Simulación | En las estadísticas geográficas, esto hace referencia a una técnica que amplía el kriging mediante la generación de muchas versiones posibles de una superficie predicha (a diferencia del kriging, que produce una superficie). El conjunto de superficies predichas proporciona una amplia gama de datos que se pueden usar para describir la incertidumbre de un valor predicho para una ubicación concreta, la incertidumbre de un conjunto de valores predichos de un área de interés o un conjunto de valores predichos que se pueden usar como entrada en un segundo modelo (físico, económico, etc.) para evaluar el riesgo y tomar decisiones mejor fundamentadas. |
Autocorrelación espacial | Los fenómenos naturales presentan a menudo autocorrelación espacial; es decir: los valores de muestra tomados en ubicaciones próximas son más similares que los tomados en ubicaciones alejadas entre sí. Algunos métodos de interpolación requieren un modelo explícito de autocorrelación espacial (por ejemplo, kriging); otros presuponen ciertos grados de autocorrelación espacial sin proporcionar un medio para medirla (por ejemplo, la ponderación por el inverso de la distancia) y otros no requieren ninguna noción de la autocorrelación espacial en el dataset. Cuando existe autocorrelación espacial, los métodos estadísticos tradicionales (que se basan en la independencia entre las observaciones) no se pueden usar de un modo fiable. |
Transformación | Una transformación de datos se realiza cuando una función (log, Box-Cox, arco cooseno, puntuación normal) se aplica a los datos para cambiar la forma de su distribución y estabilizar la varianza (reducir la relación entre la media y la varianza, por ejemplo, que la variabilidad de los datos aumente a medida que se incremente el valor medio). |
Validación | Similar a la validación cruzada, pero en lugar de usar el mismo dataset para generar y evaluar el modelo, se usan dos datasets: uno para crear el modelo y el otro como prueba de rendimiento independiente. Si solo hay un dataset disponible, la herramienta Crear subconjuntos de entidades se puede usar para dividirlo aleatoriamente en subconjuntos de entrenamiento y de prueba. |