Taller Estadística Espacial I

Author

Mateo Córdoba Toro

Análisis exploratorio de datos

Data Frame Summary  
Dimensions: 1121 x 3  
Duplicates: 0  

-----------------------------------------------------------------------------------------------------------------
No   Variable           Stats / Values            Freqs (% of Valid)     Graph               Valid      Missing  
---- ------------------ ------------------------- ---------------------- ------------------- ---------- ---------
1    Longitud           Mean (sd) : -74.7 (1.7)   1120 distinct values           : .         1121       0        
     [numeric]          min < med < max:                                         : :         (100.0%)   (0.0%)   
                        -81.7 < -74.8 < -67                                    . : :                             
                        IQR (CV) : 2.3 (0)                                     : : : .                           
                                                                             . : : : :                           

2    Latitud            Mean (sd) : 5.6 (2.6)     1121 distinct values             :         1121       0        
     [numeric]          min < med < max:                                           :         (100.0%)   (0.0%)   
                        -4.2 < 5.5 < 13.4                                          : .                           
                        IQR (CV) : 2.8 (0.5)                                   . : : : .                         
                                                                             . : : : : : :                       

3    log_val_agregado   Mean (sd) : 5.6 (1.4)     1121 distinct values         :             1121       0        
     [numeric]          min < med < max:                                       : :           (100.0%)   (0.0%)   
                        0.8 < 5.4 < 12.7                                       : :                               
                        IQR (CV) : 1.5 (0.2)                                 : : : .                             
                                                                             : : : : .                           
-----------------------------------------------------------------------------------------------------------------

El dataset contiene información geográfica y valores asociados a diferentes municipios del departamento de Antioquia, Colombia. Incluye las siguientes columnas:

  • Departamento (): Indica el departamento al que pertenece el municipio. En este caso, todos los registros son de “Antioquia”.
  • Municipio (): Nombre del municipio.
  • Longitud (): Coordenada geográfica que representa la longitud del municipio (en grados decimales, sistema CRS WGS84).
  • Latitud (): Coordenada geográfica que representa la latitud del municipio (en grados decimales, sistema CRS WGS84).
  • log_val_agregado (): es la produccion asociadoa a la ciudad o municpio calculada por metodo de valor agregado.
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

El dataset contiene información geográfica de 1121 municipios del departamento de Antioquia, Colombia, con variables de longitud y latitud en grados decimales (rango de -81.71 a -66.96 en longitud y -4.199 a 13.373 en latitud) que permiten identificar su ubicación. Además, incluye la variable val_agregado, que muestra un rango amplio desde 0.026 a 100, con una distribución altamente asimétrica hacia la derecha, donde la mayoría de los municipios tienen valores bajos (mediana de 0.65) y unos pocos destacan con valores extremadamente altos. Este conjunto de datos está bien definido para análisis geoestadísticos y visualizaciones, siendo ideal para identificar patrones espaciales y tendencias de valor agregado en el territorio.

La distribución espacial muestra una concentración de altos valores de val_agregado en áreas como el Eje Cafetero, Antioquia y los alrededores de Bogotá. En un análisis estadístico formal, esto sugiere que existe una correlación espacial positiva: si un municipio tiene un alto valor de val_agregado, es probable que sus municipios cercanos también tengan valores altos.

Esta correlación podría ser atribuida a factores comunes en esas regiones, como la infraestructura, el desarrollo económico, la densidad poblacional y la concentración de actividades industriales y comerciales.

Semivariograma

variog: computing omnidirectional variogram

El semivariograma muestra una tendencia creciente suave hasta la distancia aproximada de 15 unidades, donde se produce un disparo abrupto de la semivarianza hacia valores superiores a 60. Esta estructura puede tener varias interpretaciones estadísticas y espaciales.

Hasta aproximadamente 15 unidades de distancia, los datos muestran una estructura de dependencia espacial, lo que significa que los valores de la variable (PIB) en municipios cercanos están correlacionados. A medida que aumenta la distancia, esta correlación disminuye gradualmente.

variofit: covariance model used is spherical 
variofit: weights used: npairs 
variofit: minimisation function used: optim 
variofit: searching for best initial value ... selected values:
              sigmasq phi   tausq kappa
initial.value "5"     "10"  "0"   "0.5"
status        "est"   "est" "est" "fix"
loss value: 1740017.20762743 
Warning in variofit(bin1, ini = ini.vals, cov.model = "spherical"):
unreasonable initial value for sigmasq + nugget (too low)
variofit: covariance model used is exponential 
variofit: weights used: npairs 
variofit: minimisation function used: optim 
variofit: searching for best initial value ... selected values:
              sigmasq phi   tausq kappa
initial.value "5"     "5"   "0"   "0.5"
status        "est"   "est" "est" "fix"
loss value: 2217927.56746009 
Warning in variofit(bin1, ini = ini.vals, cov.model = "exponential"):
unreasonable initial value for sigmasq + nugget (too low)
variofit: covariance model used is gaussian 
variofit: weights used: npairs 
variofit: minimisation function used: optim 
variofit: searching for best initial value ... selected values:
              sigmasq phi   tausq kappa
initial.value "5"     "5"   "0"   "0.5"
status        "est"   "est" "est" "fix"
loss value: 1803506.44813856 
Warning in variofit(bin1, ini = ini.vals, cov.model = "gaussian"): unreasonable
initial value for sigmasq + nugget (too low)
variofit: covariance model used is matern 
variofit: weights used: npairs 
variofit: minimisation function used: optim 
variofit: searching for best initial value ... selected values:
              sigmasq phi   tausq kappa
initial.value "5"     "5"   "0"   "0.5"
status        "est"   "est" "est" "fix"
loss value: 2217927.56746009 
Warning in variofit(bin1, ini = ini.vals, cov.model = "matern"): unreasonable
initial value for sigmasq + nugget (too low)
   esferico exponencial   gaussiano     mattern 
   683552.2    683594.3    160117.5    683594.3 

El modelo gaussiano fue seleccionado como el más adecuado para modelar el semivariograma del PIB por método de valor agregado en los municipios de Colombia, ya que captura de forma más efectiva la dependencia espacial. Este resultado sugiere que los municipios cercanos presentan niveles de PIB similares, probablemente debido a la integración económica regional y condiciones compartidas, mientras que las diferencias aumentan de manera progresiva con la distancia. La explosión de semivarianza en distancias mayores podría sugerir la existencia de desigualdades regionales significativas, posiblemente entre zonas rurales y urbanas o regiones más y menos desarrolladas, lo que destaca la necesidad de políticas de desarrollo territorial para reducir estas brechas económicas.

krige.conv: model with constant mean
krige.conv: Kriging performed using global neighbourhood 

Los resultados obtenidos mediante Kriging reflejan patrones coherentes con la distribución de la variable analizada. Se observa que las zonas cercanas a centros densamente poblados y ciudades principales presentan niveles de producción más elevados en comparación con áreas más remotas.