#Descargar librerías
library(foreign)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(spdep)
## Loading required package: spData
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
## Loading required package: sf
## Linking to GEOS 3.11.0, GDAL 3.5.3, PROJ 9.1.0; sf_use_s2() is TRUE
library(tigris)
## To enable caching of data, set `options(tigris_use_cache = TRUE)`
## in your R script or .Rprofile.
library(rgeoda)
## Loading required package: digest
##
## Attaching package: 'rgeoda'
## The following object is masked from 'package:spdep':
##
## skater
library(RColorBrewer)
library(viridis)
## Loading required package: viridisLite
library(ggplot2)
library(tmap)
## Breaking News: tmap 3.x is retiring. Please test v4, e.g. with
## remotes::install_github('r-tmap/tmap')
library(sf)
library(sp)
library(readr)
library(spdep)
#Importar base de datos
library(readr)
panel_dataset <- read.csv("/Users/reginaenriquez/Desktop/Act 1/panel_dataset.csv")
new_fdi_real_mxn - New Foreign Direct Investment Inflows. Millions of Dollars.
crime_rate - Crime Rate per 100,000 state’s population.
pop_density - Population per state’s land area km².
unemployment - Percentage of Unemployment population.
college_education - College Education
Para esta primera sección se realizaron subjuntos de datos de cada una de las regiones de México para después poder continuar visualizando la informacion de los flujos de Inversión Extranjera Directa (FDI) dentro de un gráfico de barras para cada una de las regiones.
norte <- subset(panel_dataset, state %in% c("Baja California","Chihuahua", "Coahuila", "Nuevo Leon", "Sonora", "Tamaulipas"))
ggplot(data = norte, aes(x = state, y = new_fdi_real_mxn)) +
geom_bar(stat = "identity", fill = "steelblue") +
theme_minimal() +
labs(x = "Estados", y = "FDI", title = "FDI por Estados del Norte")
El gráfico de barras muestra los flujos de Inversión Extranjera Directa (FDI) en varios estados del norte de México. Se puede observar como Nuevo León lidera, seguido de Coahuila, Baja California, Tamaulipas, Chihuahua y Sonora. Esta información es clave para entender la distribución geográfica de la FDI y puede orientar políticas económicas y estrategias de desarrollo regional. Se puede decir que Nuevo León destaca gracias a su infraestructura industrial, ubicación estratégica y ambiente empresarial, mientras que Chihuahua y Sonora muestran flujos de inversión más bajos en comparación con otros estados.
sur <- subset(panel_dataset, state %in% c("Campeche", "Chiapas","Guerrero", "Oaxaca", "Quintana Roo", "Tabasco", "Veracruz", "Yucatan"))
ggplot(data=sur, aes(x=sur$state, y=sur$new_fdi_real_mxn)) +
geom_bar(stat="identity", fill="red")+
theme_minimal() +
labs(x = "Estados", y = "FDI", title = "FDI por Estados del Sur")
## Warning: Use of `sur$state` is discouraged.
## ℹ Use `state` instead.
## Warning: Use of `sur$new_fdi_real_mxn` is discouraged.
## ℹ Use `new_fdi_real_mxn` instead.
Este gráfico de barras resalta las diferencias en los flujos de inversión directa entre los estados del sur de México. Veracruz lidera en términos de FDI, posiblemente debido a su infraestructura portuaria, recursos naturales y ubicación estratégica. Tabasco y Guerrero muestran flujos de inversión similares, lo que puede estar relacionado con la industria petrolera y turística, respectivamente. Oaxaca, Campeche, Yucatán y Chiapas siguen en orden descendente en términos de flujos de inversión, lo que puede estar influenciado por diversos factores como la infraestructura, los recursos naturales, las políticas gubernamentales y las condiciones económicas locales.
centro <- subset(panel_dataset, state %in% c("Ciudad de Mexico", "Hidalgo", "Mexico", "Morelos", "Puebla", "Tlaxcala"))
ggplot(data=centro, aes(x=centro$state, y=centro$new_fdi_real_mxn)) +
geom_bar(stat="identity", fill="darkgreen")+
theme_minimal()+
labs(x = "Estados", y = "FDI", title = "FDI por Estados del Centro")
## Warning: Use of `centro$state` is discouraged.
## ℹ Use `state` instead.
## Warning: Use of `centro$new_fdi_real_mxn` is discouraged.
## ℹ Use `new_fdi_real_mxn` instead.
Se puede observar en el gráfico de barras de la región central de México como es que La Ciudad de México destaca como líder, lo cual puede ser debido a su posición como centro financiero y político. El Estado de México sigue, posiblemente debido a su proximidad con la capital y su infraestructura industrial. Puebla, reconocida por su industria automotriz, se sitúa en tercer lugar, mientras que Hidalgo, Morelos y Tlaxcala muestran flujos de inversión más bajos, sugiriendo una menor actividad económica o infraestructura industrial menos desarrollada.
occidente <- subset(panel_dataset, state %in% c("Baja California Sur", "Colima", "Durango", "Jalisco" , "Michoacan", "Nayarit", "Sinaloa"))
ggplot(data=occidente, aes(x=occidente$state, y=occidente$new_fdi_real_mxn)) +
geom_bar(stat="identity", fill="purple")+
theme_minimal()+
labs(x = "Estados", y = "FDI", title = "FDI por Estados del Occidente")
## Warning: Use of `occidente$state` is discouraged.
## ℹ Use `state` instead.
## Warning: Use of `occidente$new_fdi_real_mxn` is discouraged.
## ℹ Use `new_fdi_real_mxn` instead.
Continuando con el gráfico de barras de la región occidental de México, se observa a Jalisco en primer lugar, seguido por Baja California Sur y Michoacán. Jalisco lidera debido a su economía diversificada y sector tecnológico en crecimiento, mientras que Baja California Sur destaca por el turismo en Los Cabos y La Paz. Los otros estados muestran flujos descendentes, los cuales pueden estar impulsados por sectores como agricultura, pesca, minería y turismo. Colima cierra con flujos menores, probablemente debido a su tamaño y economía menos diversificada.
bajio <- subset(panel_dataset, state %in% c("Aguascalientes", "Guanajuato","Queretaro ", "San Luis Potosi", "Zacatecas"))
ggplot(data=bajio, aes(x=bajio$state, y=bajio$new_fdi_real_mxn)) +
geom_bar(stat="identity", fill="pink")+
theme_minimal()+
labs(x = "Estados", y = "FDI", title = "FDI por Estados del Bajio")
## Warning: Use of `bajio$state` is discouraged.
## ℹ Use `state` instead.
## Warning: Use of `bajio$new_fdi_real_mxn` is discouraged.
## ℹ Use `new_fdi_real_mxn` instead.
Por ultimo, dentro del grafico de la región Bajío de México, destaca Guanajuato en primer lugar, seguido por Querétaro y San Luis Potosí en segundo lugar, Zacatecas y finalmente Aguascalientes. Guanajuato destaca por su ubicación estratégica y fuerte infraestructura industrial, especialmente en sectores como la automotriz y la manufactura. Querétaro y San Luis Potosí comparten el segundo lugar, impulsados por el crecimiento en sectores como la aeroespacial y la manufactura. Zacatecas sigue, con una presencia importante en la minería y la agricultura. Aguascalientes, aunque muestra flujos más bajos, ha sido atractivo para inversiones en sectores como la automotriz y la electrónica.
Estadísticos de Dispersión (Global y Regional). Incluir elementos gráficos (box plots, qq- plots, etc.).
Dentro de esta sección de podrán ubservar boxplots de cada región para cada una de las variables seleccionadas. Estos gráficos facilitan la comparación de las características entre las diferentes áreas geográficas.
regiones_unicas <- unique(panel_dataset$region_a)
colores <- plasma(length(regiones_unicas))
boxplot(panel_dataset$new_fdi_real_mxn ~ panel_dataset$region_a,
xlab = "Región",
ylab = "FDI",
main = "Boxplot de FDI por región",
col = colores)
El boxplot de la variable FDI revela que los flujos de inversión en el centro de México tienen una mayor variabilidad en comparación con los demás. Aunque el centro muestra una diversidad considerable, su mediana es más baja que la del norte. Además, se observan valores atípicos en esta región. El Bajío presenta una mediana comparable a la del norte, indicando una alta concentración de inversión. Aunque los boxplots del occidente y sur tienen menor variabilidad, sus medianas son similares a las del centro.
boxplot(panel_dataset$unemployment ~ panel_dataset$region_a,
xlab = "Región",
ylab = "Desempleo",
main = "Boxplot de desempleo por región",
col = colores)
Los boxplots para la variable de desempleo muestran que el norte tiene la mayor variabilidad en las tasas de desempleo, seguido por el occidente y el sur con variabilidades moderadas. Aunque el norte tiene una mediana similar al centro, muestra más valores extremadamente altos. El sur tiene una mayor presencia de valores altos en comparación con el occidente. En resumen, el norte tiene una variabilidad significativa con valores extremos, mientras que el sur destaca por valores altos, a pesar de una variabilidad moderada.
boxplot(panel_dataset$crime_rate ~ panel_dataset$region_a,
xlab = "Región",
ylab = "Crimen",
main = "Boxplot de Crimen por región",
col = colores)
Los boxplots muestran diferencias en las tasas de crimen entre las regiones de México. El del norte tiene la mayor variabilidad y presencia de valores altos, mientras que el del centro es el más pequeño, indicando menor variabilidad. Aunque el del norte es grande, su mediana es similar al occidente, mientras que la del Bajío es la más baja, sugiriendo tasas de crimen más bajas en promedio.
boxplot(panel_dataset$pop_density ~ panel_dataset$region_a,
xlab = "Región",
ylab = "Poblacion",
main = "Boxplot de población por región",
col = colores)
El boxplot de la región del centro de México es el más grande, lo que indica una mayor variabilidad en la población dentro de esta región en comparación con otras. La presencia de outliers muy altos en el centro contribuye a hacer que los boxplots de todas las demás regiones parezcan más pequeños en comparación. A pesar de que el boxplot del centro es el más grande, el boxplot del Bajío está aún más grande que el del norte, occidente y sur. Esto indica una mayor variabilidad en la población dentro del Bajío en comparación con el centro, lo que puede deberse a factores como el crecimiento económico y la urbanización en la región.
boxplot(panel_dataset$college_education ~ panel_dataset$region_a,
xlab = "Región",
ylab = "Educación",
main = "Boxplot de educación por región",
col = colores)
Dentro de estos boxlplots de la variable educación, se puede observar que la región del norte tiene una menor variabilidad en los niveles de educación. La línea del primer cuartil en el boxplot del norte es más corta que todas las demás, lo que sugiere que la dispersión de los datos en la parte inferior del rango es menor en comparación con las otras regiones. La media de todos los boxplots es relativamente similar, pero la del occidente es la más alta y la del sur es la más baja. Esto sugiere que, en promedio, el nivel de educación tiende a ser más alto en el occidente y más bajo en el sur, en comparación con las otras regiones.
plot(panel_dataset$crime_rate, panel_dataset$new_fdi_real_mxn,
xlab = "Crimen",
ylab = "FDI",
main = "Relación entre crimen y FDI")
abline(lm(panel_dataset$new_fdi_real_mxn ~ panel_dataset$crime_rate), col = "red")
El análisis muestra que áreas con bajos niveles de crimen tienden a tener menor inversión directa (FDI). Aunque la relación es relativamente constante, hay un ligero declive en el FDI cuando aumenta el crimen, sugiriendo una posible relación negativa débil entre estas variables. Esto podría indicar que las empresas evitan invertir en áreas con alta criminalidad debido a preocupaciones de seguridad. Se necesitan análisis adicionales para comprender completamente esta relación. Sin embargo, es importante tener en cuenta otros factores y realizar un análisis más detallado para comprender completamente esta relación y sus implicaciones.
Visualizar la distribución espacial de las variables seleccionadas usando mapas.
#Variables seleccionadas
panel_dataset2 <- panel_dataset[,c(1,2,3,9,25,24,8,14)]
Se creo un nuevo conjunto de datos donde se seleccionaron únicamente las variables específicas que se utilizarán en el análisis, simplificando así el conjunto de datos a solo las columnas relevantes.
### Importar shapefile
# Estados de México (32)
mx_state_map <- st_read("/Users/reginaenriquez/Desktop/esda/mx_maps/mx_states/mexlatlong.shp")
## Reading layer `mexlatlong' from data source
## `/Users/reginaenriquez/Desktop/esda/mx_maps/mx_states/mexlatlong.shp'
## using driver `ESRI Shapefile'
## Simple feature collection with 32 features and 19 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -118.4042 ymin: 14.55055 xmax: -86.73862 ymax: 32.71846
## Geodetic CRS: WGS 84
mx_state_map <- read_sf("/Users/reginaenriquez/Desktop/esda/mx_maps/mx_states/mexlatlong.shp")
# Juntar datasets
state_geodata <- geo_join(mx_state_map,panel_dataset2,'OBJECTID','state_id',how='inner')
# Subset estados para el año 2019
datos_mapa_2019 <- subset(state_geodata, year == 2019)
# Subset estados para el año 2021
datos_mapa_2021 <- subset(state_geodata, year == 2021)
datos_mapa_2019_filtered <- datos_mapa_2019 %>%
filter(ADMIN_NAME != "Distrito Federal")
ggplot() +
geom_sf(data = datos_mapa_2019_filtered, aes(fill = new_fdi_real_mxn)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del FDI en 2019",
fill = "Tasa de FDI") +
theme_minimal()
La Ciudad de México destaca como el principal receptor de Inversión Extranjera Directa (FDI), lo cual es coherente con su papel como centro financiero y económico de México. Dado su dominio en el panorama de la inversión, se optó por filtrar a la Ciudad de México fuera del mapa para permitir una mejor visualización de los otros estados del país.
Nuevo León y el Estado de México ocupan los siguientes lugares en términos de FDI, siendo centros económicos importantes con infraestructura industrial significativa, atractivos para inversiones en sectores como la manufactura y la tecnología. Otros estados destacados son Veracruz, Querétaro, Jalisco, Guanajuato y Coahuila, atribuyendo su atractivo a factores como ubicación estratégica y mano de obra calificada. Estos hallazgos indican la importancia de ciertos estados para la inversión extranjera, con implicaciones clave para el crecimiento económico y el desarrollo regional en México.
datos_mapa_2021_filtered <- datos_mapa_2021 %>%
filter(ADMIN_NAME != "Distrito Federal")
ggplot() +
geom_sf(data = datos_mapa_2021_filtered, aes(fill = new_fdi_real_mxn)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del FDI en 2021",
fill = " Tasa de FDI") +
theme_minimal()
En 2021, la Ciudad de México mantuvo su posición como el estado con el
mayor FDI, consolidando su papel como centro económico y financiero del
país, por lo que de igual forma, para una mejor visualización de los
demás estados, se eliminó del mapa.
Nuevo León y Baja California Norte y Sur experimentaron un notable aumento en el FDI en comparación con 2019, posiblemente debido a políticas gubernamentales favorables y una infraestructura desarrollada. Michoacán, Veracruz y Tamaulipas también registraron incrementos significativos en el FDI en 2021. Mientras tanto, el Estado de México experimentó un descenso en el FDI y ya no figura entre los estados con mayores niveles de inversión extranjera directa.
ggplot() +
geom_sf(data = datos_mapa_2019, aes(fill = unemployment)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del Desempleo en 2019",
fill = "Índice de Desempleo") +
theme_minimal()
En 2019, Tabasco tuvo el mayor desempleo, lo cual puede estar relacionado con su dependencia en la industria petrolera, mientras que Baja California Norte y Guerrero mostraron los niveles más bajos, posiblemente por su diversificación económica y desarrollo turístico. Otros estados como Chiapas, Veracruz, Coahuila, Hidalgo, Guanajuato, Colima y Michoacán enfrentaron desafíos con índices de desempleo más altos, señalando la necesidad de políticas específicas para abordar las causas subyacentes en diferentes regiones.
ggplot() +
geom_sf(data = datos_mapa_2021, aes(fill = unemployment)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del Desempleo en 2021",
fill = "Índice de Desempleo") +
theme_minimal()
En 2021, se registra un aumento generalizado en la mayoría de los estados respecto a 2019, menos aquellos que mantenian las tasas más bajas, donde se observa una relativa estabilidad en el índice de desempleo. Se destaca un incremento significativo en Durango, Querétaro, Estado de México y Puebla, posiblemente debido a la desaceleración económica y los efectos de la pandemia de COVID-19. Estos hallazgos indican un panorama laboral más desafiante en México en 2021, destacando la necesidad de políticas efectivas para promover la creación de empleo y la recuperación económica post-pandemia.
ggplot() +
geom_sf(data = datos_mapa_2019, aes(fill = college_education)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial de la Educación Universitaria en 2019",
fill = "Índice de Educacion") +
theme_minimal()
En 2019, Baja California Sur, Sinaloa y Ciudad de México cuentan con los índices más altos de educación universitaria, lo que sugiere una mayor proporción de población con niveles educativos superiores, posiblemente debido a mejores oportunidades de acceso y mayor inversión en educación. En contraste, Oaxaca, Nuevo León, Michoacán y Guanajuato mostraron los índices más bajos, indicando una menor proporción de población con niveles educativos más altos, posiblemente debido a barreras socioeconómicas, culturales o de acceso a la educación universitaria.
ggplot() +
geom_sf(data = datos_mapa_2021, aes(fill = college_education)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial de la Educación Universitaria en 2021",
fill = "Índice de Educación") +
theme_minimal()
En el año 2021 se observa una declinación en el índice de educación universitaria en Sonora, Coahuila y Tamaulipas, posiblemente debido a cambios en políticas educativas o situación económica. En contraste, Jalisco experimentó un aumento, posiblemente por iniciativas exitosas en educación. La Ciudad de México sigue teniendo la tasa más alta, mientras que Oaxaca mantiene la más baja, reflejando disparidades en los sistemas educativos y desafíos socioeconómicos en México.
ggplot() +
geom_sf(data = datos_mapa_2019, aes(fill = crime_rate)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del Crimen en 2019",
fill = "Índice de Crimen") +
theme_minimal()
Coahuila, Durango, Baja California Sur, Yucatán y Aguascalientes tienen niveles más bajos de crimen, sugiriendo una menor incidencia delictiva, posiblemente debido a la efectividad de las fuerzas de seguridad y estabilidad socioeconómica. En contraste, Colima, Chihuahua y Baja California Norte muestran niveles más altos de crimen, posiblemente debido a la presencia de grupos delictivos y problemas de seguridad pública. Estos hallazgos destacan las disparidades en los niveles de crimen en México y la importancia de abordar sus causas subyacentes mediante políticas de seguridad efectivas y fortalecimiento del sistema de justicia.
ggplot() +
geom_sf(data = datos_mapa_2021, aes(fill = crime_rate)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial del Crimen en 2021",
fill = "Índice de Crimen") +
theme_minimal()
Hubo un aumento significativo en Zacatecas y Sonora en 2021 en comparación con 2019, posiblemente debido a conflictos entre grupos delictivos o problemas de seguridad pública. En contraste, Colima experimentó una disminución en el crimen en 2021. La mayoría de los estados mostraron una tendencia general a la baja en los niveles de crimen entre 2019 y 2021, excepto Zacatecas y Sonora. Esto puede ser resultado de esfuerzos gubernamentales para mejorar la seguridad y abordar las causas subyacentes del crimen.
datos_mapa_2019_filtered2 <- datos_mapa_2019 %>%
filter(ADMIN_NAME != "Distrito Federal" & ADMIN_NAME != "Mexico")
ggplot() +
geom_sf(data = datos_mapa_2019_filtered2, aes(fill = pop_density)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial de la Población en 2019",
fill = "Índice de Poblacion") +
theme_minimal()
La Ciudad de México se destaca como el área con la mayor concentración de población en comparación con otros estados en el 2019. Esto es consistente con su estatus como la ciudad más grande y densamente poblada de México. El Estado de México, que rodea la Ciudad de México, también se encuentra más poblado que el resto del país, por lo que debido a esto, se decidió filtrar tanto a la Ciudad de México como al estado de México para poder tener una visualización más clara acerca de los otros estados y su población.
Una vez observando el mapa sin la Ciudad ni el estado de México, se puede visualizar que los estados del centro continúan siendo los más poblados, mientras que la mayoría de los otros estados muestran una distribución más uniforme de población. Esto sugiere una distribución más equitativa en estos estados, sin concentraciones tan significativas como en los estados cercanos a la Ciudad de México.
datos_mapa_2021_filtered2 <- datos_mapa_2021 %>%
filter(ADMIN_NAME != "Distrito Federal" & ADMIN_NAME != "Mexico")
ggplot() +
geom_sf(data = datos_mapa_2021_filtered2, aes(fill = pop_density)) +
scale_fill_viridis_c() +
labs(title = "Distribución Espacial de la Población en 2021",
fill = "Índice de Población") +
theme_minimal()
Al igual que en 2019, la Ciudad de México continúa destacando como el área con la mayor concentración de población en comparación con otros estados, seguido por el estado de México. Esto sugiere una persistencia en el estatus de la capital como el principal centro urbano y demográfico del país.
En la mayoría de los otros estados, la distribución de población permanece relativamente uniforme, como se evidencia en el mapa con tonos uniformes. Esto sugiere una estabilidad en la distribución poblacional en estos estados, sin cambios significativos con respecto a 2019.
Elaborar y visualizar 1 – 2 matrices de conectividad para los estados / municipios de México
fdi <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "new_fdi_real_mxn", palette="Blues", style="quantile", n=8, title="MXN FDI Inflows 2019") +
tm_layout(main.title= 'New FDI Inflows', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
unemployment <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "unemployment", palette="BuGn", style="quantile", n=8, title="Unemployment") +
tm_layout(main.title= 'Unemployment 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
crime <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "crime_rate", palette="OrRd", style="quantile", n=8, title="Crime Rate") +
tm_layout(main.title= 'Crime Rate 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
pop_den <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "pop_density", palette="-viridis", style="quantile", n=8, title="Pop Density") +
tm_layout(main.title= 'Population Density 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
education <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "college_education", palette="-viridis", style="quantile", n=8, title="College Education") +
tm_layout(main.title= 'College Education 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
# Panel de mapas
tmap_arrange(fdi, unemployment, education, crime, pop_den, ncol = 2)
fdi2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "new_fdi_real_mxn", palette="Blues", style="quantile", n=8, title="MXN FDI Inflows 2021") +
tm_layout(main.title= 'New FDI Inflows', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
unemployment2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "unemployment", palette="BuGn", style="quantile", n=8, title="Unemployment") +
tm_layout(main.title= 'Unemployment 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
crime2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "crime_rate", palette="OrRd", style="quantile", n=8, title="Crime Rate") +
tm_layout(main.title= 'Crime Rate 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
pop_den2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "pop_density", palette="-viridis", style="quantile", n=8, title="Pop Density") +
tm_layout(main.title= 'Population Density 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
education2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "college_education", palette="-viridis", style="quantile", n=8, title="College Education") +
tm_layout(main.title= 'College Education 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
# Panel de Mapas
tmap_arrange(fdi2, unemployment2, education2, crime2, pop_den2, ncol = 2)
# Utilizar el método de "ROOK"
swm_rook_2019 <- poly2nb(datos_mapa_2019, queen=FALSE)
# Resumen
summary(swm_rook_2019)
## Neighbour list object:
## Number of regions: 32
## Number of nonzero links: 130
## Percentage nonzero weights: 12.69531
## Average number of links: 4.0625
## Link number distribution:
##
## 1 2 3 4 5 6 7 8
## 1 6 7 7 3 4 3 1
## 1 least connected region:
## 31 with 1 link
## 1 most connected region:
## 20 with 8 links
# Convertir matriz a lista de pesos
sswm_rook_2019 <- nb2listw(swm_rook_2019, style="W", zero.policy = TRUE)
# Convertir el mapa de estados a formato spatial
datos_mapa_2019_a <- as(datos_mapa_2019, "Spatial")
datos_mapa_2019_centroid <- coordinates(datos_mapa_2019_a)
# Graficar la matriz en el mapa
plot(datos_mapa_2019_a,border="blue",axes=FALSE,las=1, main="Estados de México 2019 con ROOK SWM")
plot(datos_mapa_2019_a,col="grey",border=grey(0.9),axes=T,add=T)
plot(sswm_rook_2019,coords=datos_mapa_2019_centroid,pch=19,cex=0.1,col="red",add=T)
# Utilizar el método de "ROOK"
swm_rook_2021 <- poly2nb(datos_mapa_2021, queen=FALSE)
# Resumen
summary(swm_rook_2021)
## Neighbour list object:
## Number of regions: 32
## Number of nonzero links: 130
## Percentage nonzero weights: 12.69531
## Average number of links: 4.0625
## Link number distribution:
##
## 1 2 3 4 5 6 7 8
## 1 6 7 7 3 4 3 1
## 1 least connected region:
## 31 with 1 link
## 1 most connected region:
## 20 with 8 links
# Convertir matriz a lista de pesos
sswm_rook_2021 <- nb2listw(swm_rook_2021, style="W", zero.policy = TRUE)
# Convertir el mapa de estados a formato spatial
datos_mapa_2021_a <- as(datos_mapa_2021, "Spatial")
datos_mapa_2021_centroid <- coordinates(datos_mapa_2021_a)
# Graficar la matriz en el mapa
plot(datos_mapa_2021_a,border="blue",axes=FALSE,las=1, main="Estados de México 2021 con ROOK SWM")
plot(datos_mapa_2021_a,col="grey",border=grey(0.9),axes=T,add=T)
plot(sswm_rook_2021,coords=datos_mapa_2021_centroid,pch=19,cex=0.1,col="red",add=T)
Detectar la presencia de autocorrelación espacial global para cada una de las variables seleccionadas.
Globan Moran I nos indica si el valor observado de una variable en una localidad es independiente de los valores de la variable en localidades vecinas.
moran.test(datos_mapa_2019$new_fdi_real_mxn, sswm_rook_2019)
##
## Moran I test under randomisation
##
## data: datos_mapa_2019$new_fdi_real_mxn
## weights: sswm_rook_2019
##
## Moran I statistic standard deviate = 1.8555, p-value = 0.03176
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.097528220 -0.032258065 0.004892719
Es estadísticamente significativa debido a que el p value es menor al 0.05, Moran I statistic tiene un resultado mayor al 0.05, lo que nos indica que sí hay una autocorrelación espacial positiva.
moran.test(datos_mapa_2021$new_fdi_real_mxn, sswm_rook_2021)
##
## Moran I test under randomisation
##
## data: datos_mapa_2021$new_fdi_real_mxn
## weights: sswm_rook_2021
##
## Moran I statistic standard deviate = 1.4415, p-value = 0.07472
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.14077318 -0.03225806 0.01440759
El Moran I statistic es mayor al 0.05 lo cual dice que sí hay una autocorrelación espacial positiva. Sin embargo, la autocorrelación no es estadísticamente significativa ya que el p value es mayor al 0.05
moran.test(datos_mapa_2019$crime_rate, sswm_rook_2019)
##
## Moran I test under randomisation
##
## data: datos_mapa_2019$crime_rate
## weights: sswm_rook_2019
##
## Moran I statistic standard deviate = 0.66232, p-value = 0.2539
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.04969026 -0.03225806 0.01530891
El p value es mayor al 0.05, esto nos indica que no es estadísticamente significativa. El Moran I statistic es menor al 0.05 lo cual indica que la autocorrelación espacial es negativa.
moran.test(datos_mapa_2021$crime_rate, sswm_rook_2021)
##
## Moran I test under randomisation
##
## data: datos_mapa_2021$crime_rate
## weights: sswm_rook_2021
##
## Moran I statistic standard deviate = 0.068795, p-value = 0.4726
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## -0.02370829 -0.03225806 0.01544512
El p value es mayor al 0.05, esto nos indica que no es estadísticamente significativa. El Moran I statistic es menor al 0.05 lo cual nos indica que que la autocorrelación espacial es negativa.
moran.test(datos_mapa_2019$pop_density, sswm_rook_2019)
##
## Moran I test under randomisation
##
## data: datos_mapa_2019$pop_density
## weights: sswm_rook_2019
##
## Moran I statistic standard deviate = 4.3896, p-value = 5.678e-06
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.0954011599 -0.0322580645 0.0008457681
El p value es menor al 0.05, lo que nos dice que la variable sí es estadísticamente significativa, y el Moran I statistic es mayor al 0.05 indicando que sí hay una autocorrelación espacial positiva. Sí podemos ver un patrón espacial en la población.
moran.test(datos_mapa_2021$pop_density, sswm_rook_2021)
##
## Moran I test under randomisation
##
## data: datos_mapa_2021$pop_density
## weights: sswm_rook_2021
##
## Moran I statistic standard deviate = 4.3771, p-value = 6.014e-06
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.0961032264 -0.0322580645 0.0008599994
El p value es menor al 0.05, y el moran I statistic es mayor al 0.05, esto nos dice que la variable es estadísticamente significativa y cuenta con una autocorrelación espacial positiva. Hay un patrón espacial con la población.
moran.test(datos_mapa_2019$unemployment, sswm_rook_2019)
##
## Moran I test under randomisation
##
## data: datos_mapa_2019$unemployment
## weights: sswm_rook_2019
##
## Moran I statistic standard deviate = 0.3703, p-value = 0.3556
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.01231655 -0.03225806 0.01449003
El p value es mayor al 0.05 lo cual nos dice que no es estadísticamente significativa, el moran I statistic es menor al 0.05, esto nos indica que no hay autocorrelación espacial positiva. No hay un patrón espacial en la tasa de desempleo.
moran.test(datos_mapa_2021$unemployment, sswm_rook_2021)
##
## Moran I test under randomisation
##
## data: datos_mapa_2021$unemployment
## weights: sswm_rook_2021
##
## Moran I statistic standard deviate = 0.42545, p-value = 0.3353
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.02115556 -0.03225806 0.01576216
El p value es mayor al 0.05, esto nos dice que no es estadísticamente significativa. El Moran I statistic es menor al 0.05 lo cual indica que no hay una autocorrelación espacial positiva.
moran.test(datos_mapa_2019$college_education, sswm_rook_2019)
##
## Moran I test under randomisation
##
## data: datos_mapa_2019$college_education
## weights: sswm_rook_2019
##
## Moran I statistic standard deviate = 1.7495, p-value = 0.0401
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.18905303 -0.03225806 0.01600201
El p value es menor al 0.05, esto nos indica que sí es estadísticamente significativa. El Moran I statistic es mayor al 0.05 lo cual indica que sí hay una autocorrelación espacial positiva. Hay un patrón espacial con los niveles de educación universitarias.
moran.test(datos_mapa_2021$college_education, sswm_rook_2021)
##
## Moran I test under randomisation
##
## data: datos_mapa_2021$college_education
## weights: sswm_rook_2021
##
## Moran I statistic standard deviate = 2.1721, p-value = 0.01492
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.24108508 -0.03225806 0.01583643
El p value es menor al 0.05, esto nos indica que sí es estadísticamente significativa. El Moran I statistic es mayor al 0.05 lo cual indica que sí existe una autocorrelación espacial positiva. La educación universitaria se encuentra estar espacialmente agrupada.
Detectar la presencia de autocorrelación espacial local para cada una de las variables seleccionadas. Identificar la posible presencia de clústers locales / regionales para cada una de las variables seleccionadas.
Para esta siguiente sección se tomaron en cuenta únicamente las variables previamente identificadas como relevantes y con significancia estadística para cada año.
datos_mapa_2019$sp_lag_new_fdi_real_mxn <- lag.listw(sswm_rook_2019, datos_mapa_2019$new_fdi_real_mxn, zero.policy=TRUE)
datos_mapa_2019$sp_lag_college_education <- lag.listw(sswm_rook_2019, datos_mapa_2019$college_education, zero.policy=TRUE)
datos_mapa_2019$sp_lag_pop_density <- lag.listw(sswm_rook_2019, datos_mapa_2019$pop_density, zero.policy=TRUE)
fdi_lag <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "sp_lag_new_fdi_real_mxn", palette="Blues", style="quantile", n=8, title="MXN FDI Inflows") +
tm_layout(main.title= 'Clusters of New FDI Inflows 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
education_lag <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "sp_lag_college_education", palette="OrRd", style="quantile", n=8, title="College Education") +
tm_layout(main.title= 'Clusters of College Education 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
pop_den_lag <- tm_shape(datos_mapa_2019) +
tm_polygons(col = "sp_lag_pop_density", palette="Blues", style="quantile", n=8, title="Population Density") +
tm_layout(main.title= 'Clusters of Population Density 2019', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
# tmap_arrange (2019)
tmap_arrange(fdi, fdi_lag, education, education_lag, pop_den, pop_den_lag, ncol = 2)
El cluster de la variable New FDI del año 2019 demuestra que los estados con mayor inversión extranjera son los estados de Tamaulipas, Estado de México y la Ciudad de México. Esto se debe a que el Estado y la Ciudad de México son importantes centros económicos, históricos y culturales, uno siendo la capital y el otro siendo el estado más poblado del país. Así mismo, la inversión en Tamaulipas se puede deber a su zona geográfica y su frontera con Estados Unidos. Por otro lado, los estados más bajos son Chihuahua, Sinaloa y Quintana Roo y esto se puede deber a temas de seguridad en las zonas y su distancia a los principales centros económicos.
El cluster de la variable de College Education demuestra un mayor índice de educación de universidad en la zona norte-occidente del país y Yucatan, esto puede ser por sus conexiones a Estados Unidos, su desarrollo económico y su presencia de universidades. Por otro lado, los estados de Guerrero y Oaxaca demuestran un índice más bajo y esto se puede deber a que son estados con menor desarrollo socioeconómico.
Por último, el cluster de densidad de población demuestra que la región más poblada del país es el centro, ya que como se menciona anteriormente, ahí se concentra la capital del país y es una zona económica, cultural e histórica, sin embargo, eso también se puede deber a que es una zona pequeña para la cantidad de gente que vive en la región. Por otro lado, se puede notar que uno de los estados con menor densidad de población es Chihuahua, que a contrario del centro, es un estado muy grande y esto puede causar a que la densidad sea pequeña.
datos_mapa_2021$sp_lag_college_education <- lag.listw(sswm_rook_2021, datos_mapa_2021$college_education, zero.policy=TRUE)
datos_mapa_2021$sp_lag_pop_density <- lag.listw(sswm_rook_2021, datos_mapa_2021$pop_density, zero.policy=TRUE)
education_lag2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "sp_lag_college_education", palette="OrRd", style="quantile", n=8, title="College Education") +
tm_layout(main.title= 'Clusters of College Education 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
pop_den_lag2 <- tm_shape(datos_mapa_2021) +
tm_polygons(col = "sp_lag_pop_density", palette="Blues", style="quantile", n=8, title="Population Density") +
tm_layout(main.title= 'Clusters of Population Density 2021', title.position = c('right', 'top'), legend.position= c("left", "bottom"), title.size = 1)
# tmap_arrange (2021)
tmap_arrange(education2, education_lag2, pop_den2, pop_den_lag2, ncol = 2)
El cluster del índice de educación de universidad en el país permanece igual que en el año 2019, ya que la cultura de la educación y el desarrollo socioeconómico de la región continua creciendo.
Lo mismo se puede ver en el cluster de densidad de población, es muy similar al de dos años anteriores, ya que el centro es un lugar muy importante para el país y mantiene una población alta debida a la migración tanto de extranjeros como de mexicanos a esta región por distintos factores, especialmente las oportunidades que existen en la capital.
# Visualización de Clusters GeoDa college education 2019
sswm_education <- queen_weights(mx_state_map) # queen spatial weight matrix (alternative format)
lisa_education <- local_moran(sswm_education, datos_mapa_2019["college_education"])
datos_mapa_2019$cluster_education <- as.factor(lisa_education$GetClusterIndicators())
levels(datos_mapa_2019$cluster_education)<-lisa_education$GetLabels()
ggplot(data=datos_mapa_2019) +
geom_sf(aes(fill=cluster_education)) +
ggtitle(label = "College Education 2019", subtitle = "Mexico's States")
Querétaro clasificado como Baja-Alta sugiere que tiene una educación universitaria más baja en comparación con sus vecinos, pero más alta en comparación con el promedio general de los estados mexicanos. Esto podría indicar que Querétaro está relativamente bien posicionado en términos de educación universitaria, pero hay áreas circundantes con niveles más bajos de educación.
Estos estados clasificados como Baja-Baja indican que tienen niveles relativamente bajos de educación universitaria en comparación con sus vecinos y con el promedio general de los estados mexicanos. Esto sugiere que estas regiones pueden enfrentar desafíos en términos de acceso o calidad de la educación universitaria. Estos estados clasificados como Alta-Alta indican que tienen niveles relativamente altos de educación universitaria tanto en ellos mismos como en sus vecinos. Esto sugiere que Baja California y Sonora destacan como regiones con niveles superiores de educación universitaria en comparación con el promedio general de los estados mexicanos y en relación con sus vecinos.
La clasificación no significativa para todos los demás estados sugiere que sus niveles de educación universitaria no difieren significativamente de lo que se esperaría bajo la aleatoriedad espacial. Esto significa que estos estados no muestran un patrón espacial fuerte en términos de educación universitaria en relación con sus vecinos. Es importante considerar el contexto socioeconómico de cada estado al interpretar estos resultados. Factores como la inversión en educación, el acceso a instituciones educativas y las oportunidades laborales pueden influir en los niveles de educación universitaria en cada región.
# Visualización de Clusters GeoDa population density 2019
sswm_pop <- queen_weights(mx_state_map) # queen spatial weight matrix (alternative format)
lisa_pop <- local_moran(sswm_pop, datos_mapa_2019["pop_density"])
datos_mapa_2019$cluster_pop <- as.factor(lisa_pop$GetClusterIndicators())
levels(datos_mapa_2019$cluster_pop)<-lisa_pop$GetLabels()
ggplot(data=datos_mapa_2019) +
geom_sf(aes(fill=cluster_pop)) +
ggtitle(label = "Pop Density 2019", subtitle = "Mexico's States")
Ciudad de México, Morelos y Estado de México - Alta-Alta: Estos estados clasificados como Alta-Alta indican que tienen niveles relativamente altos de densidad de población tanto en ellos mismos como en sus vecinos. Esto sugiere que estas regiones, que son áreas metropolitanas importantes, tienen una alta concentración de población en comparación con el promedio general de los estados mexicanos y en relación con sus vecinos.
Yucatán, Nuevo León, Chihuahua, Durango, Sinaloa y Baja California - Baja-Baja: Estos estados clasificados como Baja-Baja indican que tienen niveles relativamente bajos de densidad de población tanto en ellos mismos como en sus vecinos. Esto sugiere que estas regiones pueden ser menos densamente pobladas en comparación con el promedio general de los estados mexicanos y en relación con sus vecinos.
Resto de los Estados - No Significativos: La clasificación no significativa para el resto de los estados sugiere que sus niveles de densidad de población no difieren significativamente de lo que se esperaría bajo la aleatoriedad espacial. Esto significa que estos estados no muestran un patrón espacial fuerte en términos de densidad de población en relación con sus vecinos.
# Visualización de Clusters GeoDa college education 2021
sswm_education2 <- queen_weights(mx_state_map) # queen spatial weight matrix (alternative format)
lisa_education2 <- local_moran(sswm_education2, datos_mapa_2021["college_education"])
datos_mapa_2021$cluster_education2 <- as.factor(lisa_education2$GetClusterIndicators())
levels(datos_mapa_2021$cluster_education2)<-lisa_education2$GetLabels()
ggplot(data=datos_mapa_2021) +
geom_sf(aes(fill=cluster_education2)) +
ggtitle(label = "College Education 2021", subtitle = "Mexico's States")
Baja California - Alta-Alta: Baja California clasificada como Alta-Alta indica que tiene niveles relativamente altos de educación universitaria tanto en ella misma como en sus vecinos. Esto sugiere que Baja California, y posiblemente sus áreas metropolitanas como Tijuana, tienen una alta concentración de personas con educación universitaria en comparación con el promedio general de los estados mexicanos y en relación con sus vecinos.
Guerrero, Oaxaca y Puebla - Baja-Baja: Estos estados clasificados como Baja-Baja indican que tienen niveles relativamente bajos de educación universitaria tanto en ellos mismos como en sus vecinos. Esto sugiere que Guerrero, Oaxaca y Puebla pueden enfrentar desafíos en términos de acceso o calidad de la educación universitaria en comparación con el promedio general de los estados mexicanos y en relación con sus vecinos.
Resto de los Estados - No Significativos: La clasificación no significativa para el resto de los estados sugiere que sus niveles de educación universitaria no difieren significativamente de lo que se esperaría bajo la aleatoriedad espacial. Esto significa que estos estados no muestran un patrón espacial fuerte en términos de educación universitaria en relación con sus vecinos.
# Visualización de Clusters GeoDa population density 2021
sswm_pop2 <- queen_weights(mx_state_map) # queen spatial weight matrix (alternative format)
lisa_pop2 <- local_moran(sswm_pop2, datos_mapa_2021["pop_density"])
datos_mapa_2021$cluster_pop2 <- as.factor(lisa_pop2$GetClusterIndicators())
levels(datos_mapa_2021$cluster_pop2)<-lisa_pop2$GetLabels()
ggplot(data=datos_mapa_2021) +
geom_sf(aes(fill=cluster_pop2)) +
ggtitle(label = "Pop Density 2021", subtitle = "Mexico's States")
La distribución de la densidad de población en los estados de México muestra una consistencia entre los años 2019 y 2021 en cuanto a la clasificación de los estados en las categorías High-High, Low-Low y No Significativos. Los estados de Ciudad de México, Morelos y Estado de México continúan siendo clasificados como High-High en ambos años, lo que indica una alta concentración de densidad de población en estas regiones.
Del mismo modo, los estados de Yucatán, Nuevo León, Chihuahua, Durango, Sinaloa y Baja California siguen siendo clasificados como Low-Low en ambos años, lo que indica niveles más bajos de densidad de población en estas regiones en comparación con el promedio general.
Los resultados sugieren cierta estabilidad en la distribución espacial de la densidad de población en los estados de México entre los años 2019 y 2021, con algunas regiones manteniendo su clasificación mientras que otras permanecen no significativas en ambos años.
# Cargar nuevas librerías
library(spatialreg)
## Loading required package: Matrix
##
## Attaching package: 'spatialreg'
## The following objects are masked from 'package:spdep':
##
## get.ClusterOption, get.coresOption, get.mcOption,
## get.VerboseOption, get.ZeroPolicyOption, set.ClusterOption,
## set.coresOption, set.mcOption, set.VerboseOption,
## set.ZeroPolicyOption
library(stargazer)
##
## Please cite as:
## Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
library(plm)
##
## Attaching package: 'plm'
## The following objects are masked from 'package:dplyr':
##
## between, lag, lead
library(pspatreg)
# Importar panel dataset
panel_data <- read.csv("/Users/reginaenriquez/Desktop/Act 1/panel_dataset.csv")
summary(panel_data)
## state year state_id new_fdi
## Length:512 Min. :2006 Min. : 888 Min. :-958.11
## Class :character 1st Qu.:2010 1st Qu.:1047 1st Qu.: 59.33
## Mode :character Median :2014 Median :1081 Median : 196.00
## Mean :2014 Mean :1219 Mean : 367.61
## 3rd Qu.:2017 3rd Qu.:1118 3rd Qu.: 429.81
## Max. :2021 Max. :2357 Max. :4724.62
##
## reinv_profits intercom_acc total_fdi crime_rate
## Min. : -55.23 Min. :-796.120 Min. :-405.5 Min. : 1.710
## 1st Qu.: 69.75 1st Qu.: 6.902 1st Qu.: 195.2 1st Qu.: 7.973
## Median : 156.84 Median : 81.315 Median : 493.6 Median : 13.745
## Mean : 370.56 Mean : 207.514 Mean : 945.7 Mean : 21.758
## 3rd Qu.: 400.09 3rd Qu.: 328.062 3rd Qu.:1184.5 3rd Qu.: 25.828
## Max. :4436.22 Max. :1960.580 Max. :8777.9 Max. :181.510
##
## unemployment employment business_activity real_wage
## Min. :0.01000 Min. :0.8900 Min. :-2.980 Min. :239.3
## 1st Qu.:0.03000 1st Qu.:0.9500 1st Qu.:-2.270 1st Qu.:281.1
## Median :0.04000 Median :0.9700 Median :-2.090 Median :304.8
## Mean :0.04326 Mean :0.9632 Mean :-1.868 Mean :312.8
## 3rd Qu.:0.05000 3rd Qu.:0.9700 3rd Qu.:-1.887 3rd Qu.:333.9
## Max. :0.10000 Max. :0.9900 Max. : 2.470 Max. :466.8
##
## real_ave_month_income pop_density good_governance
## Min. :3281 Min. : 7.74 Min. : 0.000
## 1st Qu.:4553 1st Qu.: 39.56 1st Qu.: 0.170
## Median :5247 Median : 61.49 Median : 0.480
## Mean :5384 Mean : 298.49 Mean : 2.219
## 3rd Qu.:6083 3rd Qu.: 149.11 3rd Qu.: 1.258
## Max. :9206 Max. :6195.59 Max. :200.020
##
## ratio_public_investment lq_primary lq_secondary lq_tertiary
## Min. :0.000000 Min. :0.010 Min. :0.3200 Min. :0.7800
## 1st Qu.:0.000000 1st Qu.:0.400 1st Qu.:0.6700 1st Qu.:0.9400
## Median :0.000000 Median :0.740 Median :0.9900 Median :1.0100
## Mean :0.005625 Mean :1.057 Mean :0.9869 Mean :0.9996
## 3rd Qu.:0.010000 3rd Qu.:1.350 3rd Qu.:1.2500 3rd Qu.:1.0700
## Max. :0.030000 Max. :4.700 Max. :1.9900 Max. :1.1800
##
## exchange_rate patents_rate inpc border_distance
## Min. :10.85 Min. : 0.000 Min. : 62.69 Min. : 8.83
## 1st Qu.:12.87 1st Qu.: 0.330 1st Qu.: 74.14 1st Qu.: 613.26
## Median :14.14 Median : 0.800 Median : 85.48 Median : 751.64
## Mean :15.69 Mean : 1.557 Mean : 86.75 Mean : 704.92
## 3rd Qu.:19.38 3rd Qu.: 1.923 3rd Qu.: 99.46 3rd Qu.: 875.76
## Max. :20.52 Max. :13.770 Max. :117.31 Max. :1252.66
## NA's :32
## college_education new_fdi_real_mxn log_new_fdi_real_mxn region_a
## Min. :0.1860 Min. :-15305 Min. :-4.185 Length:512
## 1st Qu.:0.3050 1st Qu.: 1124 1st Qu.: 3.050 Class :character
## Median :0.3530 Median : 3496 Median : 3.544 Mode :character
## Mean :0.3599 Mean : 6587 Mean : 3.192
## 3rd Qu.:0.4140 3rd Qu.: 7558 3rd Qu.: 3.878
## Max. :0.5740 Max. : 91516 Max. : 4.961
##
## region_b trump_election exports
## Min. :1.000 Min. :0.00 Min. : 14707
## 1st Qu.:2.000 1st Qu.:0.00 1st Qu.: 1090699
## Median :3.000 Median :0.00 Median : 4125480
## Mean :3.188 Mean :0.25 Mean :10202997
## 3rd Qu.:4.250 3rd Qu.:0.25 3rd Qu.:16852403
## Max. :5.000 Max. :1.00 Max. :58614915
## NA's :32
pd_frame <- pdata.frame(panel_data, index = c("state", "year"), drop.index = TRUE)
# Especificar el modelo del panel 2019
panel_model_2019 <- new_fdi_real_mxn ~ crime_rate + pop_density + college_education + unemployment
# Estimar el modelo de regresión
non_spatial_panel_model_2019 <- plm(panel_model_2019, data = pd_frame, model = "within", effect = "twoways")
summary(non_spatial_panel_model_2019)
## Twoways effects Within Model
##
## Call:
## plm(formula = panel_model_2019, data = pd_frame, effect = "twoways",
## model = "within")
##
## Balanced Panel: n = 32, T = 16, N = 512
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -51967.33 -2522.85 -521.68 1769.87 50119.88
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## crime_rate -4.6261 21.3899 -0.2163 0.8289
## pop_density 30.9296 20.5189 1.5074 0.1324
## college_education -11717.1570 18391.2743 -0.6371 0.5244
## unemployment -19921.0568 33541.1689 -0.5939 0.5529
##
## Total Sum of Squares: 2.1112e+10
## Residual Sum of Squares: 2.0978e+10
## R-Squared: 0.0063194
## Adj. R-Squared: -0.10146
## F-statistic: 0.732947 on 4 and 461 DF, p-value: 0.5698
# Estimar el modelo de regresión espacial
spatial_panel_model_2019 <- pspatfit(formula = panel_model_2019, data = pd_frame, listw = sswm_rook_2019, demean = FALSE, eff_demean = "twoways", type = "sar", index = c("state", "year"))
##
## Fitting Model...
##
## Time to fit the model: 0.37 seconds
summary(spatial_panel_model_2019)
##
## Call
## pspatfit(formula = panel_model_2019, data = pd_frame, listw = sswm_rook_2019,
## type = "sar", demean = FALSE, eff_demean = "twoways", index = c("state",
## "year"))
##
## Parametric Terms
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.9279e+03 2.0696e+03 2.3811 0.01763 *
## crime_rate -5.2905e+00 1.6602e+01 -0.3187 0.75011
## pop_density 6.4880e+00 3.5911e-01 18.0670 < 2e-16 ***
## college_education -3.0908e+03 4.8728e+03 -0.6343 0.52618
## unemployment 9.3443e+03 2.6902e+04 0.3473 0.72848
## rho 7.4430e-02 4.7211e-02 1.5765 0.11553
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Goodness-of-Fit
##
## EDF Total: 6
## Sigma: 8038.77
## AIC: 9722.67
## BIC: 9748.1