Paso 1: Descargar y leer datos
library(readr)
datos <- read_csv("educacion_ingreso_PR_clean_simulado.csv")
Paso 2: Calcular estadísticas descriptivas (media, mediana y desviacion estándar)
# Desviaciones standar
sd <- apply(datos[, 2:3],2,sd)
sd
## Educacion PIB
## 12.18042 3560.66435
# Cuartiles, media y mediana
mm <- apply(datos[, 2:3],2,summary)
mm
## Educacion PIB
## Min. 7.00000 8232.00
## 1st Qu. 15.50000 11728.50
## Median 22.75000 14065.00
## Mean 24.57179 14580.54
## 3rd Qu. 32.47500 16334.50
## Max. 55.00000 24204.00
Desviación estándar: La desviación estándar en la educación 12.18, lo que indica una alta variabilidad en los niveles de educación entre municipios. Mientras que el PIB la desviación estándar es de 3,560.66, lo cual refleja una gran dispersión en los niveles de ingreso entre municipios.
Media: El promedio de nivel de educación acumulado es por municipio de 24.57. Mientras que el ingreso promedio por municipio es de $14,580.54.
Mediana: La mediana en la variable educación es de 22.75, lo que sugiere que más de la mitad de los municipios tiene una escolaridad menor a ese valor. La mediana en el PIB es de $14,065, lo que indica que más de la mitad de los municipios tiene ingresos por debajo del promedio.
Paso 3: Realizar diagrama de dispersión y analizar su correlación
# Diagrama de dispersión
library(plotly)
plot_ly(data = datos, x = ~Educacion, y = ~PIB, type = 'scatter', mode = 'markers',
marker = list(size = 10, color = ~Educacion, colorscale = 'Viridis')) %>%
layout(title = "Relacion entre Educacion e Ingreso por Municipio",
xaxis = list(title = "Nivel educativo acumulado"),
yaxis = list(title = "PIB per capita"))
# Correlación
cor(datos$Educacion, datos$PIB)
## [1] 0.07062226
A través del gráfico de dispersión y del valor de correlación entendemos que las variables no tienen nigún tipo de correlación. Es decir, el nivel educativo no tiene relación con el ingreso en los municipios de Puerto Rico. Por lo cual interpretamos que un mayor nivel educativo promedio no necesariamente implica un mayor ingreso promedio municipal.
Paso 4: Ajusta una regresion lineal simple
# Modelo de regresión
modelo <- lm(PIB ~ Educacion, data = datos)
summary(modelo)
##
## Call:
## lm(formula = PIB ~ Educacion, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6460.6 -2744.2 -656.2 1693.4 9618.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 14073.26 916.17 15.361 <2e-16 ***
## Educacion 20.64 33.45 0.617 0.539
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3575 on 76 degrees of freedom
## Multiple R-squared: 0.004988, Adjusted R-squared: -0.008105
## F-statistic: 0.381 on 1 and 76 DF, p-value: 0.5389
# PIB va primero dado que queremos analizar si un mayor nivel educativo se asocia con un aumento en el ingreso PIB de los muninicipios.
Paso 5: Interpretar la salida del modelo
H₀: β₁ = 0 → La educación poblacional no tiene efecto sobre el PIB del municipio.
H₁: β₁ ≠ 0 → La educación poblacional sí tiene efecto sobre el PIB del municipio.
De la salida del modelo interpretamos que no hay relación significativa entre ambas variables dado que el p-value = 0.54. El β₁ indica que, por cada 1 unidad adicional en la variable educación (X), el PIB estimado aumentaría en $20.64, pero como este efecto no es significativo no se puede afirmar que exista realmente esa relación.