IMPORTAMOS BASE
library(rio)
IDHbase= import("IDH_base.sav")
PAQUETES PARA INSTALAR: install.packages(“car”) install.packages(“stringi”) install.packages(“rio”) install.packages(“corrplot”) install.packages(“DescTools”) install.packages(“lm.beta”) install.packages(“lmtest”) install.packages(“stargazer”)
#ACTIVAR LIBRERÍAS
library(car)
## Loading required package: carData
library(corrplot)
## corrplot 0.92 loaded
library(DescTools)
##
## Attaching package: 'DescTools'
## The following object is masked from 'package:car':
##
## Recode
library(lm.beta)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(rio)
library(stargazer)
##
## Please cite as:
## Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
#PARA CREAR EL MODELO DE REGRESIÓN NECESITO EL NOMBRE DE LAS VARAIABLES
names(IDHbase)
## [1] "Distrito" "IDH" "EV" "PESC" "PAE" "IPEA"
#PARA UNA LINEAL dependiente independiente modelo <- lm(competitividad\(casos_100k ~ competitividad\)var5) summary(modelo)
modelo <- lm(IDHbase$IDH~IDHbase$EV+IDHbase$PESC+IDHbase$PAE+IDHbase$IPEA)
summary(modelo)
##
## Call:
## lm(formula = IDHbase$IDH ~ IDHbase$EV + IDHbase$PESC + IDHbase$PAE +
## IDHbase$IPEA)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.115921 -0.007664 0.005603 0.013357 0.022839
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -9.254e-02 6.510e-03 -14.21 <2e-16 ***
## IDHbase$EV 2.280e-03 9.050e-05 25.20 <2e-16 ***
## IDHbase$PESC 1.479e-03 3.081e-05 48.00 <2e-16 ***
## IDHbase$PAE 1.117e-02 4.700e-04 23.76 <2e-16 ***
## IDHbase$IPEA 3.121e-04 2.978e-06 104.80 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.01945 on 1829 degrees of freedom
## (420 observations deleted due to missingness)
## Multiple R-squared: 0.9777, Adjusted R-squared: 0.9776
## F-statistic: 2.004e+04 on 4 and 1829 DF, p-value: < 2.2e-16
1)VALIDEZ DEL MODELO: p-value: < 2.2e-16 –> menor a 0.05, se rechaza H0, sí es válido 2)EXPLICACIÓN DEL MODELO: RMÚLTIPLE: El modelo explica en un 97%. 3)VARIABLES QUE APORTAN AL MODELO (INDICAR EN QUÉ ORDEN): Todas, porque su P value es mayor a 0.05, y de acuerdo a los *** se señala su gran aporte al modelo. 4)COEFICIENTES: Y=-9.254e-02 + 2.280e-03(X1) + 1.479e-03(X2) + 1.117e-02(X3) + 3.121e-04(X4) +0.01945
AHORA SELECCIONA UN DISTRITO
EJEMPLO DE SELECCIÓN usando filter:
d1<-data %>% filter(idenpa ==“604”)
IDHbase %>% group_by(VARIABLE1)%>%summarise(confianza1=mean(VARIABLE 2.1),confianza2=mean(P13STGBS_B),confianza3=mean(p13st_c),confianza4=mean(p13st_d),confianza5=mean(p13st_e),confianza6=mean(p13st_f),confianza7=mean(p13st_g),confianza8=mean(p13st_h),confianza9=mean(p13st_i)
FILTRAR EL DISTRITO DE JESÚS MARÍA 1261 #horizontal
library("dplyr")
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
##
## recode
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
d1<-IDHbase %>% filter(Distrito=="Jesus Maria")
head(d1)
## Distrito IDH EV PESC PAE IPEA
## 1 Jesus Maria 0.7571604 79.50948 85.61644 13.42075 1442.046
PARA EL DISTRITO DE JESUS MARIA: ESTOS SERÍAN LOS X: 79.50948 85.61644 13.42075 1442.046
Y=-9.254e-02 + 2.280e-03(79.50948) + 1.479e-03(85.61644) + 1.117e-02( 13.42075) + 3.121e-04(1442.046) +0.01945
-9.254e-02 + 2.280e-03*(79.50948) + 1.479e-03*(85.61644) + 1.117e-02*( 13.42075) + 3.121e-04*(1442.046) +0.01945
## [1] 0.8347907
¿Qué predice la regresión para el valor de Y? Y= “0.8347907”
A partir de esta regresión se predice que el índice de desarrollo humano del distrito de Jesús María resulta en un 0.8347907. Teniendo en cuenta que el IDH del distrito de Jesús María es, según la base de datos, 0.7571604, podemos decir que el valor obtenido a partir del modelo de regresión se aleja del valor observado en apenas 0.7571604. El residuo es -0.0776867, pues el valor observado resulta menor al esperado. A modo resumen, el valor del residuo resulta sumamente pequeño, por tanto podemos afirmar que nuestro modelo de regresión tiene un fuerte porcentaje de explicación. Para ser exactos, el modelo presente posee un 97% de explicación del índice de desarrollo humano, con lo cual se colige que existen otros factores/variables que, si ien no fueron recogidas por la base de datos, explican el 3% restante.
VERIFICACIÓN DE LOS SUSPUESTOS: