library(rio)
admit="https://raw.githubusercontent.com/luciana1091/clase1/main/dataAdmit%20-%20dataAdmit.csv"
admit=import(admit)
mort="https://raw.githubusercontent.com/luciana1091/clase1/main/mortalidad%20-%20datos.csv"
mort=import(mort)
str(admit)
## 'data.frame':    400 obs. of  4 variables:
##  $ admitido : chr  "no" "si" "si" "si" ...
##  $ gre      : int  380 660 800 640 520 760 560 400 540 700 ...
##  $ gpa      : num  3.61 3.67 4 3.19 2.93 3 2.98 3.08 3.39 3.92 ...
##  $ prestigio: chr  "Bajo" "Bajo" "MuyAlto" "MuyBajo" ...
admit$gre=as.numeric(admit$gre)
admit = admit[complete.cases(admit),]
mort= mort[complete.cases(mort),]

ETR = "https://raw.githubusercontent.com/luciana1091/clase1/main/ETR_2022.csv"
ETR=import(ETR)
GPI = "https://raw.githubusercontent.com/luciana1091/clase1/main/GPI-2022.csv"
GPI= import(GPI)
str(ETR)
## 'data.frame':    314 obs. of  49 variables:
##  $ V1 : chr  "" "" "" "Country" ...
##  $ V2 : chr  "" "" "" "Food Risk Score" ...
##  $ V3 : chr  "" "" "" "Natural Disasters Score" ...
##  $ V4 : chr  "" "" "" "Rapid Population Growth Score" ...
##  $ V5 : chr  "" "" "" "Water Risk Score" ...
##  $ V6 : logi  NA NA NA NA NA NA ...
##  $ V7 : logi  NA NA NA NA NA NA ...
##  $ V8 : logi  NA NA NA NA NA NA ...
##  $ V9 : logi  NA NA NA NA NA NA ...
##  $ V10: logi  NA NA NA NA NA NA ...
##  $ V11: logi  NA NA NA NA NA NA ...
##  $ V12: logi  NA NA NA NA NA NA ...
##  $ V13: logi  NA NA NA NA NA NA ...
##  $ V14: logi  NA NA NA NA NA NA ...
##  $ V15: logi  NA NA NA NA NA NA ...
##  $ V16: logi  NA NA NA NA NA NA ...
##  $ V17: logi  NA NA NA NA NA NA ...
##  $ V18: logi  NA NA NA NA NA NA ...
##  $ V19: logi  NA NA NA NA NA NA ...
##  $ V20: logi  NA NA NA NA NA NA ...
##  $ V21: logi  NA NA NA NA NA NA ...
##  $ V22: logi  NA NA NA NA NA NA ...
##  $ V23: logi  NA NA NA NA NA NA ...
##  $ V24: logi  NA NA NA NA NA NA ...
##  $ V25: logi  NA NA NA NA NA NA ...
##  $ V26: logi  NA NA NA NA NA NA ...
##  $ V27: logi  NA NA NA NA NA NA ...
##  $ V28: logi  NA NA NA NA NA NA ...
##  $ V29: logi  NA NA NA NA NA NA ...
##  $ V30: logi  NA NA NA NA NA NA ...
##  $ V31: logi  NA NA NA NA NA NA ...
##  $ V32: logi  NA NA NA NA NA NA ...
##  $ V33: logi  NA NA NA NA NA NA ...
##  $ V34: logi  NA NA NA NA NA NA ...
##  $ V35: logi  NA NA NA NA NA NA ...
##  $ V36: logi  NA NA NA NA NA NA ...
##  $ V37: logi  NA NA NA NA NA NA ...
##  $ V38: logi  NA NA NA NA NA NA ...
##  $ V39: logi  NA NA NA NA NA NA ...
##  $ V40: logi  NA NA NA NA NA NA ...
##  $ V41: logi  NA NA NA NA NA NA ...
##  $ V42: logi  NA NA NA NA NA NA ...
##  $ V43: logi  NA NA NA NA NA NA ...
##  $ V44: logi  NA NA NA NA NA NA ...
##  $ V45: logi  NA NA NA NA NA NA ...
##  $ V46: logi  NA NA NA NA NA NA ...
##  $ V47: logi  NA NA NA NA NA NA ...
##  $ V48: logi  NA NA NA NA NA NA ...
##  $ V49: logi  NA NA NA NA NA NA ...
ETR=ETR[,c(1:5)] # just what is needed
ETR=ETR[,c(1:5)] # just what is needed
newNames=c('Country','FoodRisk','NaturalD','RPGrowth','WaterS')
names(ETR)=newNames
ETR=ETR[-c(1:4),] # just what is needed
ETR=ETR[c(1:232),] # just what is needed
ETR=ETR[-c(233:236),] # just what is needed
mean(admit$gre)
## [1] 587.7

Si considera un primer modelo donde WaterRisk tiene como predictores a RapidPopulationGrowth y FoodRisk; y uno segundo donde se propone que RapidPopulationGrowth, FoodRiskSafety y NaturalDisasters explican a WaterRisk. Al analizar ambos concluyes que…

ETR$WaterS=as.numeric(ETR$WaterS)
ETR$FoodRisk=as.numeric(ETR$FoodRisk)
ETR$RPGrowth=as.numeric(ETR$RPGrowth)
modelo1 <- lm(WaterS~FoodRisk+RPGrowth,data=ETR)
library(modelsummary)
modelO1=list(modelo1)
modelsummary(modelO1,
             stars = TRUE)
Model 1
(Intercept) 1.107***
(0.156)
FoodRisk 0.637***
(0.066)
RPGrowth 0.202***
(0.056)
Num.Obs. 228
R2 0.543
R2 Adj. 0.539
AIC 659.2
BIC 672.9
Log.Lik. −325.613
F 133.611
RMSE 1.01
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
ETR$NaturalD=as.numeric(ETR$NaturalD)
modelo2<- lm(WaterS ~ FoodRisk+RPGrowth+NaturalD, data= ETR)
model2=list(modelo2)
modelsummary(model2,
             stars = TRUE)
Model 1
(Intercept) 0.556**
(0.186)
FoodRisk 0.620***
(0.063)
RPGrowth 0.159**
(0.054)
NaturalD 0.209***
(0.043)
Num.Obs. 228
R2 0.587
R2 Adj. 0.581
AIC 638.2
BIC 655.3
Log.Lik. −314.086
F 106.057
RMSE 0.96
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
modelos=list(modelo1,modelo2)
modelsummary(modelos,
             stars = TRUE)
Model 1 Model 2
(Intercept) 1.107*** 0.556**
(0.156) (0.186)
FoodRisk 0.637*** 0.620***
(0.066) (0.063)
RPGrowth 0.202*** 0.159**
(0.056) (0.054)
NaturalD 0.209***
(0.043)
Num.Obs. 228 228
R2 0.543 0.587
R2 Adj. 0.539 0.581
AIC 659.2 638.2
BIC 672.9 655.3
Log.Lik. −325.613 −314.086
F 133.611 106.057
RMSE 1.01 0.96
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(kableExtra)
resBP=bptest(modelo2)
data.frame(list('BP'=resBP$statistic,
             'df'=resBP$parameter,
             "p-value"=resBP$p.value))%>%
    kable(caption = resBP$method)%>%kable_styling(full_width = F)
studentized Breusch-Pagan test
BP df p.value
BP 5.911735 3 0.1159844