library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "ggplot2", "tidyr", "plotly", "DT")
setwd("~/PyE")Importar datos
grasas <- read.table("http://verso.mat.uam.es/~joser.berrendero/datos/EdadPesoGrasas.txt", header= TRUE)
names(grasas)## [1] "peso" "edad" "grasas"
U4A2
- Ajusta el modelo que explica la cantidad de grasas en función del peso.
- Calcula y representa gráficamente la recta de regresión, junto con la correspondiente nube de puntos.
- ¿Cuánto vale el coeficiente de correlación al cuadrado en este caso?
##
## Call:
## lm(formula = grasas ~ peso, data = grasas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -127.729 -53.686 -9.239 46.537 128.404
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 199.298 85.818 2.322 0.0294 *
## peso 1.622 1.229 1.320 0.2000
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 76.65 on 23 degrees of freedom
## Multiple R-squared: 0.07038, Adjusted R-squared: 0.02996
## F-statistic: 1.741 on 1 and 23 DF, p-value: 0.2
A partir de la salida anterior, vemos que su valor en este caso es Multiple R-squared: 0.07038.
¿Cuánto valen los estimadores de todos los parámetros del modelo? los estimadores de los parámetros β0 y β1 se encuentran en la columna Std Error de la salida anterior. En este caso sus valores son 85.818 y 1.229 respectivamente.
Contrasta la hipótesis de que la pendiente de la recta es cero a nivel 0.05. En este caso podemos observar que H0:β0=.0294 H1:β1=.2000 Por lo tanto la hipotésis H0 se acepta y la hipotésis H1 se rechaza.
Calula un intervalo de confianza para la pendiente de la recta de nivel 90%.
## 5 % 95 %
## (Intercept) 52.2166142 346.378389
## peso -0.4847468 3.729432
- Calcula y representa los intervalos de confianza al 95% de la cantidad de grasas media para los individuos entre 30 y 90 kg. Lleva a cabo el diagnóstico del modelo
## 2.5 % 97.5 %
## (Intercept) 21.7696109 376.825392
## peso -0.9209324 4.165618
plot(grasas$peso, grasas$grasas, xlab="Peso", ylab="Grasas")
abline(regresion)
#Intervalos de confianza de la respuesta media
#ic es una matriz de tres columnas: la primera es la predicción, las otras son los extremos del intervalo
ic <- predict(regresion, nuevospesos, interval="confidence" )
lines(nuevospesos$peso, ic[, 2], lty =2, col="red" )
lines(nuevospesos$peso, ic[, 3], lty =2, col="red" )- Diagnostico del modelo
residuos <- rstandard(regresion)
valores.ajustados <- fitted(regresion)
plot(valores.ajustados, residuos)Dado que los puntos están bastante alineados, la normalidad también parece aceptable.
Para esta asignacion reforzamos lo visto en clase sobre la recta de regresion y como diagnosticar modelos mediante rstandar, qqnorm y qqline.