#DATOS
#Banco de datos para análisis estadísticos y visualización
library(datarium)
#VARIABLES De la lista de datos “stress” elegimos las variables
X <- c(stress$age)
Y <- c(stress$score)
plot(stress$age, stress$score, xlab='Edad', ylab='Nivel de Colesterol')
#1. ESTIMACION DE LOS COEFICIENTES DE LA ECUACION DE REGRESION
promx <- mean(X)
promy <- mean(Y)
n <- length(X)
sumxy <- sum((X-promx)*(Y-promy))/n
sumx2 <- sum((X-promx)^2)/n
sumy2 <- sum((Y-promy)^2)/n
b1 <- sumxy/sumx2
b0 <- promy-(b1*promx)
b1
## [1] 0.9878485
b0
## [1] 25.35515
Comprobación
lm(Y ~ X) -> modelo
modelo |> coef()
## (Intercept) X
## 25.3551486 0.9878485
Interpretación:
#2. PRUEBA DE HIPOTESIS
Nivel de significancia: α = 2%
modelo |> aov() |> summary()
## Df Sum Sq Mean Sq F value Pr(>F)
## X 1 1094 1093.8 22.7 1.31e-05 ***
## Residuals 58 2794 48.2
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor = 0.000
Comprobación
Fcalculada = 22.7
pvalor=pf(Fcalculada,1,58,lower.tail = FALSE)
pvalor
## [1] 1.309068e-05
Fcritico = qf(0.02, 1, 58, lower.tail=FALSE)
Fcritico
## [1] 5.72347