#DATOS

#Banco de datos para análisis estadísticos y visualización
library(datarium)

#VARIABLES De la lista de datos “stress” elegimos las variables

X <- c(stress$age)
Y <- c(stress$score)
plot(stress$age, stress$score, xlab='Edad', ylab='Nivel de Colesterol')

#1. ESTIMACION DE LOS COEFICIENTES DE LA ECUACION DE REGRESION

promx <- mean(X)
promy <- mean(Y)
n <- length(X)
  
sumxy <- sum((X-promx)*(Y-promy))/n
sumx2 <- sum((X-promx)^2)/n
sumy2 <- sum((Y-promy)^2)/n

b1 <- sumxy/sumx2
b0 <- promy-(b1*promx)
b1
## [1] 0.9878485
b0
## [1] 25.35515

Comprobación

lm(Y ~ X) -> modelo
modelo |> coef()
## (Intercept)           X 
##  25.3551486   0.9878485

Interpretación:

#2. PRUEBA DE HIPOTESIS

Nivel de significancia: α = 2%

modelo |> aov() |> summary()
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## X            1   1094  1093.8    22.7 1.31e-05 ***
## Residuals   58   2794    48.2                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor = 0.000

Comprobación

Fcalculada = 22.7
pvalor=pf(Fcalculada,1,58,lower.tail = FALSE)
pvalor
## [1] 1.309068e-05
Fcritico = qf(0.02, 1, 58, lower.tail=FALSE)
Fcritico
## [1] 5.72347
GraficoF