Haremos uso de la data perteneciente a rstudio “mtcars”, donde seleccionamos las variables mpg (millas/galón) y disp (distancia recorrida) para hacer el análisis correspondiente.
datos <- mtcars %>% select(mpg,disp)
datos
## mpg disp
## Mazda RX4 21.0 160.0
## Mazda RX4 Wag 21.0 160.0
## Datsun 710 22.8 108.0
## Hornet 4 Drive 21.4 258.0
## Hornet Sportabout 18.7 360.0
## Valiant 18.1 225.0
## Duster 360 14.3 360.0
## Merc 240D 24.4 146.7
## Merc 230 22.8 140.8
## Merc 280 19.2 167.6
## Merc 280C 17.8 167.6
## Merc 450SE 16.4 275.8
## Merc 450SL 17.3 275.8
## Merc 450SLC 15.2 275.8
## Cadillac Fleetwood 10.4 472.0
## Lincoln Continental 10.4 460.0
## Chrysler Imperial 14.7 440.0
## Fiat 128 32.4 78.7
## Honda Civic 30.4 75.7
## Toyota Corolla 33.9 71.1
## Toyota Corona 21.5 120.1
## Dodge Challenger 15.5 318.0
## AMC Javelin 15.2 304.0
## Camaro Z28 13.3 350.0
## Pontiac Firebird 19.2 400.0
## Fiat X1-9 27.3 79.0
## Porsche 914-2 26.0 120.3
## Lotus Europa 30.4 95.1
## Ford Pantera L 15.8 351.0
## Ferrari Dino 19.7 145.0
## Maserati Bora 15.0 301.0
## Volvo 142E 21.4 121.0
Donde:
a <- datos$mpg
b <- datos$disp
ma <- mean(a)
mb <- mean(b)
n <- length(a)
s2x <- (sum((a-ma)^2))/n
s2y <- (sum((b-mb)^2))/n
sxy <- (sum((a-ma)*(b-mb)))/n
B1 <- sxy/s2x
B0 <- mb-(B1*ma)
B1
## [1] -17.4
B0
## [1] 581
Obtenemos \(B_{1}= -17.4\) y \(B_{0}=581\). Verificamos:
lm(b ~ a) -> dat
dat|> coef()
## (Intercept) a
## 580.9 -17.4
Gracias a los datos obtenidos manuelamente, y usando los comandos, podemos inferir que:
Empleamos el comando aov y summary:
dat %>% aov() %>% summary()
## Df Sum Sq Mean Sq F value Pr(>F)
## a 1 342064 342064 76.5 0.00000000094 ***
## Residuals 30 134121 4471
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Gracias a los comandos utilizados, corroboramos el pvalor y hallar el ftab (fcrítico):
pvalor=pf(76.5,1,30,lower.tail = FALSE)
pvalor
## [1] 0.00000000094
fcrit= qf(0.90,1,30)
fcrit
## [1] 2.88
Nos resulta un \(pvalor < 0.1\) y \(Fcrítico < Fcal\), dado ambos resultados, concluimos que se rechaza la hipótesis nula.
A un nivel de significancia de 0.1 tenemos suficiente evidencia estadística para afirmar \(B_{1} dif 0\). Las millas por galón tienen una dependecia con la distancia recorrida.