1 Introducción

Haremos uso de la data perteneciente a rstudio “mtcars”, donde seleccionamos las variables mpg (millas/galón) y disp (distancia recorrida) para hacer el análisis correspondiente.

2 Inserción del Conjunto de Datos

datos <- mtcars %>% select(mpg,disp)
datos
##                      mpg  disp
## Mazda RX4           21.0 160.0
## Mazda RX4 Wag       21.0 160.0
## Datsun 710          22.8 108.0
## Hornet 4 Drive      21.4 258.0
## Hornet Sportabout   18.7 360.0
## Valiant             18.1 225.0
## Duster 360          14.3 360.0
## Merc 240D           24.4 146.7
## Merc 230            22.8 140.8
## Merc 280            19.2 167.6
## Merc 280C           17.8 167.6
## Merc 450SE          16.4 275.8
## Merc 450SL          17.3 275.8
## Merc 450SLC         15.2 275.8
## Cadillac Fleetwood  10.4 472.0
## Lincoln Continental 10.4 460.0
## Chrysler Imperial   14.7 440.0
## Fiat 128            32.4  78.7
## Honda Civic         30.4  75.7
## Toyota Corolla      33.9  71.1
## Toyota Corona       21.5 120.1
## Dodge Challenger    15.5 318.0
## AMC Javelin         15.2 304.0
## Camaro Z28          13.3 350.0
## Pontiac Firebird    19.2 400.0
## Fiat X1-9           27.3  79.0
## Porsche 914-2       26.0 120.3
## Lotus Europa        30.4  95.1
## Ford Pantera L      15.8 351.0
## Ferrari Dino        19.7 145.0
## Maserati Bora       15.0 301.0
## Volvo 142E          21.4 121.0

Donde:

  • mpg: Millas/galón
  • disp: Desplazamiento

3 Estimación de coeficientes de ecuación de regresión

a <-  datos$mpg
b <-  datos$disp

ma <- mean(a)
mb <- mean(b)
n <- length(a)

s2x <- (sum((a-ma)^2))/n
s2y <- (sum((b-mb)^2))/n
sxy <- (sum((a-ma)*(b-mb)))/n
B1 <- sxy/s2x
B0 <- mb-(B1*ma)
B1
## [1] -17.4
B0
## [1] 581

Obtenemos \(B_{1}= -17.4\) y \(B_{0}=581\). Verificamos:

lm(b ~ a) -> dat
dat|> coef()
## (Intercept)           a 
##       580.9       -17.4

3.1 Interpretación

Gracias a los datos obtenidos manuelamente, y usando los comandos, podemos inferir que:

  • Cuando no hemos realizado desplazamiento, obtenemos un promedio de millas por galon de \(B_{0}=580.9\)
  • Cuando el desplazamiento incrementa en una unidad, ejerce una disminución en el promedio de las millas por galón de 17.4.

4 Prueba de Hipótesis

Empleamos el comando aov y summary:

dat %>%  aov() %>%  summary()
##             Df Sum Sq Mean Sq F value        Pr(>F)    
## a            1 342064  342064    76.5 0.00000000094 ***
## Residuals   30 134121    4471                          
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Gracias a los comandos utilizados, corroboramos el pvalor y hallar el ftab (fcrítico):

pvalor=pf(76.5,1,30,lower.tail = FALSE)
pvalor
## [1] 0.00000000094
fcrit= qf(0.90,1,30)
fcrit
## [1] 2.88

4.1 Gráfico

4.2 Interpretación

Nos resulta un \(pvalor < 0.1\) y \(Fcrítico < Fcal\), dado ambos resultados, concluimos que se rechaza la hipótesis nula.

A un nivel de significancia de 0.1 tenemos suficiente evidencia estadística para afirmar \(B_{1} dif 0\). Las millas por galón tienen una dependecia con la distancia recorrida.