Variables de estudio

Utilizamos dos variables cuantitativas x e y, Número de libros (x) y Tiempo en meses (y).

# Cantidad de libros escritos en incrementos de 100
x<-c(100,200,300,400,490)
        
# Tiempo de meses 
y<-c(237,350,419,465,507)

k<-data.frame(x,y)
n=5

Estimación de coeficientes

Se calculó los valores estimados de los coeficientes b0 y b1 utilizando las fórmulas:

Sxy= (sum((x-mean(x))*(y-mean(y))))/n
S2x= (sum((x-mean(x))^2))/n

b1= Sxy/S2x
b0=mean(y)-(b1*mean(x))

b1
## [1] 0.6701291
b0
## [1] 195.9015

b0=195.9015 y b1= 0.6701291 Verificamos usando la función coef()

lm(y ~ x) -> modelo
modelo |> coef()
## (Intercept)           x 
## 195.9015404   0.6701291

Interpretación

b0=195.9015 Es la media del Tiempo que se toma el escritor cuando no escribe libros.

Por cada incremento de libros que genera el escritor, el tiempo promedio se incrementa en 0.6701291.

Prueba de Hipótesis

aov y summary

modelo |> aov() |>  summary()
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## x            1  43147   43147   69.58 0.00361 **
## Residuals    3   1860     620                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Pvalor

pvalue=pf(69.58,1,3,lower.tail = F)
pvalue
## [1] 0.003611757

Valor crítico

Fcrit = qf(1-0.10,1,3)
Fcrit
## [1] 5.538319

Interpretación

Obtenemos Fcalc > Fcrit y pvalor < 0.10. Entonces se rechaza la hipótesis nula.

Podemos decir que existe evidencia estadística para indicar que el tiempo depende de la cantidad libros escritos a un nivel de significancia del 10%.