Utilizamos dos variables cuantitativas x e y, Número de libros (x) y Tiempo en meses (y).
# Cantidad de libros escritos en incrementos de 100
x<-c(100,200,300,400,490)
# Tiempo de meses
y<-c(237,350,419,465,507)
k<-data.frame(x,y)
n=5
Se calculó los valores estimados de los coeficientes b0 y b1 utilizando las fórmulas:
Sxy= (sum((x-mean(x))*(y-mean(y))))/n
S2x= (sum((x-mean(x))^2))/n
b1= Sxy/S2x
b0=mean(y)-(b1*mean(x))
b1
## [1] 0.6701291
b0
## [1] 195.9015
b0=195.9015 y b1= 0.6701291 Verificamos usando la función coef()
lm(y ~ x) -> modelo
modelo |> coef()
## (Intercept) x
## 195.9015404 0.6701291
b0=195.9015 Es la media del Tiempo que se toma el escritor cuando no escribe libros.
Por cada incremento de libros que genera el escritor, el tiempo promedio se incrementa en 0.6701291.
modelo |> aov() |> summary()
## Df Sum Sq Mean Sq F value Pr(>F)
## x 1 43147 43147 69.58 0.00361 **
## Residuals 3 1860 620
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalue=pf(69.58,1,3,lower.tail = F)
pvalue
## [1] 0.003611757
Fcrit = qf(1-0.10,1,3)
Fcrit
## [1] 5.538319
Obtenemos Fcalc > Fcrit y pvalor < 0.10. Entonces se rechaza la hipótesis nula.
Podemos decir que existe evidencia estadística para indicar que el tiempo depende de la cantidad libros escritos a un nivel de significancia del 10%.