library(readxl)
## Warning: package 'readxl' was built under R version 4.0.4
ventas <- read_excel("C:/Users/Claudia Gallo/Desktop/Bioestadistica/ventas.xlsx")
ventas
## # A tibble: 15 x 3
## vendedor clientes ventas
## <dbl> <dbl> <dbl>
## 1 1 96 41
## 2 2 40 41
## 3 3 104 51
## 4 4 128 60
## 5 5 164 61
## 6 6 76 29
## 7 7 72 39
## 8 8 80 50
## 9 9 36 28
## 10 10 84 43
## 11 11 180 70
## 12 12 132 56
## 13 13 120 45
## 14 14 44 31
## 15 15 84 30
Se observa que la base de datos contiene información sobre el registro de las ventas (y) de unos vendedores de acuerdo al total de clientes (x) que contactó.
Se observa que el promedio de clientes que contacta un vendedor es de 96, mientras que el promedio de ventas es de 45 produtos.
attach(ventas)
## The following object is masked _by_ .GlobalEnv:
##
## ventas
summary(ventas)
## vendedor clientes ventas
## Min. : 1.0 Min. : 36 Min. :28.0
## 1st Qu.: 4.5 1st Qu.: 74 1st Qu.:35.0
## Median : 8.0 Median : 84 Median :43.0
## Mean : 8.0 Mean : 96 Mean :45.0
## 3rd Qu.:11.5 3rd Qu.:124 3rd Qu.:53.5
## Max. :15.0 Max. :180 Max. :70.0
hist(clientes,col="gray",main="Histograma de clientes",ylab="Frecuencia",xlab="Clientes")
Veamos la correlación entre ventas y clientes. Se observa que a mayor cantidad de clientes contactados las ventas aumentan y su relación es fuerte de acuerdo con el coeficiente de correlación de Pearson (0.86).
plot(clientes,ventas$ventas,main="Correlación entre ventas y clientes",ylab="Ventas",xlab="Clientes")
cor(clientes,ventas$ventas)
## [1] 0.8646318
Se observa que el coeficiente \(\beta_0\) no se debe interpretar porque no se observan valores de clientes cero. Por otro lado, el \(\beta_1=0.26\) indica que por cada cliente adicional que se contacte las ventas se incrementan en 0.26. Adicionalmente se observa que el coeficiente es significativamente distinto de cero. Se observa que el ajuste del modelo es de \(R^2=0.7476\), es decir que el modelo explica el 74% de la variabilidad de las ventas.
mod=lm(ventas~clientes,data=ventas)
summary(mod)
##
## Call:
## lm(formula = ventas ~ clientes, data = ventas)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.873 -2.861 0.255 3.511 10.595
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.9800 4.3897 4.552 0.000544 ***
## clientes 0.2606 0.0420 6.205 3.19e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared: 0.7476, Adjusted R-squared: 0.7282
## F-statistic: 38.5 on 1 and 13 DF, p-value: 3.193e-05
Podemos observar con respecto a los supuestos sobre el error \(e_i\) lo siguiente:
par(mfrow=c(2,2))
plot(mod)
¿Cuáles serían las ventas promedio esperadas para un vendedor que logre contactar un total de 60 clientes?
De acuerdo con el modelo las ventas promedio estimadas para este vendedor son de 35.
¿Si este vendedor logra un total de 50 ventas considera que esto es destacado en comparación con otros posibles vendedores?
Teniendo en cuenta que un vendedor que contacta 60 clientes en promedio logra ventas de entre 30 y 40 productos, podemos destacar el éxito que tiene el vendedor al lograr un total de 50. Es decir, se podría considerar como un vendedor que tiene un éxito mayor en ventas en terminos de clientes contactados (rendimiento).
predict(mod,list(clientes=60))
## 1
## 35.6175
predict(mod,list(clientes=60),interval="confidence",level=0.95)
## fit lwr upr
## 1 35.6175 30.64529 40.58971