Cargar Datos

## # A tibble: 15 x 3
##    vendedor clientes ventas
##       <dbl>    <dbl>  <dbl>
##  1        1       96     41
##  2        2       40     41
##  3        3      104     51
##  4        4      128     60
##  5        5      164     61
##  6        6       76     29
##  7        7       72     39
##  8        8       80     50
##  9        9       36     28
## 10       10       84     43
## 11       11      180     70
## 12       12      132     56
## 13       13      120     45
## 14       14       44     31
## 15       15       84     30

Se observa que la base de datos contiene información sobre el registro de las ventas (y) de unos asesores de acuerdo al total de clientes (x) que contactó.

Exploratorio

Se observa que el promedio de clientes que contacta un asesor es de 96, mientras el promedio de ventas es de 45 productos.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      36      74      84      96     124     180
##     vendedor       clientes       ventas    
##  Min.   : 1.0   Min.   : 36   Min.   :28.0  
##  1st Qu.: 4.5   1st Qu.: 74   1st Qu.:35.0  
##  Median : 8.0   Median : 84   Median :43.0  
##  Mean   : 8.0   Mean   : 96   Mean   :45.0  
##  3rd Qu.:11.5   3rd Qu.:124   3rd Qu.:53.5  
##  Max.   :15.0   Max.   :180   Max.   :70.0

Veamos la correlación entre clientes y ventas. Se observa que a mayor cantidad de clientes contactados las ventas aumentan y su relación es fuerte de acuerdo con el coeficiente de correlación de Pearson (0.86).

## [1] 0.8646318

Estimación del Modelo Lineal Simple

Se observa que el coeficiente \(\beta_0\) no se debe interpretar porque no se observan valores de clientes cero. Por otro lado, el \(\beta_1=0.26\) nos indica que por cada cliente adicional que se contacte, las centas se incrementan en 0.26. Adicionalmente se observa que el coeficiente es significativamente distinto de cero. Se observa que el ajuste del modelo es de \(R^2=0.7476\), es decir, que el modelo explica el 74% de la variabilidad de las ventas.

## 
## Call:
## lm(formula = ventas ~ clientes, data = ventas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -11.873  -2.861   0.255   3.511  10.595 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  19.9800     4.3897   4.552 0.000544 ***
## clientes      0.2606     0.0420   6.205 3.19e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared:  0.7476, Adjusted R-squared:  0.7282 
## F-statistic:  38.5 on 1 and 13 DF,  p-value: 3.193e-05

Validación de Supuestos

Podemos observar respecto a los supuestos sobre el error \(e_i\) lo siguiente:

  1. Media cero: Se cumple por defecto.
  2. Varianza Constante: Se observa en la gráfica 1 de residuales vs ajustados que el comportamiento es aleatorio sin alguna tendencia en particular que indique problemas. Se valida gráficamente.
  3. Normalidad: Se observa en la gráfica 2 que los datos se ajustan bien a la línea de normalidad en el ggplot. Es decir, se valida gráficamente.
  4. Independencia: Dado que estos registros no corresponden a datos en el tiempo, no se tiene un orden para realizar esta validación de este supuesto. Se valida por definición el tipo de datos transversal.

Predicciones con el Modelo Estimado

¿Cúal sería el promedio de ventas esperadas para un asesor que logre contactar 60 clientes?

De acuerdo con el modelo, las ventas promedio estimadas para este asesor son de 35.

Si este asesor logra un total de 50 ventas, ¿considera que esto es destacado en comparación con otros posibles asesores?

Teniendo en cuenta que un asesor que contacta 60 clientes en promedio logra ventas de entre 30 y 40 productos, podemos destacar el éxito que tiene este asesor al lograr un total de 50, es decir, se podría considerar como un asesor que tiene un éxito mayor en ventas en términos de clientes contactados (rendimiento).

##       1 
## 35.6175
##       fit      lwr      upr
## 1 35.6175 30.64529 40.58971