Cargar datos

library(readxl)
ventas = read_excel("C:/Users/Alejandra/Desktop/ventas.xlsx")
ventas
## # A tibble: 15 x 3
##    vendedor clientes ventas
##       <dbl>    <dbl>  <dbl>
##  1        1       96     41
##  2        2       40     41
##  3        3      104     51
##  4        4      128     60
##  5        5      164     61
##  6        6       76     29
##  7        7       72     39
##  8        8       80     50
##  9        9       36     28
## 10       10       84     43
## 11       11      180     70
## 12       12      132     56
## 13       13      120     45
## 14       14       44     31
## 15       15       84     30

Se onserva que la base de satos contiene información sobre el registro de las ventas (y) de unos asesores al total de clientes (x) que contrato

Exploratorio

Se observa que el promedio de clientes que contrata un asesor es de 96, mientras que el promedio de ventas es 45 producto.

attach(ventas)
## The following object is masked _by_ .GlobalEnv:
## 
##     ventas
summary(clientes)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      36      74      84      96     124     180
summary(ventas)
##     vendedor       clientes       ventas    
##  Min.   : 1.0   Min.   : 36   Min.   :28.0  
##  1st Qu.: 4.5   1st Qu.: 74   1st Qu.:35.0  
##  Median : 8.0   Median : 84   Median :43.0  
##  Mean   : 8.0   Mean   : 96   Mean   :45.0  
##  3rd Qu.:11.5   3rd Qu.:124   3rd Qu.:53.5  
##  Max.   :15.0   Max.   :180   Max.   :70.0
hist(clientes, col="gray")

Veamos la correlacion entre clientes y ventas. Se observa que a mayor cantidad de clientes contactados, las ventas aumentan y su relacion es fuerte de acuerdo con el coeficiente de correlacion de Person (0.86)

plot(clientes,ventas$ventas)

cor(clientes, ventas$ventas)
## [1] 0.8646318

Estimacion del modelo lineal simple

Se observa que el coeficiente en este caso \(\beta_0\) no se debe interpretar porque no se observan valores de clientes cero, por otro lado \(\beta_0=0,26\) nos indica que por cada cliente adicional que se contacte, las ventas se incrementan en 0,26. Adicionalmente se onserva que el coeficiente es sifnificativamente distinto de cero.

Se observa que el ajuste del modelo es de \(R^2=0.7476\). es decir que el modelo explica el 74% de la variabilidad de las ventas.

mood=lm(ventas~clientes,data=ventas)
summary(mood)
## 
## Call:
## lm(formula = ventas ~ clientes, data = ventas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -11.873  -2.861   0.255   3.511  10.595 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  19.9800     4.3897   4.552 0.000544 ***
## clientes      0.2606     0.0420   6.205 3.19e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared:  0.7476, Adjusted R-squared:  0.7282 
## F-statistic:  38.5 on 1 and 13 DF,  p-value: 3.193e-05

Validación de supuestos

Podemos observar resoecto a los supuestos sobre el error \(e_i\) lo siguiente:

  1. Media cero: se cumple por defecto.
  2. Homogeniedad de variana o varianza constante: Se observa en la grafica 1 de residuales vs ajustados que el comportamiento es aleatorio no con alguna tendencia en particular que indique problemas. Se valida graficamente. 3.Normalidad: Se observa en la grafica 2 que los datos se ajustan bien a la linea de la normalidad en el qqplot. Es decir, se evalua graficamente.
  3. Independencia: Dado que estos registros no corresponden a datos en el tiempo, no se tienen un orden temporal para realiar la validacio de supuestos. Se valida por definicion del tipo de datos de corte transeversal.
par(mfrow=c(2,2))
plot(mood)

Predicciones con el Modelo Estimado

¿Cual seria las ventas promedios esperadas para un asesor que logre contratar 60 clientes?

De acuerdo con el modelo de las ventas promedio estimadas para este asesor son de 35.

¿Si este asesor logra un total de 50 ventas, considera que esto es destacado en comparacion con otros posibles asesores?

Teniendo en cuenta que un asesor que contacta 60 clientes en promedio logra ventas entre 30 y 40 productos, podemos destacar el exito que tiene este asesor al lograr un total de 520. Es decir, se podria considerar como un asesor que tiene un exito mayor en ventas en termino de cientes contactado (Rendimientos).

predict(mood,list(clientes=60))
##       1 
## 35.6175
predict(mood,list(clientes=60),interval = "confidence",level = 0.95)
##       fit      lwr      upr
## 1 35.6175 30.64529 40.58971