Cargar datos

library(readxl)
ventas <- read_excel("C:/Users/juana/Documents/ESTADISTICA2/pruebas de clase/ventas.xlsx")
ventas
## # A tibble: 15 x 3
##    vendedor clientes ventas
##       <dbl>    <dbl>  <dbl>
##  1        1       96     41
##  2        2       40     41
##  3        3      104     51
##  4        4      128     60
##  5        5      164     61
##  6        6       76     29
##  7        7       72     39
##  8        8       80     50
##  9        9       36     28
## 10       10       84     43
## 11       11      180     70
## 12       12      132     56
## 13       13      120     45
## 14       14       44     31
## 15       15       84     30
attach(ventas)
## The following object is masked _by_ .GlobalEnv:
## 
##     ventas

Se observa que la base de datos contiene información sobre el registro de ventas (y) de unos asesores de acuerdo al total de clientes (x) que contacto

summary(ventas)
##     vendedor       clientes       ventas    
##  Min.   : 1.0   Min.   : 36   Min.   :28.0  
##  1st Qu.: 4.5   1st Qu.: 74   1st Qu.:35.0  
##  Median : 8.0   Median : 84   Median :43.0  
##  Mean   : 8.0   Mean   : 96   Mean   :45.0  
##  3rd Qu.:11.5   3rd Qu.:124   3rd Qu.:53.5  
##  Max.   :15.0   Max.   :180   Max.   :70.0
hist(clientes, col="gray")

Se puede observar que el promedio de clientes que contactaron a una asesor es de 96, Mientras que el promedio de ventas es de 45 productos

Observemos la correlación entre clientes y ventas:se observa que a mayor cantidad de clientes contactados las ventas aumentas y su correlacion es fuerte segun el coeficiente de correlación de Pearson

plot(clientes, ventas$ventas)

cor(clientes, ventas$ventas)
## [1] 0.8646318

Estamación del Modelo Lineal Simple

Se observa que el coeficiente \(\beta_0\) no se debe de interpretar dado que no tiene valores de clientes cero. Por otro lado el \(\beta_1=0.26\) nos indica que por cada clientes adicional que se contacte las ventas se incrementan en 0.26. Adicionalmente se observa que el coeficiente es significativamente distinto de cero. Se evidencia que el ajuste del modelo es de \(R^2=0.7476\) es decir que el modelo explica 75% de la variabilidad de las ventas.

mod = lm(ventas~clientes, data=ventas)
summary(mod)
## 
## Call:
## lm(formula = ventas ~ clientes, data = ventas)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -11.873  -2.861   0.255   3.511  10.595 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  19.9800     4.3897   4.552 0.000544 ***
## clientes      0.2606     0.0420   6.205 3.19e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared:  0.7476, Adjusted R-squared:  0.7282 
## F-statistic:  38.5 on 1 and 13 DF,  p-value: 3.193e-05

Validación de supuestos

Podemos observar respecto a los supuestos sobre el error \(e_i\) lo siguiente:

  1. Media cero: Se cumple por defecto
  2. Varianza constante, se observa en la grafica 1 de residuales vs ajustados que el comportamiento es aleatorio no con una tendencia en particular que indique problemas. Se valida graficamente.
  3. Normalidad: se observa en la grafica 2 que los datos se ajustan bien a la linea de normalidad en el qqplot. Es decir se valid graficamente.
  4. Independencia: Dado que estos registros no corresponden a datos en el tiempo no se tiene un orden temporal para realizar la validación. Se valida por definición del tipo de datos de corte transversal.
par(mfrow=c(2,2))
plot(mod)

Predicciones con el modelo estimado

¿Cuales serian las ventas esperadas para un asesor que contacte un total de 60 clientes? De acuerdo con el modelo las ventas promedio estimadas para este asesor son de 35 .

¿Si este asesor logra un total de 50 ventas, considera que esto es destacado en comparación con otros posibles asesores? Teniendo en cuenta que un asesor que contata a 60 cliente en promedio logra ventas entre 30 y 40 productos, podemos destacar el exito que tiene este asesor al lograr 50 ventas, es decir podría considerarse como un asesor que tiene un exito mayor en ventas en terminos de clientes contactados (mayor rendimiento de lo esperado)

predict(mod,list(clientes=60))
##       1 
## 35.6175
predict(mod,list(clientes=60), interval = "confidence", level=0.95)
##       fit      lwr      upr
## 1 35.6175 30.64529 40.58971