Caso Implementado:

El CEO de una empresa dedicada al ambito comercial, quiere verificar si existe una relacion lineal entre los ingresos mensuales y la cantidad de tarjeta prepagada, recopilo la siguiente informacion obtenida

comercial <- data.frame(ingresosMensuales=c(22,45,32,30,33,30,36,35,44,32,46,31),
                       cantidadTarPre=c(2,4,5,4,6,3,5,6,8,7,8,3))

comercial

Pasos para construir un modelo de regresión:

Paso 1: Determinar las variables X,Y

Paso 2: Evaluar la relación entre variables (Correlación) graficamente

Diagrama de dispersión o puntos

# Gráfico con plot
plot(x=comercial$ingresosMensuales,y=comercial$cantidadTarPre)

# Gráfico con pairs
pairs(comercial)

Interpretación: Según los resultados, hay relación lineal positiva o directa entre la inversión y la ganancia.

Coeficiente de correlación

# Mediante la función cor
cor(comercial) # Matriz de correlaciones
##                   ingresosMensuales cantidadTarPre
## ingresosMensuales         1.0000000      0.6738042
## cantidadTarPre            0.6738042      1.0000000

Coeficiente de correlación:

r = 0.6738042

Interpretación: Existe correlación positiva mul alta entre la inversión y la ganancia.

Como en este caso el coeficiente de correlación es superior a 0.35, es viable la regresión.

Paso 3: Regresión

Regresión lineal simple

Modelo general $ = b_o + b_1X $

Modelo para el caso: \(\hat{ingresosMensuales} = b_0 + b_1 cantidadTarPre\)

Para obtener el modelo, se va a utilizar una función de R > lm

# lm, notación: Y ~ X, data=
modelo1 <- lm(ingresosMensuales ~ cantidadTarPre, data=comercial)

# Resumen de resultados
summary(modelo1)
## 
## Call:
## lm(formula = ingresosMensuales ~ cantidadTarPre, data = comercial)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.3262 -2.8218 -0.7485  1.7126 12.9670 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     22.3087     4.5725   4.879 0.000643 ***
## cantidadTarPre   2.4311     0.8431   2.884 0.016283 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.523 on 10 degrees of freedom
## Multiple R-squared:  0.454,  Adjusted R-squared:  0.3994 
## F-statistic: 8.315 on 1 and 10 DF,  p-value: 0.01628
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  15.1982     2.1254   7.151 3.10e-05 ***
## inversion     3.2162     0.3792   8.482 7.03e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.579 on 10 degrees of freedom
## Multiple R-squared:  0.878,  Adjusted R-squared:  0.8658 
## F-statistic: 71.94 on 1 and 10 DF,  p-value: 7.032e-06

Modelo final con los resultados:

Modelo general

$ = 22.3087 +2.4311 X $

Modelo para el caso:

\(\hat{ingresosMensuales} = 15.1982 + 3.2162 cantidadTarPre\)