Ejemplo 1: X=Gasto, Y=Ingreso

x=c(10,2,5,6,8,9)
y=c(40,10,25,26,30,45)
cor(x,y)
## [1] 0.9493806

Dado que la correlación es igual a 0.9493, esto significa que la relación entre el gasto y el ingreso es directamente proporcional y alta.

Diagrama de dispersión del Gasto con el Ingreso

data1=data.frame(x,y)
library(ggplot2)

ggplot(data1, aes(x,y))+
  geom_jitter(color="hotpink")+
  geom_smooth(method = lm, color="maroon")+
  labs(x="Gasto",y="Ingreso")
## `geom_smooth()` using formula = 'y ~ x'

Modelo de regresión lineal simple del Ingreso en función del Gasto

modelo = lm(y~x)
summary(modelo)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##       1       2       3       4       5       6 
## -2.6154 -0.7385  2.3077 -0.6769 -4.6462  6.3692 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   2.7692     4.7384   0.584  0.59031   
## x             3.9846     0.6592   6.045  0.00378 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.339 on 4 degrees of freedom
## Multiple R-squared:  0.9013, Adjusted R-squared:  0.8767 
## F-statistic: 36.54 on 1 and 4 DF,  p-value: 0.003779

El intercepto es igual a 2.7692, lo cuál significa que cuando el gasto es 0, el ingreso esperado es de 2.7692 millones.

Por otro lado, la pendiente es iguala 3.9846, lo cuál significa que por cada aumento del gasto, el ingreso se aumenta en 3.9846 millones.

Ejemplo 3: X=Años de Experiencia, Y=Ventas Anuales (miles de $)

x1=c(1,3,4,4,6,8,10,10,11,13)
y1=c(80,97,92,102,103,111,119,123,117,136)
cor(x1,y1)
## [1] 0.9645646

Dado que la correlación es igual a 0.9646, esto significa que la relación entre los años de experiencia y las ventas anuales es directamente proporcional y alta.

Diagrama de dispersión de los Años de Experiencia con las Ventas Anuales

data2=data.frame(x1,y1)
library(ggplot2)

ggplot(data2, aes(x1,y1))+
  geom_jitter(color="hotpink2")+
  geom_smooth(method = lm, color="maroon1")+
  labs(x="Años de Experiencia",y="Ventas Anuales")
## `geom_smooth()` using formula = 'y ~ x'

Modelo de regresión lineal simple de las Ventas Anuales en función de los Años de Experiencia

modelo = lm(y1~x1)
summary(modelo)
## 
## Call:
## lm(formula = y1 ~ x1)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -7.00  -3.25  -1.00   3.75   6.00 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  80.0000     3.0753   26.01 5.12e-09 ***
## x1            4.0000     0.3868   10.34 6.61e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.61 on 8 degrees of freedom
## Multiple R-squared:  0.9304, Adjusted R-squared:  0.9217 
## F-statistic: 106.9 on 1 and 8 DF,  p-value: 6.609e-06

El intercepto es igual a 80, lo cuál significa que cuando el vendedor no tiene años de experiencia, las ventas anuales son de 80000 pesos.

Por otro lado, la pendiente es igual a 4, lo cuál significa que por cada año de experiencia, las ventas anuales se aumentan en 4000 pesos.

Proyecciones

Ecuación de la recta: Y = 4X+80

(4*5)+80
## [1] 100

Cuando el vendedor tiene 5 años de experiencia, se espera que sus ventas anuales sean de 100000 pesos.

(4*7)+80
## [1] 108

Cuando el vendedor tiene 7 años de experiencia, se espera que sus ventas anuales sean de 108000 pesos.

(4*9)+80
## [1] 116

Cuando el vendedor tiene 9 años de experiencia, se espera que sus ventas anuales sean de 116000 pesos.