library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(olsrr)
##
## Attaching package: 'olsrr'
## The following object is masked from 'package:datasets':
##
## rivers
datos <- read_excel('datosB.xlsx')
lm(y ~ X1*X2, data = datos) -> modelo
modelo |> summary()
##
## Call:
## lm(formula = y ~ X1 * X2, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.0654 -0.7640 0.1356 0.6441 3.3851
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.21900 0.48914 39.292 <2e-16 ***
## X1 2.30542 0.02593 88.894 <2e-16 ***
## X2solo taxi o auto particular -0.50013 0.67899 -0.737 0.4637
## X2solo transporte público 1.39592 0.65686 2.125 0.0369 *
## X1:X2solo taxi o auto particular 0.51538 0.03469 14.855 <2e-16 ***
## X1:X2solo transporte público 0.44930 0.03523 12.752 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.093 on 74 degrees of freedom
## Multiple R-squared: 0.9981, Adjusted R-squared: 0.9979
## F-statistic: 7640 on 5 and 74 DF, p-value: < 2.2e-16
Categorizando la variable X2
| Categorías | X21 | X22 |
|---|---|---|
| mixto | 0 | 0 |
| solo taxi o auto particular | 1 | 0 |
| solo transporte público | 0 | 1 |
Ecuación de regresion estimada:
y_est = 19.21900 + 2.30542*X1 -0.50013*X21 + 1.39592*X22 + 0.51538*X1*X21 + 0.44930*X1*X22
Ecuacion 1:
X21=0 : Cuando no usa taxi o auto particular
X22=0: Cuando no usa transporte público
y_est(X21=0, X22=0) = 19.21900 + 2.30542*X1
b0=19.21900 : El tiempo estimado cuando usa transporte mixto y no hay distancia a su trabajo es de 19.21900 minutos. (No tiene mucho sentido)
b1= 2.30542: El tiempo estimado cuando usa transporte mixto aumenta en 2.30542 minutos por cada km de distancia a su trabajo.
Ecuacion 2:
X21=1 : Cuando usa solo taxi o auto particular
X22=0: Cuando no usa transporte público
y_est(X21=1, X22=0) = 19.21900-0.50013 + (2.30542+0.51538)*X1
y_est(X21=1, X22=0) = 18.71887 + 2.8208*X1
b0=18.71887 : El tiempo estimado cuando usa solo taxi o auto particular y no hay distancia a su trabajo es de 18.71887 minutos. (No tiene mucho sentido)
b1= 2.8208: El tiempo estimado cuando usa solo taxi o auto particular aumenta en 2.8208 minutos por cada km de distancia a su trabajo.
Ecuacion 2:
X21=0 : Cuando no usa solo taxi o auto particular
X22=1: Cuando usa transporte público
y_est = 19.21900 + 2.30542*X1 -0.50013*X21 + 1.39592*X22 + 0.51538*X1*X21 + 0.44930*X1*X22
y_est(X21=0, X22=1) = 19.21900+1.39592+ (0.44930+ 1.39592)*X22
y_est(X21=0, X22=1) = 20.61492+ 1.84522*X1
b0=20.61492: El tiempo estimado cuando usa transporte público y no hay distancia a su trabajo es de 20.61492 minutos. (No tiene mucho sentido)
b1= 1.84522: El tiempo estimado cuando usa transporte público aumenta en 1.84522 minutos por cada km de distancia a su trabajo.