Análisis de Regresión
Datos
Mostramos una parte de la base de datos cars usando el paquete knitr y la función kable:
| speed | dist | \(Belen=x^2 + 2x\) |
|---|---|---|
| 4 | 2 | 18.74709 |
| 4 | 10 | 36.36729 |
| 7 | 4 | 55.32874 |
| 7 | 22 | 96.19056 |
| 8 | 16 | 96.65902 |
| 9 | 10 | 99.35906 |
| 10 | 18 | 136.97486 |
| 10 | 26 | 153.47665 |
| 10 | 34 | 169.15156 |
| 11 | 17 | 154.38922 |
Ahora usando el paquete DT y la función datatable:
Analizaremos la base de datos cars que se encuentra disponible en el ambiente base de R. A continuación mostramos estadístico descriptivos de la base de datos:
## speed dist Belén
## Min. : 4.0 Min. : 2.00 Min. : 18.75
## 1st Qu.:12.0 1st Qu.: 26.00 1st Qu.:183.96
## Median :15.0 Median : 36.00 Median :326.29
## Mean :15.4 Mean : 42.98 Mean :350.72
## 3rd Qu.:19.0 3rd Qu.: 56.00 3rd Qu.:485.91
## Max. :25.0 Max. :120.00 Max. :815.78
Gráficos
A contuación mostramos graficos cruzados de las variables de la base de datos.
Modelos
Gráfica de los modelos
Modelo 1
Usando la función plot(). Gráfico de la recta de regresión.
Usando el paquete ggplot2. Gráfico de la recta de regresión.
Una vez estimados los coeficientes del modelo de regresión siguiente:
\[ Belen_i=\beta_0+\beta_1 dist_i + \varepsilon_i \]
Obtenemos las siguientes estimaciones.
- \(\hat\beta_0 = 42.61\)
- \(\hat\beta_1 = 7.17\)
La ecuación de la recta de regresión es:
\[ Belen=42.61+7.17 dist \]
El \(R^2=0.79\)
ANOVA
Se muestra a continuación la tabla ANOVA del modelo.
| Df | Sum Sq | Mean Sq | F value | Pr(>F) | |
|---|---|---|---|---|---|
| dist | 1 | 1672210.59 | 1672210.59 | 185.16 | 0.0000 |
| Residuals | 48 | 433495.40 | 9031.15 |
## Analysis of Variance Table
##
## Response: Belén
## Df Sum Sq Mean Sq F value Pr(>F)
## dist 1 1672211 1672211 185 <2e-16 ***
## Residuals 48 433495 9031
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Plotly
Usando el paquete plotly. Gráfico de la recta de regresión.