Análisis Regresión

Cristian P.

Abril,12

Análisis de Regresión

Datos

Mostramos una parte de la base de datos cars usando el paquete knitr y la función kable:

speed dist \(Belen=x^2 + 2x\)
4 2 18.74709
4 10 36.36729
7 4 55.32874
7 22 96.19056
8 16 96.65902
9 10 99.35906
10 18 136.97486
10 26 153.47665
10 34 169.15156
11 17 154.38922

Ahora usando el paquete DT y la función datatable:

Analizaremos la base de datos cars que se encuentra disponible en el ambiente base de R. A continuación mostramos estadístico descriptivos de la base de datos:

##      speed           dist            Belén       
##  Min.   : 4.0   Min.   :  2.00   Min.   : 18.75  
##  1st Qu.:12.0   1st Qu.: 26.00   1st Qu.:183.96  
##  Median :15.0   Median : 36.00   Median :326.29  
##  Mean   :15.4   Mean   : 42.98   Mean   :350.72  
##  3rd Qu.:19.0   3rd Qu.: 56.00   3rd Qu.:485.91  
##  Max.   :25.0   Max.   :120.00   Max.   :815.78

Gráficos

A contuación mostramos graficos cruzados de las variables de la base de datos.

Modelos

Gráfica de los modelos

Modelo 1

Usando la función plot(). Gráfico de la recta de regresión.

Usando el paquete ggplot2. Gráfico de la recta de regresión.

Una vez estimados los coeficientes del modelo de regresión siguiente:

\[ Belen_i=\beta_0+\beta_1 dist_i + \varepsilon_i \]

Obtenemos las siguientes estimaciones.

  • \(\hat\beta_0 = 42.61\)
  • \(\hat\beta_1 = 7.17\)

La ecuación de la recta de regresión es:

\[ Belen=42.61+7.17 dist \]

El \(R^2=0.79\)

ANOVA

Se muestra a continuación la tabla ANOVA del modelo.

Df Sum Sq Mean Sq F value Pr(>F)
dist 1 1672210.59 1672210.59 185.16 0.0000
Residuals 48 433495.40 9031.15
## Analysis of Variance Table
## 
## Response: Belén
##           Df  Sum Sq Mean Sq F value Pr(>F)    
## dist       1 1672211 1672211     185 <2e-16 ***
## Residuals 48  433495    9031                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Plotly

Usando el paquete plotly. Gráfico de la recta de regresión.