Call:
lm(formula = weight ~ horsepower, data = datos_reg)
Residuals:
Min 1Q Median 3Q Max
-2192.63 -297.15 -79.74 330.78 1150.47
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 982.3167 62.0325 15.84 <2e-16 ***
horsepower 19.0947 0.5592 34.15 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 426.9 on 396 degrees of freedom
Multiple R-squared: 0.7465, Adjusted R-squared: 0.7458
F-statistic: 1166 on 1 and 396 DF, p-value: < 2.2e-16
[1] "Weight = 982.317 + 19.095 * Horsepower"
El modelo estima cómo cambia el peso del vehículo cuando varía el horsepower. El intercepto (982.32) representa el peso esperado cuando horsepower = 0; aunque no es interpretable físicamente, sirve como punto de referencia del modelo.
El coeficiente de horsepower (19.09) indica que, por cada unidad adicional de horsepower, el peso del vehículo aumenta en promedio 19.09 unidades, mostrando que los vehículos más potentes suelen ser más pesados. Este coeficiente es altamente significativo (p < 2e-16), por lo que existe evidencia estadística fuerte de esta relación.
El ajuste del modelo es bueno: R² = 0.7465, lo que significa que el modelo explica aproximadamente el 74.65% de la variabilidad del peso. La F-statistic también es significativa, indicando que el modelo es globalmente válido. Los residuos no muestran valores extremos ni patrones preocupantes, por lo que el ajuste es adecuado.
##Gráfico
<h3>Análisis</h3>
La gráfica muestra una relación lineal positiva entre horsepower y weight: los vehículos más potentes tienden a ser más pesados. La línea de regresión evidencia esta tendencia ascendente, indicando que el aumento en horsepower se asocia con un incremento proporcional en el peso.
La banda de confianza alrededor de la línea es relativamente estrecha, lo que sugiere que el modelo describe esta relación con buena precisión. Aunque existe cierta dispersión en los datos —lo cual es normal en variables de vehículos— no se observan valores atípicos que afecten la tendencia general.
En conjunto, la gráfica confirma visualmente que horsepower es un predictor importante del peso del vehículo, respaldando la validez del modelo lineal ajustado.
Residuals vs Fitted
En esta gráfica los residuos se distribuyen alrededor de la línea cero sin seguir un patrón definido, lo que sugiere que la relación entre horsepower y weight es razonablemente lineal. Aunque se observan algunos puntos alejados, no se identifican curvaturas fuertes que indiquen una violación importante del supuesto de linealidad o problemas graves de heterocedasticidad.
Q-Q Plot
El Q-Q plot muestra que la mayoría de los residuos siguen la línea teórica, lo que indica que estos se aproximan a una distribución normal. Solo los puntos en las colas se desvían un poco, lo cual es común en datos reales y no representa un problema serio. En general, el supuesto de normalidad de los residuos se cumple adecuadamente.
Scale-Location
La gráfica de Scale-Location muestra una ligera tendencia ascendente, lo que indica que la variabilidad de los residuos aumenta levemente a medida que aumentan los valores ajustados. Esto sugiere una pequeña presencia de heterocedasticidad, pero no lo suficiente como para invalidar el modelo. El comportamiento general aún es aceptable para un modelo lineal simple.
Residuals vs Leverage
En esta gráfica no se observan puntos con leverage extremadamente alto ni valores que superen límites de influencia como la distancia de Cook. Esto indica que no hay observaciones individuales que estén afectando de forma desproporcionada la estimación del modelo. El ajuste es estable y no depende de puntos atípicos extremos.
---
title: "Tercer avance"
output:
flexdashboard::flex_dashboard:
orientation: rows
social: menu
source_code: embed
---
```{r}
# Primero aseguramos que las variables sean numéricas
auto_mpg_csv <- read.csv("auto-mpg.csv", sep = ";")
auto_mpg_csv$horsepower <- as.numeric(auto_mpg_csv$horsepower)
auto_mpg_csv$weight <- as.numeric(auto_mpg_csv$weight)
library(ggplot2)
```
Row
-----------------------------------------------------------------------
```{r}
# Crear la base reducida solo con las variables necesarias
datos_reg <- auto_mpg_csv[, c("mpg", "horsepower", "weight")]
```
Ajuste del modelo de regresión lineal
=======================================================================
Row
-----------------------------------------------------------------------
::: {.columns}
::: {.column width="50%"}
## Columna izquierda
```{r}
# Ajustar el modelo de regresión lineal
modelo <- lm(weight ~ horsepower, data = datos_reg)
summary(modelo)
# Mostrar ecuación de la recta
coeficientes <- coef(modelo)
paste0("Weight = ",
round(coeficientes[1], 3), " + ",
round(coeficientes[2], 3), " * Horsepower")
```
:::
::: {.column width="50%"}
## Columna derecha
El modelo estima cómo cambia el peso del vehículo cuando varía el horsepower.
El intercepto (982.32) representa el peso esperado cuando horsepower = 0; aunque no es interpretable físicamente, sirve como punto de referencia del modelo.
El coeficiente de horsepower (19.09) indica que, por cada unidad adicional de horsepower, el peso del vehículo aumenta en promedio 19.09 unidades, mostrando que los vehículos más potentes suelen ser más pesados. Este coeficiente es altamente significativo (p < 2e-16), por lo que existe evidencia estadística fuerte de esta relación.
El ajuste del modelo es bueno: R² = 0.7465, lo que significa que el modelo explica aproximadamente el 74.65% de la variabilidad del peso.
La F-statistic también es significativa, indicando que el modelo es globalmente válido.
Los residuos no muestran valores extremos ni patrones preocupantes, por lo que el ajuste es adecuado.
:::
:::
Row
-----------------------------------------------------------------------
Gráfica de regresión lineal
=======================================================================
Row
-----------------------------------------------------------------------
##Gráfico
```{r}
# Ajustar el modelo
modelo <- lm(weight ~ horsepower, data = datos_reg)
```
```{r, echo=FALSE}
## Ecuación en la gráfica
eq <- paste0("Weight = ",
round(coef(modelo)[1], 2), " + ",
round(coef(modelo)[2], 2), " * HP")
library(ggplot2)
grafica_reg <- ggplot(datos_reg, aes(x = horsepower, y = weight)) +
geom_point() +
geom_smooth(method = "lm", se = TRUE, color = "green") +
annotate("text",
x = Inf, y = -Inf,
label = eq,
hjust = 1.1, vjust = -1.5,
size = 5) +
labs(title = "Regresión lineal",
x = "Horsepower",
y = "Weight")
grafica_reg
```
```{r, echo=FALSE}
eq <- paste0("Weight = ",
round(coef(modelo)[1], 2), " + ",
round(coef(modelo)[2], 2), " * HP")
library(ggplot2)
grafica_reg <- ggplot(datos_reg, aes(x = horsepower, y = weight)) +
geom_point() +
geom_smooth(method = "lm", se = TRUE) +
annotate("text",
x = Inf, y = -Inf,
label = eq,
hjust = 1.1, vjust = -1.5,
size = 5) +
labs(title = "Regresión lineal",
x = "Horsepower",
y = "Weight")
ggsave("grafica_reg.png", grafica_reg, width = 6, height = 4)
```
<div style="display: flex; gap: 20px; align-items: flex-start;">
<div style="flex: 1;">
</div>
<div style="flex: 1;">
<h3>Análisis</h3>
La gráfica muestra una relación lineal positiva entre horsepower y weight: los vehículos más potentes tienden a ser más pesados. La línea de regresión evidencia esta tendencia ascendente, indicando que el aumento en horsepower se asocia con un incremento proporcional en el peso.
La banda de confianza alrededor de la línea es relativamente estrecha, lo que sugiere que el modelo describe esta relación con buena precisión. Aunque existe cierta dispersión en los datos —lo cual es normal en variables de vehículos— no se observan valores atípicos que afecten la tendencia general.
En conjunto, la gráfica confirma visualmente que horsepower es un predictor importante del peso del vehículo, respaldando la validez del modelo lineal ajustado.
</div>
</div>
GRÁFICO DE DIAGNOSTICO
=======================================================================
```{r}
library(ggplot2)
##Residuals vs Fitted
ggplot(data.frame(fitted = fitted(modelo),
resid = resid(modelo)),
aes(x = fitted, y = resid)) +
geom_point(alpha = 0.4, size = 2, position = position_jitter(width = 10)) +
geom_hline(yintercept = 0, color = "red") +
labs(title = "Residuals vs Fitted",
x = "Fitted values",
y = "Residuals") +
theme_minimal()
##Q-Q Plot
ggplot(data.frame(resid = rstandard(modelo)),
aes(sample = resid)) +
stat_qq(alpha = 0.4, size = 2) +
stat_qq_line(color = "red") +
labs(title = "Q-Q Residuals",
x = "Theoretical Quantiles",
y = "Standardized Residuals") +
theme_minimal()
##Scale-Location
ggplot(data.frame(fitted = fitted(modelo),
resid = rstandard(modelo)),
aes(x = fitted, y = sqrt(abs(resid)))) +
geom_point(alpha = 0.4, size = 2, position = position_jitter(width = 10)) +
geom_smooth(method = "loess", se = FALSE, color = "red") +
labs(title = "Scale-Location",
x = "Fitted values",
y = "√|Standardized residuals|") +
theme_minimal()
##Residuals vs Leverage
influ <- influence.measures(modelo)
lev <- hatvalues(modelo)
stdres <- rstandard(modelo)
ggplot(data.frame(lev = lev, stdres = stdres),
aes(x = lev, y = stdres)) +
geom_point(alpha = 0.4, size = 2) +
geom_smooth(method = "loess", se = FALSE, color = "red") +
labs(title = "Residuals vs Leverage",
x = "Leverage",
y = "Standardized residuals") +
theme_minimal()
```
ANÁLISIS
=======================================================================
Residuals vs Fitted
En esta gráfica los residuos se distribuyen alrededor de la línea cero sin seguir un patrón definido, lo que sugiere que la relación entre horsepower y weight es razonablemente lineal. Aunque se observan algunos puntos alejados, no se identifican curvaturas fuertes que indiquen una violación importante del supuesto de linealidad o problemas graves de heterocedasticidad.
Q-Q Plot
El Q-Q plot muestra que la mayoría de los residuos siguen la línea teórica, lo que indica que estos se aproximan a una distribución normal. Solo los puntos en las colas se desvían un poco, lo cual es común en datos reales y no representa un problema serio. En general, el supuesto de normalidad de los residuos se cumple adecuadamente.
Scale-Location
La gráfica de Scale-Location muestra una ligera tendencia ascendente, lo que indica que la variabilidad de los residuos aumenta levemente a medida que aumentan los valores ajustados. Esto sugiere una pequeña presencia de heterocedasticidad, pero no lo suficiente como para invalidar el modelo. El comportamiento general aún es aceptable para un modelo lineal simple.
Residuals vs Leverage
En esta gráfica no se observan puntos con leverage extremadamente alto ni valores que superen límites de influencia como la distancia de Cook. Esto indica que no hay observaciones individuales que estén afectando de forma desproporcionada la estimación del modelo. El ajuste es estable y no depende de puntos atípicos extremos.