Este informe proporciona un análisis exploratorio del conjunto de
datos cars en R, que consta de 50 observaciones de
velocidad de los automóviles (en mph) y distancia de frenado (en pies).
El objetivo es resumir el conjunto de datos y visualizar la relación
entre la velocidad y la distancia de frenado.
Primero, cargamos las librerías necesarias.
# Cargar librerías necesarias
library(tidyverse) # Incluye ggplot2, dplyr y otros paquetes útiles
El conjunto de datos cars está incorporado en R, por lo
que podemos acceder a él directamente.
# Cargar y mostrar las primeras filas del conjunto de datos
data(cars)
head(cars)
## speed dist
## 1 4 2
## 2 4 10
## 3 7 4
## 4 7 22
## 5 8 16
## 6 9 10
Generamos estadísticas resumidas para obtener una visión general del conjunto de datos.
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Calculamos la correlación entre la velocidad y la distancia de frenado para cuantificar su relación.
cor(cars$speed, cars$dist)
## [1] 0.8068949
Visualizamos la relación entre la velocidad y la distancia de frenado utilizando un diagrama de dispersión con una línea de regresión ajustada.
ggplot(cars, aes(x = speed, y = dist)) +
geom_point(color = "blue", alpha = 0.7, size = 3) +
geom_smooth(method = "lm", color = "red", se = TRUE) +
labs(title = "Velocidad del Automóvil vs Distancia de Frenado",
x = "Velocidad (mph)",
y = "Distancia de Frenado (ft)") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
Ajustamos un modelo de regresión lineal simple para comprender cómo la velocidad influye en la distancia de frenado.
# Ajustar modelo lineal
model <- lm(dist ~ speed, data = cars)
# Mostrar estadísticas del modelo
summary(model)
##
## Call:
## lm(formula = dist ~ speed, data = cars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -29.069 -9.525 -2.272 9.215 43.201
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -17.5791 6.7584 -2.601 0.0123 *
## speed 3.9324 0.4155 9.464 1.49e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.38 on 48 degrees of freedom
## Multiple R-squared: 0.6511, Adjusted R-squared: 0.6438
## F-statistic: 89.57 on 1 and 48 DF, p-value: 1.49e-12
Para verificar los supuestos del modelo de regresión lineal, examinamos los residuos.
par(mfrow = c(2, 2)) # Organizar gráficos en una cuadrícula de 2x2
plot(model)
El análisis sugiere una correlación positiva entre la velocidad y la distancia de frenado. El modelo de regresión confirma esta relación, con una pendiente estimada que indica que cada mph adicional en la velocidad aumenta la distancia de frenado. Los diagnósticos de los residuos sugieren que, aunque el modelo captura bien la tendencia, podría ser necesario un análisis adicional para una predicción más robusta.