Introducción

Este informe proporciona un análisis exploratorio del conjunto de datos cars en R, que consta de 50 observaciones de velocidad de los automóviles (en mph) y distancia de frenado (en pies). El objetivo es resumir el conjunto de datos y visualizar la relación entre la velocidad y la distancia de frenado.

Librerías

Primero, cargamos las librerías necesarias.

# Cargar librerías necesarias
library(tidyverse)  # Incluye ggplot2, dplyr y otros paquetes útiles

Cargar Datos

El conjunto de datos cars está incorporado en R, por lo que podemos acceder a él directamente.

# Cargar y mostrar las primeras filas del conjunto de datos
data(cars)
head(cars)
##   speed dist
## 1     4    2
## 2     4   10
## 3     7    4
## 4     7   22
## 5     8   16
## 6     9   10

Estadísticas Resumidas

Generamos estadísticas resumidas para obtener una visión general del conjunto de datos.

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Correlación Entre Velocidad y Distancia de Frenado

Calculamos la correlación entre la velocidad y la distancia de frenado para cuantificar su relación.

cor(cars$speed, cars$dist)
## [1] 0.8068949

Visualización de Datos

Visualizamos la relación entre la velocidad y la distancia de frenado utilizando un diagrama de dispersión con una línea de regresión ajustada.

ggplot(cars, aes(x = speed, y = dist)) +
  geom_point(color = "blue", alpha = 0.7, size = 3) +
  geom_smooth(method = "lm", color = "red", se = TRUE) +
  labs(title = "Velocidad del Automóvil vs Distancia de Frenado",
       x = "Velocidad (mph)",
       y = "Distancia de Frenado (ft)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Modelo de Regresión Lineal

Ajustamos un modelo de regresión lineal simple para comprender cómo la velocidad influye en la distancia de frenado.

# Ajustar modelo lineal
model <- lm(dist ~ speed, data = cars)

# Mostrar estadísticas del modelo
summary(model)
## 
## Call:
## lm(formula = dist ~ speed, data = cars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -29.069  -9.525  -2.272   9.215  43.201 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -17.5791     6.7584  -2.601   0.0123 *  
## speed         3.9324     0.4155   9.464 1.49e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.38 on 48 degrees of freedom
## Multiple R-squared:  0.6511, Adjusted R-squared:  0.6438 
## F-statistic: 89.57 on 1 and 48 DF,  p-value: 1.49e-12

Diagnóstico de los Residuos

Para verificar los supuestos del modelo de regresión lineal, examinamos los residuos.

par(mfrow = c(2, 2))  # Organizar gráficos en una cuadrícula de 2x2
plot(model)

Conclusión

El análisis sugiere una correlación positiva entre la velocidad y la distancia de frenado. El modelo de regresión confirma esta relación, con una pendiente estimada que indica que cada mph adicional en la velocidad aumenta la distancia de frenado. Los diagnósticos de los residuos sugieren que, aunque el modelo captura bien la tendencia, podría ser necesario un análisis adicional para una predicción más robusta.