## Introducción
En este informe, utilizamos el conjunto de datos mtcars
para realizar un análisis exploratorio, visualizar relaciones entre
variables y ajustar un modelo de regresión lineal.
El conjunto de datos mtcars viene preinstalado en R. A
continuación, cargamos los datos y mostramos las primeras filas del
conjunto.
# Cargar los datos mtcars
data(mtcars)
# Mostrar las primeras 6 filas
head(mtcars)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
# Resumen estadístico
summary(mtcars[, c("mpg", "hp")])
## mpg hp
## Min. :10.40 Min. : 52.0
## 1st Qu.:15.43 1st Qu.: 96.5
## Median :19.20 Median :123.0
## Mean :20.09 Mean :146.7
## 3rd Qu.:22.80 3rd Qu.:180.0
## Max. :33.90 Max. :335.0
# Gráfico de dispersión entre millas por galón y caballos de fuerza
plot(mtcars$hp, mtcars$mpg,
xlab = "Caballos de Fuerza",
ylab = "Millas por Galón",
main = "Relación entre Caballos de Fuerza y Millas por Galón")
library(ggplot2)
# Gráfico de dispersión con línea de tendencia
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point(color = "blue", size = 3) +
geom_smooth(method = "lm", color = "red") +
labs(title = "Relación entre Peso y Millas por Galón",
x = "Peso (miles de libras)", y = "Millas por Galón") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
# Ajuste del modelo de regresión
modelo <- lm(mpg ~ wt + hp, data = mtcars)
# Resumen del modelo
summary(modelo)
##
## Call:
## lm(formula = mpg ~ wt + hp, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.941 -1.600 -0.182 1.050 5.854
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.22727 1.59879 23.285 < 2e-16 ***
## wt -3.87783 0.63273 -6.129 1.12e-06 ***
## hp -0.03177 0.00903 -3.519 0.00145 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.593 on 29 degrees of freedom
## Multiple R-squared: 0.8268, Adjusted R-squared: 0.8148
## F-statistic: 69.21 on 2 and 29 DF, p-value: 9.109e-12
# Predicciones para los primeros 5 autos
predicciones <- predict(modelo, newdata = mtcars[1:5, ])
predicciones
## Mazda RX4 Mazda RX4 Wag Datsun 710 Hornet 4 Drive
## 23.57233 22.58348 25.27582 21.26502
## Hornet Sportabout
## 18.32727
# Info adicional
media<- mean(mtcars$mpg)
media
## [1] 20.09062