Las variables que usamos son horsepower (caballos de fuerza) y weight (peso) como varibales cuantitativas y como las cuantitativas son car name (nombre del carro) Row —
library(readr)
library(readxl)
library(corrplot)
## corrplot 0.95 loaded
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
auto_mpg_csv <- read.csv("auto-mpg.csv", sep = ";")
vars_cuanti<-names(auto_mpg_csv)[sapply(auto_mpg_csv, is.numeric)]
mat_cor <- cor(auto_mpg_csv[vars_cuanti], use = "complete.obs", method = "pearson")
corrplot(mat_cor,method = "color",)
cor(auto_mpg_csv$weight, auto_mpg_csv$horsepower)
## [1] 0.8639838
summary(auto_mpg_csv$horsepower)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 46.00 75.25 92.00 104.12 125.00 230.00
El valor mínimo observado de caballos de fuerza de los autos es 46.
El primer cuartil (1st Qu): El 25% de los autos tiene menos de 75.25 caballos de fuerza y el 75% más.
La mediana (Median): La mitad de los autos tiene menos de 92 caballos de fuerza y la otra mitad más.
La media aritmética (mean) de los caballos de fuerza es 104.12
El tercer cuartil (3rd Qu): El 75% de los autos pesa tiene menos de 125 caballos de fuerza y el 25% más.
El valor máximo observado de caballos de fuerza es de 230.
summary(auto_mpg_csv$weight)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1613 2224 2804 2970 3608 5140
El valor mínimo observado del peso de los autos es 1613lb.
El primer cuartil (1st Qu): El 25% de los autos pesa menos de 2224lb y el 75% pesa más.
La mediana (Median): La mitad de los autos pesa menos de 2804lb y la otra mitad más.
La media aritmética (mean) del peso es 2970lb.
El tercer cuartil (3rd Qu): El 75% de los autos pesa menos de 3608lb, y el 25% pesa más.
El valor máximo observado del peso de los autos es 5140lb.
hist(auto_mpg_csv$weight,
main = "Histograma del peso de los autos",
xlab = "Peso (lbs)",
col = "skyblue",
border = "white")
Distribución sesgada a la derecha.
Mayor concentración en autos livianos-medianos.
plot(auto_mpg_csv$weight, auto_mpg_csv$mpg,
main = "Diagrama de dispersión: Peso vs Rendimiento (mpg)",
xlab = "Peso (lbs)",
ylab = "Millas por galón (mpg)",
pch = 19, col = "darkblue")
Relación negativa clara
boxplot(auto_mpg_csv$weight,
main = "Diagrama de cajas del peso de los autos",
ylab = "Peso (lbs)",
col = "orange",
border = "brown")
Mediana
Rango total (~1600–5100 lbs)
Los bigotes muestran los valores más extremos sin considerarse atípicos.
Hay autos muy livianos y autos muy pesados.
boxplot(auto_mpg_csv$horsepower,
main = "Diagrama de cajas de la potencia (horsepower)",
ylab = "Caballos de fuerza (hp)",
col = "lightgreen",
border = "darkgreen")
Mediana
Rango intercuartílico
El 50% central de los autos tiene una potencia dentro de este rango.
Esto concentra a la mayoría en potencias moderadas.
Rango total