Variables

Las variables que usamos son horsepower (caballos de fuerza) y weight (peso) como varibales cuantitativas y como las cuantitativas son car name (nombre del carro) Row —

library(readr)
library(readxl)
library(corrplot)
## corrplot 0.95 loaded
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
auto_mpg_csv <- read.csv("auto-mpg.csv", sep = ";")
vars_cuanti<-names(auto_mpg_csv)[sapply(auto_mpg_csv, is.numeric)]
mat_cor <- cor(auto_mpg_csv[vars_cuanti], use = "complete.obs", method = "pearson")
corrplot(mat_cor,method = "color",)

cor(auto_mpg_csv$weight, auto_mpg_csv$horsepower)
## [1] 0.8639838
summary(auto_mpg_csv$horsepower)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   46.00   75.25   92.00  104.12  125.00  230.00
  • El valor mínimo observado de caballos de fuerza de los autos es 46.

  • El primer cuartil (1st Qu): El 25% de los autos tiene menos de 75.25 caballos de fuerza y el 75% más.

  • La mediana (Median): La mitad de los autos tiene menos de 92 caballos de fuerza y la otra mitad más.

  • La media aritmética (mean) de los caballos de fuerza es 104.12

  • El tercer cuartil (3rd Qu): El 75% de los autos pesa tiene menos de 125 caballos de fuerza y el 25% más.

  • El valor máximo observado de caballos de fuerza es de 230.

summary(auto_mpg_csv$weight)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1613    2224    2804    2970    3608    5140
  • El valor mínimo observado del peso de los autos es 1613lb.

  • El primer cuartil (1st Qu): El 25% de los autos pesa menos de 2224lb y el 75% pesa más.

  • La mediana (Median): La mitad de los autos pesa menos de 2804lb y la otra mitad más.

  • La media aritmética (mean) del peso es 2970lb.

  • El tercer cuartil (3rd Qu): El 75% de los autos pesa menos de 3608lb, y el 25% pesa más.

  • El valor máximo observado del peso de los autos es 5140lb.

hist(auto_mpg_csv$weight,
     main = "Histograma del peso de los autos",
     xlab = "Peso (lbs)",
     col = "skyblue",
     border = "white")

  1. Distribución sesgada a la derecha.

    • La mayoría de los autos pesa entre 2000 y 3500 lbs.
  2. Mayor concentración en autos livianos-medianos.

    • El grupo más numeroso está en el rango de 2000–2500 lbs, seguido de 2500–3000 lbs.
plot(auto_mpg_csv$weight, auto_mpg_csv$mpg,
     main = "Diagrama de dispersión: Peso vs Rendimiento (mpg)",
     xlab = "Peso (lbs)",
     ylab = "Millas por galón (mpg)",
     pch = 19, col = "darkblue")

  1. Relación negativa clara

    • A medida que el peso del auto aumenta, el rendimiento en millas por galón disminuye.
boxplot(auto_mpg_csv$weight,
        main = "Diagrama de cajas del peso de los autos",
        ylab = "Peso (lbs)",
        col = "orange",
        border = "brown")

  1. Mediana

    • La línea gruesa dentro de la caja indica que la mitad de los autos pesan menos de 2800 lbs y la otra mitad más.
  2. Rango total (~1600–5100 lbs)

    • Los bigotes muestran los valores más extremos sin considerarse atípicos.

    • Hay autos muy livianos y autos muy pesados.

boxplot(auto_mpg_csv$horsepower,
        main = "Diagrama de cajas de la potencia (horsepower)",
        ylab = "Caballos de fuerza (hp)",
        col = "lightgreen",
        border = "darkgreen")

  1. Mediana

    • La línea central de la caja indica que la mitad de los autos tiene menos de 90 hp y la otra mitad más. Esto muestra que la mayoría son autos de potencia baja o media.
  2. Rango intercuartílico

    • El 50% central de los autos tiene una potencia dentro de este rango.

    • Esto concentra a la mayoría en potencias moderadas.

  3. Rango total

    • Los bigotes muestran que la mayoría de los autos tiene entre 50 y 200 hp.