1. Carga y Limpieza de Datos Carga nuevamente el archivo Auto.csv en un objeto llamado datos. Asegúrese de especificar que los signos de interrogación (?) deben ser tratados como valores faltantes (NA). Una vez cargado, utilice la función na.omit() para eliminar las filas con datos faltantes y utilice la función dim() para reportar cuántas observaciones y variables quedaron en el conjunto de datos limpio.

datos<-read.csv("Auto(in).csv", header = TRUE, na.strings = "?")
datos<-na.omit(datos)
dim(datos)
## [1] 392   9

2. Indexación y Subconjuntos Basándote en los datos limpios del ejercicio anterior, crea una nueva matriz u objeto que contenga solamente las columnas correspondientes a mpg, horsepower y weight. De este nuevo objeto, selecciona y guarda únicamente las primeras 20 filas. Imprime el resultado en pantalla.

subdatos <- datos[, c("mpg", "horsepower", "weight")]
subdatos_20 <- subdatos[1:20, ]
subdatos_20
##    mpg horsepower weight
## 1   18        130   3504
## 2   15        165   3693
## 3   18        150   3436
## 4   16        150   3433
## 5   17        140   3449
## 6   15        198   4341
## 7   14        220   4354
## 8   14        215   4312
## 9   14        225   4425
## 10  15        190   3850
## 11  15        170   3563
## 12  14        160   3609
## 13  15        150   3761
## 14  14        225   3086
## 15  24         95   2372
## 16  22         95   2833
## 17  18         97   2774
## 18  21         85   2587
## 19  27         88   2130
## 20  26         46   1835

3. Estadística Descriptiva Utilizando el conjunto de datos completo y limpio: a) Calcula la media (mean) de la variable weight. b) Calcula la desviación estándar (sd) de la variable mpg. c) Calcula la varianza (var) de ambas variables para observar las diferencias en magnitud y dispersión.

# Media de weight
mean(datos$weight)
## [1] 2977.584
#Desviación estándar de mpg
sd(datos$mpg)
## [1] 7.805007
#Varianza de weight y mpg
var(datos$weight)
## [1] 721484.7
var(datos$mpg)
## [1] 60.91814

4. Gráficos Personalizados Genera un gráfico de dispersión (plot) para visualizar la relación entre la potencia (horsepower) en el eje X y el rendimiento (mpg) en el eje Y. El gráfico debe incluir:

plot(datos$horsepower, datos$mpg,
     main = "Relación Potencia vs Consumo",
     xlab = "Caballos de Fuerza",
     ylab = "Millas por Galón")

5. Correlación y Simulación Primero, calcula la correlación real entre horsepower y mpg utilizando la función cor(). Segundo, realiza una simulación para comparar:

cor(datos$horsepower, datos$mpg)
## [1] -0.7784268
set.seed(50)
tam <- dim(datos)[1]
ruido <- rnorm(tam)
cor(ruido, datos$mpg)
## [1] -0.05537666
# Esperaba que la correlación fuera baja, porque los números generados con rnorm() son aleatorios y no tienen relación con mpg, así que no deberían estar conectados entre sí.