library(ISLR2)
library(tidyverse)
mpg = read.table('data/Auto.data', header = TRUE)
mpg <- mpg |>
mutate(horsepower = as.numeric(horsepower)) |>
select(c(mpg, horsepower)) |>
na.omit()
glimpse(mpg)
set.seed(1)
n_obs = nrow(mpg)
1train = sample(n_obs, size = 196)- 1
-
Aquí hacemos el muestreo de índices, aunque pudimos hacer
sample(mpg, size = 196). Esto nos daría una base de datos completa con 196 observaciones seleccionadas al azar. Pero hacer el muestreo por índices facilita el trabajo con la funciónlm
Rows: 392
Columns: 2
$ mpg <dbl> 18, 15, 18, 16, 17, 15, 14, 14, 14, 15, 15, 14, 15, 14, 24,…
$ horsepower <dbl> 130, 165, 150, 150, 140, 198, 220, 215, 225, 190, 170, 160,…