Ejercicio 1 de Estadística Computacional USACH

Lucas Mesías

library(ggplot2)

Actividad 1

Cree su propio ejemplo de regresión lineal simple utilizando un conjunto de datos con dos variables y la función lm. Grafique utilizando las funciones plot y abline.

# Generamos el conjunto de datos con dos variables (X y Y)
set.seed(123)  # Para reproducibilidad
X <- 1:20
Y <- 3*X + rnorm(20, mean = 0, sd = 5)

# Creamos un data frame con las dos variables
data <- data.frame(X = X, Y = Y)

# Ajustamos el modelo de regresión lineal simple
lm_model <- lm(Y ~ X, data = data)

# Graficamos los puntos y la línea de regresión
plot(X, Y, main = "Regresión Lineal Simple", xlab = "Variable X", ylab = "Variable Y")
abline(lm_model, col = "red")

Actividad 2

# Generamos 5 nuevos registros para predecir
nuevos_registros <- data.frame(X = 21:25)

# Realizamos las predicciones con el modelo existente
predicciones <- predict(lm_model, nuevos_registros)

# Graficamos los puntos originales, las predicciones y la nueva línea de regresión
plot(X, Y, main = "Regresión Lineal Simple con Nuevos Registros", xlab = "Variable X", ylab = "Variable Y")
points(nuevos_registros$X, predicciones, col = "orange", pch = 16)
abline(lm_model, col = "red")

La diferencia es muy dificil de ver a simple vista, aparentemente, la pendiente de la recta roja no cambió.

Actividad 3

# Tomamos un punto cualquiera del conjunto de datos
indice_punto <- 7
punto_x_multiplicado <- X[indice_punto] * 100
punto_y <- Y[indice_punto]

# Ajustamos nuevamente el modelo de regresión lineal simple con el nuevo punto
X_punto_multiplicado <- c(X[-indice_punto], punto_x_multiplicado)
Y_punto_multiplicado <- c(Y[-indice_punto], punto_y)
lm_model_punto_multiplicado <- lm(Y_punto_multiplicado ~ X_punto_multiplicado)

# Graficamos los puntos originales, el punto multiplicado y la nueva línea de regresión
plot(X, Y, main = "Regresión Lineal Simple con Punto Multiplicado", xlab = "Variable X", ylab = "Variable Y")
points(punto_x_multiplicado, punto_y, col = "green", pch = 16)
abline(lm_model_punto_multiplicado, col = "red")

La pendiente de la linea roja cambió drásticamente, pasó de ser un valor cercano a 1, es decir, una diagonal bastante definida, a uno cercano a 0, es decir, casi horizontal.

Fuentes:

  • ChatGPT (2021)