Lucas Mesías
library(ggplot2)
# Generamos el conjunto de datos con dos variables (X y Y)
set.seed(123) # Para reproducibilidad
X <- 1:20
Y <- 3*X + rnorm(20, mean = 0, sd = 5)
# Creamos un data frame con las dos variables
data <- data.frame(X = X, Y = Y)
# Ajustamos el modelo de regresión lineal simple
lm_model <- lm(Y ~ X, data = data)
# Graficamos los puntos y la línea de regresión
plot(X, Y, main = "Regresión Lineal Simple", xlab = "Variable X", ylab = "Variable Y")
abline(lm_model, col = "red")
# Generamos 5 nuevos registros para predecir
nuevos_registros <- data.frame(X = 21:25)
# Realizamos las predicciones con el modelo existente
predicciones <- predict(lm_model, nuevos_registros)
# Graficamos los puntos originales, las predicciones y la nueva línea de regresión
plot(X, Y, main = "Regresión Lineal Simple con Nuevos Registros", xlab = "Variable X", ylab = "Variable Y")
points(nuevos_registros$X, predicciones, col = "orange", pch = 16)
abline(lm_model, col = "red")
La diferencia es muy dificil de ver a simple vista, aparentemente, la
pendiente de la recta roja no cambió.
# Tomamos un punto cualquiera del conjunto de datos
indice_punto <- 7
punto_x_multiplicado <- X[indice_punto] * 100
punto_y <- Y[indice_punto]
# Ajustamos nuevamente el modelo de regresión lineal simple con el nuevo punto
X_punto_multiplicado <- c(X[-indice_punto], punto_x_multiplicado)
Y_punto_multiplicado <- c(Y[-indice_punto], punto_y)
lm_model_punto_multiplicado <- lm(Y_punto_multiplicado ~ X_punto_multiplicado)
# Graficamos los puntos originales, el punto multiplicado y la nueva línea de regresión
plot(X, Y, main = "Regresión Lineal Simple con Punto Multiplicado", xlab = "Variable X", ylab = "Variable Y")
points(punto_x_multiplicado, punto_y, col = "green", pch = 16)
abline(lm_model_punto_multiplicado, col = "red")
La pendiente de la linea roja cambió drásticamente, pasó de ser un valor
cercano a 1, es decir, una diagonal bastante definida, a uno cercano a
0, es decir, casi horizontal.