¿Qué Es La Regresión Lineal Simple?

La Regresión Lineal Simple (RLS) es un método estadístico fundamental que se utiliza para modelar la relación lineal entre dos variables continuas. Es una técnica de aprendizaje supervisado.

El modelo de RLS involucra dos tipos de variables:

Objetivo

El objetivo principal de la Regresión Lineal Simple es encontrar la línea recta que mejor se ajusta a los datos, de manera que esta línea pueda usarse para:

Ecuación del Modelo

El modelo de regresión lineal simple se representa matemáticamente con la ecuación de una línea recta:

\[Y = \beta _{0} + \beta _{1}X + \varepsilon\]

Donde:

Hipótesis

1.Salario vs. Años de Experiencia

Este modelo predice el salario (Y) basándose en los años de experiencia (X).

El entorno real de esta hipótesis es el mercado laboral y la gestión de recursos humanos. La prueba de si \(\mathbf{\beta_1}\) es diferente de cero no es un mero ejercicio académico; es la base para la toma de decisiones económicas y de política corporativa.

Contexto de la Decisión Empresarial y de Política Pública

library(knitr)
library(kableExtra)

Hipotesis_1 <- data.frame(
  "Años_De_Experiencia(X)" = c("1.1", "3.2", "5.1" , "7.4" , "10.3" , "12.0"),
  "Salario_Anual(Y)" = c("39.34", "55.79", "75.80" , "98.27" , "122.39" , "143.01"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_1, "html", caption = "Datos relacionados:") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
Datos relacionados:
Años_De_Experiencia.X. Salario_Anual.Y.
1.1 39.34
3.2 55.79
5.1 75.80
7.4 98.27
10.3 122.39
12.0 143.01
plot(Hipotesis_1,
     xlab = "Años de experiencia",
     ylab = "Salario anual",
     main = "Relación entre años de experiencia & salario anual")

Hipótesis a Contrastar

Interpretación

Supongamos que el modelo de RLS ajustado nos da la siguiente ecuación:

\[Y = 25.79 + 9.49X\]

library(knitr)
library(kableExtra)

Hipotesis_1 <- data.frame(
  "Parámetro" = c("P-Valor"),
  "Resultado" = c("2.2 x 10^-16"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_1, "html", caption = "Resultados:") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
Resultados:
Parámetro Resultado
P-Valor 2.2 x 10^-16
library(knitr)
library(kableExtra)

Hipotesis_1 <- data.frame(
  "Parámetro" = c(" $R^2$ Ajustado"),
  "Resultado" = c("0,95 ó 95%"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_1, "html", caption = " $R^2$") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
\(R^2\)
Parámetro Resultado
\(R^2\) Ajustado 0,95 ó 95%

2.Consumo Eléctrico vs. Temperatura Media

Este modelo predice el consumo eléctrico (\(Y\)) basándose en la temperatura media diaria (\(X\)), asumiendo que el consumo aumenta con el uso de aire acondicionado o calefacción.

El entorno real de esta hipótesis es el de la gestión de infraestructuras energéticas y la planificación de servicios públicos. La prueba de la hipótesis es fundamental para garantizar el suministro y la eficiencia operativa.

Contexto de la Planificación y Gestión de Riesgos

library(knitr)
library(kableExtra)

Hipotesis_2 <- data.frame(
  "Temperatura_Media_Diaria(X)" = c("5", "10", "15" , "20" , "25" , "30"),
  "Consumo_Eléctrico(Y)" = c("18.5", "16.0", "20.2" , "25.5" , "32.1" , "40.8"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_2, "html", caption = "Datos relacionados:") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
Datos relacionados:
Temperatura_Media_Diaria.X. Consumo_Eléctrico.Y.
5 18.5
10 16.0
15 20.2
20 25.5
25 32.1
30 40.8
plot(Hipotesis_2,
  xlab = "Temperatura Media Diaria",
  ylab = "Consumo eléctrico",
  main = "Relación entre temperatura y consumo eléctrico")

Hipótesis a contrastar

Interpretación

Supongamos que el modelo de RLS ajustado nos da la siguiente ecuación:

\[Y = 5.23 + 1.05X\]

library(knitr)
library(kableExtra)

Hipotesis_1 <- data.frame(
  "Parámetro" = c("P-Valor"),
  "Resultado" = c("2.2 x 10^-18"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_1, "html", caption = "Resultados:") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
Resultados:
Parámetro Resultado
P-Valor 2.2 x 10^-18
library(knitr)
library(kableExtra)

Hipotesis_1 <- data.frame(
  "Parámetro" = c(" $R^2$ Ajustado"),
  "Resultado" = c("0,86 ó 86%"),
  stringsAsFactors = FALSE
)

kable(Hipotesis_1, "html", caption = " $R^2$") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 20
  ) 
\(R^2\)
Parámetro Resultado
\(R^2\) Ajustado 0,86 ó 86%

Conclusión

Ambos análisis de Regresión Lineal Simple demostraron que las relaciones modeladas son estadísticamente robustas y predictivas, ya que en ambos casos se obtuvo un ajuste excelente (con altos valores de \(R^2\) ajustado) y una significancia extrema (p-valores cercanos a cero). Estos resultados permiten rechazar la Hipótesis Nula (\(\mathbf{H_0}: \beta_1 = 0\)) con alta confianza. En esencia, la prueba valida que la variable independiente elegida tiene un impacto real y cuantificable sobre la variable dependiente, confirmando que la linealidad es un modelo apropiado y altamente útil para la predicción y la toma de decisiones en entornos tan diversos como la gestión de recursos humanos y la planificación de infraestructuras energéticas.

Referencias

Datos Abiertos Colombia. (s/f). la plataforma de datos abiertos del gobierno colombiano. https://www.datos.gov.co/browse?sortBy=newest&utf8=%E2%9C%93&pageSize=20&page=1

Representantes, C. (2020). Integrantes de las Unidades de Trabajo Legislativo (UTL) de los Representantes a la Cámara [Data set] https://www.datos.gov.co/Funci-n-p-blica/Integrantes-de-las-Unidades-de-Trabajo-Legislativo/7w3p-s9ve/about_data

Evaluación del Clima Global en 2024. (2025, enero 9). National Centers for Environmental Information (NCEI) https://www.ncei.noaa.gov/news/clima-global-202413

Mínimos, S., & Ontrato, (C. (s/f). ESCALA M ÍNI MOS DE REMUN ERACIÓN 2024 https://www.fumc.edu.co/documentos/egresados/escala_remuneracion.pdf

Ayuda Epidat. (2014, octubre). Distribuciones de probabilidad. Servicio Galego de Saúde (SERGAS). https://www.sergas.es/Saude-publica/Documents/1899/Ayuda_Epidat_4_Distribuciones_de_probabilidad_Octubre2014.pdf