logo

Introducción

En muchos contextos empresariales y de investigación, las relaciones entre variables no son estrictamente lineales ni independientes.
El efecto de una variable sobre la respuesta puede depender del nivel de otra variable, o bien, una variable numérica puede mostrar un patrón curvo (creciente a un ritmo no constante). Los modelos lineales se pueden extender fácilmente para capturar estas situaciones mediante dos estrategias complementarias:

  1. Incluir términos de interacción:, permiten que el efecto de un predictor cambie según el valor o categoría de otro. En términos estadísticos, una interacción significa que la pendiente de una variable no es igual para todos los grupos.
    • Ejemplo: el impacto de las horas de capacitación en el desempeño laboral puede ser distinto según el departamento.
  2. Incorporar términos polinomiales: permiten modelar curvaturas en la relación entre una variable numérica y la respuesta.
    • Ejemplo: el nivel de ventas puede crecer con el presupuesto en publicidad hasta cierto punto y luego estabilizarse o disminuir, generando una relación cuadrática.

Ambas extensiones se integran dentro del marco de la regresión lineal clásica, ya que la relación sigue siendo lineal en los parámetros, aunque se incluyan combinaciones o poyencias de las variables. Lo que cambia es la forma de interpretar los coeficientes y la lectura visual de los efectos combinados o no lineales.


Modelos con interacción

¿Qué es una interacción?

Decimos que hay interacción cuando el efecto de una variable \(x\) depende del nivel/valor de otra variable \(z\).
En un modelo lineal, esto se expresa añadiendo el término producto \(x:z\).

Tipos de interacciones

Las interacciones permiten modelar cómo el efecto de una variable depende de otra.
En términos prácticos, indican que el cambio esperado en \(Y\) no es constante, sino que varía según otra variable.
A continuación se describen los tres tipos más comunes y cómo interpretarlos.


1. Numérica × numérica

Supongamos dos variables numéricas \(X_1\) y \(X_2\), cuyo efecto combinado sobre \(Y\) podría no ser aditivo. La interacción permite que el efecto de una cambie según el nivel de la otra.

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 (X_1 \times X_2) + e \]

Interpretación de los parámetros:

  • \(\beta_0\): valor esperado de \(Y\) cuando \(X_1=0\) y \(X_2=0\).
  • \(\beta_1\): pendiente de \(X_1\) cuando \(X_2=0\).
  • \(\beta_2\): pendiente de \(X_2\) cuando \(X_1=0\).
  • \(\beta_3\): cambio en la pendiente de \(X_1\) por cada unidad adicional de \(X_2\) (y, simétricamente, cambio en la pendiente de \(X_2\) por cada unidad adicional de \(X_1\)).

En R: este modelo se ajusta con: lm(Y ~ X1c * X2c), equivalente a lm(Y ~ X1c + X2c + X1c:X2c)


Ejemplo conceptual (Numérica × Numérica):

Supongamos que una empresa tecnológica desea analizar cómo las horas de capacitación (\(X_1\)) y los años de experiencia laboral (\(X_2\)) influyen en la productividad semanal (\(Y\)), medida en unidades producidas.

Los datos promedio observados son los siguientes:

Experiencia (años) Capacitación (horas) Productividad (Y)
1 10 40
1 20 55
5 10 60
5 20 90

donde:

  • \(\beta_0\): productividad esperada cuando \(X_1 = 0\) y \(X_2 = 0\);
  • \(\beta_1\): cambio esperado en productividad por hora adicional de capacitación cuando la experiencia es 0;
  • \(\beta_2\): cambio esperado en productividad por año adicional de experiencia cuando la capacitación es 0;
  • \(\beta_3\): cambio en la pendiente de \(X_1\) (capacitación) por cada año adicional de experiencia (interacción).

Supongamos que se estimaron los siguientes coeficientes:

\[ \hat{\beta}_0 = 30, \quad \hat{\beta}_1 = 1.2, \quad \hat{\beta}_2 = 4, \quad \hat{\beta}_3 = 0.6 \]

Entonces, el modelo completo es:

\[ \hat{Y} = 30 + 1.2X_1 + 4X_2 + 0.6(X_1 \times X_2) \]

Para analizar el efecto de la capacitación (\(X_1\)) según la experiencia:

  • Si \(X_2 = 1\): \(\hat{Y} = 30 + (1.2 + 0.6(1))X_1 + 4(1)\) → pendiente de \(X_1 = 1.8\)
  • Si \(X_2 = 2\): \(\hat{Y} = 30 + (1.2 + 0.6(2))X_1 + 4(2)\) → pendiente de \(X_1 = 2.4\)

Interpretaciones:
- La productividad aumenta con las horas de capacitación y la experiencia laboral, pero el efecto de la capacitación es mayor en empleados con más experiencia.
- Existe una interacción positiva: la capacitación y la experiencia se potencian mutuamente, aumentando la productividad más de lo que producirían por separado.


2. Numérica × Categórica

Supongamos una variable numérica \(X\) y una variable categórica \(C\) con \(k\) niveles, donde el nivel \(C_1\) será la categoría de referencia.

\[ Y = \beta_0 + \beta_1 X + \sum_{i=2}^k \alpha_i C_i + \sum_{i=2}^k \gamma_i (X \times C_i ) + e \]

Interpretación de los parámetros:

  • \(\beta_0\): intercepto para la categoría de referencia (\(C_1\)) cuando \(X=0\).
  • \(\beta_1\): pendiente de \(X\) en la categoría de referencia.
  • \(\alpha_i\): cambio en el intercepto de la categoría \(i\) respecto a la referencia, manteniendo \(X\) constante.
  • \(\gamma_i\): cambio en la pendiente de \(X\) en la categoría \(i\), respecto a la referencia.
  • Si todas las \(\gamma_i = 0\), las líneas son paralelas (sin interacción).
  • Si alguna \(\gamma_i \neq 0\), el efecto de \(X\) difiere entre grupos.

En R: este modelo se ajusta con: lm(Y ~ C * X)


Ejemplo conceptual (Numérica × Categórica):

Supongamos que una cadena de tiendas desea analizar cómo la inversión mensual en marketing digital (\(X\), en miles de dólares) influye en las ventas promedio (\(Y\), en miles de dólares), según el tipo de tienda: Urbana, Suburbana o Rural.

Los datos promedio observados son:

Tipo de tienda Inversión (X) Ventas promedio (Y)
Urbana 10 120
Urbana 20 160
Suburbana 10 100
Suburbana 20 140
Rural 10 80
Rural 20 110

Para incorporar esta variable en un modelo de regresión con interacción, se crean dos variables dummy, tomando Urbana como referencia:

\[ D_1 = \begin{cases} 1, & \text{si la tienda es Suburbana}\\ 0, & \text{en otro caso} \end{cases} \quad\text{y}\quad D_2 = \begin{cases} 1, & \text{si la tienda es Rural}\\ 0, & \text{en otro caso} \end{cases} \]

El modelo con interacción se expresa como:

\[ \hat{Y} = \beta_0 + \beta_1 X + \alpha_1 D_1 + \alpha_2 D_2 + \gamma_1 (X \times D_1) + \gamma_2 (X \times D_2) \]

donde:

  • \(\beta_0\): ventas esperadas en tiendas urbanas cuando \(X=0\).
  • \(\beta_1\): pendiente de inversión en tiendas urbanas.
  • \(\alpha_i\): cambio en el intercepto respecto a tiendas urbanas (manteniendo \(X\) constante).
  • \(\gamma_i\): cambio en la pendiente de inversión respecto a tiendas urbanas.

Supongamos que se estimaron los siguientes coeficientes:

\[ \hat{\beta}_0 = 100, \quad \hat{\beta}_1 = 3, \quad \hat{\alpha}_1 = -20, \quad \hat{\alpha}_2 = -40, \quad \hat{\gamma}_1 = -1, \quad \hat{\gamma}_2 = -2 \]

Entonces, los modelos por tipo de tienda serían:

  • Urbana: \(\hat{Y} = 100 + 3X\)
  • Suburbana: \(\hat{Y} = (100 - 20) + (3 - 1)X = 80 + 2X\)
  • Rural: \(\hat{Y} = (100 - 40) + (3 - 2)X = 60 + X\)

Interpretaciones:
La inversión en marketing digital impulsa las ventas en todos los tipos de tienda, pero la magnitud del efecto depende del contexto:
- Las tiendas urbanas tienen el mayor incremento por unidad invertida (pendiente 3).
- En zonas suburbanas, el efecto es moderado (pendiente 2).
- En zonas rurales, el aumento es el más bajo (pendiente 1).

Esto indica una interacción negativa, donde el retorno de la inversión disminuye al pasar de áreas urbanas a rurales.


3. Categórica × Categórica

Supongamos dos variables categóricas \(A\) y \(B\), con \(k\) y \(m\) niveles respectivamente.
Cada una se codifica en variables dummy tomando un nivel de referencia (\(A_1\) y \(B_1\)).

\[ Y = \beta_0 + \sum_{i=2}^{k} \alpha_i A_i + \sum_{j=2}^{m} \delta_j B_j + \sum_{i=2}^{k} \sum_{j=2}^{m} \gamma_{ij} (A_i \times B_j) + e \]

Interpretación de los parámetros:

  • \(\beta_0\): valor esperado de \(Y\) en la combinación de referencia (\(A_1, B_1\)).
  • \(\alpha_i\): cambio en el promedio de \(Y\) al pasar de \(A_1\) a \(A_i\), manteniendo \(B\) constante en su referencia (\(B_1\)).
  • \(\delta_j\): cambio en el promedio de \(Y\) al pasar de \(B_1\) a \(B_j\), manteniendo \(A\) constante en su referencia (\(A_1\)).
  • \(\gamma_{ij}\): cambio adicional en el efecto conjunto de \(A_i\) y \(B_j\) más allá de los efectos individuales (es decir, la diferencia de diferencias).

En R: este modelo se ajusta con: lm(Y ~ A * B), equivalente a lm(Y ~ A + B + A:B)


Ejemplo conceptual (Categórica × Categórica):

Una cadena hotelera estudia la satisfacción (\(Y\), 0–100) según:

  • Programa de fidelización \(A\): Básico, Plata, Oro (referencia \(A_1=\) Básico).
  • Motivo del viaje \(B\): Placer (referencia \(B_1\)) o Negocios (\(B_2\)).

Promedios observados:

Programa Motivo Satisfacción \(Y\)
Básico Placer 80
Plata Placer 84
Oro Placer 86
Básico Negocios 78
Plata Negocios 82
Oro Negocios 90

Definimos dummies \(A_2=\mathbf{1}\{\text{Plata}\},\; A_3=\mathbf{1}\{\text{Oro}\},\; B_2=\mathbf{1}\{\text{Negocios}\}\).
Modelo con interacción: \[ \hat Y \;=\; \beta_0 \;+\; \alpha_2 A_2 \;+\; \alpha_3 A_3 \;+\; \delta B_2 \;+\; \gamma_{2} (A_2B_2) \;+\; \gamma_{3} (A_3B_2). \]

Supongamos que se estimaron los siguientes coeficientes: \[ \hat\beta_0=80,\quad \hat\alpha_2=4,\quad \hat\alpha_3=6,\quad \hat\delta=-2,\quad \hat\gamma_2=0,\quad \hat\gamma_3=6. \]

Modelos por combinación:

  • Básico, Placer: \(80\)
  • Plata, Placer: \(80+4=84\)
  • Oro, Placer: \(80+6=86\)
  • Básico, Negocios: \(80-2=78\)
  • Plata, Negocios: \(80+4-2+0=82\)
  • Oro, Negocios: \(80+6-2+6=90\)

Interpretaciones:

  • \(\alpha_2\) y \(\alpha_3\) son diferencias entre programas cuando el motivo es Placer (categoría de referencia de \(B\)).
  • \(\delta\) es la diferencia Negocios vs. Placer solo para Básico (referencia de \(A\)).
  • \(\gamma_3=6\) indica un aumento adicional (más allá de \(\alpha_3\) y \(\delta\)) del programa Oro cuando el motivo es Negocios: una diferencia-de-diferencias.
    De hecho, \((90-86) - (78-80) = 6\).
  • \(\gamma_2=0\) sugiere que Plata no cambia su brecha frente a Básico al pasar de Placer a Negocios (no hay interacción para Plata).