¿Qué son los SEM?
Los modelos de ecuaciones estructurales (SEM, Structural Equation Models) constituyen una familia de modelos estadísticos multivariados que permiten estimar simultáneamente múltiples relaciones entre variables.
Surgieron como respuesta a la necesidad de ampliar la flexibilidad de los modelos clásicos de regresión, especialmente en contextos donde las relaciones entre variables son complejas.
Una de sus principales ventajas es que permiten incorporar explícitamente errores de medición tanto en variables dependientes como independientes.
Los SEM integran elementos de la regresión múltiple con técnicas de análisis factorial, lo que posibilita el estudio de variables observadas y latentes dentro de un mismo marco analítico.
De este modo, facilitan la representación y estimación de efectos directos, indirectos y mediadores entre las variables del modelo.
Desde el punto de vista matemático y computacional, los SEM son modelos altamente complejos, lo que requiere procedimientos de estimación avanzados.
Más que una técnica específica, los SEM representan una forma integral de concebir, formular y contrastar modelos teóricos a partir de datos empíricos.
¿Para qué sirven los SEM?
Formular modelos teóricos que permitan una comprensión más profunda de fenómenos complejos.
Evaluar empíricamente en qué medida los datos respaldan un modelo teórico que plantea múltiples relaciones de dependencia entre variables.
Analizar de forma simultánea relaciones directas, indirectas, mediadoras y potencialmente espurias entre un conjunto de variables.
Estudiar constructos latentes, es decir, variables que no pueden observarse directamente, pero que se infieren a partir de indicadores observables.
Antecedentes
En 1934, el biometrista Sewall Wright introdujo el análisis de trayectoria (path analysis), aplicándolo al estudio de relaciones causales en mediciones biológicas.
Posteriormente, sociólogos como Blalock (1964, 1971), Boudon (1965) y Duncan (1966) reconocieron su utilidad para el análisis de datos no experimentales, lo que impulsó su difusión en las ciencias sociales.
En la década de 1970, estadísticos como Jöreskog (1973), Keesling (1972) y Wiley (1973) desarrollaron el primer modelo general de ecuaciones estructurales, conocido como LISREL (Linear Structural Relations), también denominado modelo JKW.
Posteriormente, Jöreskog refinó el enfoque LISREL y desarrolló métodos para distintos tipos de datos: transversales, longitudinales, multigrupo y multinivel.
Diversos investigadores ampliaron este marco metodológico:
Sörbom (1974): modelos multigrupo con medias latentes.
Muthén (1977): inclusión de variables categóricas observadas.
Hägglund (1985): mínimos cuadrados en dos etapas.
Quiroga (1992): robustez mediante correlaciones policóricas.
Yang-Wallentin (1997): relaciones no lineales.
Extensiones recientes incluyen muestras complejas, modelos generalizados y series temporales.
¿Softwares para SEM?
LISREL (Linear Structural Relations), desarrollado por Jöreskog y Sörbom desde la década de 1970. Fue el primer software especializado en SEM y sentó las bases del enfoque moderno.
EQS, desarrollado por Bentler, orientado específicamente a SEM y ampliamente utilizado en las décadas de 1980 y 1990.
AMOS (Analysis of Moment Structures), desarrollado por Arbuckle, con énfasis en interfaces gráficas y uso integrado con SPSS.
Mplus, desarrollado por Muthén y Muthén, destaca por su flexibilidad para manejar variables categóricas, modelos multigrupo y extensiones como ESEM.
Mx / OpenMx, software libre basado en matrices, ampliamente usado en genética del comportamiento y modelos avanzados.
Otros: CALIS (SAS), RAMONA (SYSTAT), SEPATH (STATISTICA), lavaan (R), Stata y MATLAB.
La causalidad en SEM
Definición de causalidad
Antes de discutir el papel de la causalidad en los modelos de ecuaciones estructurales, es importante aclarar qué se entiende por causalidad en este contexto.
En SEM, una relación causal se concibe como una hipótesis teórica direccional que establece que una variable ejerce influencia sistemática sobre otra, bajo ciertos supuestos sobre el proceso generador de los datos. Estas hipótesis se formulan a priori y luego se contrastan empíricamente mediante el ajuste del modelo a los datos.
Causalidad en SEM
Una característica distintiva de los SEM es su capacidad para representar explícitamente hipótesis causales mediante relaciones direccionales entre variables.
Si bien los parámetros asociados a estas relaciones pueden estimarse estadísticamente, su estimación no implica automáticamente causalidad.
Toda interpretación causal debe estar sustentada en la teoría subyacente, el diseño del estudio y el conocimiento del fenómeno, no únicamente en el ajuste del modelo.
Los SEM no prueban la causalidad; permiten evaluar la plausibilidad empírica de hipótesis causales previamente formuladas.
En este enfoque, se especifica un conjunto de relaciones teóricas y se examina en qué medida estas relaciones son compatibles con la estructura de covarianzas observada en los datos.
Tipos de variables en SEM
Tipos de variables
Antes de introducir la notación formal y las ecuaciones matriciales de los modelos SEM, es fundamental comprender los tipos de variables involucradas y cómo se define la escala de los constructos latentes.
Variables manifistas (observadas, indicadoras): son variables observables, generalmente ítems o preguntas en un cuestionario.
Variables latentes (no observadas): son constructos teóricos que solo pueden medirse indirectamente a través de variables observables que actúan como sus manifestaciones. Similar al análisis factorial, se pueden utilizar múltiples medidas para representar un constructo, lo que ayuda a controlar el error de medición específico de cada variable.
Variables de error: representan tanto los errores asociados a la medición de una variable como aquellas variables no consideradas en el modelo que pueden influir en la medición de una variable observable. Al igual que las variables latentes, no son observables directamente.
Variables exógenas: Son variables que influyen en otras variables del modelo pero no son afectadas por ninguna otra variable. Son similares a las variables independientes en un modelo de regresión.
Variables endógenas: Son variables que son influenciadas por otras variables dentro del modelo. Corresponden a las variables dependientes en los modelos de regresión. Cada variable endógena debe estar acompañada de un término de error.
Variables mediadoras: Son las variables endógenas que a su vez influyen en otras endógenas.
Variables de agrupación o moderadoras: Son variables categóricas que indican la pertenencia de las observaciones a diferentes subpoblaciones. Se utilizan principalmente en análisis de comparaciones entre grupos.
Tipos de variables en un diagrama SEM
La figura siguiente presenta un diagrama SEM conceptual con fines explicativos. En él se muestran variables manifiestas e indicadores, factores latentes y sus términos de error, así como una relación estructural entre factores. Además, se asume un contexto multigrupo, donde una variable de agrupación (por ejemplo, school) define subpoblaciones para comparar el modelo entre grupos. El objetivo del diagrama es clarificar los roles conceptuales de los elementos, no interpretar estimaciones numéricas.
| x1, x2, x3, y1, y2, z1, z2 |
Manifiestas (observadas) |
Indicadores observados |
| F1, F2, F3 |
Latentes |
Constructos no observados |
| errores en x1–x3, y1–y2, z1–z2 (p.ej., e1–e7) |
Errores de medición |
Parte no explicada del indicador |
| error en F2 y F3 (disturbance) |
Error estructural |
Residuo de latentes endógenas |
| F1 |
Exógena |
No recibe flechas (no es explicada por otras latentes) |
| F2, F3 |
Endógenas |
Reciben flechas (son explicadas por otras latentes) |
| F2 |
Mediadora |
Transmite el efecto: (F1 → F2 → F3) |
| school |
Agrupación / moderadora |
Define subpoblaciones (no necesariamente aparece como nodo) |
Grupo (school)
↓
┌───────┐
│ F1 │ ← exógena
└───────┘
↑ ↑ ↑
e1 e2 e3
x1 x2 x3
↓
┌───────┐
│ F2 │ ← mediadora / endógena
└───────┘
↑ ↑
e4 e5
y1 y2
↓
┌───────┐
│ F3 │ ← endógena
└───────┘
↑ ↑
e6 e7
z1 z2
Escala de las variables latentes
Antes de introducir la notación matricial formal de los modelos de ecuaciones estructurales, es fundamental comprender cómo se define la escala de las variables latentes. Dado que las variables latentes no se observan directamente, no poseen unidades de medida inherentes, por lo que el modelo no está identificado a menos que se imponga alguna restricción para fijar su escala.
Escala: métodos
Existen tres métodos comunes para establecer la escala de una variable latente:
Variable latente estandarizada.
Variable marcador.
Codificación de efectos.
A continuación se ilustra cada método utilizando un mismo modelo conceptual base, con el objetivo de resaltar que el modelo no cambia, sino únicamente la forma en que se define la escala del factor latente.
Modelo conceptual base (común a los tres métodos)
Consideremos una variable latente \(\eta\) medida por tres indicadores observados \(x_1, x_2, x_3\):
x1
↑
|
┌───────┐
│ η │ ← variable latente
└───────┘
|
↓
x2
|
↓
x3
Este modelo de medición es idéntico en los tres métodos de escalamiento. Lo único que varía es la restricción utilizada para definir la unidad de medida de \(\eta\).
Escala: variable latente estandarizada
Restricción
En este método se impone la siguiente restricción:
\[Var(\eta)= 1\]
Interpretación conceptual
La variable latente se define en unidades de desviación estándar, de forma análoga a una variable tipificada.
Todas las cargas factoriales se estiman libremente.
La varianza del factor no se estima, sino que se fija en 1.
Interpretación de las cargas
Una carga factorial indica:
Cuántas desviaciones estándar cambia el indicador cuando la variable latente aumenta una desviación estándar.
Por ejemplo, si \(\lambda=0.70\), un aumento de una desviación estándar en \(\eta\) implica un aumento de \(0.70\) desviaciones estándar en \(x_2\).
Comentario pedagógico
Este método es útil para comparar magnitudes relativas, aunque las cargas fijadas a 1 en la métrica original no permanecen iguales a 1 cuando se muestran coeficientes estandarizados en diagramas SEM.
Carga factorial estandarizada
Definición
En un modelo CFA/SEM, la carga factorial estandarizada se define como:
\[
\lambda_{\text{std}} = \lambda_{\text{est}} \cdot \frac{\sigma_{\eta}}{\sigma_x},
\]
donde:
\(\lambda_{\text{est}}\) es la carga no estandarizada,
\(\sigma_{\eta}\) es la desviación estándar del factor latente y
\(\sigma_x\) es la desviación estándar del indicador observado.
Comentarios importantes
Este método establece la varianza de la variable latente en 1.0, convirtiéndola así en una variable estandarizada (similar a una puntuación \(Z\)).
Si las variables indicadoras también están estandarizadas, las cargas pueden interpretarse igual que un coeficiente de regresión estandarizado:
- El número de desviaciones estándar que cambia la variable manifiesta cuando la variable latente aumenta en una desviación estándar.
- Además, si hay más de una variable latente, la covarianza entre ellas se convierte en una correlación.
Estimaciones mostradas en summary() y en los diagramas SEM
Por defecto, la función summary() de lavaan presenta estimaciones no estandarizadas (columna Estimate). Estas estimaciones reflejan directamente el esquema de identificación del modelo, en el cual una carga factorial por factor suele fijarse en 1 (por ejemplo, x1 = 1, x4 = 1, x7 = 1) con el fin de definir la escala de las variables latentes.
En contraste, cuando se utiliza semPaths(..., what = "std", whatLabels = "std") del paquete semPlot, el diagrama SEM muestra coeficientes estandarizados. En este caso, las cargas factoriales fijadas a 1 en la métrica original no permanecen iguales a 1, ya que la estandarización transforma los parámetros. Por tanto, aun cuando \(\lambda_{\text{est}} = 1\), si \(\sigma_{\eta} \neq \sigma_x\), se obtiene necesariamente que
\[
\lambda_{\text{std}} \neq 1.
\]
Esto explica por qué en la salida de summary() se van a observar cargas iguales a 1, mientras que en los diagramas estandarizados dichas cargas van tomar valores distintos (si no se escriben los argumentos apropiados).
Escala: variable marcador
Definición
Este método implica restringir una carga factorial de cada variable latente a un valor arbitrario (usualmente \(\lambda_1=1.0\)).
La variable indicadora cuya carga está restringida se conoce como la variable marcador.
Este método define la varianza de la variable latente usando la variable marcador.
x1 ← variable marcador
↑
| λ1 = 1
┌───────┐
│ η │
└───────┘
|
↓
x2
|
↓
x3
Interpretación conceptual
La escala del factor queda definida en las unidades del indicador marcador.
La varianza de la variable latente se estima libremente.
Las demás cargas factoriales se interpretan relativamente al marcador.
Interpretación de las cargas
Si la carga factorial del segundo indicador es
\[
\lambda_2 = 0.80,
\]
entonces, por cada unidad de cambio en la variable latente \(\eta\) (medida en las unidades del indicador marcador \(x_1\)), el indicador \(x_2\) cambia 0.80 unidades.
Comentario pedagógico
Este es el método más utilizado en la práctica y corresponde al esquema por defecto de lavaan. Esto explica la presencia habitual de cargas factoriales fijadas en 1 en la salida de summary(), ya que dicha restricción se emplea para definir la escala del factor latente.
Escala: codificación de efectos
En este método se imponen restricciones sobre todas las cargas factoriales, de modo que su promedio sea igual a 1.
Para un factor con \(p\) indicadores, la restricción se expresa como:
\[
\frac{1}{p} \sum_{j=1}^{p} \lambda_j = 1.
\]
De manera equivalente, la suma de las cargas factoriales es igual al número de indicadores:
\[
\lambda_1 + \lambda_2 + \cdots + \lambda_p = p.
\]
En este ejemplo, \(p=3\).
x1
↑
| λ1
┌───────┐
│ η │ con promedio(λ) = 1
└───────┘
|
↓
x2
|
↓
x3
Interpretación conceptual
La variable latente se define en la escala promedio de sus indicadores.
Ningún indicador actúa como referencia privilegiada.
Todas las cargas factoriales se interpretan respecto al indicador promedio.
Comentario pedagógico
Este método es conceptualmente simétrico y elegante, aunque menos frecuente en aplicaciones estándar y en software que adopta por defecto el enfoque de variable marcador.
Comparación de los métodos de escala
| Latente estandarizada |
\(\mathrm{Var}(\eta) = 1\) |
Desviación estándar |
| Variable marcador |
\(\lambda = 1\) |
Indicador de referencia |
| Codificación de efectos |
\(\mathrm{Promedio}(\lambda) = 1\) |
Promedio de los indicadores |
Mensaje clave
En los tres casos, el modelo es el mismo.
Lo único que cambia es la convención utilizada para definir la escala de la variable latente.
Estas decisiones afectan la interpretación numérica de los parámetros, pero no alteran el ajuste del modelo ni las relaciones sustantivas entre las variables.
Tipos de relaciones entre variables
En un SEM, se pueden definir varios tipos de relaciones entre variables. A continuación se describen estos tipos de relaciones.
Covariación
Se refiere a la relación entre dos variables que varían juntas, pero sin implicar causalidad. Indica que cuando una variable cambia, la otra también lo hace, pero no necesariamente porque una cause a la otra.
Ejemplo.
La relación entre la cantidad de helados vendidos y el número de personas que van a la playa. Estas dos variables covarían porque ambas aumentan durante el verano, pero una no causa directamente a la otra. Véase la figura 8.1.
Causalidad:
Se refiere a una relación en la que un cambio en una variable provoca un cambio en otra. En SEM, la causalidad implica una dirección de influencia.
Ejemplo.
El nivel de educación y el salario. Una mayor educación (variable independiente) puede causar un aumento en el salario (variable dependiente). Véase la figura 8.2.
Relación espuria
Se da cuando dos variables parecen estar relacionadas, pero esta relación es causada por una tercera variable que afecta a ambas. La relación entre las dos variables no es directa sino que es mediada por esta tercera variable.
Ejemplo.
El tamaño del pie y la habilidad para leer en niños. Aunque pueden parecer relacionados, ambos están influenciados por la edad del niño, que es la verdadera causa subyacente de la relación. Véase la figura 8.3.
Causalidad directa
Ocurre cuando una variable directamente afecta a otra sin la intervención de otras variables. En el diagrama de SEM, esto se representa con una flecha que va directamente de la variable causa a la variable efecto.
Ejemplo.
El tenre un empleo (variable independiente) incrementa los ingresos (variable dependiente). Véase la figura 8.4.
Causalidad indirecta
Se refiere a una situación en la que una variable afecta a otra a través de una o más variables intermedias (mediadoras). En un diagrama SEM, esto se muestra como una cadena de flechas que pasan por una o más variables mediadoras antes de llegar a la variable objetivo.
Ejemplo.
La educación afecta los ingresos a través del empleo. La educación (variable independiente) aumenta la probabilidad de obtener un empleo (variable mediadora), lo cual a su vez incrementa los ingresos (variable dependiente). Véase la figura 8.5.
Causalidad recíproca
Se presenta cuando dos variables se afectan mutuamente. Cada variable es a la vez causa y efecto de la otra. En un diagrama SEM, esto se representa con flechas bidireccionales entre las dos variables.
Ejemplo.
Estrés y problemas de salud. El estrés puede causar problemas de salud, y a su vez, los problemas de salud pueden aumentar el nivel de estrés. Esta relación es bidireccional. Véase la figura 8.6.
Diagramas estructurales
Como ejemplo, véase la figura 8.7.
Observaciones.
Los efectos directos se indican con flechas rechas.
El final de la flecha es la variable dependiente.
Las estimaciones delos parámetros siempre aparecen sobre la flecha correspondiente.
Cualquier variable que sea influenciada por otra variable del modelo debe tener un término de error.
Algunos programas también suelen mostrar:
Junto a cada variable, su varianza.
En el caso de las variables dependientes, la proporción de varianza explicada correspondiente.
Componentes de un SEM
Tipos
Son dos: Modelo de medida y modelo estructural. Más adelante, se explica cada uno de ellos.
Al sustituir en el modelo de medida las relaciones de covarianza por las relaciones causales de la parte estructural, se obtiene el modelo estructural completo, también denominado modelo de regresión estructural.
Modelo de medida
Compuesto por las relaciones entre las variables indicadoras del modelo y sus constructos latentes.
Así como por las relaciones de covarianza entre las variables latentes.
Cada constructo latente y sus indicadores forman una parte del modelo de medida.
También conocido como instrumento de medida y es el modelo propuesto para “medir” las variables latentes.
Este modelo corresponde a un análisis factorial confirmatorio,en el que cada variable latente se asocia con un grupo de variables observadas, y además se permite que las variables latentes estén correlacionadas entre sí.
Véase la figura 9.1.
Modelo estructural
Se refiere a las interrelaciones causales propuestas entre las variables latentes del modelo.
Es la parte del modelo que emplea el análisis de caminos (path analysis), pero con variables alatentes.
Es similar a un análisis de regresión.
Véase la figura 9.2.
Modelo estructural completo
Véase la figura 9.3.
Otros tipos de modelos
Modelo factorial exploratorio vs confirmatorio
El modelo de variables latentes (LVM) crea las variables latentes (LVs) empleadas en el modelo estructural.
Cuando un LVM se examina sin un modelo estructural, se conoce ocasionalmente como análisis factorial confirmatorio (CFA).
Si no se tuviera una estructura hipotética para el modelo de variables latentes, se trataría de un análisis factorial exploratorio (EFA).
Véase la figura 10.1.
Modelos de segundo orden
Véase la figura 10.3.
Procedimiento para ejecutar un SEM
Etapa 1: Validación del modelo de medida
Implica realizar un Análisis factorial Confirmatorio (AFC), proponiendo los indicadores de cada variable latente y
evaluando en forma conjunta la bondad de ajuste de los instrumentos de medida empleados para cada factor.
Significa reemplazar los efectos directos e indirectos del componente estructural propuestos según la teoría por relaciones de covarianza entre las variables latentes.
Si el ajuste es rechazado se aplican herramientas de reespecificación.
Etapa 2: Ajuste del modelo completo de ecuaciones estructurales
Es el ajuste del SEM incorporando las modificaciones de la etapa anterior.
Incluye la comparación con otros modelos alternativos que difieran en la parte estructural, si los hubiera, utilizando para esto contrastes de comparación de modelos.
Pasos en cada una de las etapas
Son los siguientes (cada uno se explicará más adelante):
Especificación.
Identificación.
Evaluación de la calidad de la base de datos.
Estimación de parámetros.
Evaluación de la bondad de ajuste.
Re-especificación del modelo.
Véase la figura 12.1.
Especificación
El modelo se define con base en los conocimientos teóricos y antecedentes empíricos del tema estudiado.
Se deben incluir únicamente las variables esenciales que cuenten con un fuerte respaldo teórico y empírico.
Es crucial determinar las relaciones entre variables latentes e indicadoras, asumiendo que cualquier relación no especificada no existe.
Es recomendable realizar un análisis factorial exploratorio (AFE) previo para validar o revalidar las escalas utilizadas en la medición de cada variable latente.
Según la regla de Kenny (1979), el número de factores por factor debe ser: mínimo 2, 3 es bueno, 4 es óptimo, y 5 o más es excesivo, pero no se deben exceder los 20 factores para todo el SEM.
En esta etapa se determina qué parámetros serán estimados y cuáles se mantendrán constantes.
Además, se asume la forma de la distribución conjunta, usualmente una normalidad multivariada.
Lo más común es diseñar el modelo utilizando un diagrama estructural.
A partir de este gráfico, el software genera las ecuaciones del modelo automáticamente.
La interfaz gráfica también permite añadir directamente en el diagrama las restricciones que se imponen habitualmente sobre los parámetros para los siguientes pasos del análisis.
Identificación
Identificación (definición)
Un modelo está identificado cuando todos y cada uno de sus parámetros pueden ser estimados de manera única a partir de la matriz de varianzas y covarianzas muestrales.
Identificación (condiciones)
Se deben cumplir las siguientes condiciones necesarias para la identificación:
Condición 1.
Si tenemos \(K\) variables observables, entonces, la cantidad de datos \(p\) (es decir, la cantidad de varianzas y covarianzas muestrales) debe ser suficiente para estimar el número de parámetros (\(q\)) del modelo. Esta es la regla clásica de conteo según la cual los grados de libertad deben ser mayores o iguales a cero:
\[\text{Grados de libertad} \;=\; p - q \;=\; \frac{K(K + 1)}{2} - q \; \geq \; 0\]
Condición 2.
Debe definirse la escala de los errores (véase la figura 14.1):
- Los coeficientes de sus efectos directos sobre las indicadoras y las latentes endógenas se fijan en 1.
Condición 3.
También debe definierse la escala de los factores latentes. Las opciones habituales son fijar en 1 (véase la figura 14.1):
La carga factorial asociada a una de las variables observadas (de referencia) de cada latente o
La varianza de las variables latentes exógenas.
Identificación (observaciones)
Que se haya identificado completamente el modelo de ecuaciones estructurales (SEM) no asegura que el modelo de medida también lo esté.
Para los modelos de medida basados en análisis factorial confirmatorio (AFC) convencionales, donde cada indicador se asocia únicamente a un factor y los errores de medición no están correlacionados, es necesario cumplir con las siguientes reglas que se describen en la sección siguiente:
Identificación (Regla de los tres indicadores)
Si el modelo tiene una sola variable latente, debe incluir al menos tres indicadores (véase la figura 14.2).
Identificación (Regla de los dos indicadores)
Si el modelo incluye dos o más variables latentes, cada una de ellas debe tener al menos dos indicadores (véase la figura 14.3).
Evaluación de la calidad de la base de datos
En las siguientes secciones se van a proponer recomendaciones con respecto a los siguientes puntos:
Tamaño de la muestra.
Multicolinealidad.
Valores extremos univariados y multivariados.
4.Normalidad multivariada.
Tamaño de la muestra
Se recomienda tener:
Al menos 200 observaciones.
Al menos 10 observaciones por cada variable observada.
Multicolinealidad
Una colinealidad bivariada extrema (\(r > 0.85\)) y multivariada puede indicar la presencia de variables redundantes y que la matriz de correlación no sea definida positiva.
Es importante examinar los coeficientes de correlación, así como el determinante y los autovalores de la matriz de correlación.
Valores extremos univariados y multivariados
Se deben eliminar observaciones cuyos valores se desvíen más de 3 desviaciones estándar de la media.
En el caso de valores extremos multivariados, se deben calcular las distancias de Mahalanobis y descartar las observaciones con distancias significativas al 1%.
Normalidad multivariada
Se deben examinar los coeficientes de asimetría y curtosis para evaluar la normalidad univariada.
Se consideran normales las variables cuyos coeficientes en valor absoluto sean menores a 3 y 10 respectivamente.
Es importante aplicar pruebas de normalidad univariada (como la prueba conjunta de asimetría y curtosis) y algún test de normalidad multivariada (como el de Mardia). Lo más relevante es que se cumpla la curtosis multivariada.
Normalidad multivariada: comentario
Si la distribución no es normal pero presenta mesocurtosis, las propiedades de los estimadores de máxima verosimilitud son equivalentes a las que se tienen bajo la hipótesis de normalidad.
Sin embargo, si la curtosis difiere significativamente de la normal, estos estimadores son consistentes pero no eficientes asintóticamente.
Lo anterior puede generar dificultades en las pruebas de significación individual de los parámetros y en la prueba de validez global del modelo.
Estimación de parámetros
Objetivos
En los modelos de ecuaciones estructurales (SEM), el objetivo es ajustar las covarianzas entre las variables.
En lugar de reducir la diferencia entre los valores pronosticados y los observados a nivel individual, se busca minimizar la discrepancia entre las covarianzas observadas en la muestra y las covarianzas previstas por el modelo estructural.
Por esta razón, estos modelos también se conocen como modelos de estructura de covarianza (Covariance Structure Models).
Hipótesis fundamental
La hipótesis principal sostiene que, si el modelo es preciso, la matriz de varianzas y covarianzas de la población puede ser representada de manera exacta mediante una combinación de los parámetros del modelo.
Expresado en notación:
\[Ho:\; \Sigma \,=\, \Sigma(\theta)\]
- En la expresión anterior, \(\Sigma\) representa la matriz de varianzas y covarianzas de la población entre las variables observadas, y \(\Sigma(\theta)\) es la matriz de varianzas y covarianzas obtenida como una función de los parámetros contenidos en el vector \(\theta\).
Estimación: ejemplo
Consideremos el siguiente modelo de regresión:
\[ y \;=\; \beta x + \varepsilon\]
La matriz de varianzas y covarianzas entre \(X\) y \(Y\) es:
\[\Sigma \;= \; \begin{pmatrix}
V(X)& Cov(X,Y)\\
Cov(X,Y) & V(Y)
\end{pmatrix}\]
Aplicando propiedades de varianza y covarianza (y suponiendo que \(V(\varepsilon)=\sigma^2\)) se puede demostrar que:
\[Cov(X,Y) \;=\; \beta \,V(X), \qquad V(Y) \;=\; \beta^2\, V(X) \;+\; V(\varepsilon)\;=\; \beta^2\, V(X) \;+\; \sigma^2\]
Al reemplazar estas expresiones en la matriz de varianzas y covarianzas poblacional, se puede expresar en términos de los parámetros del modelo, obteniendo así la matriz implícita de varianzas y covarianzas:
\[\Sigma(\theta) \;= \; \begin{pmatrix}
V(X) & \beta \,V(X)\\
\beta \,V(X) & \beta^2\, V(X) \;+\; \sigma^2
\end{pmatrix}, \qquad \theta=(\beta, \sigma^2)^T\]
La estimación de los parámetros se lleva a cabo buscando maximizar la precisión del modelo. Para lograr esto, se intenta reducir al mínimo las diferencias entre las varianzas y covarianzas observadas, \(S\), y las que el modelo reproduce, \(S\big(\widehat{\theta}\big)\)
Estimación: métodos
Algunos métodos de estimación
En los modelos de ecuaciones estructurales (SEM) existen distintos métodos para estimar los parámetros del modelo, los cuales difieren en los supuestos estadísticos que adoptan, en la forma como tratan la matriz de covarianzas y en sus propiedades inferenciales. En las secciones siguientes se presentan y discuten los métodos más utilizados en la práctica aplicada:
Máxima verosimilitud (ML).
Mínimos cuadrados no ponderados (ULS).
Mínimos cuadrados generalizados (GLS).
Mínimos cuadrados ponderados (WLS) o de distribución asintóticamente libre (ADF).
Máxima verosimilitud (ML)
Es el método de estimación más utilizado en SEM y constituye la opción preferida bajo el supuesto de normalidad multivariada, debido a sus propiedades de insesgadez y eficiencia asintótica.
En la práctica, ML es relativamente robusto frente a desviaciones moderadas de la normalidad. Sin embargo, cuando la falta de normalidad es severa, se recomienda el uso de errores estándar robustos (por ejemplo, Quasi-Maximum Likelihood o correcciones tipo Huber–White) o procedimientos de bootstrap.
Mínimos cuadrados no ponderados (ULS)
Es conceptualmente similar al método de Mínimos Cuadrados Ordinarios (OLS) en regresión, en el sentido de que minimiza las discrepancias entre las covarianzas observadas y las reproducidas por el modelo.
No requiere que la matriz de covarianzas muestral sea definida positiva, lo que puede resultar ventajoso en situaciones problemáticas.
Produce estimadores insesgados, aunque generalmente menos eficientes que los obtenidos mediante ML.
Requiere que todas las variables observadas estén medidas en la misma escala.
En la práctica, suele emplearse como método preliminar para obtener valores iniciales que posteriormente se utilizan en la estimación por ML.
Mínimos cuadrados generalizados (GLS)
Al igual que ML, este método opera bajo el supuesto de normalidad multivariada.
A diferencia de ULS, no exige que todas las variables estén en la misma escala, ya que incorpora una matriz de ponderación.
En términos computacionales, suele ser más eficiente que ML y ULS, aunque en la práctica es menos utilizado que ML en aplicaciones estándar.
Mínimos cuadrados ponderados (WLS) o de distribución asintóticamente libre (ADF)
Este método no requiere el supuesto de normalidad multivariada, pero sí demanda un tamaño muestral elevado, típicamente entre 200 y 500 observaciones o más.
Es especialmente adecuado cuando se trabaja con variables ordinales o categóricas, estimadas a partir de matrices de correlaciones policóricas, tetracóricas o poliseriales.
Estimación: función de ajuste
En los modelos de ecuaciones estructurales, la estimación de los parámetros se realiza minimizando una función de ajuste, la cual mide la discrepancia entre la matriz de varianzas y covarianzas observada en la muestra, \(S\), y la matriz de varianzas y covarianzas implícita en el modelo, \(\Sigma(\theta)\).
Cada método de estimación se asocia con una función de ajuste particular, cuya minimización produce los estimadores de los parámetros del modelo.
Máxima verosimilitud (ML)
La función de ajuste de máxima verosimilitud se define como:
\[
F_{ML} \; = \; \log|\Sigma(\theta)| \;+\; \mathrm{tr}\!\left(S\,\Sigma^{-1}(\theta)\right) \;-\; \log|S| \;-\; (p+q),
\]
donde \(S\) es la matriz de covarianzas muestral, \(\Sigma(\theta)\) la matriz implícita del modelo, y \(p\) y \(q\) constantes que dependen del número de variables observadas.
Interpretación.
Este criterio evalúa qué tan probable es observar la matriz \(S\) bajo el supuesto de normalidad multivariada y dado el modelo especificado. Minimizar \(F_{ML}\) equivale a maximizar la verosimilitud del modelo, por lo que este método es el más utilizado cuando se asume normalidad multivariada.
Mínimos cuadrados no ponderados (ULS)
La función de ajuste ULS está dada por:
\[
F_{ULS} \; = \; \frac{1}{2}\,\mathrm{tr}\!\left(\big[S - \Sigma(\theta)\big]^2\right).
\]
Interpretación.
Este método minimiza directamente la suma de los cuadrados de las diferencias entre las covarianzas observadas y las reproducidas por el modelo, otorgando el mismo peso a todas ellas. Es conceptualmente simple y no requiere normalidad multivariada, aunque puede ser menos eficiente que ML.
Mínimos cuadrados generalizados (GLS)
La función de ajuste GLS se define como:
\[
F_{GLS} \; = \; \frac{1}{2}\,\mathrm{tr}\!\left(\left\{\big[S - \Sigma(\theta)\big] W^{-1}\right\}^2\right),
\]
donde \(W\) es una matriz de ponderación, usualmente relacionada con \(\Sigma(\theta)\).
Interpretación.
GLS extiende el método ULS incorporando ponderaciones, de modo que las discrepancias entre covarianzas no contribuyen todas por igual a la función de ajuste. Bajo normalidad multivariada, puede ser más eficiente que ULS, aunque suele ser computacionalmente menos estable que ML.
Mínimos cuadrados ponderados (WLS) o distribución asintóticamente libre (ADF)
La función de ajuste WLS (o ADF) se expresa como:
\[
F_{WLS} \; = \; \frac{1}{2}\,\mathrm{tr}\!\left(\left\{\big[S - \Sigma(\theta)\big] V^{-1}\right\}^2\right),
\]
donde \(V\) es la matriz de varianzas y covarianzas asintóticas de los elementos de \(S\).
Interpretación.
Este método pondera las discrepancias utilizando información sobre la variabilidad de las covarianzas muestrales. No requiere normalidad multivariada y es especialmente apropiado para variables ordinales o categóricas, aunque demanda tamaños muestrales grandes para un desempeño adecuado.
Comentario pedagógico
En todos los casos, el objetivo es el mismo: encontrar el conjunto de parámetros \(\theta\) que haga que la matriz implícita del modelo, \(\Sigma(\theta)\), se aproxime lo mejor posible a la matriz observada \(S\). Las diferencias entre los métodos radican en cómo se miden y ponderan esas discrepancias, no en la lógica general del enfoque.
Resumen de las funciones de ajuste
Véase la figura 19.1.
Estimación con variables observadas ordinales o categóricas
Observaciones generales
Cuando los indicadores asociados a una variable latente son ordinales o categóricos, el supuesto de normalidad multivariada suele verse comprometido. En estas condiciones, el uso del método de Máxima Verosimilitud (ML) no es recomendable en su forma estándar.
En su lugar, se deben emplear métodos de estimación que tengan en cuenta la falta de normalidad, ya sea mediante funciones de ajuste alternativas o a través de correcciones robustas en los errores estándar.
Indicadores en escala Likert o similar
Cuando los indicadores constituyen un conjunto homogéneo de variables medidas en escala Likert (u otras escalas ordinales similares), es posible agrupar los ítems (mediante la suma o el promedio de los puntajes) con el objetivo de aproximar la normalidad y así poder aplicar el método ML.
Este enfoque es válido únicamente bajo el supuesto de unidimensionalidad, es decir, que los indicadores agrupados midan un único constructo latente.
Para evaluar este supuesto, se recomienda realizar previamente un Análisis Factorial Exploratorio (AFE).
La agrupación de indicadores puede realizarse de forma aleatoria o, preferiblemente, atendiendo a criterios de contenido o afinidad conceptual.
Metodología de Muthén (1984) para variables continuas y categóricas (CVM)
En este enfoque, las variables observadas pueden ser de cualquier tipo: dicotómicas, ordinales o continuas.
El método se basa en el uso de una matriz de correlaciones policóricas (o tetracóricas, según corresponda), seguida de la estimación del modelo mediante Mínimos Cuadrados Ponderados (WLS) o el método Asintóticamente Libre de Distribución (ADF).
Esta metodología requiere un tamaño muestral considerable, dado el elevado número de parámetros involucrados en la matriz de ponderación.
Cuando se presentan dificultades asociadas a muestras pequeñas o problemas de convergencia, es posible complementar este enfoque con métodos de estimación robusta, que mejoren la estabilidad de los resultados.
Evaluación del ajuste
Observaciones
Se examina la significancia de los coeficientes, similar a un modelo de regresión, y se revisan las medidas de bondad de ajuste.
Ninguna medida por sí sola proporciona toda la información necesaria para evaluar el modelo, por lo que generalmente se utiliza un conjunto de medidas que se informa simultáneamente.
Tipos de medidas de ajuste
Las medidas de bondad de ajuste en los modelos de ecuaciones estructurales se agrupan, de manera general, en tres categorías principales, cada una de las cuales evalúa un aspecto distinto del desempeño del modelo:
Medidas absolutas. Evalúan directamente el grado de discrepancia entre la matriz de varianzas y covarianzas observada y la reproducida por el modelo, es decir, analizan el tamaño de los residuos sin realizar comparaciones con otros modelos.
Medidas de ajuste comparativo o incremental. Comparan el ajuste del modelo propuesto con el de un modelo de referencia más restrictivo (usualmente el modelo nulo o independiente), permitiendo valorar la mejora relativa del modelo especificado.
Medidas de parsimonia. Evalúan el ajuste del modelo teniendo en cuenta su complejidad, penalizando la inclusión excesiva de parámetros y favoreciendo modelos más simples que expliquen adecuadamente los datos.
Indices de ajuste
- La figura 21.1 resume los principales tipos de medidas de ajuste empleadas en SEM.
El estadístico \(\chi^2\) evalúa la discrepancia global entre la matriz observada y la matriz reproducida por el modelo. Idealmente, este estadístico debería resultar no significativo.
Un valor significativo de \(\chi^2\) indica que el modelo teórico propuesto difiere de manera significativa de la estructura de covarianzas observada en los datos.
En este contexto, la hipótesis nula establece que los residuos del modelo son nulos, es decir, que el modelo reproduce exactamente la matriz de varianzas y covarianzas poblacional.
Re-especificación del modelo
Descripción
Cuando el ajuste del modelo no es satisfactorio, puede ser necesario proceder a su re-especificación, siempre guiada por criterios teóricos y sustantivos.
Para ello, se examinan los índices de modificación, que corresponden a parámetros inicialmente fijados en cero (efectos no incluidos en el modelo).
Cada índice de modificación indica la reducción esperada en el estadístico \(\chi^2\) si el parámetro correspondiente fuera liberado y estimado.
Un valor superior a 3.84 (valor crítico de una \(\chi^2\) con 1 grado de libertad y \(\alpha = 0.05\)) sugiere que la inclusión de dicho parámetro produciría una mejora estadísticamente significativa en el ajuste del modelo.
En consecuencia, un índice de modificación elevado señala que la incorporación del efecto adicional podría mejorar de forma sustantiva el ajuste del modelo a los datos, siempre que exista una justificación teórica para ello.
Nota pedagógica: sobre la re-especificación de modelos
Aunque los índices de modificación constituyen una herramienta útil para diagnosticar fuentes de mal ajuste, no deben utilizarse como un mecanismo automático de corrección del modelo. En particular, es importante que el estudiante tenga en cuenta lo siguiente:
Los índices de modificación se calculan condicionalmente al modelo estimado y a la muestra analizada. Por tanto, reflejan posibles mejoras específicas de los datos y no necesariamente relaciones estructurales reales en la población.
Re-especificar un modelo basándose únicamente en criterios estadísticos puede conducir a sobreajuste (overfitting), es decir, a un modelo que reproduce muy bien los datos observados, pero que tiene escasa capacidad de generalización.
La inclusión indiscriminada de parámetros adicionales suele aumentar artificialmente el ajuste, pero debilita la interpretabilidad y la parsimonia del modelo, dos principios centrales en SEM.
Todo parámetro liberado debe contar con una justificación teórica, sustantiva o metodológica clara (por ejemplo, similitud de contenido entre ítems, efectos de método o fundamentos conceptuales previos).
En la práctica recomendada, los índices de modificación deben utilizarse como herramientas exploratorias, no como reglas de decisión automáticas.
En consecuencia, la re-especificación de un modelo SEM debe entenderse como un proceso iterativo guiado por la teoría, en el que la evidencia empírica complementa (pero no sustituye) al razonamiento conceptual.
Ejercicios
Los siguientes ejercicios tienen como objetivo reforzar la comprensión conceptual de los modelos de ecuaciones estructurales antes de introducir formalmente la notación matricial y los desarrollos algebraicos. En todos los casos, el énfasis debe ponerse en la interpretación, no en la optimización automática del ajuste.
Ejercicio 1. Identificación de tipos de variables
Considere el siguiente escenario:
Un investigador desea estudiar el efecto de la motivación académica sobre el rendimiento estudiantil, considerando además el rol de la autoeficacia como variable intermedia.
La motivación se mide mediante cuatro ítems tipo Likert, la autoeficacia mediante tres ítems y el rendimiento mediante el promedio de calificaciones. El estudio se realiza comparando estudiantes de colegios públicos y privados.
Desarrolle los siguientes incisos:
Identifique todas las variables manifiestas del estudio.
Identifique las variables latentes.
Señale cuáles variables son exógenas, endógenas y *mediadoras**.
Indique explícitamente los términos de error asociados.
Identifique la variable de agrupación y explique su función en un análisis SEM multigrupo.
Ejercicio 2. Lectura conceptual de un diagrama SEM
Considere un diagrama SEM conceptual que contiene:
Dos factores latentes \(F_1\) y \(F_2\).
Tres indicadores para \(F_1\) y dos para \(F_2\)
Una relación estructural \(F_2 \leftarrow F_1\).
Términos de error para todos los indicadores.
Desarrolle los siguientes incisos:
Explique por qué \(F_1\) se clasifica como variable exógena.
Justifique por qué \(F_2\) es una variable endógena.
Indique en qué sentido \(F_2\) puede considerarse una variable mediadora.
Explique por qué los términos de error no deben interpretarse como “ruido irrelevante”.
Ejercicio 3. Escala de la variable latente
Considere un factor latente \(\eta\) medido por tres indicadores \(x_1, x_2, x_3\).
Explique conceptualmente qué significa que el modelo no esté identificado si no se fija la escala de \(\eta\).
Describa cómo se define la escala de \(\eta\) bajo cada uno de los siguientes métodos:
Discuta una ventaja y una desventaja conceptual de cada método.
Ejercicio 4. Interpretación de cargas factoriales
Suponga que en un modelo con variable marcador se fija \(\lambda_1 = 1\) para el indicador \(x_1\), y se estima \(\lambda_2 = 0.75\) para \(x_2\).
Interprete \(\lambda_2 = 0.75\) en términos de unidades de cambio.
Explique por qué esta interpretación depende del indicador marcador elegido.
Discuta qué cambiaría (conceptualmente) si el modelo se estimara usando codificación de efectos.
Ejercicio 5. Métodos de estimación
Para cada uno de los siguientes escenarios, indique qué método de estimación sería más apropiado y justifique su respuesta:
Indicadores continuos aproximadamente normales, tamaño muestral moderado.
Indicadores ordinales tipo Likert con cinco categorías y muestra grande.
Indicadores dicotómicos con fuerte asimetría y curtosis elevada.
Modelo preliminar usado únicamente para obtener valores iniciales.
Ejercicio 6. Evaluación del ajuste del modelo
Suponga que un modelo SEM arroja los siguientes resultados:
Desarrolle los siguientes incisos:
Evalúe el ajuste global del modelo considerando distintos tipos de índices.
Explique por qué un \(\chi^2\) significativo no implica necesariamente un mal modelo.
Discuta el papel del tamaño muestral en la interpretación del ajuste.
Ejercicio 7. Re-especificación responsable del modelo
Un modelo SEM presenta un ajuste insatisfactorio y varios índices de modificación superiores a 10.
Explique por qué no es apropiado liberar automáticamente todos los parámetros sugeridos.
Indique al menos tres criterios no estadísticos que deberían guiar una re-especificación.
Discuta cómo la re-especificación puede afectar la replicabilidad del modelo.
Ejercicio 8. Integrador
Construya un diagrama SEM conceptual que incluya explícitamente los siete tipos de variables discutidos en el capítulo:
Manifiestas.
Latentes.
Errores.
Exógenas.
Endógenas.
Mediadoras.
Variable de agrupación.
Explique brevemente el rol de cada elemento en el diagrama.
