20/12/25
Abstract
En Rpubs:: toc se pueden ver otros documentos de posible interés.
En este capítulo se aborda la invarianza de medida como un requisito fundamental para la comparación válida de constructos latentes entre distintos grupos poblacionales. A diferencia de los capítulos anteriores, centrados en la consistencia interna y la dimensionalidad de las escalas, el foco aquí se desplaza hacia la equivalencia del modelo de medición entre grupos, condición necesaria para cualquier inferencia comparativa en el marco de los modelos de ecuaciones estructurales.
En particular, la invarianza métrica evalúa si los ítems que componen una escala mantienen el mismo significado y la misma relación con el constructo latente en todos los grupos considerados. Esto implica que las cargas factoriales sean equivalentes entre grupos, garantizando que una unidad de cambio en el factor latente se traduzca en el mismo cambio esperado en los indicadores observados, independientemente del grupo al que pertenezcan los individuos.
A lo largo del capítulo se presentan los fundamentos conceptuales de la invarianza de medida, distinguiendo entre los niveles configural, métrico, escalar y estricto, así como sus implicaciones para la interpretación de resultados en estudios comparativos y en modelos de ecuaciones estructurales (SEM) multigrupo. Se enfatiza que estos niveles no constituyen alternativas metodológicas, sino requisitos jerárquicos que determinan qué tipos de comparaciones son estadísticamente y conceptualmente válidas.
La exposición se centra en el desarrollo teórico y metodológico del concepto de invarianza, apoyándose en formulaciones matemáticas, criterios de evaluación estadística y representaciones gráficas con fines didácticos. La aplicación empírica de estos conceptos, mediante ejemplos reproducibles en R y modelos factoriales confirmatorios (CFA) multigrupo, se presenta en un documento independiente, al cual se remite al lector al final del capítulo o haciendo click aquí.
En conjunto, este capítulo establece el marco conceptual que conecta el modelo de medición con la inferencia estructural, destacando el papel central de la invarianza de medida (y en particular de la invarianza métrica) como puente entre la teoría psicométrica y la comparación sustantiva entre grupos.
En este capítulo teórico se utiliza el paquete ggplot2 exclusivamente con fines didácticos, para construir representaciones gráficas que ilustran de manera intuitiva los distintos niveles de invarianza de medida.
library(ggplot2)
Las figuras presentadas en este capítulo no sustituyen la evaluación estadística formal de la invarianza, sino que permiten visualizar cómo las restricciones impuestas en los modelos CFA multigrupo (cargas factoriales, interceptos y varianzas residuales) afectan la relación entre los factores latentes y los ítems observados.
Los paquetes utilizados para la estimación, comparación y evaluación empírica de modelos CFA multigrupo y de la invarianza de medida se presentan y emplean de forma detallada en el capítulo de aplicación empírica (hacer click aquí).
En investigación empírica es frecuente comparar grupos poblacionales distintos, como por ejemplo sexo, tipo de institución, país, cultura o momento temporal. Estas comparaciones pueden involucrar:
Medias de constructos latentes.
Relaciones estructurales (regresiones).
Varianzas y covarianzas.
Sin embargo, todas estas comparaciones presuponen que los constructos se miden de la misma manera en todos los grupos. Esta suposición no es trivial y debe ser evaluada explícitamente mediante pruebas de invarianza de medida.
La invarianza de medida se evalúa típicamente dentro del marco de los modelos factoriales confirmatorios multigrupo (MG-CFA), y constituye un prerrequisito fundamental para cualquier inferencia comparativa entre grupos.
La invarianza de medida se refiere al grado en que un instrumento mide el mismo constructo latente de manera equivalente en distintos grupos. Formalmente, implica que ciertos parámetros del modelo factorial sean iguales entre grupos.
Siguiendo la formulación clásica (Meredith, 1993), el modelo de medición para un ítem \(i\) en el grupo \(g\) puede escribirse como:
\[ y_{ig} = \tau_{ig} + \lambda_{ig} \eta_g + \varepsilon_{ig} \]
donde:
\(\tau_{ig}\) es el intercepto del ítem.
\(\lambda_{ig}\) es la carga factorial.
\(\eta_g\) es el factor latente.
\(\varepsilon_{ig}\) es el error de medición.
La invarianza se evalúa imponiendo restricciones de igualdad sobre estos parámetros a través de modelos anidados.
De forma progresiva, se distinguen varios niveles de invarianza:
Invarianza configural.
Invarianza métrica (o débil).
Invarianza escalar (o fuerte).
Invarianza estricta.
A continuación explicaremos cada uno de ellos.
La invarianza configural establece el punto de partida. Requiere que:
El Número de factores sea el mismo en todos los grupos.
Cada ítem cargue sobre el mismo factor en todos los grupos.
No se imponen restricciones de igualdad sobre los parámetros. Todos los parámetros son estimados libremente en cada grupo.
Este nivel responde a la pregunta:
Si este modelo no presenta un ajuste aceptable, no tiene sentido avanzar hacia niveles más restrictivos.
En la Figura 4.1, se representa la relación entre un factor latente simulado y un ítem observado para dos grupos, donde las pendientes y los interceptos difieren. En ella, ambos grupos comparten la misma estructura factorial, pero presentan diferentes cargas factoriales e interceptos.
set.seed(123)
eta <- seq(-3, 3, length.out = 100)
y_g1 <- 0.5 + 0.8 * eta
y_g2 <- -0.5 + 1.3 * eta
df_configural <- data.frame(
eta = rep(eta, 2),
y = c(y_g1, y_g2),
grupo = factor(rep(c("Grupo 1", "Grupo 2"), each = length(eta)))
)
ggplot(df_configural, aes(x = eta, y = y, color = grupo)) +
geom_line(linewidth = 1) +
labs(x = "Factor latente (η)",
y = "Ítem observado",
color = "Grupo"
) +
theme_minimal()
Figure 4.1: Invarianza configural.
La figura representa la relación entre un factor latente (\(\eta\)) y un ítem observado para dos grupos distintos. Cada recta corresponde a un grupo poblacional diferente y describe el valor esperado del ítem observado en función del nivel del factor latente.
Desde el punto de vista del modelo de medición,
\[ y_{ig} = \tau_{ig} + \lambda_{ig}\eta_g + \varepsilon_{ig}, \]
la pendiente de cada recta representa la carga factorial (\(\lambda_{ig}\)), mientras que el punto de intersección con el eje vertical representa el intercepto (\(\tau_{ig}\)).
En la figura se observa que:
Las rectas correspondientes a ambos grupos no son paralelas, lo que indica que las pendientes son diferentes.
Esto implica que las cargas factoriales difieren entre grupos.
En consecuencia, no se cumple la invarianza métrica.
Desde una interpretación sustantiva, esto significa que una misma variación en el factor latente no produce el mismo cambio esperado en el ítem observado en ambos grupos. Es decir, el ítem no tiene el mismo significado métrico en relación con el constructo latente.
Por esta razón, en este escenario no es válido comparar relaciones estructurales, tales como regresiones, correlaciones o varianzas latentes entre grupos, ya que dichas comparaciones podrían reflejar diferencias en la medición y no diferencias reales en el constructo.
La invarianza métrica se alcanza cuando las cargas factoriales se restringen a ser iguales entre grupos:
\[ \lambda_{i1} = \lambda_{i2} = \dots = \lambda_{iG} \]
mientras que interceptos, varianzas residuales y medias latentes permanecen libres.
La invarianza métrica garantiza que:
Los ítems tienen la misma relación con el constructo latente en todos los grupos.
Una unidad de cambio en el factor latente representa el mismo cambio esperado en el ítem observado.
En términos sustantivos, esto implica que:
Cuando la invarianza métrica se cumple, es válido comparar:
Relaciones estructurales (regresiones).
Correlaciones entre factores.
Varianzas latentes.
No obstante, no es válido comparar medias latentes, ya que los interceptos aún pueden diferir.
Una vez establecido el significado conceptual de la invarianza métrica y sus implicaciones sustantivas, el siguiente paso consiste en evaluar empíricamente si dicha condición es compatible con los datos observados.
La invarianza métrica se evalúa mediante la comparación de modelos CFA multigrupo anidados, específicamente entre los siguientes modelos:
El modelo configural, en el cual la estructura factorial es la misma en todos los grupos pero los parámetros se estiman libremente.
El modelo métrico (o débil), en el que se imponen restricciones de igualdad sobre las cargas factoriales entre grupos.
La comparación entre estos modelos permite evaluar si los ítems mantienen el mismo significado métrico en todos los grupos; es decir, si una unidad de cambio en el factor latente se traduce en el mismo cambio esperado en los ítems observados.
Para esta evaluación se utilizan tanto índices de ajuste global como criterios de cambio en el ajuste, entre los cuales se destacan:
El cambio en el estadístico \(\Delta \chi^2\).
El cambio en el Comparative Fit Index (\(\Delta \text{CFI}\)).
El cambio en el Root Mean Square Error of Approximation (\(\Delta \text{RMSEA}\)).
El cambio en el Tucker–Lewis Index (\(\Delta \text{TLI}\)).
Criterios de información como AIC y BIC.
En la práctica aplicada, no se recomienda basar la decisión exclusivamente en el test \(\chi^2\), debido a su alta sensibilidad al tamaño muestral. En su lugar, se da mayor peso a cambios pequeños en CFI y RMSEA, los cuales han mostrado mayor estabilidad empírica en estudios de simulación y aplicaciones reales.
Los distintos tipos de índices de bondad de ajuste comúnmente utilizados en SEM —índices absolutos, incrementales y de parsimonia— se resumen esquemáticamente en la Figura 5.1. Esta clasificación resulta útil para interpretar el comportamiento de los índices al comparar modelos anidados en el contexto de la invarianza de medida.
Figure 5.1: Tipos de medidas de ajuste en SEM
Una explicación detallada de estos índices de bondad de ajuste, así como de las funciones utilizadas para su cálculo e interpretación en R, puede consultarse en el siguiente material de apoyo:
Este recurso complementa el presente capítulo y permite profundizar en los fundamentos teóricos y computacionales de las métricas de ajuste empleadas en modelos de ecuaciones estructurales.
La Figura 5.2 ilustra este escenario. Ambos grupos presentan la misma pendiente, indicando que el ítem tiene el mismo significado métrico en relación con el factor latente. En este caso, es válido comparar relaciones estructurales, correlaciones y varianzas latentes entre grupos. Sin embargo, la comparación de medias latentes aún no es válida.
set.seed(123)
y_g1 <- 0.5 + 1.0 * eta
y_g2 <- -0.5 + 1.0 * eta
df_metric <- data.frame(
eta = rep(eta, 2),
y = c(y_g1, y_g2),
grupo = factor(rep(c("Grupo 1", "Grupo 2"), each = length(eta)))
)
ggplot(df_metric, aes(x = eta, y = y, color = grupo)) +
geom_line(linewidth = 1) +
labs(
x = "Factor latente (η)",
y = "Ítem observado",
color = "Grupo"
) +
theme_minimal()
Figure 5.2: Invarianza métrica.
La figura muestra la relación entre el factor latente (\(\eta\)) y un ítem observado para dos grupos distintos. Cada recta representa el valor esperado del ítem observado en función del nivel del factor latente para cada grupo.
Desde el modelo de medición
\[ y_{ig} = \tau_{ig} + \lambda_{ig}\eta_g + \varepsilon_{ig}, \]
la pendiente de cada recta corresponde a la carga factorial (\(\lambda_{ig}\)), mientras que el desplazamiento vertical de las rectas está determinado por los interceptos (\(\tau_{ig}\)).
En la figura se observa que:
Las rectas correspondientes a ambos grupos son paralelas, lo que indica que las cargas factoriales son iguales entre grupos.
Los interceptos difieren, generando un desplazamiento vertical entre las rectas.
Este patrón visual es característico de un escenario de invarianza métrica (o débil). Es importante destacar que la diferencia en los interceptos no viola la invarianza métrica, ya que este nivel de invarianza únicamente exige la igualdad de las cargas factoriales.
En este contexto, los ítems mantienen el mismo significado métrico en todos los grupos, es decir, una unidad de cambio en el factor latente produce el mismo cambio esperado en el ítem observado, independientemente del grupo.
Como consecuencia:
Es válido comparar relaciones estructurales, tales como regresiones entre factores, correlaciones y varianzas latentes.
No es válido comparar medias latentes, ya que ello requiere el cumplimiento adicional de la invarianza escalar. En ausencia de esta, las diferencias observadas pueden estar influenciadas por interceptos distintos entre grupos.
Nota:
Un error frecuente consiste en asumir que interceptos distintos implican ausencia de invarianza métrica. Como se ilustra en la figura, la invarianza métrica se evalúa exclusivamente a través de la igualdad de las cargas factoriales.
La invarianza escalar se establece cuando, además de las cargas factoriales, los interceptos de los ítems se restringen a ser iguales entre grupos:
\[ \tau_{i1} = \tau_{i2} = \dots = \tau_{iG} \]
Esto implica que, para un mismo nivel del factor latente, los grupos presentan el mismo nivel esperado en los ítems observados.
La invarianza escalar garantiza que:
Las diferencias observadas en los ítems reflejan diferencias reales en el constructo latente.
No existen desplazamientos sistemáticos debidos a normas culturales, estilos de respuesta o sesgos aditivos.
En términos prácticos:
Cuando se cumple la invarianza escalar, es válido:
Comparar medias de factores latentes.
Interpretar diferencias de grupo como diferencias reales en el constructo.
Realizar análisis longitudinales de cambio en el tiempo.
Una vez establecida la invarianza métrica, el siguiente paso consiste en evaluar la invarianza escalar, que introduce restricciones adicionales sobre los interceptos de los ítems.
La invarianza escalar se evalúa mediante la comparación de modelos CFA multigrupo anidados, específicamente entre los siguientes modelos:
El modelo métrico, en el cual las cargas factoriales se mantienen iguales entre grupos.
El modelo escalar (o fuerte), en el que se imponen restricciones de igualdad tanto sobre las cargas factoriales como sobre los interceptos de los ítems.
Esta comparación permite evaluar si, para un mismo nivel del factor latente, los grupos presentan el mismo valor esperado en los ítems observados, condición necesaria para interpretar las diferencias entre grupos como diferencias reales en el constructo latente.
Para la evaluación empírica de la invarianza escalar se utilizan, al igual que en el nivel métrico, índices de ajuste global y criterios de cambio en el ajuste, entre los cuales se destacan:
El cambio en el estadístico \(\Delta \chi^2\).
El cambio en el Comparative Fit Index (\(\Delta \text{CFI}\)).
El cambio en el Root Mean Square Error of Approximation (\(\Delta \text{RMSEA}\)).
El cambio en el Tucker–Lewis Index (\(\Delta \text{TLI}\)).
Criterios de información como AIC y BIC.
En la práctica aplicada, un deterioro moderado en el ajuste del modelo escalar no implica necesariamente el rechazo de la invarianza, siempre que los cambios en CFI y RMSEA se mantengan dentro de rangos considerados pequeños y que exista coherencia teórica con el modelo de medición.
La Figura 6.1 muestra este caso, donde las diferencias observadas entre grupos reflejarían diferencias reales en el nivel del factor latente. Este nivel de invarianza es condición necesaria para la comparación de medias latentes entre grupos.
set.seed(123)
y_g1 <- 0.0 + 1.0 * eta
y_g2 <- 0.0 + 1.0 * eta
df_scalar <- data.frame(
eta = rep(eta, 2),
y = c(y_g1, y_g2),
grupo = factor(rep(c("Grupo 1", "Grupo 2"), each = length(eta)))
)
ggplot(df_scalar, aes(x = eta, y = y, color = grupo)) +
geom_line(linewidth = 1) +
labs(
x = "Factor latente (η)",
y = "Ítem observado",
color = "Grupo"
) +
theme_minimal()
Figure 6.1: Invarianza escalar.
La figura representa la relación entre el factor latente (\(\eta\)) y un ítem observado para dos grupos distintos. En este caso, las rectas correspondientes a ambos grupos se superponen completamente a lo largo de todo el rango del factor latente.
Desde el modelo de medición
\[ y_{ig} = \tau_{ig} + \lambda_{ig}\eta_g + \varepsilon_{ig}, \]
esta superposición indica que tanto las cargas factoriales (\(\lambda_{ig}\)) como los interceptos (\(\tau_{ig}\)) son iguales entre grupos.
En particular, la figura muestra que:
Las pendientes de las rectas son idénticas, lo que confirma la invarianza métrica.
Los interceptos también coinciden, lo que implica la invarianza escalar.
Este patrón visual es característico de un escenario en el que, para un mismo nivel del factor latente, ambos grupos presentan el mismo valor esperado en el ítem observado. Por lo tanto, cualquier diferencia observada entre grupos puede atribuirse a diferencias reales en el nivel del constructo latente, y no a sesgos aditivos o desplazamientos sistemáticos en los ítems.
Como consecuencia:
Es válido comparar medias latentes entre grupos.
Las diferencias de grupo pueden interpretarse como diferencias sustantivas en el constructo.
Se mantiene la validez de las comparaciones de relaciones estructurales ya permitidas bajo invarianza métrica.
En síntesis, la coincidencia completa de las rectas ilustra gráficamente la condición necesaria para la comparación legítima de medias latentes entre grupos.
En la siguiente sección se discute un nivel aún más restrictivo de equivalencia, la invarianza estricta, que incorpora la igualdad de las varianzas residuales de los ítems.
La invarianza estricta se establece cuando, además de las restricciones impuestas en los niveles anteriores, se exige que los siguientes parámetros del modelo de medición sean iguales entre grupos:
Las cargas factoriales.
Los interceptos de los ítems.
Las varianzas residuales de los ítems.
Formalmente, para cada ítem \(i\) y para cada grupo \(g = 1, \ldots, G\), se impone la restricción:
\[ \varepsilon_{i1} = \varepsilon_{i2} = \cdots = \varepsilon_{iG}. \]
Esta condición implica que la cantidad de error de medición asociada a cada ítem es equivalente en todos los grupos considerados.
El cumplimiento de la invarianza estricta indica que:
Los ítems presentan el mismo nivel de precisión y confiabilidad en todos los grupos.
La varianza observada de cada ítem se descompone en la misma proporción de varianza verdadera y varianza de error en todos los grupos.
En consecuencia, las diferencias observadas entre grupos no pueden atribuirse a diferencias en la calidad de medición de los ítems.
La invarianza estricta resulta especialmente relevante cuando se desea:
Comparar puntuaciones observadas (sumas o promedios de ítems) entre grupos.
Utilizar escalas sin un modelamiento latente explícito.
En el contexto de los modelos de ecuaciones estructurales (SEM), este nivel de invarianza no siempre es indispensable, dado que el error de medición se modela de forma explícita dentro del sistema de ecuaciones. No obstante, su evaluación proporciona evidencia adicional sobre la equivalencia psicométrica de las escalas y fortalece la validez de las comparaciones entre grupos.
Una vez establecida la invarianza escalar, puede evaluarse la invarianza estricta, que introduce restricciones adicionales sobre las varianzas residuales de los ítems.
La invarianza estricta se evalúa mediante la comparación de modelos CFA multigrupo anidados, específicamente entre los siguientes modelos:
El modelo escalar, en el cual se mantienen iguales las cargas factoriales y los interceptos entre grupos.
El modelo estricto, en el que, además, se imponen restricciones de igualdad sobre las varianzas residuales de los ítems.
Esta comparación permite evaluar si los ítems presentan no solo el mismo significado métrico y el mismo nivel esperado, sino también la misma precisión de medición en todos los grupos.
Al igual que en los niveles anteriores, la evaluación empírica se basa en índices de ajuste global y criterios de cambio en el ajuste, tales como:
El cambio en el estadístico \(\Delta \chi^2\).
El cambio en el Comparative Fit Index (\(\Delta \text{CFI}\)).
El cambio en el Root Mean Square Error of Approximation (\(\Delta \text{RMSEA}\)).
El cambio en el Tucker–Lewis Index (\(\Delta \text{TLI}\)).
Criterios de información como AIC y BIC.
En la práctica aplicada, la invarianza estricta raramente se cumple de forma completa, y su incumplimiento no invalida necesariamente las comparaciones basadas en modelos SEM, dado que el error de medición se modela explícitamente. Por esta razón, los criterios de cambio en CFI y RMSEA deben interpretarse con especial cautela, y siempre a la luz de la plausibilidad teórica de las restricciones impuestas.
La Figura 7.1 ilustra dos grupos con igual pendiente e intercepto, pero distinta dispersión residual. En ella, la invarianza estricta es particularmente relevante cuando se utilizan puntuaciones observadas, mientras que en SEM su cumplimiento no siempre es indispensable, dado que el error de medición se modela explícitamente.
set.seed(321)
y_g1 <- 1.0 * eta + rnorm(length(eta), sd = 0.5)
y_g2 <- 1.0 * eta + rnorm(length(eta), sd = 0.5)
df_strict <- data.frame(
eta = rep(eta, 2),
y = c(y_g1, y_g2),
grupo = factor(rep(c("Grupo 1", "Grupo 2"), each = length(eta)))
)
ggplot(df_strict, aes(x = eta, y = y, color = grupo)) +
geom_point(alpha = 0.4) +
geom_smooth(method = "lm", se = FALSE, linewidth = 1) +
labs(
x = "Factor latente (η)",
y = "Ítem observado",
color = "Grupo"
) +
theme_minimal()
Figure 7.1: Invarianza estricta.
La figura representa la relación entre el factor latente (\(\eta\)) y un ítem observado para dos grupos distintos, incorporando explícitamente la variabilidad residual alrededor de la recta de regresión.
Desde el modelo de medición
\[ y_{ig} = \tau_{ig} + \lambda_{ig}\eta_g + \varepsilon_{ig}, \]
la pendiente de la recta representa la carga factorial (\(\lambda_{ig}\)), el intercepto corresponde a \(\tau_{ig}\), y la dispersión de los puntos alrededor de la recta refleja la varianza residual (\(\text{Var}(\varepsilon_{ig})\)).
En la figura se observa que:
Las rectas de regresión para ambos grupos coinciden, lo que indica que las cargas factoriales y los interceptos son iguales entre grupos.
La dispersión de los puntos alrededor de las rectas es similar en ambos grupos, lo que sugiere que las varianzas residuales también son equivalentes.
Este patrón visual es característico de un escenario de invarianza estricta, en el cual no solo se preserva el significado métrico del ítem y la comparabilidad de medias latentes, sino también la precisión de la medición en todos los grupos.
Como consecuencia:
Las puntuaciones observadas (sumas o promedios de ítems) pueden compararse legítimamente entre grupos.
Las diferencias observadas no pueden atribuirse a diferencias en el error de medición, sino a diferencias reales en el constructo latente.
En el contexto de los modelos de ecuaciones estructurales (SEM), la invarianza estricta no siempre es indispensable, dado que el error de medición se modela explícitamente. Sin embargo, su evaluación proporciona evidencia adicional de equivalencia psicométrica y fortalece la validez de las comparaciones entre grupos.
La Tabla 8.1 sintetiza los niveles de invarianza de medida, las restricciones que impone cada modelo en términos de parámetros del modelo de medición, y los tipos de comparaciones que se consideran válidas en cada caso. Esta tabla funciona como guía rápida antes de pasar a la aplicación empírica con modelos CFA multigrupo.
| Nivel de invarianza | Restricciones entre grupos | Comparaciones válidas | Precaución |
|---|---|---|---|
| Configural | Misma estructura factorial (mismo patrón de cargas). | Estructura factorial (forma del constructo). | No comparar medias latentes ni puntuaciones observadas. |
| Métrica (débil) | Configural + cargas factoriales iguales: λ_{ig} iguales. | Relaciones estructurales: regresiones, correlaciones, varianzas latentes. | No comparar medias latentes (interceptos aún pueden diferir). |
| Escalar (fuerte) | Métrica + interceptos iguales: τ_{ig} iguales. | Medias latentes (y diferencias de grupo en el factor). | No comparar puntuaciones observadas si se requiere equivalencia del error. |
| Estricta | Escalar + varianzas residuales iguales: Var(ε_{ig}) iguales. | Puntuaciones observadas (sumas/promedios) con precisión comparable. | Nivel más restrictivo; rara vez se cumple perfectamente. |
Aunque los niveles de invarianza configural, métrica, escalar y estricta se presentan de forma progresiva, es importante enfatizar que la evaluación de la invarianza de medida no debe interpretarse como un procedimiento mecánico ni dicotómico.
En la práctica aplicada:
Los modelos se evalúan mediante comparaciones entre modelos anidados, no de forma aislada.
La decisión sobre la invarianza debe basarse en una evaluación conjunta de:
Los cambios en los índices de ajuste.
El tamaño muestral.
La complejidad del modelo.
La plausibilidad teórica de las restricciones impuestas.
Asimismo, el incumplimiento de un nivel de invarianza no implica automáticamente el abandono del análisis, sino que puede motivar la exploración de modelos de invarianza parcial, siempre que exista justificación sustantiva para liberar determinadas restricciones.
En este sentido, la invarianza de medida debe entenderse como un criterio de suficiencia para la inferencia, más que como una condición absoluta que deba cumplirse en todos los casos.
En muchos estudios empíricos reales, especialmente en contextos educativos, culturales o longitudinales, es frecuente que no todos los parámetros del modelo de medición sean completamente invariantes entre grupos.
En estos casos, puede considerarse la especificación de modelos de invarianza parcial, en los cuales se adoptan las siguientes estrategias:
Mantener las restricciones de igualdad para la mayoría de los parámetros.
Liberar aquellas cargas factoriales, interceptos o varianzas residuales que muestran evidencia empírica y teórica de no invarianza.
La literatura ha mostrado que, bajo ciertas condiciones, la invarianza parcial es suficiente para realizar inferencias válidas, especialmente cuando:
La mayoría de los ítems permanecen invariantes.
Las restricciones liberadas están debidamente justificadas desde el punto de vista sustantivo.
En la aplicación empírica que se presenta a continuación se ilustrará cómo evaluar estos niveles de invarianza y, en caso necesario, cómo interpretar los resultados cuando las restricciones completas no se sostienen plenamente.
Desde un punto de vista formal, la invarianza parcial puede expresarse dentro del modelo de medición
\[ y_{ig} = \tau_{ig} + \lambda_{ig}\eta_g + \varepsilon_{ig}, \]
imponiendo restricciones de igualdad únicamente sobre un subconjunto de los parámetros del modelo. En particular, se asume que para la mayoría de los ítems se cumple
\[ \lambda_{i1} = \lambda_{i2} = \cdots = \lambda_{iG}, \quad \tau_{i1} = \tau_{i2} = \cdots = \tau_{iG}, \]
mientras que uno o varios parámetros específicos pueden estimarse libremente entre grupos cuando existe evidencia empírica y sustantiva de no invarianza.
Este enfoque reconoce que la equivalencia de medida es, en muchos contextos reales, aproximada más que exacta, y permite preservar la validez de la inferencia comparativa siempre que las desviaciones de invarianza sean limitadas, localizadas y teóricamente justificadas.
Desde el punto de vista metodológico, la especificación de modelos de invarianza parcial no implica la liberación arbitraria de parámetros. En general, se asume que la mayoría de los ítems asociados a cada factor deben permanecer invariantes, de modo que el constructo conserve un anclaje común entre grupos. En particular, se recomienda que al menos dos indicadores por factor mantengan cargas factoriales e interceptos invariantes, garantizando así la identificabilidad y comparabilidad del factor latente.
La liberación de un número excesivo de parámetros (por ejemplo, cuando la mayoría de los ítems presentan evidencia de no invarianza) sugiere que el constructo no es conceptualmente equivalente entre grupos y que las comparaciones sustantivas carecen de validez.
Las representaciones gráficas presentadas en esta sección tienen un propósito didáctico: facilitar la comprensión intuitiva de cómo los distintos niveles de invarianza de medida afectan la relación entre los factores latentes y los ítems observados. No sustituyen la evaluación estadística formal, sino que ilustran visualmente las restricciones impuestas en los modelos CFA multigrupo.
En conjunto, los ejemplos muestran por qué los distintos niveles de invarianza de medida cumplen funciones específicas en la inferencia comparativa:
La invarianza métrica es una condición necesaria para comparar relaciones estructurales, tales como regresiones, correlaciones y varianzas latentes.
La invarianza escalar es indispensable para la comparación legítima de medias latentes entre grupos.
La invarianza estricta respalda la comparación de puntuaciones observadas, al garantizar una precisión de medición equivalente entre grupos.
Estos niveles de invarianza no constituyen opciones metodológicas alternativas, sino requisitos jerárquicos que determinan qué tipos de inferencias comparativas son estadísticamente y conceptualmente válidas.
En la siguiente sección se presentan aplicaciones empíricas de estos conceptos utilizando datos reales, donde la invarianza se evalúa mediante modelos CFA multigrupo y criterios de ajuste, más allá de la inspección visual.
En este capítulo se han presentado los fundamentos conceptuales y metodológicos de la invarianza de medida en el marco de los modelos de ecuaciones estructurales, con énfasis en los niveles configural, métrico, escalar y estricto, así como en sus implicaciones para la inferencia comparativa entre grupos.
A través de formulaciones matemáticas, criterios de evaluación estadística y representaciones gráficas, se ha mostrado que la invarianza de medida no constituye un requisito meramente técnico, sino una condición epistemológica fundamental que determina qué tipos de comparaciones son estadísticamente y conceptualmente válidas.
Dado que la evaluación de la invarianza implica decisiones prácticas —como la comparación de modelos anidados, la interpretación de cambios en los índices de ajuste y, en ocasiones, la especificación de modelos de invarianza parcial—, resulta natural complementar este marco teórico con ejemplos empíricos reproducibles.
Por esta razón, la aplicación práctica de los conceptos desarrollados en este capítulo, incluyendo la especificación de modelos CFA multigrupo, la evaluación de los distintos niveles de invarianza y la interpretación de resultados en R, se presenta en un documento independiente:
Se recomienda al lector revisar primero el presente capítulo teórico antes de abordar la aplicación empírica, de modo que las decisiones metodológicas y los resultados obtenidos puedan interpretarse de forma adecuada y fundamentada.
Este conjunto de ejercicios muestra que la evaluación de escalas no termina con la fiabilidad interna. La validez de las comparaciones entre grupos depende críticamente de la invarianza de medida, que conecta el modelo de medición con la inferencia sustantiva en estudios comparativos y modelos SEM multigrupo.
El objetivo de esta sección de ejercicios es que el lector:
Comprenda conceptualmente la invarianza de medida.
Implemente pruebas de invarianza métrica mediante CFA multigrupo.
Interprete resultados estadísticos y sustantivos.
Reflexione sobre las implicaciones de la invarianza (o su ausencia) en estudios comparativos y modelos SEM.
Estos ejercicios están diseñados para fortalecer la comprensión conceptual y metodológica de la invarianza de medida antes de su implementación empírica. No requieren el uso de datos reales y deben resolverse priorizando el razonamiento teórico y la interpretación sustantiva de los modelos.
Explique con sus propias palabras qué significa que un instrumento sea invariante entre grupos.
Explique por qué no es válido comparar medias o relaciones entre grupos sin evaluar previamente la invarianza de medida.
Describa brevemente las diferencias conceptuales entre:
Invarianza configural.
Invarianza métrica.
Invarianza escalar.
Invarianza estricta.
Indique qué tipo de comparaciones (medias, regresiones, correlaciones) son válidas en cada nivel de invarianza.
Considere el siguiente modelo de medición con tres factores latentes y nueve indicadores.
Escriba el modelo CFA en sintaxis lavaan.
Justifique la asignación de los ítems a cada factor desde un punto de vista conceptual.
Explique por qué este modelo debe evaluarse primero por separado en cada grupo.
Ajuste un modelo CFA multigrupo sin restricciones de igualdad.
Examine los principales índices de ajuste global del modelo.
Indique si el modelo presenta un ajuste aceptable en ambos grupos.
Explique qué implicaría un mal ajuste a este nivel de invarianza.
Justifique por qué en este modelo no se estiman diferencias de medias latentes entre grupos.
Ajuste un modelo CFA multigrupo imponiendo igualdad en las cargas factoriales.
Compare el ajuste del modelo métrico con el modelo configural.
Analice los cambios en los siguientes índices de ajuste: χ², CFI y RMSEA.
Interprete si puede asumirse invarianza métrica.
Explique qué implica la invarianza métrica respecto al significado de los constructos latentes.
Indique qué tipo de análisis comparativos ya son válidos en este punto.
Suponga que el modelo métrico presenta un deterioro sustancial del ajuste.
Explique conceptualmente qué significa la no invarianza métrica.
Utilice los índices de modificación para identificar cargas factoriales problemáticas.
Discuta posibles causas sustantivas de la no invarianza (culturales, educativas o cognitivas).
Ajuste un modelo con invarianza métrica parcial, liberando las cargas identificadas como no invariantes.
Compare el ajuste del modelo parcial con el modelo métrico completo.
Discuta si es legítimo continuar el análisis bajo invarianza parcial.
Explique bajo qué condiciones teóricas y empíricas la invarianza parcial es aceptable.
Analice cómo la invarianza parcial afecta la interpretación de los resultados.
Ajuste un modelo CFA multigrupo con igualdad en cargas factoriales e interceptos.
Compare el ajuste del modelo escalar con el modelo métrico.
Interprete los cambios observados en los índices de ajuste.
Indique si es válido comparar medias latentes entre grupos.
Explique las implicaciones de la no invarianza escalar.
Identifique interceptos no invariantes mediante índices de modificación.
Ajuste un modelo con invarianza escalar parcial.
Analice las medias latentes estimadas bajo este modelo.
Explique cómo cambia la interpretación de las diferencias entre grupos.
Discuta qué riesgos existirían si se ignorara la no invarianza escalar.
Explique conceptualmente la diferencia entre invarianza escalar e invarianza estricta.
Ajuste un modelo CFA multigrupo con igualdad en las varianzas residuales.
Compare el ajuste con el modelo escalar parcial.
Indique si es apropiado utilizar puntuaciones observadas.
Discuta en qué contextos la invarianza estricta es realmente necesaria.
Explique qué se entiende por invarianza estructural.
Ajuste un modelo donde se restrinjan las:
Varianzas latentes.
Covarianzas latentes.
Discuta si estas restricciones son empíricamente sostenibles.
Explique por qué la invarianza métrica es un requisito mínimo para comparar relaciones estructurales entre grupos.
Redacte un breve texto (máx. 1 página) donde discuta:
Por qué la invarianza de medida es un problema epistemológico y no solo técnico.
Las consecuencias de ignorar la no invarianza de medida.
La importancia de la invarianza en estudios comparativos y longitudinales.
Suponga que los mismos ítems se aplican a los mismos individuos en dos momentos temporales.
Explique cómo se reinterpretan los niveles de invarianza en un contexto longitudinal.
Discuta por qué la invarianza escalar es crucial para interpretar el cambio.
Compare conceptualmente la invarianza longitudinal con la invarianza multigrupo.
Consultar el documento RPubs :: Análisis multivariado (bibliografía).
If you found any ERRORS or have SUGGESTIONS, please report them to my email. Thanks.