:::

El proceso de Medición

  • Medición es el proceso de asignar números o etiquetas a personas, objetos, o eventos de acuerdo con una regla específica para representar cantidades o cualidades de atributos.

  • El valor asignado refleja la cantidad de un atributo perteneciente a una persona, objeto o evento.

  • No se mide al objeto sino a sus atributos (p. ej. no medimos al consumidor, sino la actitud del consumidor).

  • Una regla de medición es una guía, método, o comando que le dice al investigador que hacer. (p. ej. asignar los números 1 a 5 de acuerdo con su nivel de satisfacción)

Pasos en el proceso de medición

  1. Identificar el concepto de interés.

  2. Desarrollar un constructo.

  3. Definir el concepto teóricamente.

  4. Definir el concepto operacionalmente (característica observable y proceso de asignación de valor).

  5. Desarrollar una escala de medida

  6. Evaluar la fiabilidad y validez de la medición.

Introducción

Los modelos de ecuaciones estructurales (SEM) son modelos de variables latentes que usan regresiones multivariadas y han crecido enormemente en popularidad durante las últimas dos décadas.

Este aumento refleja al menos tres fenómenos relacionados:

  1. la creciente sofisticación de la capacitación cuantitativa en las ciencias sociales;

  2. la disponibilidad de grandes conjuntos de datos multivariados; y

  3. la potencia computacional para estimar modelos complejos y altamente parametrizados.

Variables Observadas (Manifiestas)

  • Son variables medidas, manipuladas u observadas directamente.
  • Por ejemplo:
    • Respuesta a un ítem del tipo: “Me siento exhausto al final de un día de trabajo” con opciones “1- nada” a “5-mucho”.
    • Número de pensamientos suicidas.
    • Participación en actividades sociales.
    • Número de veces a la semana que le dices a tu pareja que lo amas.
    • Peso.
    • Rendimiento medio mensual.
    • Clasificación en una prueba de evaluación

Variables Latentes, Factores o Constructos

  • Las variables latentes son variables que no son medidas u observadas directamente.
    • Se asume que existen.
    • Presencia inferida a partir de variables observadas (manifiestas).
    • Registra la covariación entre variables observadas.
  • Por ejemplo:
    • Compromiso afectivo
    • Estado depresivo
    • Satisfacción de un cliente
    • Lealtad de un cliente

Modelos con Variables Latentes

Casos particulares de modelos de variables latentes: Modelización de la estructura de la covarianza:

Variables en SEM

  • Las variables latentes y observadas pueden ser métricas o categóricas.
  • De acuerdo a su rol pueden ser clasificadas como:
    • Independientes o exógenas: La causa de la variación de estas variables reside fuera del modelo (no son influenciadas por ninguna variable en el modelo.)
    • Dependientes o endógenas: La causa de la variación de las variables reside dentro del modelo (son explicadas por variables presentes en el modelo)

¿Qué son los SEM?

  • Familia de modelos usados para evaluar la validez de modelos teóricos que definen relaciones causales e hipotéticas entre variables observadas y (a menudo) latentes.
  • Las relaciones son representadas por parámetros que indican la magnitud del efecto que las variables (independientes) tienen sobre otras variables (dependientes)
  • Son una extensión de modelos lineales generalizados que considera, de forma explícita, los errores de medida asociadas con las variables en estudio.

¿Qué son los SEM

En general, el objetivo de SEM es comprender patrones estructurales en las asociaciones entre variables

  • Por ejemplo, ¿son suficientes 20 items en un test de satisfacción para medir un constructo subyacente (hipotético)?
  • SEM permite a los investigadores probar hipótesis sobre variables observadas, así como variables latentes que no se miden directamente. Esto abre la puerta para desarrollar la validez de construcción de una variable latente (por ejemplo, la lealtad), o para probar hipótesis sobre cómo los constructos se relacionan entre sí (por ejemplo, la relación entre satisfacción y lealtad).

SEM: Componentes Principales

Modelo Estructural

¿Cómo inferir relaciones causales complejas entre las variables que no son observadas directamente?

Modelo de Medición

¿Qué es lo que la medida observada está realmente midiendo?

Modelo Estructural

  • Representa las relaciones entre constructos, ya sean observados o latentes. Esto es lo más parecido a las técnicas de regresión estándar, donde se cree que una variable causa (o al menos está asociada a) otra.

  • Por ejemplo, la edad a menudo predice el nivel de rendimiento en las pruebas de memoria de trabajo. Por lo tanto:

\[ \begin{align*} \textrm{Edad} &\rightarrow \textrm{Memoria_de_Trabajo} \\ \end{align*} \]

Modelo Estructural

  • Un psicólogo del desarrollo podría notar rápidamente que la edad no es la causa en sí misma. Más bien, la causa próxima podría ser el aumento de la integración funcional de las redes cerebrales, o algún otro resultado del envejecimiento.

  • Podríamos pensar esto en términos de edad que tenga un efecto indirecto en la memoria de trabajo a través de una o más variables intermedias (mediadoras)

Modelo Estructural

Modelo Estructural

Modelo de Medición

  • Especifica cómo las variables observadas se relacionan entre sí para formar variables latentes subyacentes.
  • Las variables observadas se consideran indicadores (es decir, medidas indirectas) de una variable latente. Y las variables latentes típicamente representan constructos hipotéticos en SEM.
  • Por ejemplo, el narcisismo es un constructo que describe la tendencia a ser grandioso, vengativo, auto-mejorado y potencialmente vulnerable al rechazo.

Modelo de Medición

  • La investigación sobre el narcisismo (por ejemplo, Pincus y Lukowitsky, 2010) sugiere que probablemente tenga múltiples facetas, como la grandiosidad frente a la vulnerabilidad. Entonces, tal vez sea un constructo hipotético compuesto de subcomponentes latentes separables.
  • El rol de un modelo de medición es probar si la estructura latente subyacente de los indicadores coincide con la teoría del investigador.
  • Por ejemplo, un item en un test psicométrico destinado a capturar la grandiosidad puede no correlacionarse con otros items que pretenden también medir la grandiosidad. Por lo tanto, es probable que sea un mal indicador de ese constructo latente.

Modelo de Medición

Modelo de medición

Causalidad en SEM

  • Existe la concepción errada de que un modelo ajustado correctamente a los datos demuestra, estadísticamente, la causalidad propuesta en el modelo.
  • La estimación de los parámetros son similares a la de los parámetros de otros modelos lineales en el sentido de que no demuestran la existencia de las relaciones causales entre las variables.
  • Las relaciones causales entre las variables son supuestos del modelo.
  • La significancia estadística del modelo puede ser usada solamente para demostrar la falsedad del modelo, nunca para demostrar la veracidad de las relaciones causales.

Correlaciones y Covarianzas en SEM

  • Las covarianzas (y correlaciones) entre variables manifiestas son los “datos” que permiten evaluar la plausibilidad de un SEM en estudio.
  • Factores que afectan la calidad de las covarianzas o correlaciones podrán afectar también la calidad del ajuste del modelo a los datos y de las estimaciones de los parámetros del modelo.
  • El tipo de correlación en SEM es también dependiente de la escala de medida de las variables.
  • Siendo rigurosos la correlación de Person es una medida de asociación de tipo lineal para variables medidas en una escala métrica (al menos intervalo.)

Correlaciones y Covarianzas en SEM

  • Cuando la escala de las variables no puede ser asumida como de tipo métrica es aconsejable recurrir a otros coeficientes.
  • Si las variables son medidas en una escala ordinal, más provienen de variables latentes contínuas con distribución normal bivariada, debe utilizarse, preferentemente, el coeficiente de correlación policórica (Jöreskog y Sörbom, 1996.)
  • Si una de las variables fuera por lo menos intervalar y la otra ordinal, debe usarse, preferentemente, el coeficiente de correlación poliserial.
  • Finalmente, para el caso de variables nominales dicotómicas, puede usarse el coeficiente de correlación tetracórica.

Correlaciones y Covarianzas en SEM

  • Estudios de simulación sugieren que los coeficientes de correlación policórica y poliserial son, comparativamente a los de Pearson, Spearman y \(\tau\) de Kendall, los que mejor reproducen la estructura correlacional de las variables cuando están medidas en una escala ordinal (Babakus, Ferguson, & Jöreskog, 1987.)

  • Sin embargo, existe cierta controversia sobre la real utilidad de estos coeficientes como alternativa al coeficiente de correlación de Pearson.

Correlaciones y Covarianzas en SEM

  • El uso de correlaciones policóricas y poliseriales con muestras pequeñas y muchas variables puede no garantizar mejores resultados que los obtenidos con la correlación de Pearson.

  • Por ejemplo, Arbuckle(2009) argumenta que los supuestos de normalidad bivariada y de muestras mayores a 2000 observaciones para la estimación correcta de las correlaciones policóricas y tetracóricas (Yuan & Bentler, 1994) son irreales en la mayoría de escenarios prácticos de los SEM.

¿Correlaciones o covarianzas?

  • Los SEM pueden estimarse usando matrices de correlación o de covarianzas.

  • El análisis de las matrices de covarianzas procura mantener las diferencias entre las magnitudes de medida de las diferentes variables y las respectivas magnitudes de las varianzas.

  • El análisis de las matrices de correlaciones procura eliminar los efectos de las diferentes magnitudes de medida y de la varianza de las variables originales.

¿Correlaciones o covarianzas?

  • A pesar de que usualmente se sugiere usar datos estandarizados (correlaciones), esto puede conducir a resultados erróneos (Kline, 2004, p. 22):
    • En análisis multigrupos, cuando los grupos presentan diferentes matrices de covarianzas.
    • En análisis de modelos longitudinales, donde las varianzas de las medidas no permanencen constantes.
    • En análisis en los que las magnitudes de las medidas tienen un significado que es necesario contabilizar en las asociaciones de las variables (por ejemplo, salario mensual vs. años de escolaridad.)

Modelamiento de la estructura de la covarianza

El objetivo general de los SEM es probar hipótesis sobre la estructura de las matrices de covarianza.

  • Por ejemplo,
    • ¿están relacionadas dos variables porque una causa (o al menos predice) la otra?
    • ¿Se correlacionan dos variables porque son indicadores de una construcción subyacente?

Modelamiento de la estructura de la covarianza

Considere una matriz de correlación de items relacionados con el bienestar subjetivo, el desapego y el narcisismo

Modelamiento de la estructura de la covarianza

La “bondad” de un modelo se puede pensar en términos de qué tan bien predice (captura) la matriz de covarianza completa de los datos usando menos parámetros.

En una matriz de covarianza, tenemos \[f =\frac{p (p - 1)}{2} + p =\frac{p (p + 1)}{2}\] parámetros libres. Es decir, tenemos que estimar cada celda en la matriz de covarianza.

Modelamiento de la estructura de la covarianza

En el caso del conjunto de datos anterior con 9 variables, tenemos \[ f = \frac{9 \cdot 10} {2} = 45 \] parámetros: 36 covarianzas, y 9 varianzas (diagonal).

SEM busca capturar la matriz de covarianza completa \(\mathbf{S}\) usando una matriz de covarianza impuesta por el modelo \(\hat{\Sigma}\).

Modelamiento de la estructura de la covarianza

Si esto se puede hacer con menos de 45 parámetros, sugiere que hay una estructura subyacente en la matriz de covarianza que es más parsimoniosa que una no estructurada.

Esto se relaciona con los grados de libertad en el modelo, lo cuál motiva el tema de identificación del modelo.

Evaluación de un modelo de estructura de covarianza

Podemos probar qué tan bien un modelo candidato captura la matriz de covarianza de 9 x 9 de estos datos utilizando menos de 45 parámetros.

Hemos representado la matriz de covarianza completa usando 22 parámetros.

Diagramas Estructurales: Notación

Tipos de Parámetros

  1. Libres: Son desconocidos y necesitan estimarse.

  2. Fijos: Son constantes y a menudo especificados por el investigador, típicamente 0 o 1.

  3. Restringidos: Son desconocidos pero restringidos a ser iguales a algún o varios parámetros; es decir, especifican una relación requerida entre dos variables. Por ejemplo:

  • x = 2y.
  • Las cargas de dos factores son iguales.
  • Un parámetro debe estar dentro de un cierto rango (por ejemplo, -2 a 2).

Tipos de Parámetros

3.1. Restricción de Igualdad: Cuando dos parámetros libres están obligados a ser iguales, en efecto, solo se estima un parámetro libre.

  • Por ejemplo, si postulamos que la asociación entre el autoodio y la tristeza de la pareja en una interacción debería ser igual para ambos miembros de una pareja (p1 y p2), entonces podemos estimar solo un parámetro ( \(b\) en el modelo de trayectorias mostrado a continuación).

Tipos de Parámetros

Relaciones entre variables

Efectos directos

  • Los efectos directos representan la relación entre un predictor y una variable dependiente (variable endógena) que no está mediada por ninguna otra variable (Bollen, 1987).

  • Esto podría significar ignorar posibles variables mediadoras (es decir, no están incluidas en el modelo) o incluirlas.

Relaciones entre variables

Efectos directos

  • En el análisis de mediación causal, el efecto directo representa el efecto de una variable independiente (e.g., tratamiento) en un resultado (v.g., depresión) que contiene un candidato mediador constante que ocurriría bajo el nivel correspondiente del tratamiento.

Relaciones entre variables

Efectos indirectos

  • Los efectos indirectos representan el efecto de un predictor sobre una variable respuesta través de una o más variables intermedias (mediadoras).

  • Por lo tanto, la idea es que la variable respuesta esté relacionado con un predictor porque el predictor influye en una variable mediadora, que a su vez influye en el resultado.

Relaciones entre variables

Efectos indirectos

Mediador Simple

Relaciones entre variables

Efectos indirectos

Mediadores Múltiples

  • En un modelo de mediación múltiple, se considera el efecto directo \(e\) de un predictor \(X\) en una variable respuesta \(Y\) después de tener en cuenta todas las variables mediadoras (aquí, \(M1\) y \(M2\)).

Relaciones entre variables

Efectos indirectos

Efecto indirecto específico

  • La mediación múltiple también expone el nuevo concepto de efectos indirectos específicos, que resume la asociación entre un predictor, \(X\) y el resultado \(Y\) a través de una o más vías de intervención específicas.

  • Por ejemplo, en el modelo anterior, podríamos medir cuánto de la relación entre \(X\) y \(Y\) se transmite a través de \(X \rightarrow M1 \rightarrow Y\), que sería \(a \cdot d\).

Relaciones entre variables

Efectos indirectos

Efecto indirecto total

El efecto indirecto total es la suma de todas las rutas indirectas entre \(X\) y \(Y\) (es decir, excluyendo la ruta \(X \rightarrow Y\)).

Prueba de efectos indirectos

Cuando pensamos en la magnitud de un efecto indirecto, es mejor conceptualizarlo como un producto de las vías entre el predictor y la respuesta. Por lo tanto, el efecto indirecto específico de \(X\) en \(Y\) a través de la ruta \(X \rightarrow M1 \rightarrow M2 \rightarrow Y\) es el producto de las estimaciones de parámetros correspondientes \(a \cdot b \cdot c\).

Relaciones entre variables

Efectos total

El efecto total de \(X\) en \(Y\) es la suma del efecto directo y los efectos totales indirectos.

Causa común

Dos variables pueden estar relacionadas entre sí porque fueron causadas por una tercera variable común. Por ejemplo, \(Y_1\) y \(Y_2\) pueden estar relacionados porque ambos fueron influenciados por \(X\).

Relaciones entre variables

Causa común

Diagramas de Trayectorias (senderos)

Diagramas de Trayectorias (senderos)

Ejemplo: Regresión Lineal (univariada)

Ejemplo: Regresión Lineal (multivariada)

Ejemplo: Path Analysis (Análisis de Trayectorias)