Unidad 3 - Medición en Investigación de Mercados
1MN022 - Investigación de Mercados Aplicada
Universidad del Pacífico
:::
Medición es el proceso de asignar números o etiquetas a personas, objetos, o eventos de acuerdo con una regla específica para representar cantidades o cualidades de atributos.
El valor asignado refleja la cantidad de un atributo perteneciente a una persona, objeto o evento.
No se mide al objeto sino a sus atributos (p. ej. no medimos al consumidor, sino la actitud del consumidor).
Una regla de medición es una guía, método, o comando que le dice al investigador que hacer. (p. ej. asignar los números 1 a 5 de acuerdo con su nivel de satisfacción)
Identificar el concepto de interés.
Desarrollar un constructo.
Definir el concepto teóricamente.
Definir el concepto operacionalmente (característica observable y proceso de asignación de valor).
Desarrollar una escala de medida
Evaluar la fiabilidad y validez de la medición.
Los modelos de ecuaciones estructurales (SEM) son modelos de variables latentes que usan regresiones multivariadas y han crecido enormemente en popularidad durante las últimas dos décadas.
Este aumento refleja al menos tres fenómenos relacionados:
la creciente sofisticación de la capacitación cuantitativa en las ciencias sociales;
la disponibilidad de grandes conjuntos de datos multivariados; y
la potencia computacional para estimar modelos complejos y altamente parametrizados.
Casos particulares de modelos de variables latentes: Modelización de la estructura de la covarianza:
En general, el objetivo de SEM es comprender patrones estructurales en las asociaciones entre variables
Modelo Estructural
¿Cómo inferir relaciones causales complejas entre las variables que no son observadas directamente?
Modelo de Medición
¿Qué es lo que la medida observada está realmente midiendo?
Representa las relaciones entre constructos, ya sean observados o latentes. Esto es lo más parecido a las técnicas de regresión estándar, donde se cree que una variable causa (o al menos está asociada a) otra.
Por ejemplo, la edad a menudo predice el nivel de rendimiento en las pruebas de memoria de trabajo. Por lo tanto:
\[ \begin{align*} \textrm{Edad} &\rightarrow \textrm{Memoria_de_Trabajo} \\ \end{align*} \]
Un psicólogo del desarrollo podría notar rápidamente que la edad no es la causa en sí misma. Más bien, la causa próxima podría ser el aumento de la integración funcional de las redes cerebrales, o algún otro resultado del envejecimiento.
Podríamos pensar esto en términos de edad que tenga un efecto indirecto en la memoria de trabajo a través de una o más variables intermedias (mediadoras)
Modelo Estructural
Modelo de medición
Estudios de simulación sugieren que los coeficientes de correlación policórica y poliserial son, comparativamente a los de Pearson, Spearman y \(\tau\) de Kendall, los que mejor reproducen la estructura correlacional de las variables cuando están medidas en una escala ordinal (Babakus, Ferguson, & Jöreskog, 1987.)
Sin embargo, existe cierta controversia sobre la real utilidad de estos coeficientes como alternativa al coeficiente de correlación de Pearson.
El uso de correlaciones policóricas y poliseriales con muestras pequeñas y muchas variables puede no garantizar mejores resultados que los obtenidos con la correlación de Pearson.
Por ejemplo, Arbuckle(2009) argumenta que los supuestos de normalidad bivariada y de muestras mayores a 2000 observaciones para la estimación correcta de las correlaciones policóricas y tetracóricas (Yuan & Bentler, 1994) son irreales en la mayoría de escenarios prácticos de los SEM.
Los SEM pueden estimarse usando matrices de correlación o de covarianzas.
El análisis de las matrices de covarianzas procura mantener las diferencias entre las magnitudes de medida de las diferentes variables y las respectivas magnitudes de las varianzas.
El análisis de las matrices de correlaciones procura eliminar los efectos de las diferentes magnitudes de medida y de la varianza de las variables originales.
El objetivo general de los SEM es probar hipótesis sobre la estructura de las matrices de covarianza.
Considere una matriz de correlación de items relacionados con el bienestar subjetivo, el desapego y el narcisismo
La “bondad” de un modelo se puede pensar en términos de qué tan bien predice (captura) la matriz de covarianza completa de los datos usando menos parámetros.
En una matriz de covarianza, tenemos \[f =\frac{p (p - 1)}{2} + p =\frac{p (p + 1)}{2}\] parámetros libres. Es decir, tenemos que estimar cada celda en la matriz de covarianza.
En el caso del conjunto de datos anterior con 9 variables, tenemos \[ f = \frac{9 \cdot 10} {2} = 45 \] parámetros: 36 covarianzas, y 9 varianzas (diagonal).
SEM busca capturar la matriz de covarianza completa \(\mathbf{S}\) usando una matriz de covarianza impuesta por el modelo \(\hat{\Sigma}\).
Si esto se puede hacer con menos de 45 parámetros, sugiere que hay una estructura subyacente en la matriz de covarianza que es más parsimoniosa que una no estructurada.
Esto se relaciona con los grados de libertad en el modelo, lo cuál motiva el tema de identificación del modelo.
Podemos probar qué tan bien un modelo candidato captura la matriz de covarianza de 9 x 9 de estos datos utilizando menos de 45 parámetros.
Hemos representado la matriz de covarianza completa usando 22 parámetros.
Libres: Son desconocidos y necesitan estimarse.
Fijos: Son constantes y a menudo especificados por el investigador, típicamente 0 o 1.
Restringidos: Son desconocidos pero restringidos a ser iguales a algún o varios parámetros; es decir, especifican una relación requerida entre dos variables. Por ejemplo:
3.1. Restricción de Igualdad: Cuando dos parámetros libres están obligados a ser iguales, en efecto, solo se estima un parámetro libre.
Los efectos directos representan la relación entre un predictor y una variable dependiente (variable endógena) que no está mediada por ninguna otra variable (Bollen, 1987).
Esto podría significar ignorar posibles variables mediadoras (es decir, no están incluidas en el modelo) o incluirlas.
Los efectos indirectos representan el efecto de un predictor sobre una variable respuesta través de una o más variables intermedias (mediadoras).
Por lo tanto, la idea es que la variable respuesta esté relacionado con un predictor porque el predictor influye en una variable mediadora, que a su vez influye en el resultado.
La mediación múltiple también expone el nuevo concepto de efectos indirectos específicos, que resume la asociación entre un predictor, \(X\) y el resultado \(Y\) a través de una o más vías de intervención específicas.
Por ejemplo, en el modelo anterior, podríamos medir cuánto de la relación entre \(X\) y \(Y\) se transmite a través de \(X \rightarrow M1 \rightarrow Y\), que sería \(a \cdot d\).
El efecto indirecto total es la suma de todas las rutas indirectas entre \(X\) y \(Y\) (es decir, excluyendo la ruta \(X \rightarrow Y\)).
Cuando pensamos en la magnitud de un efecto indirecto, es mejor conceptualizarlo como un producto de las vías entre el predictor y la respuesta. Por lo tanto, el efecto indirecto específico de \(X\) en \(Y\) a través de la ruta \(X \rightarrow M1 \rightarrow M2 \rightarrow Y\) es el producto de las estimaciones de parámetros correspondientes \(a \cdot b \cdot c\).
El efecto total de \(X\) en \(Y\) es la suma del efecto directo y los efectos totales indirectos.
Dos variables pueden estar relacionadas entre sí porque fueron causadas por una tercera variable común. Por ejemplo, \(Y_1\) y \(Y_2\) pueden estar relacionados porque ambos fueron influenciados por \(X\).