Análisis Cualitativo Comparativo

Diego Solís Delgadillo

diego.solis@colsan.edu.mx

¿Qué es QCA?

  • Metodología cualitativa
  • Busca identificar la combinación de factores que es necesaria o suficiente para producir un resultado

¿Cuándo es de utilidad QCA?

  • Diferencias cualitativas
  • Número intermedio de casos
  • Explicación compleja
  • Equifinalidad

Estudios de N grande y estudios de caso

Estudios de N grande

  • Hacen inferencias de una muestra a la población
  • Estiman el efecto medio de \(X\) sobre \(Y\)
  • Tienen alta validez externa

Estudios de caso

  • Identifican mecanismos causales
  • ¿Cómo X produce Y?
  • Tienen alta validez interna

¿Dónde se ubica QCA?

  • QCA se ubica entre los estudios de N grande y estudio de caso
    • Obtener profundidad del caso y su complejidad
    • Tener cierto nivel de generalización

Diferencias cualitativas

  • Hay conceptos que pueden medirse en una escala de intervalo
    • Pero algunos puntos cambian cualitativamente

Tip

  • Podríamos analizar el efecto de los años de estudio sobre el ingreso
  • Pero podría interesarnos cuál es el efecto de haber concluido la preparatoria
    • ¿Cuál es el efecto de haber concluido el grado académico?

Explicaciones complejas

  • QCA es útil cuando pensamos nuestras explicaciones en términos coyunturales

Ejemplo

  • El grado académico podría interactuar con otros factores
    • Si su escuela fue pública o privada
    • Si se trata de un hombre o una mujer

Equifinalidad

  • QCA está abierto a que existen diferentes configuraciones causales que producen un mismo fenómeno

Ejemplo

  • En un estudio sobre ingreso alto QCA podría encontrar dos caminos
    • Hombres con educación privada
    • Mujeres con educación superior

Dos tradiciones

  • Métodos cuantitativos
    • Basados en la estadística inferencial
  • Métodos cualitativos
    • Basados en la teoría de conjuntos y la lógica

Importante

  • La selección del método depende de los objetivos de investigación

Tipos de hipótesis

  • Hipótesis en métodos cuantitativos
    • “Si X aumenta/disminuye, Y aumenta/ disminuye”
  • En QCA las hipótesis son planteadas en términos de condiciones necesarias o suficientes

Hipótesis QCA

  • “Cuando \(X\) está presente, \(Y\) puede ocurrir o no, pero si \(X\) está ausente \(Y\) no podrá ocurrir” (condición necesaria)
  • “Cuando \(X\) está presente \(Y\) ocurrirá, pero cuando \(X\) está ausente \(Y\) puede o no ocurrir”)

Tipos de teorías

  • Los investigadores cualitativos suelen utilizar el lenguaje de la lógica

Tip

  • Para señalar que \(X\) es necesario para \(Y\)
    • “solo si”, “es esencial”, “indispensable”, “requisito” o “sine qua non
  • Cuando consideran algo suficiente
    • “siempre es seguido de”, “inevitablemente lleva”, “genera”, “produce”

TEORÍA DE CONJUNTOS

TEORÍA DE CONJUNTOS

Conjuntos

  • Mahoney (2010) los define como áreas de inclusión y exclusión

    • A= {naranja, limón, lima, toronja, mandarina}
  • Se puede entender como sinónimo de categoría

    • P.e. urbano o rural / democracia/autocracia

Elementos

  • Son los objetos contenidos centro del conjunto

Tipos de conjuntos

  • Crisp (nítidos)
    • Bivalentes
    • Multivalentes
  • Fuzzy (difusos)

Crisp Sets

  • Son colecciones de elementos bien definidos
    • Pertenecen o no al conjunto
    • Si el elemento que define a \(𝐴\) es verdadero pertenece al conjunto

Crisp sets

  • Los conjuntos nítidos son mutuamente excluyentes
    • P.e. Un perro no pertenece al conjunto vivíparos
  • Pero un elemento puede formar parte de varios conjuntos
    • P.e. Un gato es un felino pero también es un mamífero

Fuzzy Sets

  • Son categorías con fronteras borrosas y grados de membresía

  • Cada objeto tiene un grado de pertenencia que va de 0 a 1

  • Un elemento puede pertenecer más o menos a un conjunto

Ejemplo

  • Una persona no es solo rica o pobre sino que pertenece más o menos a un conjunto

Grados de membresía

  • Los conceptos pueden pensarse de manera dicotómica
    • Los extremos son los tipos ideales
  • Pero sus manifestaciones empíricas se observan en grados

Ejemplo

  • Sabemos que Finlandia es una democracia y que Corea del Norte es una autocracia.
  • Los límites pueden ser borrosos en algunos casos
    • Podríamos encontrar países con una democracia electoral y que limitan libertades o presenten violaciones a derechos humanos

Conjunción lógica

  • Denotan la combinación de factores
  • Es el área de intersección de dos o más conjuntos
  • Puede ser leída como el operador lógico “y”
  • Las conjunciones son expresadas con multiplicaciones booleanas \(A*B\)

Disyunción lógica

  • Implica la unión de dos o más conjuntos
  • Si un elemento cumple con cualquiera de los dos entonces está en el conjunto
  • Para indicar disyunciones se utiliza la adición booleana \(A+B\)
  • P.e. “personas con licenciatura o cinco años de experiencia”

Negación del conjunto

  • Implica identificar al complemento del conjunto
    • Son todos los elementos del universo que no forman parte de \(A\)
  • La negación se expresa el símbolo ~
    • En lenguaje común equivale a “no” “no hombre”, “no democracia”

Condiciones necesarias o suficientes

  • En ocasiones nos interesa saber si hay condiciones (\(X\)) que producen un resultado (\(Y\))

  • Nos puede interesar dos cosas

    • Conocer elementos indispensables para que se produzca \(Y\)
  • Los factores que siempre llevan a \(Y\)

Condición suficiente

  • Es aquella que cada vez que se presenta se observa el resultado de interés
    • Lluvia es suficiente para calles mojadas
  • Si se presenta \(X\) entonces \(Y\)

Important

  • La ausencia de \(X\) no implica la ausencia de \(Y\)

Ejemplo 1

\(Y\) => Buenos resultados \(Y_0\) => Sin buenos resultados

\(X\) => Buena infraestructura \(X_0\) => Sin buena infraestructura

Ejemplo 1

\(Y\) \(Y_0\)
\(X\) a c
\(X_0\) b d

Suficiencia

\(Y\) \(Y_0\)
\(X\) 2 0
\(X_0\) 0 2

\(Y\) \(Y_0\)
\(X\) 2 0
\(X_0\) 1 2
  • \(X\) sigue siendo una causa suficiente
    • Cada vez que está presente se genera el resultado
  • La marca distintiva de una condición suficiente es que cuando \(X\) está presente \(Y_0=0\)

Suficiencia en teoría de conjuntos

  • En teoría de conjuntos la suficiencia significa que \(X\) es un subconjunto de \(Y\)
  • \(X\)\(Y\)
  • \(Y\) es un superconjunto de \(X\)

  • Cuando \(Y\) es más grande que \(X\) significa que hay otras explicaciones de \(Y\)

  • Buenos resultados de pruebas educativas tendrían otras explicaciones

Condiciones de suficiencia en conjuntos difusos

  • Las relaciones perfectas son difíciles de encontrar

  • Fuzzy sets toma como suficiente a los conjuntos que están mayormente contenidos en \(Y\)

Gráfico XY (Suficiencia)

  • Una alternativa a los Diagramas de Venn en fuzzy sets son los gráficos \(XY\)

  • Cuando los valores de \(X\) son menores a \(Y\) podemos decir que hay suficiencia

  • Los casos caen por encima de la diagonal

Ejemplos condiciones suficientes

  • Lluvia ⇒ Baquetas mojadas
  • Ser francés ⇒ Europeo
  • Plagiar trabajo ⇒ Reprobar
  • Knockout ⇒ Ganar pelea de box
  • Diada de democracias ⇒ Paz entre los dos países

Condiciones de necesidad

  • Una condición \(𝑋\) es necesaria si cada vez que observamos \(Y\), el factor \(X\) también está presente
  • Una condición es necesaria si \(Y\) no puede ocurrir sin \(X\)
  • Si \(Y\) entonces \(X\)

Advertencia

  • Pueden existir elementos de \(X\) que no están contenidos en \(Y\)

Ejemplo necesidad

\(Y\) \(Y_0\)
\(X\) 3 1
\(X_0\) 0 0

Tip

  • Una forma es ver el elemento común de todos los casos positivos
  • No hay casos en que se presente sin esta condición

Necesidad en Teoría de Conjuntos

  • Las condiciones necesarias indican que \(Y\) es un subconjunto de \(X\)

  • \(X\)\(Y\)

  • \(X\) es un superconjunto de \(Y\)

Necesidad en conjuntos difusos

  • La inclusión perfecta es rara de observar

  • En fuzzy sets no es necesaria una inclusión completa de \(Y\) en \(X\)

  • Basta con que la gran mayoría de \(Y\) esté contenida en \(X\)

Gráfico XY (necesidad)

  • Cuando los valores de \(X\) son mayores a los de \(Y\) los casos se observan debajo de la diagonal

  • Para una condición de necesidad la mayoría de los casos deben estar en esta área

Necesidad para conjunciones

  • También existen conjunciones necesarias
  • El resultado de interés está incluido en la intersección de esos conjuntos

\(A*B\)\(Y\)

Ejemplos condiciones necesarias

  • VIH ⇐ SIDA
  • Elecciones ⇐ Democracia
  • Democracia ⇐ Membresía en UE
  • Ser estadounidense ⇐ Presidente de EE.UU

Condiciones necesaria triviales

  • Un factor puede ser necesario pero trivial

  • Necesitamos saber el tamaño relativo de \(X\) con respecto a \(Y\)

  • \(X\) es más importante conforme se convierte en un superset más pequeño de \(Y\)

CALIBRACIÓN

CALIBRACIÓN

¿Qué es la calibración?

  • Es el proceso por el que transformamos valores crudos en puntuaciones de membresía a un conjunto
    • En crisp sets los valores posibles son 0 o 1
    • En fuzzy sets son todos los valores entre 0 y 1

Crisp Sets

  • En ocasiones la asignación de valores es simple: se cuenta con el atributo o no
    • Experiencia legislativa
    • Grado académico
    • Sexo

  • Otros datos requieren de establecer un criterio
    • Países ricos
    • Democracia
    • Desarrollo humano

La teoría guía a la calibración

  • Podemos vernos tentados a utilizar a la media como criterio de inclusión

  • Pero la clasificación debe estar fundamentada en la teoría

    • Es un criterio externo a los datos

Tip

  • Los datos no nos dirán que significa ser alto, ni un termómetro en dónde empieza una temperatura calurosa

¿Qué hacer si no hay un referente teórico?

  • Cuando no hay una clara definición debemos analizar los datos

  • Identificar si hay los casos se agrupan naturalmente

Agrupación en R

  • El paquete QCA de R cuenta con la función findTh()

  • La instrucción agrupa a los datos en clusters utilizando la distancia euclidiana

library (QCA)
data (LR)

findTh(LR$DEV)

Fuzzy sets

  • Se utilizan cuando tenemos conceptos con límites borrosos

Tip

  • En lugar en pensar en si hay o no desarrollo humano podemos ver sus grados
  • Los polos son cualitativamente distintos, pero sus manifestaciones empíricas se manifiestan en grados.
  • Tienen una puntuación entre 0 y 1

Calibración en fuzzy sets

  • En fuzzy sets pueden utilizarse varios métodos:

    1. Asignación directa
    2. Método directo
    3. Método indirecto

Asignación directa

  • Utiliza el conocimiento experto para asignar valores a los casos.
  • Los expertos asignan los valores entre 0 y 1.
  • Este procedimiento suele tener justificaciones teóricas

Warning

  • Es un método subjetivo
  • Poco probable que dos expertos lleguen a los mismos valores

Método directo

  • Utiliza una función logarítimica para establecer el grado de pertenencia al conjunto
  • Los resultados del procedimiento son contenidos dentro de 0 y 1
  • La función nunca alcanza 0 y 1
  • Los valores 0.95 y 0.05 son interpretados como membresías completas

  • En el método directo se establecen tres anclajes para transformar los valores:
    • Inclusión completa (0.95)
    • Punto de cruce (0.5) –Punto de mayor ambigüedad-
    • Total exclusión (0.05)

Tip

Estos valores los transformamos en posibilidades asociadas

Posibilidades asociadas

  • PA= Posibilidades asociadas
  • GM= Grado de membresía

\[ PA= GM/ (1- GM)\]

  • Ejemplo:

\[ PA= 0.95/ (1- 0.95)= 19\]

Calculamos el logaritmo natural de este valor \[ln(19)=2.94\]

Para el punto de cruce \[ PA= 0.5/ (1- 0.5)= 1\] \[ln(1)=0\]

Para el punto de exclusión \[ PA= 0.05/ (1- 0.05)= 0.05\] \[ln(0.05)=-2.94\]

Posibilidades asociadas

Grado membresía Posibilidades asociadas Log momios
Membresía completa 0.95 19 2.94
Punto de cruce 0.50 1 0
Exclusión completa 0.05 0.05 2.94

Calibración IDH

  • Es un indicador que va de 0 a 1

  • El IDH ofrece varios cortes

    • 0.80 o más indica un “desarrollo humano muy alto”
    • 0.70 son países con “alto desarrollo humano”
    • 0.55 son casos con “bajo desarrollo humano”.

Tip

Tomaremos estos cortes como punto de inclusión, cruce y exclusión

Paso 1: Desviación

  • El primer paso es calcular su desviación con respecto al punto de cruce (0.70)
  • Por ejemplo, para Alemania la operación sería 0.957 - 0.70= .257

Ejemplo

País IDH Desviación
Noruega 0.957 0.257
Alemania 0.947 0.247
Reino Unido 0.932 0.232
España 0.904 0.204
México 0.779 0.079
Brasil 0.765 0.065
Ecuador 0.759 0.059
Bolivia 0.718 0.018

País IDH Desviación
Irak 0.674 -0.026
Guatemala 0.660 -0.04
Kenia 0.601 -0.099
Angola 0.581 -0.119
Ruanda 0.543 -0.157
Afganistán 0.511 -0.189
Mozambique 0.456 -0.244
Mali 0.434 -0.266

Paso 2: Escalares

  • Calculamos la diferencia absoluta entre los umbrales
    • 0.8 (TOTAL INCLUSIÓN)- 0.7(PUNTO DE CRUCE)= .10
    • 0.55(TOTAL EXLCUSIÓN) – 0.7(PUNTO DE CRUCE)= 0.15

  • Tomamos las razones de momios (2.94) ya establecidas y las dividimos por estas diferencias

\[ 2.94/.10=29.4\] \[ 2.94/.15= 19.6\]

País IDH Desviación Escalar
Noruega 0.957 0.257 29.4
Alemania 0.947 0.247 29.4
Reino Unido 0.932 0.232 29.4
España 0.904 0.204 29.4
México 0.779 0.079 29.4
Brasil 0.765 0.065 29.4
Ecuador 0.759 0.059 29.4
Bolivia 0.718 0.018 29.4

País IDH Desviación Escalar
Irak 0.674 -0.026 19.6
Guatemala 0.660 -0.04 19.6
Kenia 0.601 -0.099 19.6
Angola 0.581 -0.119 19.6
Ruanda 0.543 -0.157 19.6
Afganistán 0.511 -0.189 19.6
Mozambique 0.456 -0.244 19.6
Mali 0.434 -0.266 19.6

Paso 3. Producto

  • Calcular el producto entre la diferencia y los escalares

  • Para el caso de Reino Unido \(0.232*29.4=6.82\)

País IDH Desv Escalar Producto
Noruega 0.957 0.257 29.4 7.55
Alemania 0.947 0.247 29.4 7.26
Reino Unido 0.932 0.232 29.4 6.82
España 0.904 0.204 29.4 5.99
México 0.779 0.079 29.4 2.32
Brasil 0.765 0.065 29.4 1.91
Ecuador 0.759 0.059 29.4 1.73
Bolivia 0.718 0.018 29.4 0.52

País IDH Desv Escalar Producto
Irak 0.674 -0.026 19.6 -0.76
Guatemala 0.660 -0.04 19.6 -1.17
Kenia 0.601 -0.099 19.6 -2.91
Angola 0.581 -0.119 19.6 -3.49
Ruanda 0.543 -0.157 19.6 -4.61
Afganistán 0.511 -0.189 19.6 -5.55
Mozambique 0.456 -0.244 19.6 -7.17
Mali 0.434 -0.266 19.6 -7.82

Paso 4. Datos calibrados

DC= Datos calibrados Prod= Producto

\[ DC= (exp(Prod))/(1+(exp(Prod)))\]

\[ MX= (exp(2.32))/((1+ (exp(2.32)))= 0.91\]

Tip

Exponenciado al número de Euler 2.71828

Datos calibrados

País Desv Escalar Producto Dato Cal
Noruega 0.257 29.4 7.55 1.00
Alemania 0.247 29.4 7.26 1.00
Reino Unido 0.232 29.4 6.82 0.99
España 0.204 29.4 5.99 0.99
México 0.079 29.4 2.32 0.91
Brasil 0.065 29.4 1.91 0.87
Ecuador 0.059 29.4 1.73 0.84
Bolivia 0.018 29.4 0.52 0.62

País Desv Escalar Producto Datos Cal
Irak -0.026 19.6 -0.76 0.31
Guatemala -0.04 19.6 -1.17 0.23
Kenia -0.099 19.6 -2.91 0.05
Angola -0.119 19.6 -3.49 0.03
Ruanda -0.157 19.6 -4.61 0.01
Afganistán -0.189 19.6 -5.55 0.00
Mozambique -0.244 19.6 -7.17 0.00
Mali -0.266 19.6 -7.82 0.00

Método indirecto

Note

  • En lugar de anclajes, el método indirecto se basa en una agrupación de casos
  • El investigador hace una clasificación preliminar de los casos
  • El método consiste en la refinación de estos grados de membresía

Categorías propuestas por Ragin (2008)

  1. Totalmente dentro (1.0)
  2. Mayormente dentro (0.8)
  3. Más dentro que fuera (0.6)
  4. Más fuera que dentro (0.4)
  5. Mayormente fuera (0.2)
  6. Totalmente fuera (0)

Ejemplo

Ragin (2008) realiza una clasificación preliminar de ingreso nacional

  • 20,000 (1.00)
  • 10,000 20,000 (0.8)
  • 7,000– 10,000 (0.6)
  • 4,000 – 7,000 (0.4)
  • 2,000 – 4,000 (0.2)
  • Menor a 2,000 (0.0)

  • Para obtener la calibración de los datos se utiliza un modelo logit fraccional

  • La variable dependiente es la clasificación cualitativa

  • La variable independiente son los datos crudos

  • Los valores predichos son la estimación de sus membresías

:::

Método directo en R

País Ingreso
UK 1030
NL 1008
FR 936
SE 897
DE 795
AU 720
IE 662
FI 590
CZ 586
IT 517
EE 468
HU 424
GR 390
ES 367
PL 350
RO 331
PT 320

Note

  • Establezco los tres anclajes
    • Inclusión: 700
    • Cruce: 518
    • Exclusión: 350
library(QCA)
data(LR)
attach(LR)

desarrollo <- calibrate(DEV, 
    thresholds = "e=350, 
                  c=518,
                  i=700")

Gráficar datos calibrados

plot(DEV, desarrollo,
  main="Datos calibrados",
  xlab = "Datos crudos", 
  ylab = "Datos calibrados")

Método indirecto en R

calibrate(DEV, 
    method = "indirect", 
    thresholds = "350, 450,
                  650, 850, 
                  950")
 [1] 0.518348 0.999507 0.462647 0.374534 0.463161 0.979273 0.638722 0.154243
 [9] 0.264270 0.477645 0.437461 0.989560 0.048995 0.012423 0.021803 0.086667
[17] 0.874916 0.995825

Criterios propuestos por Ragin

  • Totalmente dentro (1.0)
  • Mayormente dentro (0.8)
  • Más dentro que fuera (0.6)
  • Más fuera que dentro (0.4)
  • Mayormente fuera (0.2)
  • Totalmente fuera (0)

PROTOCOLO QCA

PROTOCOLO QCA

Protocolo para csQCA

  • Construir tabla comparativa
  • Identificar condiciones necesarias
  • Construir la tabla de verdad
  • Minimizar la solución
  • Evaluar el modelo (consistencia y cobertura)

Tabla comparativa

Caso Dictamen Caso Dictamen
A Si L Si
B Si M No
C Si N Si
D No O No
E No P Si
F Si Q No
G No R No
H Si S No
I Si T No
J Si U Si
K Si

Factores explicativos en la literatura

Experiencia legislativa

Educación superior

Género

Condiciones necesarias

  • Condiciones sin las cuales el resultado no puede producirse
  • El factor explicativo es un superconjunto del resultado
  • \[𝑋⇐𝑌\]

Hipótesis de Skocpol (1979)

La revolución social (\(Y\)) se produce solamente en situaciones de quiebre de estatalidad (\(X\))

Condiciones necesarias

Caso Dictamen Experiencia Educación Hombre
A 1 0 1 0
B 1 0 1 0
C 1 1 1 0
D 0 1 1 1
E 0 0 0 0
F 1 1 1 1
G 0 1 1 1
H 1 0 1 1
I 1 1 1 1
J 1 1 1 1
K 1 0 1 0

Caso Dictamen Experiencia Educación Hombre
L 1 0 1 1
M 0 0 0 0
N 1 1 1 1
O 1 0 1 1
P 0 0 0 0
Q 0 1 1 0
R 0 1 1 0
S 0 1 1 0
T 0 0 0 1
U 1 1 1 1

  • Observamos si existe una condición que siempre este presente cuando el resultado es igual a 1

  • Educación está presente en todas las instancias de dictamen positivo

  • Es una condición potencialmente necesaria

covN (Coverage of Necesity)

  • La cobertura de necesidad es la proporción de \(X\) que es cubierta por la intersección con \(Y\)

\[CovN_x ⇐𝑌=(𝑋∩𝑌)/𝑋=12/16=0.75\]


        inclN   RoN   covN  
--------------------------- 
1  EDU  1.000  0.556  0.750 
--------------------------- 

RoN (Relevance of Necesity)

  • Si tanto \(X\) como \(Y\) son conjuntos muy grandes la condición también es trivial

  • RoN evalúa si la condición es trivial

\[ RoN= \frac{\Sigma(1-X)}{\Sigma(1-min(X,Y))} \] ::: callout-important - Valores bajos de RoN indican que es una condición trivial :::

Tip

  • Sino encontramos condiciones individuales podemos explorar disyunciones
    • Experiencia + Educación
    • Experiencia + Hombre
    • Educación + Hombre

Análisis de necesidad en R

Note

  • Las condiciones de necesidad pueden analizarse con el comando pof() del paquete QCA

  • Utilizando los datos calibrados de la base de Lipset

data(LC)

pof("DEV","SURV", data = LC)

        inclN   RoN   covN  
--------------------------- 
1  DEV  1.000  0.800  0.800 
---------------------------