Casos y Calibración
en QCA

Diego Solís Delgadillo

diego.solis@colsan.edu.mx

Contenido de la sesión

  1. Selección de casos
  2. Factores explicativos y conceptos
  3. Calibración (crisp & fuzzy)
  4. Ejemplo práctico en R

Pregunta de investigación

  • Una investigación comienza con una pregunta sobre un fenómeno empírico

Ejemplo

  • ¿Por qué algunos presidentes son removidos del cargo y otros no?
  • ¿Por qué algunos gobiernos populistas resultan en una alta erosión democrática y otros no?
  • La variación inspira el problema de investigación
    • ¿Por qué en ciertos casos ocurre algo (\(Y\)) y en otros no (\(no-Y\))
  • En QCA con frecuencia la pregunta es ¿Bajo qué condiciones ocurre \(Y\)?

Resultado y factores explicativos

  • Una vez establecido el problema, ofrecemos una explicación tentativa
    • Una hipótesis
  • Un argumento de cómo un resultado es producido por factores explicativos

Tip

  • En QCA se evita el lenguaje de variables (dependiente/independiente)
  • A la selección de factores explciativos se le conoce como especificación del modelo

Ejemplo

  • Resultado: Presidencia interrumpida
  • Factores explicativos:
    1. Protesta social
    2. Baja aprobación
    3. Asuencia de Mayoría Legislativa
    4. Escándalo de corrupción
  • Resultado: Cabildeo exitoso
  • Factores explicativos:
    1. Grupo con altos recursos
    2. Tema técnico
    3. Baja visibilidad pública
    4. Ausencia de contra cabildeo

Los Casos

  • La investigación suele proceder a partir de una muestra
    • Un número de casos limitados que hace viable la investigación
  • En estudios cuantitativos esa muestra es aleatoria y representativa
  • En los estudios de N pequeña, el número casos es mucho menor y su selección suele ser intencional.

Selección de casos

  • QCA suele utilizar muestras pequeñas (N pequeña)
    • Entre 5-50 casos
  • ⚠️Pero también es utilizada en estudios de N grande
    • Corine Bara (2014) utiliza 500 observaciones para explicar el inicio de conflictos civiles

Selección de casos

Ventajas y desventajas N pequeña

✅ Conocimiento profundo de los casos

✅ Disminuye errores de medición

⚠️ Generalización limitada

Ventajas y desventajas N grande

✅Aumenta la generalización de los hallazgos

❌ Conocimiento superficial de los casos

❌ Errores de medición

¿Cuántos casos?

  • Un análisis de QCA puede buscar
    • Generar nuevas hipótesis
    • Poner a prueba hipótesis

Tip

  • Cuando es exploratorio se recomienda un número reducido de casos
  • Cuando se busca probar hipótesis se recomienda aumentar el número casos

¿Cuántos casos?

  • Cuando se estudian estados/regiones muchas veces es posible analizar a la población entera

Ejemplo

  • Los 18 países de América Latina y el Caribe
  • Las 32 entidades federativas en México
  • Todos los miembros de la SCJN desde 1994

¿Qué casos seleccionar?

  • Debe aclararse si es una muestra o una selección de casos
  • La selección requiere que el investigador tome decisiones sobre qué casos incluir

Important

  • La estrategia más común es tomar los casos que son más similares con resultados diferentes

Diseño de sistemas más parecidos

  • Seleccionar casos similares en la mayoría de sus características pero que difieren en el resultado a explicar.
  • El objetivo es controlar las variables contextuales (historia, cultura, estructura política) y aislar la variable explicativa clave que distingue los resultados.

Tip

  • Esta estrategia se conoce como “Diseño de sistemas más parecidos” (Most Similar Systems Design, MSSD)
  • Busca maximizar la comparabilidad y minimizar la variación no explicada.

Ejemplo presidencia interrumpida

País Año Contexto principal Resultado
Bolivia (2003) Crisis del gas, protestas y represión Renuncia de Sánchez de Lozada
Ecuador (2005) Movilización ciudadana contra corrupción Destitución de Gutiérrez
Chile (2019) Protestas por desigualdad y transporte Continuidad de Piñera
Colombia (2021) Protestas por reforma fiscal Continuidad de Duque

Diseño de sistemas más diferentes

  • El Diseño de sistemas más diferentes (Most Different Systems Design) (MDSD) selecciona casos muy distintos que comparten el mismo resultado
    • Identifica los factores comunes que lo explican.
  • El MSSD controla el contexto para aislar una causa
  • El MDSD busca la convergencia causal en entornos distintos

Críticas al MSSD

  • Puede incurrir en sesgo de selección, ya que los investigadores eligen casos que confirman su hipótesis.
  • Las variables omitidas o las diferencias no observadas pueden invalidar la inferencia causal.
  • Pero puede servir para identificar condicones necesarias

Casos equilibrados

  • El investigador debe asegurarse de que exista variación en el resultado
    • P.e. Si estamos estudiando el éxito de los juicios políticos necesitamos casos de éxito y fracaso

Tip

  • En QCA es válido seleccionar por el resultado

¿Cuantos factores explicativos?

  • La recomendación es que sean no más de 7 factores explicativos
    • QCA estima todas las combinaciones posibles de los factores explicativos
    • E identifica los que son necesarios o suficientes

Important

  • Cuando hay demasiados factores explicativos se corre el riego de configuraciones que solo describen el caso

¿Qué factores explicativos?

  • En la selección de asegurarse la heterogeneidad de casos
  • Si una de las condiciones explicativas no varían entre los casos entonces puede omitirse

Ejemplo

  • Si estoy estudiando la estabilidad de la democracia en AL, el presidencialismo como factor explicativo no es muy informativo
  • Es constante

Factores explicativos

  • QCA evita el uso del término variables (independiente y dependiente)

  • En QCA se refieren como factores explicativos \(X\) y resultado \(Y\)

  • Los factores explicativos tienden a estar adjetivados

    • Por ejemplo, PIB per capita alto, democracia consolidada
    • Denotan la pertenencia a un cojunto (concepto)

Conceptos

  • Los conceptos son contenedores de datos (Sartori, 2012)
    • Tienen consecuencias sobre la información que recogemos
    • Escala de abstracción
      • Muchos atributos -> menos casos
      • Menos atributos -> más casos

Tip

  • Los conceptos en las ciencias sociales son complejos y disputados.
  • No se puede dar por sentado que otros los comprenden de la misma manera

Claridad conceptual

Buen estudiante

  • ¿Qué es un buen estudiante?
    • El desempeño de los estudiantes es multidimensional
    • Pudieramos pensar simplemente en sus notas
    • Pero otros elementos pudieran ser incluidos
      • Asiste a clases
      • Participa
      • Hace las lecturas el curso

¿Qué es la calibración?

  • Es el proceso por el que transformamos valores crudos en puntuaciones de membresía a un conjunto
    • En crisp sets los valores posibles son 0 o 1
    • En fuzzy sets son todos los valores entre 0 y 1

Medida y calibración

  • Podemos tener una medida del desempeño de los alumnos
  • Pero necesitamos determinar cuáles son buenos estudiantes

Tip

  • ¿Incluimos solo a los estudiantes con excelente desempeño?
  • ¿A los estudiantes con desempeño superior al promedio?
  • La Ñcalibración es un proceso fundamentalmente conceptual]{style=“color: #cc0000”}

Crisp Sets

  • En ocasiones la asignación de valores es simple: se cuenta con el atributo o no
    • Experiencia legislativa
    • Grado académico
    • Principio de representación (MR)
    • Género

  • Otros datos requieren de establecer un criterio
    • Países ricos
    • Democracia
    • Desarrollo humano
    • Calidad democrática

La teoría guía a la calibración

  • Podemos vernos tentados a utilizar a la media como criterio de inclusión

  • Pero la clasificación debe estar fundamentada en la teoría

    • Es un criterio externo a los datos

Ejemplo termómetro

  • Los datos no nos dirán que significa ser alto, ni un termómetro en dónde empieza una temperatura calurosa

Ejemplo PIB

País PIB (entre guerras)
Reino Unido 1,038
Países Bajos 1.008
Francia 936
Suecia 837
Dinamarca 795
Austria 720
Irlanda 662
Finlandia 590
República Checa 586
Italia 517
Estonia 468
Hungría 424
Grecia 390
España 367
Polonia 350
Rumania 331
Portugal 320
Media 604

Warning

  • Tomando la media, Finlandia, que consideramos un país rico, no entraría en el conjunto

¿Qué hacer si no hay un referente teórico?

  • Cuando no hay una clara definición debemos analizar los datos

  • Identificar si hay los casos se agrupan naturalmente

Agrupación en R

  • El paquete QCA de R cuenta con la función findTh()

  • La instrucción agrupa a los datos en clusters utilizando la distancia euclidiana

library (QCA)
data (LR)

findTh(LR$DEV)

Fuzzy sets

  • Se utilizan cuando tenemos conceptos con límites borrosos

Tip

  • En lugar en pensar en si hay o no desarrollo humano podemos ver sus grados
  • Los polos son cualitativamente distintos, pero sus manifestaciones empíricas se manifiestan en grados.
  • Tienen una puntuación entre 0 y 1

Calibración en fuzzy sets

  • En fuzzy sets pueden utilizarse varios métodos:

    1. Asignación directa
    2. Método directo
    3. Método indirecto

Asignación directa

  • Utiliza el conocimiento experto para asignar valores a los casos.
  • Los expertos asignan los valores entre 0 y 1.
  • Este procedimiento suele tener justificaciones teóricas

Warning

  • Es un método subjetivo
  • Poco probable que dos expertos lleguen a los mismos valores

Método directo

  • Utiliza una función logarítmica para establecer el grado de pertenencia al conjunto
  • Los resultados del procedimiento son contenidos dentro de 0 y 1
  • La función nunca alcanza 0 y 1
  • Los valores 0.95 y 0.05 son interpretados como membresías completas

  • En el método directo se establecen tres anclajes para transformar los valores:
    • Inclusión completa (0.95)
    • Punto de cruce (0.5) –Punto de mayor ambigüedad-
    • Total exclusión (0.05)

Tip

  • Estos valores los transformamos en posibilidades asociadas

Posibilidades asociadas

  • PA= Posibilidades asociadas
  • GM= Grado de membresía

\[ PA = \frac{GM}{1 - GM} \]

  • Ejemplo:

\[ PA = \frac{0.95}{1 - 0.95} = 19 \]

Posibilidades asociadas ii

Calculamos el logaritmo natural de este valor \[ln(19)=2.94\]

Para el punto de cruce \[ PA = \frac{0.5}{1 - 0.5} = 1 \] \[ln(1)=0\]

Posibilidades asociadas iii

Para el punto de exclusión \[PA = \frac{0.05}{1 - 0.05} = \frac{0.05}{0.95} \approx 0.05\]

\[ln(0.05)=-2.94\]

Anclajes

Grado membresía Posibilidades asociadas Log momios
Membresía completa 0.95 19 2.94
Punto de cruce 0.50 1 0
Exclusión completa 0.05 0.05 -2.94

Calibración IDH

  • Es un indicador que va de 0 a 1

  • El IDH ofrece varios cortes

    • 0.80 o más indica un “desarrollo humano muy alto”
    • 0.70 son países con “alto desarrollo humano”
    • 0.55 son casos con “bajo desarrollo humano”.

Tip

  • Tomaremos estos cortes como punto de inclusión, cruce y exclusión

Paso 1: Desviación

  • El primer paso es calcular su desviación con respecto al punto de cruce (0.70)
  • Por ejemplo, para Alemania la operación sería 0.957 - 0.70= 0.257

Ejemplo

País IDH Desviación
Noruega 0.957 0.257
Alemania 0.947 0.247
Reino Unido 0.932 0.232
España 0.904 0.204
México 0.779 0.079
Brasil 0.765 0.065
Ecuador 0.759 0.059
Bolivia 0.718 0.018

País IDH Desviación
Irak 0.674 -0.026
Guatemala 0.660 -0.04
Kenia 0.601 -0.099
Angola 0.581 -0.119
Ruanda 0.543 -0.157
Afganistán 0.511 -0.189
Mozambique 0.456 -0.244
Mali 0.434 -0.266

Paso 2: Escalares

  • Calculamos la diferencia absoluta entre los umbrales
    • 0.8 (TOTAL INCLUSIÓN)- 0.7(PUNTO DE CRUCE)= .10
    • 0.55(TOTAL EXCLUSIÓN) – 0.7(PUNTO DE CRUCE)= 0.15

  • Tomamos los anclajes -log momios- (2.94) ya establecidos y las dividimos por estas diferencias

\[ \frac{2.94}{0.10} = 29.4 \]

\[ \frac{2.94}{0.15} = 19.6 \]

País IDH Desviación Escalar
Noruega 0.957 0.257 29.4
Alemania 0.947 0.247 29.4
Reino Unido 0.932 0.232 29.4
España 0.904 0.204 29.4
México 0.779 0.079 29.4
Brasil 0.765 0.065 29.4
Ecuador 0.759 0.059 29.4
Bolivia 0.718 0.018 29.4

País IDH Desviación Escalar
Irak 0.674 -0.026 19.6
Guatemala 0.660 -0.04 19.6
Kenia 0.601 -0.099 19.6
Angola 0.581 -0.119 19.6
Ruanda 0.543 -0.157 19.6
Afganistán 0.511 -0.189 19.6
Mozambique 0.456 -0.244 19.6
Mali 0.434 -0.266 19.6

Paso 3. Producto

  • Calcular el producto entre la diferencia y los escalares

  • Para el caso de Reino Unido \(0.232*29.4=6.82\)

País IDH Desv Escalar Producto
Noruega 0.957 0.257 29.4 7.55
Alemania 0.947 0.247 29.4 7.26
Reino Unido 0.932 0.232 29.4 6.82
España 0.904 0.204 29.4 5.99
México 0.779 0.079 29.4 2.32
Brasil 0.765 0.065 29.4 1.91
Ecuador 0.759 0.059 29.4 1.73
Bolivia 0.718 0.018 29.4 0.52

País IDH Desv Escalar Producto
Irak 0.674 -0.026 19.6 -0.50
Guatemala 0.660 -0.04 19.6 -0.78
Kenia 0.601 -0.099 19.6 -1.94
Angola 0.581 -0.119 19.6 -2.33
Ruanda 0.543 -0.157 19.6 -3.07
Afganistán 0.511 -0.189 19.6 -3.70
Mozambique 0.456 -0.244 19.6 -4.78
Mali 0.434 -0.266 19.6 -5.21

Paso 4. Datos calibrados

DC= Datos calibrados Prod= Producto

\[ DC= (exp(Prod))/(1+(exp(Prod)))\]

\[ MX= (exp(2.32))/((1+ (exp(2.32)))= 0.91\]

Tip

  • Exponenciado al número de Euler 2.71828

Datos calibrados

País Desv Escalar Producto Dato Cal
Noruega 0.257 29.4 7.55 1.00
Alemania 0.247 29.4 7.26 1.00
Reino Unido 0.232 29.4 6.82 0.99
España 0.204 29.4 5.99 0.99
México 0.079 29.4 2.32 0.91
Brasil 0.065 29.4 1.91 0.87
Ecuador 0.059 29.4 1.73 0.84
Bolivia 0.018 29.4 0.52 0.62

País Desv Escalar Producto Datos Cal
Irak -0.026 19.6 -0.50 0.37
Guatemala -0.04 19.6 -0.78 0.31
Kenia -0.099 19.6 -1.94 0.12
Angola -0.119 19.6 -2.33 0.08
Ruanda -0.157 19.6 -3.07 0.04
Afganistán -0.189 19.6 -3.70 0.02
Mozambique -0.244 19.6 -4.78 0.00
Mali -0.266 19.6 -5.21 0.00

Método indirecto

Note

  • En lugar de anclajes, el método indirecto se basa en una agrupación de casos
  • El investigador hace una clasificación preliminar de los casos
  • El método consiste en la refinación de estos grados de membresía

Categorías propuestas por Ragin (2008)

  1. Totalmente dentro (1.0)
  2. Mayormente dentro (0.8)
  3. Más dentro que fuera (0.6)
  4. Más fuera que dentro (0.4)
  5. Mayormente fuera (0.2)
  6. Totalmente fuera (0)

Ejemplo

  • Ragin (2008) realiza una clasificación preliminar de ingreso nacional

  • 20,000 (1.00)

  • 10,000 20,000 (0.8)

  • 7,000– 10,000 (0.6)

  • 4,000 – 7,000 (0.4)

  • 2,000 – 4,000 (0.2)

  • Menor a 2,000 (0.0)

  • Para obtener la calibración de los datos se utiliza un modelo logit fraccional

  • La variable dependiente es la clasificación cualitativa

  • La variable independiente son los datos crudos

  • Los valores predichos son la estimación de sus membresías

:::

Método directo en R

País Ingreso
UK 1030
NL 1008
FR 936
SE 897
DE 795
AU 720
IE 662
FI 590
CZ 586
IT 517
EE 468
HU 424
GR 390
ES 367
PL 350
RO 331
PT 320

Note

  • Establezco los tres anclajes
    • Inclusión: 700
    • Cruce: 518
    • Exclusión: 350
library(QCA)
data(LR)
attach(LR)

desarrollo <- calibrate(DEV, 
    thresholds = "e=350, 
                  c=518,
                  i=700")

Graficar datos calibrados

plot(DEV, desarrollo,
  main="Datos calibrados",
  xlab = "Datos crudos", 
  ylab = "Datos calibrados")

Método indirecto en R

calibrate(DEV, 
    method = "indirect", 
    thresholds = "350, 450,
                  650, 850, 
                  950")
 [1] 0.518348 0.999507 0.462647 0.374534 0.463161 0.979273 0.638722 0.154243
 [9] 0.264270 0.477645 0.437461 0.989560 0.048995 0.012423 0.021803 0.086667
[17] 0.874916 0.995825

Criterios propuestos por Ragin

  • Totalmente dentro (1.0)
  • Mayormente dentro (0.8)
  • Más dentro que fuera (0.6)
  • Más fuera que dentro (0.4)
  • Mayormente fuera (0.2)
  • Totalmente fuera (0)