Casos y calibración en QCA

Programa de Estudios Avanzados en Métodos

Diego Solís Delgadillo

diego.solis@flacso.edu.mx

Contenido de la sesión

  1. Selección de casos
  2. Resultado y condiciones explicativas
  3. Conceptos y calibración
  4. Crisp sets y fuzzy sets
  5. Método directo e indirecto
  6. Ejemplo práctico en R

Objetivos de la sesión

Al finalizar la sesión podrán:

  • Formular una pregunta de investigación adecuada para QCA.
  • Distinguir resultado y condiciones explicativas.
  • Justificar la selección de casos.
  • Entender por qué la calibración es conceptual.
  • Diferenciar calibración crisp y fuzzy.
  • Aplicar una calibración básica en R.

Pregunta de investigación

Una investigación comienza con una pregunta sobre un fenómeno empírico

Ejemplos:

  • ¿Por qué algunos presidentes son removidos del cargo y otros no?
  • ¿Por qué algunos gobiernos populistas producen erosión democrática y otros no?
  • ¿Por qué algunas iniciativas de cabildeo son exitosas y otras fracasan?

En QCA la pregunta suele ser:

¿Bajo qué condiciones ocurre Y?

La variación como problema

QCA parte de una comparación entre casos

Caso Resultado
Caso A Ocurre Y
Caso B Ocurre Y
Caso C No ocurre Y
Caso D No ocurre Y

La pregunta no es solo si una variable aumenta otra.

La pregunta es qué configuraciones distinguen a los casos con Y de los casos sin Y.

Resultado y condiciones explicativas

En QCA evitamos hablar de variable dependiente e independiente

Lenguaje estadístico Lenguaje QCA
Variable dependiente Resultado
Variables independientes Condiciones explicativas
Efecto promedio Configuración causal
Relación lineal Relación de conjuntos

A la selección de condiciones explicativas se le conoce como especificación del modelo.

Ejemplo: presidencias interrumpidas

Resultado

Presidencia interrumpida

Condiciones explicativas posibles

  • Protesta social intensa.
  • Baja aprobación presidencial.
  • Ausencia de mayoría legislativa.
  • Escándalo de corrupción.

La pregunta sería:

¿Qué combinaciones de condiciones son suficientes para la interrupción presidencial?

Ejemplo: cabildeo exitoso

Resultado

Cabildeo exitoso

Condiciones explicativas posibles

  • Grupo con altos recursos.
  • Tema técnico.
  • Baja visibilidad pública.
  • Ausencia de contracabildeo.

QCA permite pensar que puede haber más de un camino hacia el mismo resultado.

Los casos

La investigación suele proceder a partir de una selección de casos

  • En estudios cuantitativos la muestra ideal suele ser aleatoria y representativa.
  • En estudios de N pequeña la selección suele ser intencional.
  • En QCA los casos deben ser suficientemente comparables.

La selección de casos afecta directamente la interpretación de los resultados.

¿Cuántos casos?

QCA suele trabajar con N pequeña o mediana

  • Frecuentemente entre 5 y 50 casos.
  • También puede utilizarse con N grande.
  • El tamaño depende del objetivo de investigación.
Objetivo Recomendación general
Exploratorio Menos casos, mayor conocimiento contextual
Prueba de hipótesis Más casos, mayor cobertura empírica

N pequeña y N grande

Estrategia Ventaja Límite
N pequeña Conocimiento profundo de los casos Generalización limitada
N grande Mayor cobertura y generalización Menor conocimiento contextual

QCA no exige un solo tamaño de N.

Exige que los casos sean pertinentes para la pregunta.

Población completa

A veces no necesitamos una muestra

Cuando se estudian unidades acotadas, es posible analizar toda la población.

Ejemplos:

  • Los países de América Latina.
  • Las 32 entidades federativas en México.
  • Todos los miembros de la SCJN desde 1994.
  • Todas las presidencias interrumpidas en una región.

¿Qué casos seleccionar?

La selección debe justificarse

El investigador debe aclarar:

  • Si trabaja con una muestra o con una población.
  • Por qué incluye esos casos y no otros.
  • Qué tan comparables son los casos.
  • Si existe variación suficiente en el resultado.

En QCA es válido seleccionar por el resultado, pero debe hacerse con cuidado.

Diseño de sistemas más parecidos

Most Similar Systems Design

Selecciona casos similares en la mayoría de sus características, pero que difieren en el resultado.

Lógica Objetivo
Casos parecidos Controlar el contexto
Resultado diferente Identificar condiciones que explican la diferencia

Busca maximizar la comparabilidad y minimizar la variación no explicada.

Ejemplo: presidencia interrumpida

País Año Contexto principal Resultado
Bolivia 2003 Crisis del gas, protestas y represión Renuncia de Sánchez de Lozada
Ecuador 2005 Movilización contra corrupción Destitución de Gutiérrez
Chile 2019 Protestas por desigualdad y transporte Continuidad de Piñera
Colombia 2021 Protestas por reforma fiscal Continuidad de Duque

Diseño de sistemas más diferentes

Most Different Systems Design

Selecciona casos muy distintos que comparten el mismo resultado.

Lógica Objetivo
Casos diferentes Aumentar heterogeneidad contextual
Mismo resultado Buscar condiciones comunes

Puede servir para identificar condiciones necesarias.

Riesgos en la selección de casos

La selección no es neutral

  • Puede haber sesgo si se eligen solo casos que confirman la hipótesis.
  • Las variables omitidas pueden afectar la inferencia.
  • Los casos sin variación en el resultado reducen la capacidad comparativa.

Warning

La selección de casos debe ser defendible teóricamente, no solo conveniente.

Casos equilibrados

Necesitamos variación en el resultado

Si estudiamos el éxito de juicios políticos, necesitamos:

  • Casos donde el juicio político fue exitoso.
  • Casos donde el juicio político fracasó.

Sin variación en Y, es difícil identificar qué condiciones distinguen a los casos.

¿Cuántas condiciones explicativas?

La recomendación práctica es no usar demasiadas

En QCA se analizan combinaciones posibles de condiciones.

\[ 2^k \]

Donde \(k\) es el número de condiciones.

Condiciones Configuraciones posibles
3 8
4 16
5 32
6 64
7 128

Diversidad limitada

Muchas condiciones producen demasiadas combinaciones

Cuando hay muchas condiciones:

  • Aumentan las configuraciones posibles.
  • Muchas configuraciones quedan sin casos empíricos.
  • Algunas configuraciones solo describen un caso.

Por eso suele recomendarse trabajar con no más de 7 condiciones.

¿Qué condiciones elegir?

Las condiciones deben variar entre los casos

Una condición que no varía no ayuda a distinguir caminos causales.

Ejemplo:

  • Si estudiamos democracias en América Latina, el presidencialismo puede ser poco informativo.
  • Si todos los casos son presidenciales, esa condición es constante.

La selección de condiciones debe combinar teoría y conocimiento de casos.

Factores explicativos como conjuntos

En QCA las condiciones suelen estar adjetivadas

No usamos simplemente:

  • PIB per cápita.
  • Democracia.
  • Capacidad estatal.

Sino:

  • PIB per cápita alto.
  • Democracia consolidada.
  • Alta capacidad estatal.

Es decir, condiciones que expresan pertenencia a un conjunto.

Conceptos

Los conceptos son contenedores de datos

Los conceptos definen qué información observamos y cómo la clasificamos.

Decisión conceptual Consecuencia
Más atributos Menos casos incluidos
Menos atributos Más casos incluidos
Concepto abstracto Mayor cobertura
Concepto específico Mayor precisión

Claridad conceptual

Ejemplo: “buen estudiante”

¿Qué significa pertenecer al conjunto de buenos estudiantes?

  • ¿Tener buenas notas?
  • ¿Asistir a clase?
  • ¿Participar?
  • ¿Hacer las lecturas?
  • ¿Entregar trabajos de calidad?

La calibración depende de cómo definimos el concepto.

¿Qué es la calibración?

Transformar datos crudos en membresía a conjuntos

La calibración convierte una medida original en una puntuación de pertenencia.

Tipo de conjunto Valores posibles
Crisp set 0 o 1
Fuzzy set Valores entre 0 y 1

La calibración es un proceso conceptual, no solo técnico.

Medida y calibración

Medir no es lo mismo que calibrar

Podemos medir el desempeño de estudiantes con una calificación.

Pero calibrar exige decidir:

  • ¿Desde qué nota alguien pertenece al conjunto de buenos estudiantes?
  • ¿Qué hacemos con casos cercanos al umbral?
  • ¿La membresía debe ser binaria o gradual?

Important

La calibración traduce conceptos en conjuntos observables.

Crisp sets

Membresía binaria

En crisp sets los casos están:

  • Dentro del conjunto: 1
  • Fuera del conjunto: 0

Ejemplos relativamente simples:

  • Tener experiencia legislativa.
  • Tener grado académico.
  • Ser electo por mayoría relativa.

Crisp sets con umbral

Otros conceptos requieren criterio

Para clasificar casos como 0 o 1 necesitamos establecer un corte.

Ejemplos:

  • País rico.
  • Democracia.
  • Desarrollo humano alto.
  • Calidad democrática alta.

El problema central es justificar el umbral.

La teoría guía la calibración

La media rara vez es suficiente

Podemos vernos tentados a usar la media como criterio de inclusión.

Pero la clasificación debe estar fundamentada en:

  • Teoría.
  • Conocimiento experto.
  • Estándares externos.
  • Distribución empírica de los casos.

Ejemplo: PIB entre guerras

País PIB País PIB
Reino Unido 1038 Italia 517
Países Bajos 1008 Estonia 468
Francia 936 Hungría 424
Suecia 837 Grecia 390
Dinamarca 795 España 367
Austria 720 Polonia 350
Irlanda 662 Rumania 331
Finlandia 590 Portugal 320
República Checa 586 Media 604

Si usamos la media, Finlandia quedaría fuera del conjunto de países ricos.

Cuando no hay referente teórico

Podemos explorar la distribución de los datos

  • Revisar si los casos se agrupan naturalmente.
  • Identificar saltos o brechas en la distribución.
  • Contrastar esos cortes con conocimiento sustantivo.

Agrupación en R

El paquete QCA incluye herramientas para explorar umbrales

library(QCA)
data(LR)

findTh(LR$DEV)

findTh() permite explorar agrupamientos de datos para orientar la calibración.

Fuzzy sets

Membresía gradual

Se usan cuando los conceptos tienen límites borrosos.

Ejemplo:

En lugar de preguntar si un país tiene o no desarrollo humano, podemos preguntar en qué grado pertenece al conjunto de países con alto desarrollo humano.

Los valores van de 0 a 1.

Interpretación de fuzzy sets

Membresía Interpretación
1.00 Totalmente dentro
0.80 Mayormente dentro
0.60 Más dentro que fuera
0.50 Punto de máxima ambigüedad
0.40 Más fuera que dentro
0.20 Mayormente fuera
0.00 Totalmente fuera

Métodos de calibración fuzzy

Tres caminos frecuentes

  1. Asignación directa
  2. Método directo
  3. Método indirecto

Los tres requieren decisiones conceptuales.

La diferencia está en cómo se traducen esas decisiones a números.

Asignación directa

Uso de conocimiento experto

Los expertos asignan valores entre 0 y 1 a cada caso.

Ventajas:

  • Puede recoger conocimiento sustantivo fino.
  • Permite justificar casos difíciles.

Límites:

  • Es más subjetiva.
  • Dos expertos pueden asignar valores distintos.

Método directo

Tres anclajes conceptuales

El método directo requiere definir tres puntos:

Anclaje Membresía
Inclusión completa 0.95
Punto de cruce 0.50
Exclusión completa 0.05

El punto de cruce es el punto de mayor ambigüedad.

Método directo: intuición

La calibración transforma valores crudos en grados de membresía

Posibilidades asociadas

De membresía a momios

\[ PA = \frac{GM}{1 - GM} \]

Donde:

  • \(PA\) = posibilidades asociadas
  • \(GM\) = grado de membresía

Ejemplo:

\[ PA = \frac{0.95}{1 - 0.95} = 19 \]

Log momios

Los anclajes se expresan en log momios

Para inclusión completa:

\[ \ln(19) = 2.94 \]

Para el punto de cruce:

\[ PA = \frac{0.50}{1 - 0.50} = 1 \]

\[ \ln(1) = 0 \]

Exclusión completa

Para exclusión completa:

\[ PA = \frac{0.05}{1 - 0.05} = \frac{0.05}{0.95} \approx 0.05 \]

\[ \ln(0.05) = -2.94 \]

Anclajes del método directo

Anclaje Grado de membresía Posibilidades asociadas Log momios
Inclusión completa 0.95 19 2.94
Punto de cruce 0.50 1 0
Exclusión completa 0.05 0.05 -2.94

Calibración del IDH

Ejemplo con desarrollo humano

El IDH ya va de 0 a 1, pero eso no significa que esté calibrado.

Usaremos tres anclajes:

Anclaje Valor IDH
Inclusión completa 0.80
Punto de cruce 0.70
Exclusión completa 0.55

Paso 1: desviación

Restar el punto de cruce

El primer paso es calcular la desviación respecto al punto de cruce.

Ejemplo:

\[ 0.957 - 0.70 = 0.257 \]

Los valores positivos están por encima del cruce.

Los valores negativos están por debajo.

Ejemplo: desviación

# A tibble: 8 × 3
  pais          idh desviacion
  <chr>       <dbl>      <dbl>
1 Noruega     0.957     0.257 
2 Alemania    0.947     0.247 
3 Reino Unido 0.932     0.232 
4 España      0.904     0.204 
5 México      0.779     0.0790
6 Brasil      0.765     0.0650
7 Ecuador     0.759     0.0590
8 Bolivia     0.718     0.0180

Ejemplo: desviación II

# A tibble: 8 × 3
  pais         idh desviacion
  <chr>      <dbl>      <dbl>
1 Irak       0.674    -0.0260
2 Guatemala  0.66     -0.0400
3 Kenia      0.601    -0.099 
4 Angola     0.581    -0.119 
5 Ruanda     0.543    -0.157 
6 Afganistán 0.511    -0.189 
7 Mozambique 0.456    -0.244 
8 Mali       0.434    -0.266 

Paso 2: escalares

Diferencia absoluta entre umbrales

Para valores por encima del punto de cruce:

\[ 0.80 - 0.70 = 0.10 \]

Para valores por debajo del punto de cruce:

\[ 0.70 - 0.55 = 0.15 \]

Paso 2: escalares II

Dividir los log momios entre esas diferencias

\[ \frac{2.94}{0.10} = 29.4 \]

\[ \frac{2.94}{0.15} = 19.6 \]

Los valores por encima y por debajo del punto de cruce pueden tener pendientes distintas.

Paso 3: producto

Multiplicar desviación por escalar

Para Reino Unido:

\[ 0.232 \times 29.4 = 6.82 \]

# A tibble: 8 × 5
  pais          idh desviacion escalar producto
  <chr>       <dbl>      <dbl>   <dbl>    <dbl>
1 Noruega     0.957     0.257     29.4    7.56 
2 Alemania    0.947     0.247     29.4    7.26 
3 Reino Unido 0.932     0.232     29.4    6.82 
4 España      0.904     0.204     29.4    6.00 
5 México      0.779     0.0790    29.4    2.32 
6 Brasil      0.765     0.0650    29.4    1.91 
7 Ecuador     0.759     0.0590    29.4    1.73 
8 Bolivia     0.718     0.0180    29.4    0.529

Paso 3: producto II

# A tibble: 8 × 5
  pais         idh desviacion escalar producto
  <chr>      <dbl>      <dbl>   <dbl>    <dbl>
1 Irak       0.674    -0.0260    19.6   -0.510
2 Guatemala  0.66     -0.0400    19.6   -0.784
3 Kenia      0.601    -0.099     19.6   -1.94 
4 Angola     0.581    -0.119     19.6   -2.33 
5 Ruanda     0.543    -0.157     19.6   -3.08 
6 Afganistán 0.511    -0.189     19.6   -3.70 
7 Mozambique 0.456    -0.244     19.6   -4.78 
8 Mali       0.434    -0.266     19.6   -5.21 

Paso 4: datos calibrados

Convertir el producto a membresía fuzzy

\[ DC = \frac{\exp(Producto)}{1 + \exp(Producto)} \]

Ejemplo para México:

\[ DC = \frac{\exp(2.32)}{1 + \exp(2.32)} = 0.91 \]

Datos calibrados

# A tibble: 8 × 5
  pais        desviacion escalar producto dato_calibrado
  <chr>            <dbl>   <dbl>    <dbl>          <dbl>
1 Noruega         0.257     29.4    7.56           0.999
2 Alemania        0.247     29.4    7.26           0.999
3 Reino Unido     0.232     29.4    6.82           0.999
4 España          0.204     29.4    6.00           0.998
5 México          0.0790    29.4    2.32           0.911
6 Brasil          0.0650    29.4    1.91           0.871
7 Ecuador         0.0590    29.4    1.73           0.850
8 Bolivia         0.0180    29.4    0.529          0.629

Datos calibrados II

# A tibble: 8 × 5
  pais       desviacion escalar producto dato_calibrado
  <chr>           <dbl>   <dbl>    <dbl>          <dbl>
1 Irak          -0.0260    19.6   -0.510        0.375  
2 Guatemala     -0.0400    19.6   -0.784        0.313  
3 Kenia         -0.099     19.6   -1.94         0.126  
4 Angola        -0.119     19.6   -2.33         0.0885 
5 Ruanda        -0.157     19.6   -3.08         0.0441 
6 Afganistán    -0.189     19.6   -3.70         0.0240 
7 Mozambique    -0.244     19.6   -4.78         0.00831
8 Mali          -0.266     19.6   -5.21         0.00541

Visualización de la calibración

Método indirecto

Parte de una clasificación cualitativa inicial

El investigador clasifica casos en categorías de membresía.

Categoría Membresía
Totalmente dentro 1.0
Mayormente dentro 0.8
Más dentro que fuera 0.6
Más fuera que dentro 0.4
Mayormente fuera 0.2
Totalmente fuera 0.0

Método indirecto: ejemplo

Clasificación preliminar de ingreso nacional

Rango de ingreso Membresía inicial
20,000 o más 1.0
10,000 a 20,000 0.8
7,000 a 10,000 0.6
4,000 a 7,000 0.4
2,000 a 4,000 0.2
Menos de 2,000 0.0

Método indirecto: lógica

Refinar la clasificación inicial

  • La clasificación cualitativa funciona como variable dependiente.
  • Los datos crudos funcionan como variable independiente.
  • Se estima un modelo logit fraccional.
  • Los valores predichos son las membresías refinadas.

El método indirecto combina juicio cualitativo y ajuste estadístico.

Método directo en R

Calibración con QCA::calibrate()

library(QCA)
data(LR)

LR$desarrollo <- calibrate(
  LR$DEV,
  thresholds = "e=350, c=518, i=700"
)
  • e = exclusión completa
  • c = punto de cruce
  • i = inclusión completa

Método directo en R: ejemplo completo

library(QCA)
data(LR)

LR$desarrollo <- calibrate(
  LR$DEV,
  thresholds = "e=350, c=518, i=700"
)

plot(
  LR$DEV,
  LR$desarrollo,
  main = "Datos calibrados",
  xlab = "Datos crudos",
  ylab = "Datos calibrados"
)

Graficar datos calibrados

Método indirecto en R

library(QCA)
data(LR)

calibrate(
  LR$DEV,
  method = "indirect",
  thresholds = "350, 450, 650, 850, 950"
)

Los umbrales corresponden a categorías cualitativas ordenadas.

Cierre

Ideas centrales

  • QCA exige justificar la selección de casos.
  • Las condiciones explicativas deben tener sentido teórico y variar entre casos.
  • Los conceptos se traducen en conjuntos mediante calibración.
  • La calibración no es solo técnica: es una decisión conceptual.
  • Crisp sets usan 0/1; fuzzy sets permiten grados de membresía.

Para la siguiente sesión

Pregunta guía

Una vez calibrados los casos:

¿Cómo identificamos configuraciones necesarias y suficientes?

La respuesta pasa por construir y analizar una tabla de verdad.