s02_qca

Casos y calibración en QCA

Programa de Estudios Avanzados en Métodos

Diego Solís Delgadillo

diego.solis@flacso.edu.mx

Contenido de la sesión

Selección de casos
Resultado y condiciones explicativas
Conceptos y calibración
Crisp sets y fuzzy sets
Método directo e indirecto
Ejemplo práctico en R

Objetivos de la sesión

Al finalizar la sesión podrán:

Formular una pregunta de investigación adecuada para QCA.
Distinguir resultado y condiciones explicativas.
Justificar la selección de casos.
Entender por qué la calibración es conceptual.
Diferenciar calibración crisp y fuzzy.
Aplicar una calibración básica en R.

Pregunta de investigación

Una investigación comienza con una pregunta sobre un fenómeno empírico

Ejemplos:

¿Por qué algunos presidentes son removidos del cargo y otros no?
¿Por qué algunos gobiernos populistas producen erosión democrática y otros no?
¿Por qué algunas iniciativas de cabildeo son exitosas y otras fracasan?

En QCA la pregunta suele ser:

¿Bajo qué condiciones ocurre Y?

La variación como problema

QCA parte de una comparación entre casos

Caso	Resultado
Caso A	Ocurre Y
Caso B	Ocurre Y
Caso C	No ocurre Y
Caso D	No ocurre Y

La pregunta no es solo si una variable aumenta otra.

La pregunta es qué configuraciones distinguen a los casos con Y de los casos sin Y.

Resultado y condiciones explicativas

En QCA evitamos hablar de variable dependiente e independiente

Lenguaje estadístico	Lenguaje QCA
Variable dependiente	Resultado
Variables independientes	Condiciones explicativas
Efecto promedio	Configuración causal
Relación lineal	Relación de conjuntos

A la selección de condiciones explicativas se le conoce como especificación del modelo.

Ejemplo: presidencias interrumpidas

Resultado

Presidencia interrumpida

Condiciones explicativas posibles

Protesta social intensa.
Baja aprobación presidencial.
Ausencia de mayoría legislativa.
Escándalo de corrupción.

La pregunta sería:

¿Qué combinaciones de condiciones son suficientes para la interrupción presidencial?

Ejemplo: cabildeo exitoso

Resultado

Cabildeo exitoso

Condiciones explicativas posibles

Grupo con altos recursos.
Tema técnico.
Baja visibilidad pública.
Ausencia de contracabildeo.

QCA permite pensar que puede haber más de un camino hacia el mismo resultado.

Los casos

La investigación suele proceder a partir de una selección de casos

En estudios cuantitativos la muestra ideal suele ser aleatoria y representativa.
En estudios de N pequeña la selección suele ser intencional.
En QCA los casos deben ser suficientemente comparables.

La selección de casos afecta directamente la interpretación de los resultados.

¿Cuántos casos?

QCA suele trabajar con N pequeña o mediana

Frecuentemente entre 5 y 50 casos.
También puede utilizarse con N grande.
El tamaño depende del objetivo de investigación.

Objetivo	Recomendación general
Exploratorio	Menos casos, mayor conocimiento contextual
Prueba de hipótesis	Más casos, mayor cobertura empírica

N pequeña y N grande

Estrategia	Ventaja	Límite
N pequeña	Conocimiento profundo de los casos	Generalización limitada
N grande	Mayor cobertura y generalización	Menor conocimiento contextual

QCA no exige un solo tamaño de N.

Exige que los casos sean pertinentes para la pregunta.

Población completa

A veces no necesitamos una muestra

Cuando se estudian unidades acotadas, es posible analizar toda la población.

Ejemplos:

Los países de América Latina.
Las 32 entidades federativas en México.
Todos los miembros de la SCJN desde 1994.
Todas las presidencias interrumpidas en una región.

¿Qué casos seleccionar?

La selección debe justificarse

El investigador debe aclarar:

Si trabaja con una muestra o con una población.
Por qué incluye esos casos y no otros.
Qué tan comparables son los casos.
Si existe variación suficiente en el resultado.

En QCA es válido seleccionar por el resultado, pero debe hacerse con cuidado.

Diseño de sistemas más parecidos

Most Similar Systems Design

Selecciona casos similares en la mayoría de sus características, pero que difieren en el resultado.

Lógica	Objetivo
Casos parecidos	Controlar el contexto
Resultado diferente	Identificar condiciones que explican la diferencia

Busca maximizar la comparabilidad y minimizar la variación no explicada.

Ejemplo: presidencia interrumpida

País	Año	Contexto principal	Resultado
Bolivia	2003	Crisis del gas, protestas y represión	Renuncia de Sánchez de Lozada
Ecuador	2005	Movilización contra corrupción	Destitución de Gutiérrez
Chile	2019	Protestas por desigualdad y transporte	Continuidad de Piñera
Colombia	2021	Protestas por reforma fiscal	Continuidad de Duque

Diseño de sistemas más diferentes

Most Different Systems Design

Selecciona casos muy distintos que comparten el mismo resultado.

Lógica	Objetivo
Casos diferentes	Aumentar heterogeneidad contextual
Mismo resultado	Buscar condiciones comunes

Puede servir para identificar condiciones necesarias.

Riesgos en la selección de casos

La selección no es neutral

Puede haber sesgo si se eligen solo casos que confirman la hipótesis.
Las variables omitidas pueden afectar la inferencia.
Los casos sin variación en el resultado reducen la capacidad comparativa.

Warning

La selección de casos debe ser defendible teóricamente, no solo conveniente.

Casos equilibrados

Necesitamos variación en el resultado

Si estudiamos el éxito de juicios políticos, necesitamos:

Casos donde el juicio político fue exitoso.
Casos donde el juicio político fracasó.

Sin variación en Y, es difícil identificar qué condiciones distinguen a los casos.

¿Cuántas condiciones explicativas?

La recomendación práctica es no usar demasiadas

En QCA se analizan combinaciones posibles de condiciones.

\[ 2^k \]

Donde \(k\) es el número de condiciones.

Condiciones	Configuraciones posibles
3	8
4	16
5	32
6	64
7	128

Diversidad limitada

Muchas condiciones producen demasiadas combinaciones

Cuando hay muchas condiciones:

Aumentan las configuraciones posibles.
Muchas configuraciones quedan sin casos empíricos.
Algunas configuraciones solo describen un caso.

Por eso suele recomendarse trabajar con no más de 7 condiciones.

¿Qué condiciones elegir?

Las condiciones deben variar entre los casos

Una condición que no varía no ayuda a distinguir caminos causales.

Ejemplo:

Si estudiamos democracias en América Latina, el presidencialismo puede ser poco informativo.
Si todos los casos son presidenciales, esa condición es constante.

La selección de condiciones debe combinar teoría y conocimiento de casos.

Factores explicativos como conjuntos

En QCA las condiciones suelen estar adjetivadas

No usamos simplemente:

PIB per cápita.
Democracia.
Capacidad estatal.

Sino:

PIB per cápita alto.
Democracia consolidada.
Alta capacidad estatal.

Es decir, condiciones que expresan pertenencia a un conjunto.

Conceptos

Los conceptos son contenedores de datos

Los conceptos definen qué información observamos y cómo la clasificamos.

Decisión conceptual	Consecuencia
Más atributos	Menos casos incluidos
Menos atributos	Más casos incluidos
Concepto abstracto	Mayor cobertura
Concepto específico	Mayor precisión

Claridad conceptual

Ejemplo: “buen estudiante”

¿Qué significa pertenecer al conjunto de buenos estudiantes?

¿Tener buenas notas?
¿Asistir a clase?
¿Participar?
¿Hacer las lecturas?
¿Entregar trabajos de calidad?

La calibración depende de cómo definimos el concepto.

¿Qué es la calibración?

Transformar datos crudos en membresía a conjuntos

La calibración convierte una medida original en una puntuación de pertenencia.

Tipo de conjunto	Valores posibles
Crisp set	0 o 1
Fuzzy set	Valores entre 0 y 1

La calibración es un proceso conceptual, no solo técnico.

Medida y calibración

Medir no es lo mismo que calibrar

Podemos medir el desempeño de estudiantes con una calificación.

Pero calibrar exige decidir:

¿Desde qué nota alguien pertenece al conjunto de buenos estudiantes?
¿Qué hacemos con casos cercanos al umbral?
¿La membresía debe ser binaria o gradual?

Important

La calibración traduce conceptos en conjuntos observables.

Crisp sets

Membresía binaria

En crisp sets los casos están:

Dentro del conjunto: 1
Fuera del conjunto: 0

Ejemplos relativamente simples:

Tener experiencia legislativa.
Tener grado académico.
Ser electo por mayoría relativa.

Crisp sets con umbral

Otros conceptos requieren criterio

Para clasificar casos como 0 o 1 necesitamos establecer un corte.

Ejemplos:

País rico.
Democracia.
Desarrollo humano alto.
Calidad democrática alta.

El problema central es justificar el umbral.

La teoría guía la calibración

La media rara vez es suficiente

Podemos vernos tentados a usar la media como criterio de inclusión.

Pero la clasificación debe estar fundamentada en:

Teoría.
Conocimiento experto.
Estándares externos.
Distribución empírica de los casos.

Ejemplo: PIB entre guerras

País	PIB	País	PIB
Reino Unido	1038	Italia	517
Países Bajos	1008	Estonia	468
Francia	936	Hungría	424
Suecia	837	Grecia	390
Dinamarca	795	España	367
Austria	720	Polonia	350
Irlanda	662	Rumania	331
Finlandia	590	Portugal	320
República Checa	586	Media	604

Si usamos la media, Finlandia quedaría fuera del conjunto de países ricos.

Cuando no hay referente teórico

Podemos explorar la distribución de los datos

Revisar si los casos se agrupan naturalmente.
Identificar saltos o brechas en la distribución.
Contrastar esos cortes con conocimiento sustantivo.

Agrupación en R

El paquete `QCA` incluye herramientas para explorar umbrales

library(QCA)
data(LR)

findTh(LR$DEV)

findTh() permite explorar agrupamientos de datos para orientar la calibración.

Fuzzy sets

Membresía gradual

Se usan cuando los conceptos tienen límites borrosos.

Ejemplo:

En lugar de preguntar si un país tiene o no desarrollo humano, podemos preguntar en qué grado pertenece al conjunto de países con alto desarrollo humano.

Los valores van de 0 a 1.

Interpretación de fuzzy sets

Membresía	Interpretación
1.00	Totalmente dentro
0.80	Mayormente dentro
0.60	Más dentro que fuera
0.50	Punto de máxima ambigüedad
0.40	Más fuera que dentro
0.20	Mayormente fuera
0.00	Totalmente fuera

Métodos de calibración fuzzy

Tres caminos frecuentes

Asignación directa
Método directo
Método indirecto

Los tres requieren decisiones conceptuales.

La diferencia está en cómo se traducen esas decisiones a números.

Asignación directa

Uso de conocimiento experto

Los expertos asignan valores entre 0 y 1 a cada caso.

Ventajas:

Puede recoger conocimiento sustantivo fino.
Permite justificar casos difíciles.

Límites:

Es más subjetiva.
Dos expertos pueden asignar valores distintos.

Método directo

Tres anclajes conceptuales

El método directo requiere definir tres puntos:

Anclaje	Membresía
Inclusión completa	0.95
Punto de cruce	0.50
Exclusión completa	0.05

El punto de cruce es el punto de mayor ambigüedad.

Método directo: intuición

La calibración transforma valores crudos en grados de membresía

Posibilidades asociadas

De membresía a momios

\[ PA = \frac{GM}{1 - GM} \]

Donde:

\(PA\) = posibilidades asociadas
\(GM\) = grado de membresía

Ejemplo:

\[ PA = \frac{0.95}{1 - 0.95} = 19 \]

Log momios

Los anclajes se expresan en log momios

Para inclusión completa:

\[ \ln(19) = 2.94 \]

Para el punto de cruce:

\[ PA = \frac{0.50}{1 - 0.50} = 1 \]

\[ \ln(1) = 0 \]

Exclusión completa

Para exclusión completa:

\[ PA = \frac{0.05}{1 - 0.05} = \frac{0.05}{0.95} \approx 0.05 \]

\[ \ln(0.05) = -2.94 \]

Anclajes del método directo

Anclaje	Grado de membresía	Posibilidades asociadas	Log momios
Inclusión completa	0.95	19	2.94
Punto de cruce	0.50	1	0
Exclusión completa	0.05	0.05	-2.94

Calibración del IDH

Ejemplo con desarrollo humano

El IDH ya va de 0 a 1, pero eso no significa que esté calibrado.

Usaremos tres anclajes:

Anclaje	Valor IDH
Inclusión completa	0.80
Punto de cruce	0.70
Exclusión completa	0.55

Paso 1: desviación

Restar el punto de cruce

El primer paso es calcular la desviación respecto al punto de cruce.

Ejemplo:

\[ 0.957 - 0.70 = 0.257 \]

Los valores positivos están por encima del cruce.

Los valores negativos están por debajo.

Ejemplo: desviación

# A tibble: 8 × 3
  pais          idh desviacion
  <chr>       <dbl>      <dbl>
1 Noruega     0.957     0.257 
2 Alemania    0.947     0.247 
3 Reino Unido 0.932     0.232 
4 España      0.904     0.204 
5 México      0.779     0.0790
6 Brasil      0.765     0.0650
7 Ecuador     0.759     0.0590
8 Bolivia     0.718     0.0180

Ejemplo: desviación II

# A tibble: 8 × 3
  pais         idh desviacion
  <chr>      <dbl>      <dbl>
1 Irak       0.674    -0.0260
2 Guatemala  0.66     -0.0400
3 Kenia      0.601    -0.099 
4 Angola     0.581    -0.119 
5 Ruanda     0.543    -0.157 
6 Afganistán 0.511    -0.189 
7 Mozambique 0.456    -0.244 
8 Mali       0.434    -0.266

Paso 2: escalares

Diferencia absoluta entre umbrales

Para valores por encima del punto de cruce:

\[ 0.80 - 0.70 = 0.10 \]

Para valores por debajo del punto de cruce:

\[ 0.70 - 0.55 = 0.15 \]

Paso 2: escalares II

Dividir los log momios entre esas diferencias

\[ \frac{2.94}{0.10} = 29.4 \]

\[ \frac{2.94}{0.15} = 19.6 \]

Los valores por encima y por debajo del punto de cruce pueden tener pendientes distintas.

Paso 3: producto

Multiplicar desviación por escalar

Para Reino Unido:

\[ 0.232 \times 29.4 = 6.82 \]

# A tibble: 8 × 5
  pais          idh desviacion escalar producto
  <chr>       <dbl>      <dbl>   <dbl>    <dbl>
1 Noruega     0.957     0.257     29.4    7.56 
2 Alemania    0.947     0.247     29.4    7.26 
3 Reino Unido 0.932     0.232     29.4    6.82 
4 España      0.904     0.204     29.4    6.00 
5 México      0.779     0.0790    29.4    2.32 
6 Brasil      0.765     0.0650    29.4    1.91 
7 Ecuador     0.759     0.0590    29.4    1.73 
8 Bolivia     0.718     0.0180    29.4    0.529

Paso 3: producto II

# A tibble: 8 × 5
  pais         idh desviacion escalar producto
  <chr>      <dbl>      <dbl>   <dbl>    <dbl>
1 Irak       0.674    -0.0260    19.6   -0.510
2 Guatemala  0.66     -0.0400    19.6   -0.784
3 Kenia      0.601    -0.099     19.6   -1.94 
4 Angola     0.581    -0.119     19.6   -2.33 
5 Ruanda     0.543    -0.157     19.6   -3.08 
6 Afganistán 0.511    -0.189     19.6   -3.70 
7 Mozambique 0.456    -0.244     19.6   -4.78 
8 Mali       0.434    -0.266     19.6   -5.21

Paso 4: datos calibrados

Convertir el producto a membresía fuzzy

\[ DC = \frac{\exp(Producto)}{1 + \exp(Producto)} \]

Ejemplo para México:

\[ DC = \frac{\exp(2.32)}{1 + \exp(2.32)} = 0.91 \]

Datos calibrados

# A tibble: 8 × 5
  pais        desviacion escalar producto dato_calibrado
  <chr>            <dbl>   <dbl>    <dbl>          <dbl>
1 Noruega         0.257     29.4    7.56           0.999
2 Alemania        0.247     29.4    7.26           0.999
3 Reino Unido     0.232     29.4    6.82           0.999
4 España          0.204     29.4    6.00           0.998
5 México          0.0790    29.4    2.32           0.911
6 Brasil          0.0650    29.4    1.91           0.871
7 Ecuador         0.0590    29.4    1.73           0.850
8 Bolivia         0.0180    29.4    0.529          0.629

Datos calibrados II

# A tibble: 8 × 5
  pais       desviacion escalar producto dato_calibrado
  <chr>           <dbl>   <dbl>    <dbl>          <dbl>
1 Irak          -0.0260    19.6   -0.510        0.375  
2 Guatemala     -0.0400    19.6   -0.784        0.313  
3 Kenia         -0.099     19.6   -1.94         0.126  
4 Angola        -0.119     19.6   -2.33         0.0885 
5 Ruanda        -0.157     19.6   -3.08         0.0441 
6 Afganistán    -0.189     19.6   -3.70         0.0240 
7 Mozambique    -0.244     19.6   -4.78         0.00831
8 Mali          -0.266     19.6   -5.21         0.00541

Visualización de la calibración

Método indirecto

Parte de una clasificación cualitativa inicial

El investigador clasifica casos en categorías de membresía.

Categoría	Membresía
Totalmente dentro	1.0
Mayormente dentro	0.8
Más dentro que fuera	0.6
Más fuera que dentro	0.4
Mayormente fuera	0.2
Totalmente fuera	0.0

Método indirecto: ejemplo

Clasificación preliminar de ingreso nacional

Rango de ingreso	Membresía inicial
20,000 o más	1.0
10,000 a 20,000	0.8
7,000 a 10,000	0.6
4,000 a 7,000	0.4
2,000 a 4,000	0.2
Menos de 2,000	0.0

Método indirecto: lógica

Refinar la clasificación inicial

La clasificación cualitativa funciona como variable dependiente.
Los datos crudos funcionan como variable independiente.
Se estima un modelo logit fraccional.
Los valores predichos son las membresías refinadas.

El método indirecto combina juicio cualitativo y ajuste estadístico.

Método directo en R

Calibración con `QCA::calibrate()`

library(QCA)
data(LR)

LR$desarrollo <- calibrate(
  LR$DEV,
  thresholds = "e=350, c=518, i=700"
)

e = exclusión completa
c = punto de cruce
i = inclusión completa

Método directo en R: ejemplo completo

library(QCA)
data(LR)

LR$desarrollo <- calibrate(
  LR$DEV,
  thresholds = "e=350, c=518, i=700"
)

plot(
  LR$DEV,
  LR$desarrollo,
  main = "Datos calibrados",
  xlab = "Datos crudos",
  ylab = "Datos calibrados"
)

Graficar datos calibrados

Método indirecto en R

library(QCA)
data(LR)

calibrate(
  LR$DEV,
  method = "indirect",
  thresholds = "350, 450, 650, 850, 950"
)

Los umbrales corresponden a categorías cualitativas ordenadas.

Cierre

Ideas centrales

QCA exige justificar la selección de casos.
Las condiciones explicativas deben tener sentido teórico y variar entre casos.
Los conceptos se traducen en conjuntos mediante calibración.
La calibración no es solo técnica: es una decisión conceptual.
Crisp sets usan 0/1; fuzzy sets permiten grados de membresía.

Para la siguiente sesión

Pregunta guía

Una vez calibrados los casos:

¿Cómo identificamos configuraciones necesarias y suficientes?

La respuesta pasa por construir y analizar una tabla de verdad.

Contenido de la sesión

Objetivos de la sesión

Al finalizar la sesión podrán:

Pregunta de investigación

Una investigación comienza con una pregunta sobre un fenómeno empírico

La variación como problema

QCA parte de una comparación entre casos

Resultado y condiciones explicativas

En QCA evitamos hablar de variable dependiente e independiente

Ejemplo: presidencias interrumpidas

Resultado

Condiciones explicativas posibles

Ejemplo: cabildeo exitoso

Resultado

Condiciones explicativas posibles

Los casos

La investigación suele proceder a partir de una selección de casos

¿Cuántos casos?

QCA suele trabajar con N pequeña o mediana

N pequeña y N grande

Población completa

A veces no necesitamos una muestra

¿Qué casos seleccionar?

La selección debe justificarse

Diseño de sistemas más parecidos

Most Similar Systems Design

Ejemplo: presidencia interrumpida

Diseño de sistemas más diferentes

Most Different Systems Design

Riesgos en la selección de casos

La selección no es neutral

Casos equilibrados

Necesitamos variación en el resultado

¿Cuántas condiciones explicativas?

La recomendación práctica es no usar demasiadas

Diversidad limitada

Muchas condiciones producen demasiadas combinaciones

¿Qué condiciones elegir?

Las condiciones deben variar entre los casos

Factores explicativos como conjuntos

En QCA las condiciones suelen estar adjetivadas

Conceptos

Los conceptos son contenedores de datos

Claridad conceptual

Ejemplo: “buen estudiante”

¿Qué es la calibración?

Transformar datos crudos en membresía a conjuntos

Medida y calibración

Medir no es lo mismo que calibrar

Crisp sets

Membresía binaria

Crisp sets con umbral

Otros conceptos requieren criterio

La teoría guía la calibración

La media rara vez es suficiente

Ejemplo: PIB entre guerras

Cuando no hay referente teórico

Podemos explorar la distribución de los datos

Agrupación en R

El paquete QCA incluye herramientas para explorar umbrales

Fuzzy sets

Membresía gradual

Interpretación de fuzzy sets

Métodos de calibración fuzzy

Tres caminos frecuentes

Asignación directa

Uso de conocimiento experto

Método directo

Tres anclajes conceptuales

Método directo: intuición

La calibración transforma valores crudos en grados de membresía

Posibilidades asociadas

De membresía a momios

Log momios

Los anclajes se expresan en log momios

Exclusión completa

Anclajes del método directo

Calibración del IDH

Ejemplo con desarrollo humano

Paso 1: desviación

El paquete `QCA` incluye herramientas para explorar umbrales

Calibración con `QCA::calibrate()`