Estudios de caso y recomendaciones

Diego Solís Delgadillo

diego.solis@colsan.edu.mx

Contenidos de la sesión

  1. Supuestos incoherentes e insostenibles
  2. Datos panel con QCA
  3. Selección de estudios de caso
  4. Aplicaciones de QCA
  5. Recomendaciones

Supuestos insostenibles

  • Los supuestos incoherentes son los que contradicen a las condiciones necesarias
  • Los supuestos insostenibles son lógicamente contradictorios o van en contra del conocimiento previo

Ejemplo supuesto insostenible

  • P.e. una configuración con “país rico * país pobre” “hombre*persona embarazada”
  • Necesitamos excluir esas configuraciones del proceso de minimización

Supuestos contradictorios con SetMethods

library(SetMethods)
library(QCA) # Para extrar la base Lipset

data(LF)

ttLF <- truthTable(LF, outcome = "SURV", incl.cut = 0.8, show.cases = TRUE)

ttLFn <- truthTable(LF, outcome = "~SURV", incl.cut = 0.8, show.cases = TRUE)

pLF <- minimize(ttLF, include = "?")
pLFn <- minimize(ttLFn, include = "?")
  • Primero identificamos los supuestos simplificadores contradictorios
SSCsm<-LR.intersect(pLF, pLFn)

Supuestos contradictorios con SetMethods

[1] "10" "12" "14" "16" "17" "21" "25" "29"
  • Con esa información se crea una nueva tabla de verdad

  • La función esa permite excluir estas configuraciones de la tabla de verdad

ttLFesa<- esa(oldtt=ttLF, 
          contrad_rows=c(SSCsm))

Tabla de verdad sin supuestos contradictorios


  OUT: output value
    n: number of cases in configuration
 incl: sufficiency inclusion score
  PRI: proportional reduction in inconsistency

     DEV URB LIT IND STB   OUT    n  incl  PRI   cases      
 1    0   0   0   0   0     0     3  0.216 0.000 GR,PT,ES   
 2    0   0   0   0   1     0     2  0.278 0.000 IT,RO      
 5    0   0   1   0   0     0     2  0.521 0.113 HU,PL      
 6    0   0   1   0   1     0     1  0.529 0.228 EE         
10    0   1   0   0   1     0     0    -     -              
12    0   1   0   1   1     0     0    -     -              
14    0   1   1   0   1     0     0    -     -              
16    0   1   1   1   1     0     0    -     -              
17    1   0   0   0   0     0     0    -     -              
21    1   0   1   0   0     0     0    -     -              
22    1   0   1   0   1     1     2  0.804 0.719 FI,IE      
23    1   0   1   1   0     0     1  0.378 0.040 AU         
24    1   0   1   1   1     0     2  0.709 0.634 FR,SE      
25    1   1   0   0   0     0     0    -     -              
29    1   1   1   0   0     0     0    -     -              
31    1   1   1   1   0     0     1  0.445 0.050 DE         
32    1   1   1   1   1     1     4  0.904 0.886 BE,CZ,NL,UK

Minimización lógica

  • Con la nueva tabla de verdad procedemos a la minimización

Solución parsinomiosa

minimize(ttLFesa, 
         include="?")

M1: DEV*URB*STB + DEV*~IND*STB -> SURV

Solución intermedia

minimize(ttLF, 
         include = "?",
         exclude = SSCsm,
         dir.exp = "1,1,1,1,1")

From C1P1: 

M1:    DEV*URB*LIT*STB + DEV*LIT*~IND*STB -> SURV 

Supuestos incoherentes

  • Ya que identificamos las condiciones necesarias, no pueden incluirse remanentes lógicos que no incluyan la condición necesaria

Ejemplo

  • Las condicionesLIT+STB en la base de Lipset son condiciones necesarias
  • Las configuraciones que incluyan ~LIT+~STB son condiciones incoherentes

¿Cómo excluir las condiciones incoherentes?

  • La función nec_cond() de SetMethods excluye las configuraciones que contradicen a las condiciones necesarias
ttLFesa1<- esa(oldtt=ttLF, 
               contrad_rows=c(SSCsm),
               nec_cond = "LIT + STB")
  • Con esta nueva tabla de verdad puedo proceder a la minimización

¿Cómo excluir las condiciones incoherentes?

minimize(ttLFesa1, 
         include="?")

M1: DEV*URB*STB + DEV*~IND*STB -> SURV

Supuestos insostenibles

  • Son combinaciones de condiciones que no pueden existir
    • Son lógicamente imposibles (los casos no existen)
  • En el paquete SetMethods se puede incluir el argumento untenable_LR e indicar la condición que es imposible
  • Pensemos que es imposible encontrar casos con industrialización sin urbanización (IND*~URB)
ttLFesa2<- esa(oldtt=ttLF,
               contrad_rows=c(SSCsm),
               nec_cond = "LIT + STB",
               untenable_LR = "IND*~URB")

minimize(ttLFesa2, 
         include="?")

M1: DEV*URB*STB + DEV*~IND*STB -> SURV

Datos panel en QCA

  • El paquete QCA funciona bien para datos transversales.
  • Pero no incluye las extensiones recientes para datos panel.
  • Por ello se usan paquetes externos como SetMethods (Medzihorsky et al. 2017).
  • R permite extender QCA porque sus funciones son públicas y reutilizables.

¿Por qué QCA necesita extensiones para datos panel?

  • Los datos panel combinan tiempo y unidades.
  • Esto permite detectar patrones entre casos y dentro de los casos a lo largo del tiempo.
  • QCA tradicional solo trabaja con una medición por caso.

Tipos de consistencia en datos panel

1️⃣ Consistencia entre casos (Between)

\[ \text{incl}_B(X_t \rightarrow Y_t)= \frac{\sum_i \min(X_{it},Y_{it})}{\sum_i X_{it}} \]

2️⃣ Consistencia dentro de los casos (Within)

\[ \text{incl}_W(X_i \rightarrow Y_i)= \frac{\sum_t \min(X_{it},Y_{it})}{\sum_t X_{it}} \]

3️⃣ Consistencia agrupada (Pooled)

\[ \text{incl}_P(X \rightarrow Y)= \frac{\sum \min(X,Y)}{\sum X} \]

Datos panel con SetMethods

library(SetMethods)

# Cargar datos incluidos en el paquete
data(SCHLF)

head(SCHLF)

ttSL <- truthTable(
  SCHLF,
  conditions = "EMP, BARGAIN, UNI, OCCUP",
  outcome    = "EXPORT",
  incl.cut   = 0.9,
  show.cases = TRUE)
              EMP BARGAIN  UNI OCCUP STOCK   MA EXPORT   COUNTRY YEAR
Australia_90 0.07    0.90 1.00  0.68  0.45 0.33   0.19 Australia 1990
Austria_90   0.70    0.98 0.01  0.91  0.01 0.05   0.25   Austria 1990
Belgium_90   0.94    0.95 0.14  0.37  0.26 0.14   0.14   Belgium 1990
Canada_90    0.04    0.21 0.99  0.11  0.62 0.31   0.28    Canada 1990
Denmark_90   0.59    0.78 0.10  0.55  0.53 0.10   0.34   Denmark 1990
Finland_90   0.70    0.97 0.20  0.95  0.02 0.13   0.17   Finland 1990

Datos panel con SetMethods

Consistencies:
---------------
                   ~EMP*~BARGAIN*OCCUP EMP*~BARGAIN*~OCCUP ~EMP*BARGAIN*~OCCUP
Pooled                           0.909               0.960               0.924
Between 1990 (19)                0.839               0.991               0.838
Between 1995 (19)                0.903               0.991               0.912
Between 1999 (19)                0.928               1.000               1.000
Between 2003 (19)                0.951               0.878               0.954


Distances:
----------
                       ~EMP*~BARGAIN*OCCUP EMP*~BARGAIN*~OCCUP
From Between to Pooled               0.023               0.026
                       ~EMP*BARGAIN*~OCCUP
From Between to Pooled               0.032


Coverages:
----------
                   ~EMP*~BARGAIN*OCCUP EMP*~BARGAIN*~OCCUP ~EMP*BARGAIN*~OCCUP
Pooled                           0.194               0.229               0.334
Between 1990 (19)                0.231               0.289               0.399
Between 1995 (19)                0.206               0.249               0.469
Between 1999 (19)                0.174               0.206               0.261
Between 2003 (19)                0.184               0.203               0.274

Estudios de caso

Estudios de caso

Más allá de la solución

  • La solución de QCA puede dejar preguntas sin responder

    • ¿Qué mecanismos unen a los términos de suficiencia con el resultado?
    • ¿Qué casos son típicos de la relación de suficiencia?
    • ¿Qué casos contradicen la afirmación de suficiencia?
    • ¿Qué casos no son explicados por la solución?

¿Qué casos estudiar?

  • Los estudios de QCA pueden complementarse con estudios de caso

  • Pero podemos preguntarnos ¿qué casos seleccionar?

    • Esto depende del objetivo de la investigación
      • Casos típicos
      • Casos desviados
      • Casos no explicados

Gráficos X,Y

  • Un primer acercamiento es presentar los resultados en un gráfico de dispersión

Tipos de casos

Tipos de casos

1- Típico

2- Desviado en consistencia (grado)

3- Desviado en consistencia (tipo)

4- Desviado en cobertura

5- Individualmente irrelevantes

Tipos de casos

  • Los casos son clasificados depndiendo de la membresía a \(Y\) en
    • El término de suficiencia \(T\) o
    • La fórmula de solución \(S\)

Casos identificables en \(T\)

  • Los casos típicos toman como referente los términos de suficiencia \(T\)
  • Los casos con desviación en consistencia también toman como referencia el término \(T\)

Casos identificables en \(S\)

  • Los casos desviados en cobertura y los individualmente irrelevantes son identificados con referencia a fórmula de solución \(S\)

Tip

  • Lo que queremos es identificar los casos que no son explicados por el modelo
  • Ninguna configuraciones \(T\) los explica

¿Para qué sirve cada caso?

  • Cada tipo de caso tiene un objetivo al ser seleccionado
Tipo de caso Objetivo
Típico (con cobertura única) Mecanismo causal Son los que más se ajustan al término de suficiencia
Desviado en consistencia (grado) No recomendado Inconsistente con el término de suficiencia
Desviados en consistencia (tipo) Identificar conjunción omitida Son casos con el término de suficiencia pero sin el resultado
Desviados en cobertura Identificar conjunción omitida Cuentan con el resultado pero sin el término de suficiencia
Individualmente irrelevantes No son útiles para estudio de caso No presentan ni \(T\) ni el resultado

Aplicaciones de QCA

Aplicaciones de QCA

Corinne Bara (Conflictos Civiles)

  • Artículo: Incentives and opportunities: A complexity-oriented explanation of violent ethnic conflict
  • Meta: explicar los inicios de conflictos civiles como resultado de la combinación de oportuidades y agravios

Inicio Guerras Civiles

  • Debate entre explicaciones centradas en los agravios y las oportunidades
  • Bara sostiene que la competencia entre estas dos aproximaciiones es inadecuada
  • El conflicto posiblemente sea resultado de ambas

Argumento de Bara

  • Tanto los agravios como los conflictos son necesarios para que inicie un conflicto
  • Los rebeldes deben:
    1. Estar dispuestos a rebelarse
    2. Deben poder rebelarse

Tip

  • Utiliza Análisis Cualitativo Comparativo con conjuntos nítidos (csQCA) para explorar su hipótesis

Operacionalización

Factor Explicativo Fuente Medición
Exclusión política (polx) EPR-ETH StatusID: 1 si un grupo étnico está excluido del poder ejecutivo central en la mayoría del período.
Grupo pequeño (tiny) EPRETH GroupSize 1 si un grupo representa <1% de la población total del país y tiene menos de un millón de personas.
Inestabilidad política (instab) Polity IV 1 si hubo un cambio de régimen (de democracia a autocracia o viceversa) en el período.
Pobreza extrema del Estado (xpoor) Penn World Tables 1 si el país está entre el 10% más pobre según el PIB real per cápita.
Parentesco étnico transnacional (havtek) International Conflict Research, ETH Zurich 1 si el grupo tiene un grupo étnico afín en un país vecino por frontera terrestre.

Operacionalización

Factor Explicativo Fuente Medición
Conflicto transnacional (tekcon) International Conflict Research, ETH Zurich 1 si el grupo tiene un conflicto étnico en curso en un país vecino y las áreas de asentamiento son contiguas.
Expulsión del poder (oust) EPR-ETH 1 si el grupo fue excluido del poder ejecutivo central durante el período.
Grupo gobernante (ruler) EPR-ETH 1 si el grupo mantuvo su estatus como socio principal en el gobierno durante todo el período.
Concentración territorial (conc) GeoEPR-ETH 1 si el grupo tiene un patrón de asentamiento definido (no disperso, migrante o urbano).
Recursos petroleros (petrol) GeoEPR-ETH + Lujala 1 si hay al menos un gran campo de petróleo o gas en el área de asentamiento del grupo.
Conflicto previo (precon) Cederman, Wimmer & Min (2010) 1 si el grupo ya había experimentado un conflicto étnico previo.

Muestra

  • La base de datos incluye 102 inicios de conflictos entre 1990-2009
  • A esta base se le agregó una muestra aleatoria de 400 no-inicios para tener una base de 500 observaciones

Análisis de necesidad

  • Estableció un umbral de 0.95 para la consistencia en el modelo de necesidad
  • Dos términos cumplen con este criterio ~tiny y ~ruler
  • Significaría que, con pocas excepciones, el conflicto étnico pasara solo en grupos étnicos que no son pequeños y que no están en el gobierno
  • Pero la cobertura del modelo es muy baja, por tanto son condiciones necearias paro triviales

Análisis de suficiencia

  • Para el análisis de suficiencia utilizaron un critierio de consistencia de 0.75
  • Al incluir las 11 condiciones en una sola solución resulta en un modelo dificil de interpretar
  • Explica el 62% de los inicios pero genera demasiados caminos

Depuración del modelo

  • Eliminó las condicones:
    • concentración territorial (conc),
    • pobreza estatal extrema (xpoor) y
    • familiaras étnicos en países vecinos (havtek)
  • El modelo se redujó a ocho condiciones explicativas

Resultados

Tip

  • La solución tiene una consistencia de 0.88 y una cobertura de 0.60
  • Explica casi dos tercios de todos los conflictos (61 de 102) en solo cuatro caminos

Caminos al conflicto étnico

Ragin y Fiss: Interseccionalidad

  • Libro: Intersectional Inequality
  • Meta: entender la pobreza y la no-pobreza como resultado de combinaciones (no de “una variable”).

Datos y grupos de análisis

  • Encuesta NLSY (National Longitudinal Surveys)
  • Analizan por subgrupos (raza y sexo)
  • Resultado principal: evitar pobreza (Y=1) / estar en pobreza (Y=1)

Tip

  • Cada subgrupo puede tener recetas distintas para el mismo resultado.

De variables a conjuntos (fuzzy sets)

  • Ejemplos de conjuntos:
    • “Ingreso parental no bajo
    • “Puntajes de prueba altos
    • Alta educación del respondente”
  • Calibran 0–1 según puntos de corte justificados (teoría).

Note

  • Esto permite preguntar: “¿Qué combinaciones de ventajas/desventajas se asocian a evitar pobreza?”.

Tabla de verdad: la mesa de combinaciones

  1. Elige 4–5 condiciones (ej.: AFQT alto, ingreso parental no bajo, padres educados, educación propia alta).
  2. Construye 2^k filas (todas las combinaciones).
  3. Para cada fila: frecuencia y consistencia con el resultado.

“Grumos” de ventaja (lumpiness)

  • En varones blancos, una combinación con 4 ventajas es muy común (muchos casos).
  • En varones negros, combinaciones con 3 desventajas son mucho más frecuentes.

Important

  • La estructura de oportunidades es distinta por subgrupo → justifica análisis separados.

Asimetría: Evitar no es “lo contrario” de Estar

  • Analiza evitar pobreza y estar en pobreza por separado.

  • Las recetas para evitar y estar en pobreza NO son el espejo una de la otra

Tip

  • Modela dos historias: rutas al éxito y rutas al fracaso.

Evitar pobreza — población blanca

Varones blancos

  • Cons ≥ .90: educado * ~baja_puntuación_AFQT * situación_doméstica_favorable
    → ruta principal al éxito económico.
  • Cons ≥ .85: educado * (~baja_puntuación_AFQT + origen_familiar_favorable)
    → dos vías alternativas con educación como base.
  • Cons ≥ .80: educado * (~baja_puntuación_AFQT + situación_doméstica_favorable)
    → combina ventajas educativas y estabilidad familiar.

Tip

  • Las ventajas (educación, puntajes, entorno familiar) coinciden y se refuerzan.
  • Muchos hombres blancos acumulan las tres

Evitar pobreza — mujeres blancas

  • Cons ≥ .90: educado * ~baja_puntuación_AFQT * situación_doméstica_favorable
    → misma configuración principal que los varones blancos.
  • Cons ≥ .85: educado * ~baja_puntuación_AFQT * (situación_doméstica_favorable + origen_familiar_favorable)
    → dos rutas posibles: desempeño o apoyo familiar.
  • Cons ≥ .80: educado * (~baja_puntuación_AFQT + situación_doméstica_favorable)
    → la educación actúa como núcleo necesario en todas las combinaciones.

Note

  • La estabilidad doméstica y el capital familiar actúan como sustitutos parciales.
  • Las rutas femeninas son más restringidas: requieren al menos dos ventajas simultáneas.

Evitar pobreza — población negra

Varones negros
- Cons ≥ .90: educado * ~baja_puntuación * origen_familiar_favorable * situación_doméstica_favorable (4 ventajas).

- Cons ≥ .85: educado * ~baja_puntuación * origen_familiar_favorable.

- Cons ≥ .80educado * ~baja_puntuación * origen_familiar_favorable + educado * ~baja_puntuación * situación_doméstica_favorable.

Tip

  • La estructura refleja una mayor barrera estructural: la misma receta de los blancos requiere más condiciones para funcionar.

Evitar pobreza — población negra

Mujeres negras
- Cons ≥ .90: todas las cuatro ventajas (educación + ~baja_puntuación + origen_familiar_fav + situación_doméstica_fav).
- Cons ≥ .85: educado * ~baja_puntuación * situación_doméstica_favorable.
- Cons ≥ .80 (factorizadas):
educado • situación_doméstica_fav * (~baja_puntuación + origen_familiar_fav).

Tip

La educación es el elemento necesario en todas las combinaciones.
- La estabilidad del hogar actúa como condición pivote: sustituye parcialmente la ventaja familiar o académica.

Recomendaciones

Recomendaciones

Errores comunes

Warning

  • Sustituir un análisis estadístico con QCA
    • Están diseñados para responder diferentes preguntas
  • Utilizar un lenguaje de variables
    • QCA no analiza el efecto de variables independientes
    • Sino combinaciones de factores que producen un resultado
  • Sostener causalidad sin identificar mecanismos

Errores comunes

Warning

  • Incluir solo casos positivos
    • Debe incluirse observaciones donde el resultado está ausente
  • Utilizar sustantivos para nombrar a las condiciones en lugar de frases adjetivadas
    • P.e. utilizar el “PIB” en lugar de “País Desarrollado”

Errores comunes

Warning

  • Utilizar calibraciones simétricas
    • La calibración es asimétrica
    • La negación de rico no es pobre, sino “no rico”
    • La negación de “país desarrollado” no es “subdesarrollado”
  • Calibrar con 0.5
    • Demostraría máxima ambigüedad
    • La observación no está ni dentro ni fuera del conjunto

Errores comunes

Warning

  • No explicar la calibración
    • Debe justificarse el porqué de los anclajes
  • Utilizar medidas de tendencia central para calibrar
    • Por ejemplo, utilizar la media o rangos intercuartílicos
    • Una excepción es si nos interesa un concepto como “familia con ingreso superior al medio”

Errores comunes

Warning

  • Utilizar todos los valores de las escalas de Likert para calibrar
    • No se debe pensar que los extremos equivalen a 0 y 1
    • Varias categorías pudieran comprimirse: por ejemplo, 1-3= totalmente fuera
  • Utilizar un umbral de consistencia menor a 0.8 en el análisis de suficiencia

Errores comunes

Warning

  • No correr un modelo para presencia y ausencia del resultado
    • Si tu interés es la presencia y ausencia del resultado necesitas correr los dos modelos
    • Los resultados en QCA no son simétricos
  • No correr un análisis de necesidad

Errores comunes

Warning

  • Analizar condiciones que siempre están presentes
    • Son condiciones necesarias pero triviales
  • No interpretar los resultados
    • No solo se reporta la solución con su consistencia/cobertura
    • Hay que interpretar los resultados con su mecanismo causal.

Buenas prácticas

Tip

  • Cuando sea posible hacer públicos los datos crudos
  • Siempre reportar la tabla de verdad
  • Presentar la solución con la notación booleana
  • Las medidas de consistencia y cobertura siempre deben reportarse
  • Presentar una explicación detallada de la selección de los casos

Buenas prácticas

Tip

  • Seleccionar los factores explicativos con base en la teoría o conocimiento empírico previo
  • Mantener moderado el número de condiciones explicativas
  • Detallar la calibración de los datos
  • Utilizar un software para minimizar la tabla de verdad
  • Hacer transparente el tratamiento de las configuraciones residuales