Protocolo csQCA

Diego Solís Delgadillo

diego.solis@colsan.edu.mx

Ruta de hoy: Protocolo csQCA

Objetivos

- Entender el protocolo csQCA

- Practicar necesidad y suficiencia

- Aplicar minimización lógica (compleja, parsimoniosa, intermedia)

- Reportar consistencia y cobertura

Agenda

1) Tabla comparativa → casos y resultado
2) Necesidad: covN & RoN
3) Tabla de verdad y parámetros (n.cut, incl.cut)
4) Suficiencia y minimización (?, direxps)
5) Evaluación: consistencia/cobertura, residuales

Protocolo para csQCA

  • Construir tabla comparativa
  • Identificar condiciones necesarias
  • Construir la tabla de verdad
  • Minimizar la solución
  • Evaluar el modelo (consistencia y cobertura)

Tabla comparativa

Caso Dictamen Caso Dictamen
A Si L Si
B Si M No
C Si N Si
D No O No
E No P Si
F Si Q No
G No R No
H Si S No
I Si T No
J Si U Si
K Si

Factores explicativos en la literatura

Experiencia legislativa

Educación superior

Género

Condiciones necesarias

  • Condiciones sin las cuales el resultado no puede producirse
  • El factor explicativo es un superconjunto del resultado

\[X⇐Y\]

Hipótesis de Skocpol (1979)

  • La revolución social (\(Y\)) se produce solamente en situaciones de quiebre de estatalidad (\(X\)){style=“color:#cc3399”}

Condiciones necesarias

Caso Dictamen Experiencia Educación Hombre
A 1 0 1 0
B 1 0 1 0
C 1 1 1 0
D 0 1 1 1
E 0 0 0 0
F 1 1 1 1
G 0 1 1 1
H 1 0 1 1
I 1 1 1 1
J 1 1 1 1
K 1 0 1 0

Caso Dictamen Experiencia Educación Hombre
L 1 0 1 1
M 0 0 0 0
N 1 1 1 1
O 1 0 1 1
P 0 0 0 0
Q 0 1 1 0
R 0 1 1 0
S 0 1 1 0
T 0 0 0 1
U 1 1 1 1

¿Cómo identificar la condición necesaria?

  • Observamos si existe una condición que siempre este presente cuando el resultado es igual a 1

  • Educación está presente en todas las instancias de dictamen positivo

    • Es una condición potencialmente necesaria

Tip

  • En la práctica es dificil encontrar condiciones que aparezcan en todos los casos positivos
  • En lugar de ello tomamos factores que cubren casi todos los casos

inclN (Consistencia de Necesidad)

  • La consistencia mide el grado en que el resultado \(Y\) está contenido dentro de la condición \(X\).
    • Cuán perfectamente se cumple \(Y \subseteq X\)
    • Qué proporción de casos positivos presentan \(X\)

\[ \textbf{inclN}_{X \Leftarrow Y}=\frac{|X\cap Y|}{|Y|} \] \[ \textbf{inclN}_{X \Leftarrow Y}=\frac{|X\cap Y|}{|Y|}=\frac{12}{12}= \mathbf{1.00}\]

covN (Coverage of Necesity)

  • La cobertura de necesidad es la proporción de \(X\) que es cubierta por la intersección con \(Y\)
  • Qué proporción de los casos que presentan \(X\) son positivos

\[ \mathrm{CovN}_x \Leftarrow Y = \frac{X \cap Y}{X} = \frac{12}{16} = 0.75\]


        inclN   RoN   covN  
--------------------------- 
1  EDU  1.000  0.556  0.750 
--------------------------- 

RoN (Relevance of Necesity)

  • Distingue necesidades reales de necesidades triviales.

Tip

  • Si \(X\) es casi universal (aparece en casi todos los casos), puede parecer “necesaria” para \(Y\) solo por ser muy grande.
  • RoN evalúa si la condición es trivial

RoN (Relevance of Necesity)

  • RoN mide cuánto cubre \(X\) el universo más allá del simple \(Y \subseteq X\).

Interpretación

  • Valores altos ⇒ la necesidad aporta información (no es trivial).
  • Valores bajos ⇒ la necesidad es trivial (casi todo está en \(X\))

\[RoN= \frac{\Sigma(1-X)}{\Sigma(1-min(X,Y))}\]

Tip

  • \((1 - X)\): proporción de casos [fuera de \(X\)]{style=“color: #3399ff”}
  • \((1 - \min(X,Y)\): proporción de casos fuera de la intersección \(X \cap Y\)
  • El cociente compara cuánto aporta \(X\) más allá de la simple superposición con \(Y\).

RoN (Relevance of Necesity)


\[RoN \;=\; \frac{\text{suma de las ausencias de } Y}{\text{suma de las ausencias de la intersección } (X \cap Y)} \]

Ejemplo RoN

CASO Dictamen Educación min X,Y 1 - X 1 - min X,Y
A 1 1 1 0 0
B 1 1 1 0 0
C 1 1 1 0 0
D 0 1 0 0 1
E 0 0 0 1 1
F 1 1 1 0 0
G 0 1 0 0 1
H 1 1 1 0 0
I 1 1 1 0 0
J 1 1 1 0 0
K 1 1 1 0 0
L 1 1 1 0 0
M 0 1 0 0 1
N 1 1 1 0 0
O 1 1 1 0 0
P 0 1 0 0 1
Q 0 0 0 1 1
R 0 0 0 1 1
S 0 0 0 1 1
T 0 0 0 1 1
U 1 1 1 0 0
Σ 5 9

Ejemplo RoN

Interpretación:
El RoN se calcula como
\[ RoN = \frac{\sum (1 - Y)}{\sum [1 - \min(X, Y)]} = \frac{5}{9} = 0.55 \]

Necesidad compleja

Caso Dictamen Experiencia Educación Hombre Exp ∨ Hom
A 1 0 1 0 0
B 1 0 1 0 0
C 1 1 1 0 1
D 0 1 1 1 1
E 0 0 0 0 0
F 1 1 1 1 1
G 0 1 1 1 1
H 1 0 1 1 1
I 1 1 1 1 1
J 1 1 1 1 1

Tip

  • Sino encontramos condiciones individuales podemos explorar disyunciones
    • Experiencia + Educación
    • Experiencia + Hombre
    • Educación + Hombre

Análisis de necesidad en R

Note

  • Las condiciones de necesidad pueden analizarse con el comando pof() del paquete QCA
    • El comando analiza los términos o cojunciones individualmente
  • Utilizando los datos calibrados de la base de Lipset:
data(LC)

pof("DEV","SURV", data = LC)

        inclN   RoN   covN  
--------------------------- 
1  DEV  1.000  0.800  0.800 
--------------------------- 

Análisis de necesidad en R

  • Para analizar todas las condiciones al mismo tiempo se utiliza el comando superSubset()
superSubset(LC, 
            outcome = "SURV", 
            incl.cut = 0.9)

                inclN   RoN   covN  
----------------------------------- 
1  DEV          1.000  0.800  0.800 
2  LIT          1.000  0.500  0.615 
3  STB          1.000  0.700  0.727 
4  DEV*LIT      1.000  0.800  0.800 
5  DEV*STB      1.000  1.000  1.000 
6  LIT*STB      1.000  0.900  0.889 
7  DEV*LIT*STB  1.000  1.000  1.000 
8  ~URB + IND   1.000  0.000  0.444 
----------------------------------- 

Análisis de necesidad en R

  • También puede especificarse la consistencia y el valor de RoN
superSubset(LC, outcome = "SURV", 
            incl.cut = 1,
            ron.cut = 0.8)

                inclN   RoN   covN  
----------------------------------- 
1  DEV          1.000  0.800  0.800 
2  DEV*LIT      1.000  0.800  0.800 
3  DEV*STB      1.000  1.000  1.000 
4  LIT*STB      1.000  0.900  0.889 
5  DEV*LIT*STB  1.000  1.000  1.000 
----------------------------------- 

Análisis de suficiencia

Análisis de suficiencia

Condición suficiente

  • Indican que cada vez que se presenta \(X\) observamos \(Y\)

\[ X ⇒ Y \]

  • \(X\) es un subconjunto de \(Y\)

  • Tomamos como ejemplo el dictamen de iniciativas de la Comisión de Ciencia y Tecnología

Tabla de verdad

Configuración EXP EDU HOMBRE
1 1 1 1
2 1 1 0
3 1 0 1
4 1 0 0
5 0 1 1
6 0 1 0
7 0 0 1
8 0 0 0

Revisamos nuestros casos

Caso Dictamen Experiencia Educación Hombre
A 1 1 0 1
B 1 1 0 1
C 1 0 0 1
D 0 0 0 0
E 0 1 1 1
F 1 0 0 0
G 0 0 0 0
H 1 1 0 0
I 1 0 0 0
J 1 0 0 0
K 1 1 0 1

Revisión de los casos

Caso Dictamen Experiencia Educación Hombre
L 1 1 0 1
M 1 1 0 1
N 1 0 0 1
O 0 0 0 0
P 0 1 1 1
Q 1 0 0 0
R 0 0 0 0
S 1 1 0 0
T 1 0 0 0
U 1 0 0 0

Clasificación de casos

Conf EXP EDU HOMBRE Dic (0) Dic(1)
1 1 1 1 E
2 1 1 0 Q,R,S,T
3 1 0 1 A,B,K,N
4 1 0 0 H
5 0 1 1
6 0 1 0
7 0 0 1 C,L,O
8 0 0 0 D,G,M,P F,I,J,U

Índice de consistencia

Conf EXP EDU HOM Dic (0) Dic(1) Cons
1 1 1 1 E
2 1 1 0 Q,R,S,T
3 1 0 1 A,B,K,N 1.00
4 1 0 0 H 1.00
5 0 1 1
6 0 1 0
7 0 0 1 C,L,O 1.00
8 0 0 0 D,G,M,P F,I,J,U 0.50

Important

  • Indica qué proporción de los casos que caen en esa configuración causal son positivos

Tipos de configuraciones

  • Las configuraciones verdaderas son las que son suficientes para generar el resultado

  • Cuando nos encontramos con las configuraciones negativas hablamos de configuraciones falsas

  • Cuando encontramos casos positivos y negativos nos referimos a ellas como configuraciones contradictorias

Minimización lógica

Conf EXP EDU HOM Dic(1) Tipo
3 1 0 1 A,B,K,N V
4 1 0 0 H v
7 0 0 1 C,L,O v
  • Se pueden resumir estas configuraciones en un argumento más simple:

  • Con experiencia * Sin educación superior ⇒ Dictamen

Conf EXP EDU HOM Dic(1) Tipo
3 1 0 1 A,B,K,N V
4 1 0 0 H v
7 0 0 1 C,L,O v
  • Sin educación superior * Hombre ⇒ Dictamen

Regla de Minimización

  • La regla de minimización: tenemos que comprar cada configuración suficiente con las demás

Important

  • Si estas son iguales en todas sus condiciones causales excepto en una, podemos eliminar esta condición que varía y quedarnos con los otros elementos.

Consistencia del modelo

  • Las configuraciones 3, 4 y 7 cumplen con la condición
  • ~Educación *(Experiencia + Hombre ) ⇒ Dictamen
Conf EXP EDU HOM Dic (0) Dic(1) Cons
3 1 0 1 A,B,K,N 1.00
4 1 0 0 H 1.00
7 0 0 1 C,L,O 1.00
  • En los ocho casos se presentan tanto las configuraciones causales como el resultado
  • Entonces hay una consistencia de 8/8

Cobertura (cov) (suficiencia)

  • La cobertura mide la proporción del resultado \((Y)\) queda explicada por las configuraciones de la solución
  • Complementa a la consistencia de suficiencia (qué tan bien \(X\subseteq Y\).

Tip

  • Nos dice qué tanto del resutlado explica cada término
  • El modelo genera también una cobertura del modelo -> cuánto explica todo el modelo (todos términos) del resultado

Tipos de cobertura

  • Se puede identificar
    • Cobertura bruta covS
    • Cobertura única covU

¿Cuál es la diferencia

  • La cobertura bruta indica todos los casos que cumplen con la solución
  • La cobertura única excluye casos que son explicados por más de una solución

Configuraciones residuales

  • Son la configuraciones que no tienen referente empírico
  • Nuestro resultado va a variar si consideramos esas configuraciones como verdaderas o falsas.
  • Cuando tratamos a las configuraciones residuales como falsas decimos la solución es compleja

  • Las configuraciones 5 y 6 son residuales
Conf EXP EDU HOM Dic (0) Dic(1) Cons
1 1 1 1 E
2 1 1 0 Q,R,S,T
3 1 0 1 A,B,K,N 1.00
4 1 0 0 H 1.00
5 0 1 1
6 0 1 0
7 0 0 1 C,L,O 1.00
8 0 0 0 D,G,M,P F,I,J,U 0.50

Solución parsimoniosa

Conf EXP EDU HOM Dic(1) Tipo
3 1 0 1 A,B,K,N V
4 1 0 0 H V
7 0 0 1 C,L,O V
5 0 1 1 R
6 0 1 0 R
  • ~Experiencia*Hombre ⇒ Dictamen

Solución intermedia

  • Solo algunas configuraciones residuales como verdaderas

  • La justificación para tomar las condiciones como verdaderas es teórica

    • Existen argumentos teóricos que proponen esa explicación
    • Solo esas configuraciones son integradas en la minimización lógica

Contrafactuales sencillos y dificiles

Counterfacticos sencillos - Están alineados con la teoría/expectativas direccionales

Contrafactuales dificiles - Son los que contradicen la teoría

Regla práctica

  • Sencillo = “consistente con el mecanismo esperado”;
  • Dificil = “lo negaría”.

Análisis de redundancia

  • Algunos implicantes primarios pueden ser redundantes

  • Creamos una tabla con las expresiones primitivas (sin minimizar)

  • Analizamos si éstas son cubiertas por los implicantes primarios

Análisis de redundancia

Implicante primario ~EL*ES*~H ~EL*ES*H EL*ES*~H EL*~ES *~H EL* ~ES*H
EL*~ES x x
EL*~H x x
ES*~EL x x
ES*~H x x

csQCA con R

library (QCA)
BAC <-c(0,1,1,0,1,0) 
MAJ <-c(1,1,1, 1, 1, 0)
JUD <-c(1, 0,0,1,0,1)
DIR_DEM<-c(0,0,1,1,1,0)
INS <-c(1,1,0,1,0,0)

df<-data.frame(BAC, MAJ, JUD, 
               DIR_DEM, INS)
               
rownames(df) <- c("AMLO", "Bukele", 
                  "Correa","Morales",
                  "Chávez", "Humala")

df
        BAC MAJ JUD DIR_DEM INS
AMLO      0   1   1       0   1
Bukele    1   1   0       0   1
Correa    1   1   0       1   0
Morales   0   1   1       1   1
Chávez    1   1   0       1   0
Humala    0   0   1       0   0

Tabla de verdad en R

ttbk<- truthTable(df, outcome = "BAC", 
                  complete = TRUE,
                  show.cases = TRUE)

ttbk

  OUT: output value
    n: number of cases in configuration
 incl: sufficiency inclusion score
  PRI: proportional reduction in inconsistency

     MAJ JUD DIR_DEM INS   OUT    n  incl  PRI   cases        
 1    0   0     0     0     ?     0    -     -                
 2    0   0     0     1     ?     0    -     -                
 3    0   0     1     0     ?     0    -     -                
 4    0   0     1     1     ?     0    -     -                
 5    0   1     0     0     0     1  0.000 0.000 Humala       
 6    0   1     0     1     ?     0    -     -                
 7    0   1     1     0     ?     0    -     -                
 8    0   1     1     1     ?     0    -     -                
 9    1   0     0     0     ?     0    -     -                
10    1   0     0     1     1     1  1.000 1.000 Bukele       
11    1   0     1     0     1     2  1.000 1.000 Correa,Chávez
12    1   0     1     1     ?     0    -     -                
13    1   1     0     0     ?     0    -     -                
14    1   1     0     1     0     1  0.000 0.000 AMLO         
15    1   1     1     0     ?     0    -     -                
16    1   1     1     1     0     1  0.000 0.000 Morales      

Minimización lógica R

Solución compleja

minimize(ttbk, details = TRUE)

M1: MAJ*~JUD*DIR_DEM*~INS + MAJ*~JUD*~DIR_DEM*INS <-> BAC

                          inclS   PRI   covS   covU   cases 
------------------------------------------------------------------- 
1  MAJ*~JUD*DIR_DEM*~INS  1.000  1.000  0.667  0.667  Correa,Chávez 
2  MAJ*~JUD*~DIR_DEM*INS  1.000  1.000  0.333  0.333  Bukele 
------------------------------------------------------------------- 
                      M1  1.000  1.000  1.000 

Minimización lógica R

Solución parsinomiosa


M1: ~JUD <-> BAC

         inclS   PRI   covS   covU   cases 
---------------------------------------------------------- 
1  ~JUD  1.000  1.000  1.000    -    Bukele; Correa,Chávez 
---------------------------------------------------------- 
     M1  1.000  1.000  1.000 

Minimización lógica R

Solución intermedia

library(SetMethods)
sol_i <- minimize(df, outcome = "BAC", 
                  conditions = c("MAJ", "JUD",
                                 "DIR_DEM","INS"), 
                  incl.cut = 1, 
                  include = "?",
                  details = TRUE, 
                  show.cases = TRUE, 
                  dir.exp = c(1,0,1,0))
sol_i

From C1P1: 

M1:    MAJ*~JUD <-> BAC 

             inclS   PRI   covS   covU   cases 
-------------------------------------------------------------- 
1  MAJ*~JUD  1.000  1.000  1.000    -    Bukele; Correa,Chávez 
-------------------------------------------------------------- 
         M1  1.000  1.000  1.000