En la investigación empírica recurrimos a indicadores que nos permiten cuantificar los atributos que deseamos observar con fines comparativos. Las fórmulas de estos indicadores reflejan una lógica conceptual, y entender esa lógica es crucial para la interpretación de las cantidades que tales fórmulas arrojan.

En este breviario se ilustra este punto con un indicador de uso muy extendido en la ciencia política, el número efectivo de partidos. Además de su celebridad, este indicador resulta interesante porque en él se aplican dos reglas básicas de la probabilidad: la probabilidad de eventos independientes y la probabilidad de eventos disjuntos. De paso, se aprovecha para introducir algunas técnicas simples de simulación de procesos aleatorios (en este caso, la selección al azar de dos diputados para ver si pertenecen o no al mismo partido).

El número efectivo de partidos

Un indicador muy utilizado en la ciencia política es el número efectivo de partidos de Laakso y Taagepera (1979). Aplicado a los partidos en un órgano legislativo como la Cámara de Diputados, la fórmula para obtenerlo es \[N = \frac{1}{\sum_{i=1}^n p_i^2},\] donde \(n\) es el número de partidos con representación y \(p_i\) es la proporción de escaños que tiene el partido \(i\).

El número efectivo de partidos, \(N\),

es el número de partidos hipotéticos de igual tamaño que tendrían el mismo efecto total en la fraccionalización del sistema que el que tienen los partidos reales de tamaño desigual (Laakso y Taagepera 1979, 4).

Al tomar en cuenta el peso relativo de cada partido, \(N\) es una medida que da una mejor idea de la fragmentación de un órgano legislativo que la cuenta simple de partidos con al menos un escaño, representada por \(n\).1 Este último valor otorga el mismo peso a un partido con muy baja representación que a un partido que tiene suficientes escaños como para legislar por sí mismo.

Así, por ejemplo, en las pasadas elecciones federales de junio de 2021 siete partidos obtuvieron representación. El peso de estos siete partidos es muy variable. En un extremo está el PRD, con el 3% de los escaños; en el otro, Morena, que con el 39.8% es el partido con más representación. Aquí los datos para todos los partidos.2

partido <- c("PAN", "PRI", "PRD", "PVEM", "PT", "MC", "Morena") # vector con siglas
curules <- c(114, 71, 14, 43, 37, 23, 198) # vector con número de escaños
cam.dip <- data.frame(partido, curules) # marco de datos con ambos vectores
cam.dip$p <- cam.dip$curules / sum(curules) # proporción de escaños por partido
library(knitr)
kable(cam.dip, align = "lcc", caption = "Integración de la Cámara de Diputados" )
Integración de la Cámara de Diputados
partido curules p
PAN 114 0.228
PRI 71 0.142
PRD 14 0.028
PVEM 43 0.086
PT 37 0.074
MC 23 0.046
Morena 198 0.396

A continuación, calculamos el número efectivo de partidos.

cam.dip$p2 <- cam.dip$p^2 # cuadrado de la proporción de escaños
denom <- sum(cam.dip$p^2) # suma de los cuadrados
N <- 1/denom # Número efectivo de partidos
round(N, digits = 2) 
## [1] 4.09

Así, aunque hay siete partidos con diputaciones, la fragmentación de la cámara baja es equivalente a la que se observaría con cuatro partidos de igual tamaño.

Probabilidad de que dos legisladores pertenezcan al mismo partido

El número efectivo de partidos se toma como un indicador de dispersión o fragmentación de la representación. Para ver el razonamiento probabilístico subyacente, vamos a suponer que se toman dos legisladores al azar. ¿Cuál es la probabilidad de que ambos sean del mismo partido? Es claro que esta probabilidad es mayor en la medida en que unos pocos partidos concentran la mayor parte de los escaños.

Para realizar este sorteo con los legisladores de la Cámara de Diputados, vamos a crear primero un vector de 500 elementos, en el que se repite las siglas de cada partido un número de veces igual al número de escaños que dicho partido controla.

dips <- c(rep(partido[1], curules[1]), rep(partido[2], curules[2]),
          rep(partido[3], curules[3]), rep(partido[4], curules[4]),
          rep(partido[5], curules[5]), rep(partido[6], curules[6]),
          rep(partido[7], curules[7]))
table(dips)
## dips
##     MC Morena    PAN    PRD    PRI     PT   PVEM 
##     23    198    114     14     71     37     43

De esta forma, si seleccionamos al azar dos elementos del vector dips es como si tomáramos dos diputados de 500 y observáramos su partido. La función sample() permite hacer esto. El operador binario == nos devuelve el valor de TRUE si el partido es el mismo y de FALSE en caso contrario.

set.seed(9447)
dos <- sample(dips, size = 2, replace = TRUE) # una muestra de dos diputados, con remplazo
dos # observamos los partidos
## [1] "Morena" "PRI"
dos[1] == dos[2] # ¿El primer elemento de la muestra es igual al segundo?
## [1] FALSE

En este caso, nuestra muestra arroja a un diputado Morena y a otro del PRI. Por este motivo, en la última línea se nos indica que es falso que se trate del mismo partido.

Al volver a ejecutar el comando, se repite el proceso de seleccionar dos diputados al azar.

dos <- sample(dips, 2, replace = TRUE)
dos
## [1] "PT"  "PRI"
dos[1] == dos[2]
## [1] FALSE

Podemos obtener la probabilidad de que dos diputados seleccionados al azar sean del mismo partido mediante simulación. Para ello, replicamos muchas veces el proceso de tomar dos diputados. La probabilidad buscada es la proporción de veces en las que los diputados son del mismo partido con respecto al total de simulaciones.

Esto se hace en el siguiente código. Es importante tener en cuenta que los valores lógicos TRUE y FALSE son registrados con los valores numéricos 1 y 0, respectivamente, lo que permite realizar con ellos operaciones aritméticas como la suma.

## Función para escoger dos diputados al azar e indicar si son del mismo partido.
sorteo <- function(){
  dos <- sample(dips, 2, replace = TRUE)
  dos[1] == dos[2]
}
nsims <- 100000 # número de simulaciones
## Con replicate() se replica la función en el segundo argumento
## el número de veces indicado en el primer argumento
## El vector reps registra, en cada proceso, si los dos diputados del mismo partido o no.
reps <- replicate(nsims, sorteo())
## número de simulaciones en que los diputados son del mismo partido sobre el total
prob2dips <- sum(reps) / nsims 
prob2dips
## [1] 0.24525

Así, la probabilidad de que dos legisladores de la Cámara de Diputados sean del mismo partido es de 24%.

Al dividir 1 entre esta probabilidad, lo que obtenemos es (aproximadamente) el número efectivo de partidos.

Nsim <- 1/prob2dips
round(Nsim, digits = 2)
## [1] 4.08

El denominador de \(N\)

Entonces, en \(N = 1/\sum_{i=1}^n p_i^2\), el denominador, \(\sum_{i=1}^n p_i^2\) es la probabilidad de obtener dos diputados del mismo partido. Para ver esto, comencemos por una pregunta más simple relacionada con nuestro sorteo: al tomar dos legisladores al azar, me pregunto por la probabilidad de que ambos sean del PAN. Digamos que primero tomo uno. El PAN tiene 111 diputaciones. Si todos los legisladores tienen la misma probabilidad de ser seleccionados, entonces la probabilidad de que el legislador sea del PAN es \[\Pr\left(\text{obtener panista} \right) = p_{PAN} = 111/500;\] es decir, la proporción de escaños del PAN.

Si al volver a tomar un diputado al azar la selección sigue el mismo procedimiento (los 500 legisladores tienen la misma probabilidad de ser seleccionado), entonces el resultado al tomar al segundo legislador es independiente del resultado al tomar al primer legislador. Cuando \(A\) y \(B\) son eventos independientes, la probabilidad de que los eventos \(A\) y \(B\) ocurran de manera conjunta es \[\Pr \left(A \& B \right) = \Pr \left(A \right) \cdot \Pr \left(B \right).\]

Así, la probabilidad de que en los dos sorteos se obtenga un legislador del PAN es \[\Pr\left(\text{obtener dos panistas} \right) = p_{PAN} \cdot p_{PAN} = p_{PAN}^2.\] Siguendo la misma lógica, la probabilidad de que los dos legisladores pertenezcan al PT es el cuadrado de la proporción de escaños del PT, \(p_{PT}^2\).

¿Cuál es la probabilidad de que los dos diputados sean del PAN o del PT? Para contestar esto, debemos considerar que estas dos posibilidades son mutuamente excluyentes: si los dos legisladores son del PT, no pueden ser del PAN y viceversa. Es decir que se trata de eventos disjuntos. Cuando \(C\) y \(D\) son eventos disjuntos, la probabilidad de que ocurra algunos de los dos es \[\Pr \left(C \text{ o } D \right) = \Pr \left(C \right) + \Pr \left(D \right).\]

Entonces, la probabilidad de obtener dos panistas o dos petistas es \[\Pr\left(\text{obtener dos del PAN o dos del PT} \right) = p_{PAN}^2 + p_{PT}^2.\]

Si quiero saber la probabilidad de que los dos diputados sean del PAN o del PT o de Morena, aplica la misma regla de los eventos disjuntos: \[\Pr\left(\text{obtener dos del PAN o dos del PT o dos de Morena} \right) = p_{PAN}^2 + p_{PT}^2 + p_{Morena}^2.\]

De esta forma, preguntarse por la probabilidad de que dos legisladores pertenezcan al mismo partido significa la probabilidad de que los dos diputados pertenezcan a cualquiera de los siete partidos en la Cámara de Diputados, lo que se obtienen sumando el cuadrado de la proporción de escaños de todos los partidos, es decir: \(HH = \sum_{i=1}^n p_i^2\), el denominador del número del número efectivo de partidos.

Esta suma de cuadrados es conocida como Índice de Herfindahl–Hirschman.3 Al ser esta suma una probabilidad, tiene valores entre 0 y 1. A medida que pasamos del valor mínimo al máximo, pasamos de una situación en la que todos los legisladores pertenecen a un partido distinto a otra en la que todos los legisladores pertenecen al mismo partido.4

Así, \(N\) no es más que el inverso de \(HH\). Pero con esta transformación la interpretación deja de ser probabilística y se hace en los términos de la definición presentada al inicio. Un aspecto importante es que, mientras que con \(HH\) valores mayores indican mayor concentración, con \(N\) ocurre lo contrario valores mayores indican mayor dispersión. También cambia el rango de valores posibles. En el mínimo, \(N = 1\) indica una situación en la que un sólo partido tiene todos los escaños. En el máximo, \(N = n\) indica una situación en la que todos los \(n\) partidos con representación en la legislatura tienen exactamente la misma proporción de escaños.

Para saber más…

El número de partidos efectivos, además de ser muy usado, ha sido muy discutido y existen propuestas alternativas de índices para contabilizar el número de partidos ponderando por su peso. Buena parte de ellas son expuestas y comentadas en Golosov (2010). El debate alrededor de las propiedades de \(N\) fue en buena medida iniciado por el politólogo mexicano Molinar (1991), quien realizó un ajuste de \(N\) para capturar mejor las situaciones de predominio por un partido hegemónico.

Un antecedente del uso de \(HH\) aplicado a sistemas de partidos es el índice de fraccionalización de Rae (1967), \(1-HH\), que es la probabilidad de que dos legisladores escogidos al azar pertenezcan a partidos distintos. Hirschman (1964) hace un relato del origen de \(HH\) en la economía y su papel en él (aunque no parece apreciar el aspecto probabilístico del indicador).

Referencias

Golosov, Grigorii V. 2010. «The Effective Number of Parties: A New Approach». Party Politics 16 (2): 171-92.
Hirschman, Albert O. 1964. «The Paternity of an Index». The American Economic Review 54 (5): 761.
Laakso, Markku, y Rein Taagepera. 1979. «Effective” Number of Parties: A Measure with Application to West Europe». Comparative Political Studies 12 (1): 3-27.
Molinar, Juan. 1991. «Counting the Number of Parties: An Alternative Index». The American Political Science Review 85 (4): 1383-91.
Rae, Douglas W. 1967. The Political Consequences of Electoral Laws. New Haven, CT: Yale University Press.

  1. Aquí trabajaremos con la distribución de escaños en los órganos legislativos, pero el índice también se utiliza para calcular el Numero efectivo de partidos electorales, que utiliza la misma fórmula, con la diferencia de que \(p_i\) es la proporción de votos del partido \(i\). La interpretación no cambia en lo sustantivo.↩︎

  2. Datos de la Cámara de Diputados.↩︎

  3. Originalmente, en \(HH\) \(p_i\) representa la proporción del mercado de la empresa \(i\) y \(n\) es el número de empresas. Así, HH mide el grado de concentración monopólica.↩︎

  4. En estricto sentido, el valor mínimo posible de \(HH\) no es cero, sino \(1/E\), donde \(E\) es el total de escaños en el congreso. Esta cantidad representa la probabilidad de obtener dos veces al mismo legislador.↩︎