¿Qué tan grande tiene que ser un grupo de personas para que la probabilidad de que al menos dos cumplan años el mismo día sea aproximadamente \(50\%\)? Es claro que en un grupo de trescientas sesenta y seis personas o más, la probabilidad de que al menos dos tengan el mismo cumpleaños es del \(100\%\), entonces la intuición nos podría tentar a pensar que necesitaríamos de ciento ochenta y tres personas para que esta probabilidad sea aproximadamente del \(50\%\); sin embargo, esto no es tan así, y las leyes de la probabilidad nos ayudaran a entender el porqué.

Definamos entonces el experimento a realizar y los eventos.

Experimento: Se preguntan las fechas de cumpleaños de todo un grupo de \(n\) personas.

\(E_n:\) De entre las \(n\) personas del grupo, al menos dos cumplen años el mismo día.

Es claro que \(n \geq 2\).

Calcular \(P(E_n)\) es un problema combinatorio bastante complejo, por lo que es mejor optar calcular \(P(E_n^c)\) y emplear la ley de la probabilidad del complemento de eventos \(P(E_n) = 1 - P(E_n^c)\).

El evento \(E_n^c\) se debe leer como: “De entre las \(n\) personas del grupo, ni una cumple años el mismo día”.

Calculemos entonces \(P(E_n^c)\) para distintos \(n\).

\[ \begin{align} P(E_2^c) &= \frac{364}{365} \\ \ P(E_3^c) &= \frac{364}{365} \cdot \frac{363}{365} \\ \ P(E_4^c) &= \frac{364}{365} \cdot \frac{363}{365} \cdot \frac{362}{365} \\ \ \end{align} \] Se puede ver claramente que existe un patrón. Por lo tanto, para cualquier \(n \geq 2\) se tiene que:

\[ P(E_n^c) = \frac{364}{365} \cdot \frac{363}{365} \cdot \frac{362}{365} \cdots \frac{366-n}{365} \]

Empleando notación factorial, podemos escribir \(P(E_n^c)\) como una función:

\[P(E_n^c) = \frac{364!}{(365)^{n-1} \ \cdot \ (365-n)!}\ , \ n \geq 2\]

Empleando la ley de la probabilidad del complemento:

\[ P(E_n) = 1 - \frac{364!}{(365)^{n-1} \ \cdot \ (365-n)!}\ , \ n \geq 2 \] Si usamos la notación del combinatorio, tenemos que:

\[ P(E_n) = 1 - \frac{n!}{365^n} \cdot \binom{365}{n}\ , \ n \geq 2 \]

Evidentemente \(P(E_n) = 1\) siempre que \(n \geq 366\).

Podemos observar ciertos valores de \(P(E_n)\) para determinados \(n\). Utilizando el lenguaje \(\texttt{R}\).

library(latex2exp)
library(knitr)
n = 2:100
p = 1 - factorial(n)/365^n * choose(365, n)

probs = c(0.25, 0.5, 0.75, 0.9, 0.99)
n.probs = rep(NA, length(probs))
p.probs = rep(NA, length(probs))

for (i in 1:length(probs)) {
  n.probs[i] = min(n[p > probs[i]])
  p.probs[i] = min(p[p > probs[i]])
}

kable(x = data.frame(cbind(n.probs, p.probs)),
      col.names = c("n", "Probabilidad"), 
      align = rep("c", 2), 
      digits = 3)
n Probabilidad
15 0.253
23 0.507
32 0.753
41 0.903
57 0.990

Vemos entonces que en un grupo de veintitrés personas la probabilidad de que al menos dos personas cumplan años el mismo día es del \(50.7\%\), cuando el grupo es de cuarenta y uno la probabilidad ya es del \(90.3\%\) y con cincuenta y siete personas el evento es casi seguro con una probabilidad del \(99\%\). Como se indicó al principio, estas probabilidades son muy anti intuitivas, por qué se podría pensar que para obtener estas probabilidades se requerirían grupos de personas más grandes; sin embargo, podemos observar el comportamiento de la probabilidad en función de \(n\) en el siguiente gráfico.

n = 2:60
p = 1 - factorial(n)/365^n * choose(365, n)

plot(x = n,
     y = p, 
     pch = 20, 
     cex = 0.5)
abline(h = 0.5, lty = 2, cex = 0.2, col = "red")
text(x = 10, y = 0.55, TeX("$P(E_{23}) = 0.507$"))

Conocemos que \(P(E_n) = 1\) siempre que \(n \geq 366\), ademas también conocemos que \(P(E_{57}) = 0.99\), podríamos decir entonces que la probabilidad crece “rápido” cuando \(2 \leq n \leq 57\), sin embargo cuando \(58 \leq n \leq 365\) la probabilidad crece extremadamente poco.

Por lo tanto, respondiendo a la pregunta inicial, para que la probabilidad de que al menos dos personas cumplan años el mismo día sea del \(50\%\) aproximadamente, la cantidad de personas en ese grupo deben ser 23. Básicamente, si se juegan muchísimos partidos de fútbol once contra once y agregamos al árbitro, en la mitad de esos partidos al menos dos personas en cancha tendrán el mismo día de cumpleaños.