Introducción

La máquina de cafés de la escuela de informática falla con cierta regularidad. Unos estudiantes de doctorado de la misma escuela, cansados de malgastar monedas en la máquina, deciden poner fin a dicha situación escribiendo una reclamación a la empresa. Para escribir esa carta necesitan calcular cual es la probabilidad de fallo que tiene la máquina de café. O dicho de otra forma, cual sería la proporción de cafés derramados a la larga.

Para calcular esta proporción deciden poner la máquina a prueba: pedirán 100 cafés y anotarán el número de cafés que la máquina tira al suelo. Un total de 7 cafés derramados. En resumen, una propoción del \(7\%\). Sin embargo, no todos quedaron contentos con dicho resultado. Algunos decían que les parecía demasiado alto y sin embargo otros aseguraban que les parecía demasiado bajo. Cada uno, desde su experiencia personal con la máquina, había detectado inconscientemente una proporción de fallo ligeramente diferente. Mientras unos decían que un \(3\%\) sería la cifra más verosímil otros tantos aseguraban que lo más apropiado sería un \(11\%\).

¿Cómo se puede explicar ésto?¿Por qué la misma máquina había generado distintas impresiones en distintos compañeros?¿Representa ese \(7\%\) la verdadera tasa de fallos de la máquina o puede ser que la verdadera tasa de fallo es otro valor y hemos obtenido ese \(7\%\) solo por pura aleatoriedad?¿Como podríamos mejorar nuestra estimáción de la verdadera tasa de errores?

Modelando la máquina de cafés

Los cafés de Bernouilli

Dispuestos a salir de dudas, pensaron que sería apropiado realizar un estudio en profundidad. En primer lugar decidieron simplificar el funcionamiento de la máquina al máximo, estableciendo las siguientes hipótesis o suposiciones sobre el funcionamiento de la máquina.

  • La máquina tiene una probabilidad p de cometer un error al servir un café.
  • La probabilidad p de cometer un error permanece constante en el tiempo (al menos en el tiempo que llevaban haciendo el doctorado)
  • Cuando la máquina sirve un café bien o mal, no influye en la probabilidad de que el siguiente café esté bien o mal. Los cafés son independientes.

Es decir, el resultado de servir un café es un fenómeno aleatorio con probabilidad p de servirlo mal y probabilidad q = 1 - p de servirlo bien. Además esta probabilidad no cambia con el tiempo y además la probabiidad de cada café es totalmente independiente del anterior. Al resultado “servir mál el café” le asignaremos un “1” y “servir bien el café”" le asignaremos un “0”. Con lo cual, los posibles resultados del experimento vendrán soportados por el conjunto \(x = \left\{0,1\right\}\)

Al cumplirse las condiciones de independencia y estar idénticamente distribuiodas por la distribución que genera el parámetro p, podemos decir sin ningún tipo de dudas que se trata de un experimento de Bernouilli. Siendo \(X_i\) la variable aleatoria que representa el café número \(i\), podremos expresar todo lo que hemos dicho de esta forma:

\[prob\left(X_i = x_i \right) = p^{x_i}(1-p)^{1-x_i}\] No hemos dicho nada raro. Solo hemos condensado toda la información en una linea. Si \(x_i = 1\) entonces tendremos: \(prob\left(X_i = 1 \right) = p^1(1-p)^{1-1} = p\) y en caso contrario, si \(x_i = 0\) tendremos que \[prob\left(X_i = 0 \right) = p^0(1-p)^{1-0} = 1-p\]

Al pedir 100 cafés, hemos realizado el experimento de Bernouilli 100 veces, y esto se traduce en:

\[X = \left\{ X_1, X_2, X_3...X_{100}\right\} \; \forall X_i \sim Bern(p)\]

Cafés binomiales:

Dada una colección de cafés aleatorias de tamaño N, estamos interesados en el número de cafés mal servidos, esto es: \(Y = \sum_i^N{X_i}\). Como vemos \(Y\) es una nueva variable aleatoria y se soporta en un espacio completamente diferente al de \(X\). Si \(X \in \left\{ 0, 1\right\}\) ahora \(Y \in \left\{ 0, 1, 2, ..., N\right\}\). Ahora nos interesaría poder calcular la probabilidad de que \(Y = y\). Es decir, que la variable aleatoria \(Y\) resulte en el valor \(y\). (Nota: Permítanme abusar un poco de la notación.A veces me referiré a y o x como un resultado de la variable aleatoria, y a veces como al conjunto de todos los valores posibles.)

Probabilidad de una configuración de cafés en concreto

Nuestra colección de cafés están independientemente e idénticamente distribuidos, esto es \(X_i \sim Be(p)\). Con lo cual, podemos decir que la probabilidad de una configuración determinada se puede calcular simplemente multiplicando sus probabilidades. Supongamos que obtenemos esta configuración en las 5 primeras variables aleatorias: \(X_1 = 1, X_2 = 0, X_3 = 1, X_4 = 0, = X_3 = 0\). La probabilidad de esta configuración será \(prob\left\{X_1 = 1, X_2 = 0, X_3 = 1, X_4 = 0, X_5 = 0 \right\} = pqpqq = p^2*(1-p)^3\).

Como vemos, ambos exponentes están en función de nuestra nueva variable aleatoria \(Y\). Es decir: \(Y = \sum_{i =1}^{N = 5}x_i = 1 + 0 + 1 + 0 + 0 = 2\) y por oposición \(N-Y = \sum_{i =1}^{N = 5}x_i = 1 + 0 + 1 + 0 + 0 = 5-2 = 3\). Por otro lado, cuando tenemos una muestra de cafés, suele ser muy útil dejar el número de cafés derramados en función de la proporción de la propia muestra, y del tamaño de la muestra. Es decir: \(Y = \sum_{i =1}^{N = 5}x_i = 1 + 0 + 1 + 0 + 0 = 2 = \frac{2}{5}* 5\) generalizando \(Y = \frac{\sum_i^N{X_i}}{N}N = \bar{x}n\). Por ello podemos generalizar y decir que para una muestra de tamaño \(n\) tendremos que:

\[prob\left\{X_1 = x_1, X_2 = x_2, ..., X_n = x_n\right\} = \prod_{i = 1}^{n}prob(X_i = x_i) = p^{\sum_i^n{x_i}}(1 - p)^{n- \sum_i^n{x_i}} = p^{y}(1 - p)^{n - y}= p^{\bar{x}n}(1 - p)^{n - \bar{x}n}\]

Resumiendo y condensando:

\[prob\left\{X_1 = x_1, X_2 = x_2, ..., X_n = x_n\right\} = p^{y}(1 - p)^{n - y} = p^{\bar{x}n}(1 - p)^{n - \bar{x}n}\] ###Probabilidad de una configuración de cafés en concreto

Ahora bien, ¿cuál será la probabilidad de que de 100 cafés, se derramen 2, es decir \(Y = 2\)? Nos bastará con tener en cuenta a todas las configuraciones posibles tal que \(Y = 2\). Como la probabilidad de cada una de estas vendrá dado por \(p^2*(1-p)^3\), entonces la probabilidad de \(Y = 2\) se podrá expresar como:

\[prob\left\{Y = 2\right\} = C*p^2(1-p)^3\]

donde \(C\)es representa el número configuraciones posibles en las que habrían dos cafés en el suelo (por ejemplo los dos primeros cafés al suelo, y los 3 restantes bien servidos. El primero y el último al suelo. Los dos últimos al suelo, etc. etc.). Calcular esta \(C\) es más sencillo de lo que parece, pero nos extenderíamos demasiado si lo explicaramos. Se puede comprobar con facilidad que el número de combinaciones que generan \(Y = 2\) es:

\[C = \binom{5}{2} = \frac{5!}{2!(5-2)!} = 10\] Quedando : \[prob\left\{Y = 2\right\} = 10*p^2(1-p)^3\] Visto todo esto, podemos generalizar el fenómeno aleatorio que gobierna nuestra experimento sobre la máquina de cafés de la siguiente forma: \[prob\left\{Y = y\right\} = \binom{n}{y} p^{y}(1 - p)^{n - y}\]

Como vemos, esta expresión distribuye probabilidad sobre el soporte y y además, dado un valor y del cual queramos su probabilidad, ésta quedará absolutamente determinada por los valores n y p. Por ello se suele hablar de una Binomial de parámetros p y n. Dicho de otra forma:

\[Y \sim Binom(p, n) \] ## Problema inverso de la probabilidad: Dado un valor \(p\) y un valor \(N = n\), queda determinada la probabilidad de que \(Y = y\). ¿Pero que sucede con el problema inverso? Es decir, dado \(Y = y\) y \(N = n\) queda determinado \(p\)?

