1 Introducción

La mayoría de los experimentos no son de carácter deterministico, es decir, no conocemos de antemano el resultado del mismo, razón por la cual, es necesario medir la posibilidad de ocurrencia de un evento en presencia de incertidumbre. A esta medición se le llama probabilidad.

Además de medir la incertidumbre de un evento, a partir de la probabilidad es posible construir modelos que permitan describir las características de una variable en una población, y a partir de éstos, hacer inferencias sobre los parámetros del modelo con base en los datos de una muestra.

Por lo tanto, resulta de vital importancia el conocimiento de los conceptos básicos de probabilidad, pues los modelos de probabilidad, son la base de la construcción de los intervalos de confianza y de los estadísticos de prueba en el juzgamiento de hipótesis.

2 Objetivos:

Apropiarse de los conceptos previos a la probabilidad como el de experimento aleatorio y espacio muestral.
Conocer, entender y aplicar la definición, características y propiedades de una medida de probabilidad.
Entender y aplicar los teoremas aditivo, multiplicativo, de la probabilidad total, de Bayes y sus aplicaciones.

3 Competencias

En este módulo el estudiante aprenderá los conceptos básicos de la teoría de probabilidad, aprenderá a aplicar dichos conceptos, de tal forma que estará en la capacidad de calcular las probabilidades que le sean solicitadas en su ejercicio profesional.

4 Conceptos preliminares

4.1 Teoría de conjuntos

A continuación una breve descripción de las operaciones entre conjuntos y su notación, dado que son de vital importancia en la teoría de probabilidad.

Sean \(\Omega\) el conjunto universal, \(A\in\Omega\) y \(B\in\Omega\):

Complemento: \(A^c=\Omega-A=\left\lbrace x\in\Omega:x\notin A\right\rbrace\)
Unión: \(A\cup B=\left\lbrace x\in\Omega:x\in A\text{ o }x\in B\right\rbrace\)
Intersección: \(A\cap B=\left\lbrace x\in\Omega:x\in A\text{ y }x\in B\right\rbrace\)
Diferencia: \(A-B=\left\lbrace x\in\Omega:x\in A\text{ y }x\notin B\right\rbrace\)
Leyes de Morgan: \((A\cup B)^c=A^c\cap B^c\) y \((A\cap B)^c=A^c\cup B^c\)

4.2 Conteo

Dado que el cálculo de probabilidades implica contar en algunas situaciones prácticas, a continuación se presentan algunos principios del conteo. En particular vamos a contestar la siguiente pregunta: para \(k<n\), ¿de cuántas formas se pueden seleccionar \(k\) elementos de \(n\)?

4.2.1 Principio multiplicativo del conteo

Sean \(E_1,E_2,\ldots,E_m\) conjuntos (procesos). Si:

\(E_1\) ocurre de \(n_1\) formas
\(E_2\) ocurre de \(n_2\) formas
\(\vdots\)
\(E_m\) ocurre de \(n_m\) formas

entonces, el número de formas en que puede ocurrir \(E_1\cap E_2\cap... E_m\) es \(\prod_{j=1}^{m}n_j\).

4.2.1.1 Ejemplo

En consulta, un médico determina que su paciente debe tomar medicación para dos condiciones, para la primera tiene 3 opciones de medicamentos y para la segunda 5, ¿cuántas posibles prescripciones diferentes puede hacer el médico?

Medicamento 1: \(n_1=3\)
Medicamento 2: \(n_2=5\)

Así, el número de prescripciones es: \(n_1*n_2=3*5=15\).

Nota: al resulado de la multiplicación de los \(n\) primeros enteros se le llama \(n!\), \[1\times 2\times ...\times n=n!\] Por definición \(0!=1\).

4.2.2 Para \(k<n\), ¿de cuántas formas se pueden seleccionar \(k\) elementos de \(n\)?

4.2.2.1 Si el orden importa y no es posible tener repeticiones

La operación resultante se llama permutación sin repetición: \[P^n_k=n\times (n-1)\times ...\times (n-(k-1))=\frac{n!}{(n-k)!}\]

4.2.2.2 Si el orden importa y es posible tener repeticiones

La operación resultante se llama permutación con repetición: \[n^k=n\times n\times....\times n\]

4.2.2.3 Si el orden no importa y no es posible tener repeticiones

La operación resultante se llama combinación:

\[\binom{n}{k} = \frac{n!}{k!(n-k)!}\]

4.2.2.4 Ejemplos

¿De cuantás maneras se puede ordenar la secuencia ATGC? \[P^4_4=\frac{4!}{0!} = 24\]

# permutacion
factorial(4)/factorial(0)

## [1] 24

# lista de posibilidades
library(gtools)
lista <- permutations(n = 4, r = 4, v = c("A", "T", "G", "C"))
head(lista)

##      [,1] [,2] [,3] [,4]
## [1,] "A"  "C"  "G"  "T" 
## [2,] "A"  "C"  "T"  "G" 
## [3,] "A"  "G"  "C"  "T" 
## [4,] "A"  "G"  "T"  "C" 
## [5,] "A"  "T"  "C"  "G" 
## [6,] "A"  "T"  "G"  "C"

dim(lista )

## [1] 24  4

¿Cuántas posibles claves de 3 dígitos se pueden obtener con los números de 1 a 5? \[5^3=125\]

# permutación con repetición
5^3

## [1] 125

# lista de posibilidades
lista <- permutations(n = 5, r = 3, v = 1:5, repeats.allowed = T)
head(lista)

##      [,1] [,2] [,3]
## [1,]    1    1    1
## [2,]    1    1    2
## [3,]    1    1    3
## [4,]    1    1    4
## [5,]    1    1    5
## [6,]    1    2    1

dim(lista)

## [1] 125   3

¿De cuántas formas se pueden seleccionar 3 personas en un grupo de 20? \[\binom{20}{3}=\frac{20!}{3!17!}=1140\]

# combinación
choose(n = 20, k = 3)

## [1] 1140

# otra manera
factorial(20)/(factorial(3)*factorial(17))

## [1] 1140

# lista de posibilidades
lista <- combinations(n = 20, r = 3, v = 1:20)
head(lista)

##      [,1] [,2] [,3]
## [1,]    1    2    3
## [2,]    1    2    4
## [3,]    1    2    5
## [4,]    1    2    6
## [5,]    1    2    7
## [6,]    1    2    8

dim(lista)

## [1] 1140    3

Ejercicios:

En un grupo de 15 hombres y 18 mujeres, ¿de cuántas formas se pueden seleccionar 5 hombres y 6 mujeres?
Determinar cuántos posibles resultados tiene el Baloto.

4.3 Espacio de probabilidad

Para definir un espacio de probabilidad es preciso definir algunos conceptos previamente.

4.3.1 Experimento aleatorio:

Un experimento aleatorio es cualquier experimento que satisface las siguientes condiciones:

Todos los posibles resultados del experimento son conocidos antes de ejecutarlo.
El resultado de cualquier ejecución del experimento no se puede conocer de antemano.

4.3.2 Espacio muestral \(\Omega\)

El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio.

4.3.3 Eventos

Cualquier subconjunto del espacio muestral se llama evento aleatorio.

Cuando un evento tiene un solo elemento se denomina evento elemental o simple.

El conjunto \(\Phi\) se llama evento imposible, que nunca sucede, y el conjunto \(\Omega\) se llama evento seguro, que siempre sucede.

Si \(A\) es un evento y el resultado observado del experimento aleatorio es un elemento de \(A\) significa que el evento \(A\) ha sucedido.

4.3.3.1 Ejemplo

Considere un estudio longitudinal con 3 pacientes.

Experimento: contar el número de pacientes, entre los 3, que desarrollan el desenlace durante el periodo de seguimiento.
Espacio muestral: \(\Omega={0,1,2,3}\).

4.3.4 Medida de probabilidad:

Una medida de probabilidad es una función que le asigna un número entre \(0\) y \(1\) a los eventos de un experimento aleatorio: \[ A\longrightarrow P(A) \] y que satisface:

\(P(A)\geq0\)
\(P(\Omega)=1\)
Si \(A_1, A_2,\ldots\) son eventos mutuamente excluyentes incluidos en \(\Omega\), entonces \[P\left(\bigcup_{i=1}^{\infty}A_i \right)=\sum_{i=1}^{\infty}P(A_i)\]

Observe que la probabilidad de un evento \(A\), denotada con \(P(A)\), es una medida de la incertidumbre relacionada con la posibilidad de la ocurrencia del evento \(A\).

4.3.4.1 Asignación clásica (frecuentista) de probabilidades

Se supone que un experimento aleatorio se repite \(n\) veces y que un evento \(A\) asociado con estos experimentos ocurre exactamente \(k\) veces. Entonces, la frecuencia relativa de \(A\), \(h_n(A)\), se define como la proporción entre la cantidad de veces que ocurre el evento \(A\) y el número total de repeticiones del experimento aleatorio: \[ h_n(A) = \frac{k}{n} \]

La frecuencia relativa de un evento \(A\) correspondiente a un “gran número” de repeticiones de un experimento aleatorio es igual a la probabilidad del evento \(A\), es decir \[ P(A) = \lim_{n\to\infty} h_n(A) \]

La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
Cuanto mayor sea el número de experimentos, tanto mejor será la estimación de la probabilidad.
La validez de esta estimación depende de que las condiciones en que se realiza el experimento sean “idénticas”.

4.3.4.1.1 Ejemplo

Se llevó a cabo un estudio de cohorte cuyo desenlace era una Infección Respiratoria Aguda (IRA), donde se evaluaron 1,542 pacientes, de los caules 326 tuvieron IRA. ¿Cuál es la probabilidad de desarrollar IRA?

Sea \(A\) el evento “desarrollar IRA”. Entonces: \[P(A)=\frac{326}{1542}=0.2114\] En particular, dado que es un estudio de cohorte, a dicha probabilidad se le llama riesgo, lo que quiere decir que el riesgo de desarrollar IRA es del \(21.14\%\).

4.3.4.2 Algunas propiedades de una medida de probabilidad:

Sea \(\Omega\) un espacio muestral no vacío, \(A\) y \(B\) eventos aleatorios incluidos en \(\Omega\) y \(P(.)\) una medida de probabilidad sobre \(\Omega\). Entonces se satisfacen las siguientes propiedades:

\(P(\phi)=0\)
\(P(A^c)=1-P(A)\)
Si \(A\subset B\), entonces \(P(A)\leq P(B)\)
\(P(A-B)=P(A)-P(A\cap B)\)
\(P(A\cup B)=P(A)+P(B)-P(A\cap B)\)

4.3.4.2.1 Ejemplo

Sean \(A\), \(B\) y \(C\) eventos tales que \(P(A) = 0.50\), \(P(B) = 0.26\), \(P(C) = 0.55\), \(P(A \cup B) = 0.61\), \(P(A \cap C) = 0.25\), \(P(B \cap C) = 0.15\) y \(P(A \cap B \cap C) = 0.05\). Con base en esta información, calcular las siguientes probabilidades: \(P(A \cup B)\), \(P\left(A \cap C^C\right)\), \(P\left(A^C \cup C\right)\).

Aplicando las propiedades se obtiene que \[ P(A \cup B) = P(A) + P(B) - P(A \cap B) = 0.50 + 0.26 - 0.15 = 0.61. \] Además, \(P(A)=P(A\cap C)+P\left(A \cap C^C\right)\) de donde \[\begin{equation*} P\left(A \cap C^C\right) = P(A) - P(A \cap C) = 0.50 - 0.25 = 0.25. \end{equation*}\] Por otra parte, utilizando las leyes de Morgan se concluye que \[\begin{equation*} P\left(A^C \cup C\right) = 1 - P\left(\left(A^C \cup C\right)^C\right) = 1 - P\left(A \cap C^C\right) = 1 - 0.25 = 0.75. \end{equation*}\]

5 Teoremas básicos de probabilidad

5.1 Teorema aditivo

El teorema aditivo está relacionado con la probabilidad de la unión de eventos, así:

\[P\left(\bigcup_{i=1}^{m} A_i\right)=\sum_{i=1}^{m}P(A_i)-\sum_{i>j}P(A_i\cap A_j)+\sum_{i>j>k}P(A_i\cap A_j\cap A_k)-\ldots-(-1)^{m-1}P\left(\bigcap_{i=1}^{m} A_i \right)\]

En particular, para \(m=3\):

\[P(A_1\cup A_2\cup A_3)=P(A_1)+P(A_2)+P(A_3)-P(A_1\cap A_2)-P(A_1\cap A_3)-P(A_2\cap A_3)+P(A_1\cap A_2\cap A_3)\]

5.2 Probabilidad condicional

La probabilidad condicional es una medida de probabilidad definida por:

\[P(A_i\mid A_j)=\frac{P(A_i\cap A_j)}{P(A_j)}\] siempre que \(P(A_j)\neq 0\).

Dado que la probabilidad condicional también constituye una medida de probabilidad, cumple las propiedades de una medida de probabilidad. Por ejemplo:

\(P(\phi\mid A_j)=0\)
\(P(A_i^c\mid A_j)=1-P(A_i\mid A_j)\)
\(P(A_i\cup A_k\mid A_j) = P(A_i\mid A_j) + P(A_k\mid A_j) - P(A_i\cap A_k\mid A_j)\)

5.3 Teorema multiplicativo

El teorema aditivo está relacionado con la probabilidad de la intersección de eventos.

En general, se tiene que: \[P(A_i\cap A_j)=P(A_i\mid A_j)\,P(A_j)\]
Si \(A_i\) y \(A_j\) son eventos independientes, entonces: \[P(A_i\cap A_j)=P(A_i)\,P(A_j)\]

5.4 Teorema de la probabilidad total

El terorema de la probabilidad total se utiliza cuando se quiere encontrar la probabilidad de un evento que se encuentra “repartido” en las partes de una patición.

Sea \(E_1, E_2,\ldots, E_m\) una partición de \(\Omega\), es decir, \(E_1, E_2,\ldots, E_m\) es una colección de subconjuntos de \(\Omega\) tales que: \[\bigcup_{i=1}^m E_i=\Omega\] \[E_i\cap E_j=\phi, \qquad i\neq j\] Entonces, la probabilidad de ocurrencia de un evento \(A\) se reparte en la partición de la siguiente forma:

\[\begin{align*} P(A)&=P(A\cap E_1)+P(A\cap E_2)+\ldots+P(A\cap E_m)\\ &=P(A\mid E_1)P(E_1)+P(A\mid E_2)P(E_2)+\ldots+P(A\mid E_m)P(E_m)\\ &=\sum_{i=1}^{m}P(A\mid E_i)P(E_i) \end{align*}\]

5.5 Teorema de Bayes

El terorema de Bayes es ampliamente utilizado en epidemiología, especialmente en la evaluación de las características de pruebas diagnósticas. En el teorema parte de la probabilidad a priori de la ocurrencia de un evento, \(P(E_k)\), para calcular su probabilidad a posteriori, \(P(E_k\mid A)\).

\[\begin{align*} P(E_k\mid A)&=\frac{P(A\mid E_k)P(E_k)}{\sum_{i=1}^{m}P(A\mid E_i)P(E_i)} \end{align*}\]

5.5.1 Ejemplo (Pruebas diagnósticas):

Es bien sabido que si se obtiene un resultado positivo en una prueba diagnóstica, éste no asegura que el paciente tenga la enfermedad, del mismo modo, un resultado negativo no asegura que el paciente no tenga la enfermedad. Es por ésto que se deben medir las características operativas de las pruebas diagnósticas, las cuáles se definen como: \[Sensibilidad=S=P(P\mid E)\] \[Especificidad=E=P(P^c\mid E^c)\]

dodne \(P\) = “la prueba da resultado positivo” y \(E\) = “el paciente tiene la enfermedad”.

En una ciudad se llevan a cabo pruebas para detectar cierta enfermedad. El 1 por ciento de las personas sanas son registradas como enfermas, el 0.1 por ciento está realmente enfermo y el 90 por ciento de los enfermos son registrados como tales. Se desea calcular la probabilidad de que una persona seleccionada al azar y reportada como enferma realmente lo esté.

Así, los datos del problema se pueden traducir de la siguiente forma:

El 1 por ciento de las personas sanas son registradas como enfermas:

\(P(P\mid E^c)=0.01\)
El 0.1 por ciento está realmente enfermo: \(P(E)=0.001\)
El 90 por ciento de los enfermos son registrados como tales:\(P(P\mid E)=0.9\)
Se desea calcular la probabilidad de que una persona seleccionada al azar y reportada como enferma realmente lo esté: \(P(E\mid P)=?\)

\[P(E\mid P)=\frac{P(P\mid E)P(E)}{P(P\mid E)P(E)+P(P\mid E^c)P(E^c)}=\frac{0.9\times0.001}{0.9\times0.001+0.1\times0.999}\]

6 Ejercicios

Se ha observado que los hombres y las mujeres reaccionan de una manera diferente en ciertas circunstancias; el \(70\) por ciento de las mujeres reaccionan positivamente mientras que el porcentaje de los hombres es sólo del \(40\) por ciento. Se sometió a prueba a un grupo de 20 personas 15 mujeres y 5 hombres y se les pidió llenar un cuestionario para descubrir sus reacciones. Una respuesta escogida al azar de las 20 resultó negativa. ¿Cuál es la probabilidad de que haya sido contestada por un hombre?.
Un médico aplica una prueba diagnóstica a alumnos de un colegio para detectar una enfermedad cuya incidencia sobre una población de niños es del 10 por ciento. La sensibilidad del test es del 80 por ciento y la especificidad del 75 por ciento.

¿Cuál es la probabilidad de que un paciente tenga un resultado positivo?
Calcular la probabilidad de que prueba suministre un resultado incorrecto.

Una urna A contiene 5 bolas blancas y 7 bolas negras. Una urna B contiene 3 bolas blancas y 12 bolas negras. Se lanza una moneda corriente, si el resultado es cara, entonces se extrae una bola de la urna A, si el resultado es sello entonces se extrae una bola de la urna B. Supóngase que una bola blanca es seleccionada. ¿A qué es igual la probabilidad de que el resultado del lanzamiento de la moneda haya sido sello?.

7 Bibliografía

Barón F.J. Bioestadística. Universidad de Málaga. http://www.bioestadistica.uma.es/baron/bioestadistica.pdf
Soto O, Franco D. Fundamentos conceptuales de estadística. Universidad Nacional de Colombia. Notas de clase.
Blanco L. Probabilidad. Universidad Nacional de Colombia.

Probabilidad

Lina Buitrago, labuitragor@unal.edu.co

Juan Sosa, jcsosam@unal.edu.co