1 Introducción

La mayoría de los experimentos no son deterministicos, es decir, no conocemos de antemano el resultado del mismo, razón por la cual, es necesario medir la ocurrencia de un evento en presencia de dicha incertidumbre. A esta medición se le llama probabilidad.

La probabilidad es inherente al ser humano, aunque pase por desapercibido el concepto como tal. Por ejemplo, cuando salimos de casa y miramos el cielo y decimos: ¿hoy va a llover?, ésto porque tenemos un conocimiento a priori de lo que sucede de acuerdo a como veamos el cielo, es decir, de acuerdo a ese conocimiento le asignamos un valor a la incertidumbre.

Otro ejemplo ocurre en la práctica médica, cuando un paciente se acerca a su médico y le cuenta sus síntomas, de acuerdo a ellos el clínico piensa en un posible listado de enfermedades que pueden estar relacionadas con dichos síntomas y a su vez piensa ¿cuál considera más probable?, dicha medición de la incertidumbre va cambiando de acuerdo a los resultados de las pruebas diagnósticas utilizadas. En este ejemplo, el clínico, sin ser consciente de ello, está utlizando las leyes de la probabilidad, incluyendo las de la probabilidad condicional.

Por otro lado, además de medir la incertidumbre de un evento, a partir de la probabilidad es posible determinar modelos que permitan describir las características de una variable en la población y a partir de éstos, hacer inferencias sobre un parámetro de interés con base en una muestra. Por lo tanto, resulta de vital importancia el conocimiento de los conceptos básicos de probabilidad, pues los modelos de probabilidad, son la base de la construcción de los intervalos de confianza y de los estadísticos de prueba en el juzgamiento de hipótesis.

2 Objetivos:

  • Apropiarse de los conceptos previos a la probabilidad: experimento aleatorio, espacio muestral y sigma álgebra.

  • Conocer, entender y aplicar la definición, características y propiedades de una medida de probabilidad.

  • Entender y aplicar los teoremas aditivo, multiplicativo, de Bayes y teorema de la probabilidad total y sus aplicaciones en Epidemiología (Riesgos, sensibilidad, especificidad).

3 Competencias

En este módulo el estudiante aprenderá los conceptos básicos de la teoría de probabilidad, aprenderá a aplicar dichos conceptos, de tal forma que al finalizar estará en la capacidad de calcular las probabilidades que le sean solicitadas en su ejercicio como epidemiologo.

4 Conceptos preliminares

4.1 Teoría de conjuntos

A continuación una breve descripción de las operaciones entre conjuntos y su notación, dado que son de vital importancia en la teoría de probabilidad. Sean \(\Omega\) el conjunto universal, \(A\in\Omega\) y \(B\in\Omega\):

  1. Complemento: \(A^c=\Omega-A=\left\lbrace x\in\Omega:x\notin A\right\rbrace\)
  2. Unión: \(A\cup B=\left\lbrace x\in\Omega:x\in A\text{ o }x\in B\right\rbrace\)
  3. Intersección: \(A\cap B=\left\lbrace x\in\Omega:x\in A\text{ y }x\in B\right\rbrace\)
  4. Diferencia: \(A-B=\left\lbrace x\in\Omega:x\in A\text{ y }x\notin B\right\rbrace\)
  5. Leyes de Morgan: \[(A\cup B)^c=A^c\cap B^c\] \[(A\cap B)^c=A^c\cup B^c\]

4.2 Conteo

Dado que el cálculo de probabilidades implica contar, veremos algunos de los principios del conteo, en particular vamos a contestar la siguiente pregunta: ¿De cuántas formas se pueden seleccionar \(k\) elementos de \(n\) (\(k<n\))?

4.2.1 Principio multiplicativo del conteo

Si: -\(E_1\) ocurre de \(n_1\) formas -\(E_2\) ocurre de \(n_2\) formas \(\vdots\) -\(E_m\) ocurre de \(n_m\) formas

el número de formas en que puede ocurrir \(E_1\cap E_2\cap... E_k\) es \(\prod_{i=1}^{m}n_i\)

4.2.1.1 Ejemplo

En consulta, un médico determina que su paciente debe tomar medicación para dos condiciones, para la primera tiene 3 opciones de medicamentos y para la segunda 5, ¿cuántas posibles prescripciones diferentes puede hacer el médico?

  • Medicamento 1: \(n_1=3\)
  • Medicamento 2: \(n_2=5\)

Así, el número de prescripciones es: \(n_1*n_2=3*5=15\).

Nota: Al resulado de la multiplicación de los \(n\) primeros enteros se le llama \(n!\): \[1\times 2\times ...\times n=n!\] Por definición \(0!=1\).

4.2.2 ¿De cuántas formas se pueden seleccionar \(k\) elementos de \(n\) (\(k<n\))?

4.2.2.1 Si el orden importa y no es posible tener repeticiones

En este caso a la operación resultante se le llama permutación sin repetición:

\[n\times (n-1)\times ...\times (n-(k-1))=\frac{n!}{(n-k)!}=P^n_k\]

4.2.2.2 Si el orden importa y es posible tener repeticiones

La operación resultante se le llama permutación con repetición: \[n\times n\times....\times n=n^k\]

4.2.2.3 Si el orden no importa y no es posible tener repeticiones

La operación resultante se le llama combinación:

\[\frac{n!}{k!(n-k)!}=\binom{n}{k}\]

4.2.2.4 Ejemplos

  1. ¿Cuántas “palabras” diferentes se pueden escribir con las letras de la palabra MISSISSIPPI?

\[\frac{11!}{4!4!2!}\]

## [1] 34650
  1. ¿Cuántas posibles claves de 3 dígitos pueden obtenerse con los números de 1 a 5?

\[P^5_3=\frac{5!}{2!}\]

## [1] 60
##      [,1] [,2] [,3]
## [1,]    1    2    3
## [2,]    1    2    4
## [3,]    1    2    5
## [4,]    1    3    2
## [5,]    1    3    4
## [6,]    1    3    5
## [1] 60
  1. ¿De cuántas formas se pueden seleccionar 3 personas en un grupo de 20? \[\binom{20}{3}=\frac{20!}{3!17!}\]
## [1] 1140
##      [,1] [,2] [,3]
## [1,]    1    2    3
## [2,]    1    2    4
## [3,]    1    2    5
## [4,]    1    2    6
## [5,]    1    2    7
## [6,]    1    2    8
## [1] 1140

Ejercicios: - Determine cuántos posibles resultados tiene el baloto - En un grupo de 15 hombres y 18 mujeres, ¿de cuántas formas se pueden seleccionar 5 hombres y 6 mujeres?

4.3 Espacio de probabilidad

Para definir un espacio de probabilidad es preciso definir algunos conceptos:

4.3.1 Experimento aleatorio:

Un experimento aleatorio es aquel en el que no se puede anticipar con exactitud su resultado.

4.3.2 Espacio muestral (\(\Omega\)):

Es el conjunto de todos los posibles resultados de un experimento.Ejemplo: En un estudio de cohorte:

\(E\):Determinar si un paciente desarrolla o no el desenlace.\ \(\Omega\)=$S, N$, dónde \(S\) significa que desarrolla el desenlace y \(N\) que no desarrolla el desenlace.

4.3.3 \(\sigma\)-álgebra:

Una \(\sigma\)-álgebra, \(\mathcal{A}\), es una colección de subconjuntos de \(\Omega\) que satiface:

  1. \(\Omega\in\mathcal{A}\)
  2. Si \(A\in\mathcal{A}\), entonces \(A^c\in\mathcal{A}\)
  3. Si \(A_1,A_2,...\in\mathcal{A}\), entonces \(\cup_{i=1}^{\infty}A_i\in\mathcal{A}\)

Los elementos de la \(\sigma\)-álgebra,\(A\in\mathcal{A}\), son llamados eventos.

4.3.3.0.1 Ejemplos:
  • \(\mathcal{A}_1=\left\lbrace \Omega,\phi\right\rbrace\) es una \(\sigma\)-álgebra, llamada \(\sigma\)-álgebra trivial.

  • \(\mathcal{A}_2=\mathcal{P}(\Omega)\), donde \(\mathcal{P}(\Omega)\) representa al conjunto de todos los posibles subconjuntos de \(\Omega\).

4.3.3.1 Ejemplo:

Supongamos que estamos en un estudio longitudinal con 3 pacientes (el ejemplo es sólo para entender el concepto pues ésto no tendría sentido en la vida práctica):

  • \(E\): Contar el número de pacientes, entre los 3, que desarrollan el desenlace durante el periodo de seguimiento.
  • \(\Omega={0,1,2,3}\)

  • \(\mathcal{P}(\Omega)\) en este experimento está dada por la colección:

    \[\left\lbrace \Omega,\phi,\left\lbrace 0 \right\rbrace,\left\lbrace 1 \right\rbrace,\left\lbrace 2 \right\rbrace,\left\lbrace 3 \right\rbrace,\left\lbrace 0,1 \right\rbrace, \left\lbrace 0,2 \right\rbrace,\left\lbrace 0,3 \right\rbrace,\left\lbrace 1,2 \right\rbrace,\left\lbrace 1,3 \right\rbrace, \left\lbrace 2,3 \right\rbrace,\left\lbrace 0,1,2 \right\rbrace,\left\lbrace 0,1,3 \right\rbrace,\left\lbrace 0,2,3 \right\rbrace,\left\lbrace 1,2,3 \right\rbrace \right\rbrace \]

    Por otro lado, \[\mathcal{A}_1=\left\lbrace \phi,\Omega,\left\lbrace 0,1 \right\rbrace,\left\lbrace 1,2,3 \right\rbrace\right\rbrace\]

    no es una \(\sigma\)-álgebra, pues por ejemplo \(\left\lbrace 0,1 \right\rbrace^c\notin\mathcal{A}_1\)

4.3.4 Medida de probabilidad:

Una medida de probabilidad es una función que le asigna un número entre \(0\) y \(1\) a los eventos de la \(\sigma\)-álgebra: \[\begin{align*} P:\mathcal{A}&\longrightarrow [0,1]\\ A&\longrightarrow P(A):\text{Probabilidad del evento } A \end{align*}\] y que satisface:

  • \(P(A)>0\), \(A\in\mathcal{A}\).
  • \(P(\phi)=0\).
  • Dados los eventos \(A_1,A_2,...\in\mathcal{A}\), tales que \(A_i\cap A_j=\phi\), \[P\left(\cup_{i=1}^{\infty}A_i \right)=\sum_{i=1}^{\infty}P(A_i) \]

4.3.4.1 Definición clásica de probabilidad

Si un experimento tiene \(n\) posibles resultados y \(n_j\) favorecen el evento \(A_j\),

\[P(A_j)=\frac{n_j}{n}=\frac{\text{casos favorables}}{\text{casos posibles}}\]

es una medida de probabilidad.(Se deja al estudiante la verificación)

4.3.4.1.1 Ejemplo

Suponga que se llevó a cabo un estudio de cohorte cuyo desenlace era IRA (Infección Respiratoria Aguda), del total de 1542 pacientes, 326 tuvieron IRA. ¿Cuál fue la probabilidad de desarrollar IRA? Sea \(A\) el evento: “desarrollar IRA”, entonces:

\[P(A)=\frac{326}{1542}=0.2114\] En particular, dado que es un estudio de cohorte, a dicha probabilidad se le llama riesgo, es decir que el riesgo de desarrollar IRA fue del \(21.14\%\).

4.3.4.2 Espacio de probabilidad:

Un espacio de probabilidad se conforma por la terna conformada por el espacio muestral, la \(\sigma\)-álgebra y la medida de probabilidad \((\Omega, \mathcal{A},P)\)

Nota: En general, se trabaja sobre el espacio de probabilidad Laplaciano, el en cuál \(\mathcal{A}=\mathcal{P}(\Omega)\) y \(P\) corresponde a la definición clásica de probabilidad.

4.3.4.3 Propiedades de una medida de probabilidad:

Sea \((\Omega, \mathcal{A},P)\) un espacio de probabilidad y \(A, B\in\mathcal{A}\), se satisfacen:

  • \(P(\Omega)=1\)
  • \(P(A^c)=1-P(A)\)
  • \(P(A-B)=P(A)-P(A\cap B)\)
  • \(P(A\cup B)=P(A-B)+P(A\cap B)+P(B-A)=P(A)+P(B)-P(A\cap B)\)
  • Si \(A\subset B\), entonces \(P(A)\leq P(B)\)
  • \(P(A\cup B)\leq P(A)+P(B)\)

5 Teoremas básicos de probabilidad

Sean \((\Omega, \mathcal{A},P)\) un espacio de probabilidad y \(A_1,A_2,...\in\mathcal{A}\).

5.1 Teorema aditivo

El teorema aditivo está relacionado con la probabilidad de la unión de eventos, así:

\[P\left(\bigcup_{i=1}^{m} A_i\right)=\sum_{i=1}^{m}P(A_i)-\sum_{i>j}P(A_i\cap A_j)+\sum_{i>j>k}P(A_i\cap A_j\cap A_k)-...-(-1)^{m-1}P\left(\bigcap_{i=1}^{m} A_i \right)\]

En particular, para \(m=3\):

\[P(A_1\cup A_2\cup A_3)=P(A_1)+P(A_2)+P(A_3)-P(A_1\cap A_2)-P(A_1\cap A_3)-P(A_2\cap A_3)+P(A_1\cap A_2\cap A_3)\]

5.2 Teorema multiplicativo

El teorema aditivo está relacionado con la probabilidad de la intersección de eventos, así:

  • Si \(A_1\) y \(A_2\) son eventos independientes: \[P(A_1\cap A_2)=P(A_1)P(A_2)\]

  • Si no son independientes: \[P(A_1\cap A_2)=P(A_1)P(A_2|A_1)\] dónde \(P(A_2|A_1)\), es la probabilidad condicional del evento \(A_2\) dado que es \(A_1\), es decir es la proporción de elementos que son \(A_1\) entre los elementos que son \(A_2\).

5.3 Probabilidad condicional

La probabilidad condicional es una medida de probabilidad definida por:

\[P(A_j|A_i)=\frac{\text{casos que son }A_j\text{y }A_i}{\text{casos que son }A_i}=\frac{P(A_i\cap A_j)}{P(A_i)}\]

Por ser una medida de probabilidad cumple las siguientes propiedades:

  • \(P(A_j^c|A_i)=1-P(A_j|A_i)\)
  • \(P(\phi|A_i)=0\)
  • \(P(A_j\cup A_k|A_i)\)

5.4 Teorema de la probabilidad total

El terorema de la probabilidad total se utiliza cuando se quiere encontrar la probabilidad de un evento que se encuentra repartido en las partes de una patición. Sea \(E_1, E_2,..., Em\) una partición de \(\Omega\), es decir, \(E_1, E_2,..., Em\) es una colección de subconjuntos de \(\Omega\) tales que: \[\bigcup_{i=1}^m E_i=\Omega\] \[E_j\cap E_k=\phi, j\neq k\]

Entonces, la probabilidad de ocurrencia de un evento \(A\) se reparte en la partición de la siguiente forma:

\[\begin{align*} P(A)&=P(A\cap E_1)+P(A\cap E_2)+...+P(A\cap E_m)\\ &=P(A|E_1)P(E_1)+P(A|E_2)P(E_2)+...+P(A|E_m)P(E_m)\\ &=\sum_{i=1}^{m}P(A|E_i)P(E_i) \end{align*}\]

5.5 Teorema de Bayes

El terorema de Bayes es ampliamente utilizado en epidemiología, especialmente en la evaluación de las características de pruebas diagnósticas. En el teorema parte de la probabilidad a priori de la ocurrencia de un evento, \(P(E_k)\), para calcular su probabilidad a posteriori, \(P(E_k|A)\).

\[\begin{align*} P(E_k|A)&=\frac{P(A|E_k)P(E_k)}{\sum_{i=1}^{m}P(A|E_i)P(E_i)} \end{align*}\]

5.5.1 Ejemplo (Pruebas diagnósticas):

Es bien sabido que si se obtiene un resultado positivo en una prueba diagnóstica, éste no asegura que el paciente tenga la enfermedad, del mismo modo, un resultado negativo no asegura que el paciente no tenga la enfermedad. Es por ésto que se deben medir las características operativas de las pruebas diagnósticas, las cuáles se definen como: \[Sensibilidad=S=P(P|E)\] \[Especificidad=E=P(P^c|E^c)\]

con, \(P\):la prueba da resultado positivo, \(E\): el paciente tiene la enfermedad.

En una ciudad se llevan a cabo pruebas para detectar cierta enfermedad. El 1 por ciento de las personas sanas son registradas como enfermas, el 0.1 por ciento está realmente enfermo y el 90 por ciento de los enfermos son registrados como tales. Se desea calcular la probabilidad de que una persona seleccionada al azar y reportada como enferma realmente lo esté.

Sean los eventos: \(P\):la prueba da resultado positivo, \(E\): la persona tiene la enfermedad. Así, los datos del problema se pueden traducir de la siguiente forma:

El 1 por ciento de las personas sanas son registradas como enfermas: \(P(P|E^c)=0.01\)\ El 0.1 por ciento está realmente enfermo: \(P(E)=0.001\)\ El 90 por ciento de los enfermos son registrados como tales:\(P(P|E)=0.9\)\ Se desea calcular la probabilidad de que una persona seleccionada al azar y reportada como enferma realmente lo esté: \(P(E|P)=?\)

\[P(E|P)=\frac{P(P|E)P(E)}{P(P|E)P(E)+P(P|E^c)P(E^c)}=\frac{0.9\times0.001}{0.9\times0.001+0.1\times0.999}\]

6 Ejercicios

  1. Se ha observado que los hombres y las mujeres reaccionan de una manera diferente en ciertas circunstancias; el \(70\)por ciento de las mujeres reaccionan positivamente mientras que el porcentaje de los hombres es sólo del \(40\) por ciento. Se sometió a prueba a un grupo de 20 personas 15 mujeres y 5 hombres y se les pidió llenar un cuestionario para descubrir sus reacciones. Una respuesta escogida al azar de las 20 resultó negativa. ¿ Cuál es la probabilidad de que haya sido contestada por un hombre?.

  2. Un médico aplica una prueba diagnóstica a 10 alumnos de un colegio para detectar una enfermedad cuya incidencia sobre una población de niños es del 10 por ciento. La sensibilidad del test es del 80 por ciento y la especificidad del 75 por ciento.
  • ¿Cuál es la probabilidad de que un paciente tenga un resultado positivo?
  • Calcular la probabilidad de que prueba suministre un resultado incorrecto.
  • ¿Cuál es la probabilidad de que exactamente a cuatro personas le dé un resultado positivo?
  • Si en la muestra hay cuatro personas a las que el test le da positivo, ¿cuál es la probabilidad de que entre éstas, exactamente dos estén sanas?
  1. Una urna A contiene 5 bolas blancas y 7 bolas negras. Una urna B contiene 3 bolas blancas y 12 bolas negras. Se lanza una moneda corriente, si el resultado es cara, entonces se extrae una bola de la urna A, si el resultado es sello entonces se extrae una bola de la urna B. Supóngase que una bola blanca es seleccionada. ¿A qué es igual la probabilidad de que el resultado del lanzamiento de la moneda haya sido sello?.

  2. Ejercicios propuestos para estudiar:Barón López F.J. Bioestadística. Universidad de Málaga. http://www.bioestadistica.uma.es/baron/bioestadistica.pdf. Capítulo 4.

7 Bibliografía