5.1 Introducción

La intersección de dos o más eventos es frecuentemente de interés para un experimentador. Por ejemplo, un jugador de black-jack está interesado en el evento de sacar un as y una “ figura” de una baraja de 52 cartas. Un biólogo que observa el número de animales que sobreviven de una camada se preocupa por la intersección de estos eventos:

A: la camada contiene \(n\) animales. B: sobreviven y animales.

Del mismo modo, observar la estatura y peso de una persona representa la intersección de un par específico de eventos asociado con medidas de estatura-peso.

Lo que es más importante para expertos en estadística son las intersecciones que se presentan en el curso de tomar muestras. Suponga que \(Y_1, Y_2, . . . , Y_n\) denota los resultados de \(n\) intentos sucesivos de un experimento. Por ejemplo, esta secuencia podría representar los pesos de \(n\) personas o las medidas de \(n\) características físicas para una sola persona. Un conjunto específico de resultados o mediciones muestrales puede ser expresado en términos de la intersección de los \(n\) eventos (\(Y_1 = y_1), (Y_2 = y_2), . . . , (Y_n = y_n)\), que denotaremos como \((Y_1 =y_1,Y_2 =y_2,...,Y_n =y_n)\) o bien,de un modo más compacto,como \((y_1,y_2,...,y_n)\).El cálculo de la probabilidad de esta intersección es esencial para hacer inferencias acerca de la población de la cual se tomó la muestra y es una razón importante para estudiar distribuciones de probabilidad multivariantes.

5.2 Distribuciones de probabilidad bivariantes y multivariantes

Se pueden definir muchas variables aleatorias sobre el mismo espacio muestral. Por ejemplo, considere el experimento de lanzar un par de dados. El espacio muestral contiene 36 puntos muestrales, correspondientes a las \(mn = (6)(6) = 36\) formas en las que pueden aparecer números en las caras de los dados. Cualquiera de las siguientes variables aleatorias podría estar definida sobre el espacio muestral y podría ser de interés para el experimentador:

\(Y_1\): el número de puntos que aparecen en el dado 1.

\(Y_2\): el número de puntos que aparecen en el dado 2.

\(Y_3\): la suma del número de puntos en los dados.

\(Y_4\): el producto del número de puntos que aparecen en los dados.

Los 36 puntos muestrales asociados con el experimento tienen la misma probabilidad y corresponden a los 36 eventos numéricos \((y_1, y_2)\). Así, lanzar un par de números 1 es el evento sencillo (1, 1). Lanzar un 2 en el dado 1 y un 3 en el dado 2 es el evento sencillo (2, 3). Como todos los pares \((y_1, y_2)\) ocurren con la misma frecuencia relativa, asignamos una probabilidad \(1/36\) a cada punto muestral. Para este ejemplo sencillo la intersección \((y_1, y_2)\) contiene a lo sumo un punto muestral. En consecuencia, la función de probabilidad bivariante es

\(p(y_1,y_2)=P(Y_1 =y_1,Y_2 =y_2)=1/36,\text{ }y_1 =1,2,..., 6,y_2 =1,2,..., 6\).

En la Figura 5.1 se muestra una gráfica de la función de probabilidad bivariante para el experimento de lanzar dados. Observe que una probabilidad diferente de cero se asigna a un punto \((y_1,y_2)\) del plano si y sólo si \(y_1 =1, 2,...,6\) y \(y_2 =1, 2,...,6\).Entonces,a los 36 puntos del plano se les asignan exactamente probabilidades diferentes de cero. Además, las probabilidades se asignan en tal forma que la suma de las probabilidades diferentes de cero es igual a 1. En la Figura 5.1 los puntos a los que se asignan probabilidades diferentes de cero están representados en el plano \((y_1, y_2)\), mientras que las probabilidades asociadas con estos puntos están dadas por las longitudes de las rectas que aparecen arriba de ellos. La Figura 5.1 puede verse como histograma teórico de frecuencia relativa en tres dimensiones para los pares de observaciones \((y_1, y_2)\). Al igual que en el caso discreto de una sola variable, el histograma teórico da un modelo para el histograma muestral que se obtendría si el experimento de lanzar dados se repitiera un gran número de veces.


Definición 5.1

Sean \(Y_1\) y \(Y_2\) variables aleatorias discretas. La función de probabilidad conjunta (o bivariante) para \(Y_1\) y \(Y_2\) está dada por \(p(y_1,y_2)=P(Y_1 =y_1,Y_2 =y_2), −\infty<y_1 <\infty,−\infty<y_2 <\infty\)


En el caso de la variable única que estudiamos en el Capítulo 3 vimos que la función de probabilidad para una variable aleatoria discreta Y asigna probabilidades diferentes de cero a un número infinito o contable de valores distintos de Y, en forma tal que la suma de las probabilidades es igual a 1. Del mismo modo, en el caso bivariante la función de probabilidad conjunta \(p(y_1, y_2)\) asigna probabilidades diferentes de cero a sólo un número infinito o contable de pares de valores \((y_1, y_2)\). Además, las probabilidades diferentes de cero deben sumar 1.


Teorema 5.1

Si \(Y_1\) y \(Y_2\) son variables aleatorias discretas con función de probabilidad conjunta \(p(y_1, y_2)\), entonces

  1. \(p(y_1, y_2) ≥ 0\) para toda \(y_1, y_2\).

  2. \(\sum_{y_1, y_2} p(y_1, y_2) = 1\), donde la suma es para todos los valores \((y_1, y_2)\) a los que se asignan probabilidades diferentes de cero.


Al igual que en el caso discreto univariante, la función de probabilidad conjunta para variables aleatorias discretas a veces se denomina función de masa de probabilidad conjunta porque especifica la probabilidad (masa) asociada con cada uno de los posibles pares de va- lores para las variables aleatorias. Una vez que la función de probabilidad conjunta se haya determinado para variables aleatorias discretas \(Y_1\) y \(Y_2\), calcular las probabilidades conjuntasen donde aparecen \(Y_1\) y \(Y_2\) es fácil. Para el experimento de lanzar dados, P\((2 ≤ Y_1 ≤ 3, 1 ≤ Y_2 ≤ 2)\) es

\(P(2≤Y_1 ≤3,1≤Y_2 ≤2)=p(2,1)+p(2,2)+p(3,1)+p(3,2) = 4/ 36 = 1/ 9.\)


Ejemplo 5.1

Un supermercado local tiene tres cajas. Dos clientes llegan a las cajas en momentos diferentes cuando las cajas no atienden a otros clientes. Cada cliente escoge una caja de manera aleatoria, independientemente del otro. Denote con \(Y_1\) el número de clientes que escogen la caja 1 y con \(Y_2\) el número que selecciona la caja 2. Encuentre la función de probabilidad conjunta de \(Y_1\) y \(Y_2\).

Solución

Podríamos proceder en muchas formas. La más directa es considerar el espacio muestral asociado con el experimento. Denotemos con el par \({i, j}\) el evento sencillo de que el primer cliente escogió la caja \(i\) y el segundo cliente escogió la caja \(j\), donde \(i, j = 1, 2 y 3\). Usando la regla \(mn\), el espacio muestral está formado por \(3 × 3 = 9\) puntos muestrales. De acuerdo con las suposiciones dadas antes, cada punto muestral es igualmente probable y tiene probabilidad 1/9. El espacio muestral asociado con el experimento es

\(S = [{1, 1}, {1, 2}, {1, 3}, {2, 1}, {2, 2}, {2, 3}, {3, 1}, {3, 2}, {3, 3}]\).

Observe que el punto muestral \({1, 1}\) es el único correspondiente a \((Y_1 = 2, Y_2 = 0)\) y por tanto \(P(Y_1=2,Y_2=0)=1/9\).Del mismo modo,\(P(Y_1 =1,Y_2 =1)=P({1,2}o{2,1})=2/9\). La Tabla 5.1 contiene las probabilidades asociadas con cada posible par de valores para \(Y_1\) y \(Y_2\), es decir, la función de probabilidad conjunta para \(Y_1\) y \(Y_2\). Como siempre, los resultados del Teorema 5.1 se cumplen para este ejemplo.

\(y_1\) \(y_1\) \(y_1\)
\(y_2\) 0 1 2
0 1/9 2/9 1/9
1 2/9 2/9 0
2 1/9 0 0

Al igual que en el caso de variables aleatorias univariantes, la distinción entre variables aleatorias continuas conjuntas y discretas conjuntas puede ser caracterizado en términos de sus funciones de distribución (conjuntas).


Definicion 5.2

Para cualesquiera variables aleatorias \(Y_1\) y \(Y_2\), la función de distribución (bivariante) conjunta \(F(y_1, y_2)\) es \(F(y_1,y_2)=P(Y_1 ≤y_1,Y_2 ≤y_2), −\infty<y_1 <\infty,−\infty<y_2 <\infty\).


Para dos variables discretas \(Y_1\) y \(Y_2\), \(F(y_1, y_2)\) está dada por

\(F(y_1, y_2) = \sum_{t_1≤y_1}\sum_{t_2≤y_2}p(t_1,t_2).\)

Para el experimento de lanzar un dado,

\(F(2, 3) = P(Y_1 ≤ 2, Y_2 ≤ 3)= p(1, 1)+p(1, 2)+p(1, 3)+p(2, 1)+p(2, 2)+p(2, 3).\)

Como \(p(y_1, y_2) = 1/ 36\) para todos los pares de valores de \(y_1\) y \(y_2\) en consideración, \(F(2, 3) = 6/36 = 1/6\).

Ejemplo_Definicion_5.2 = (1/36)+(1/36)+(1/36)+(1/36)+(1/36)+(1/36)
print(Ejemplo_Definicion_5.2)
[1] 0.1666667

Ejemplo 5.2

Considere las variables aleatorias \(Y_1\) y \(Y_2\) del Ejemplo 5.1. Encuentre \(F(–1, 2), F(1.5, 2)\) y \(F(5, 7)\).

Solucion

Usando los resultados de la Tabla 5.1 vemos que

\(F(−1, 2)=P(Y_1 ≤−1,Y_2 ≤2)=P(Ø)=0.\)

Además

\(F(1.5, 2) = P(Y_1 ≤1.5, Y_2 ≤2)\) \(=p(0, 0)+p(0, 1)+p(0, 2)+p(1, 0)+p(1, 1)+p(1, 2)=8/9.\)

De manera similar,

\(F(5, 7) = P(Y_1 ≤5, Y_2 ≤7) =1.\)

Observeque \(F(y_1,y_2)=1\) para toda \(y_1,y_2\) tal que min{\({y_1,y_2}\)}\(≥2\).También, \(F(y_1,y_2)=0\) si mín{\({y_1, y_2}\)}\(<0\).


Se dice que dos variables aleatorias son continuas conjuntas si su función de distribución conjunta \(F(y_1, y_2)\) es continua en ambos argumentos.


Definicion 5.3

Sean \(Y_1\) y \(Y_2\) variables aleatorias continuas con función de distribución conjunta \(F(y_1, y_2)\). Si existe una función no negativa \(f(y_1, y_2)\), tal que

\(F(y_1,y_2)=\int_{-\infty}^{y_1}\int_{-\infty}^{y_2}f(t_1,t_2)dt_2dt_1\)

para toda \(−\infty < y_1 <\infty,−\infty < y_2 <\infty\), entonces se dice que \(Y_1\) y \(Y_2\) son variables aleatorias continuas conjuntas. La función \(f(y_1, y_2)\) recibe el nombre de función de densidad de probabilidad conjunta.


Las funciones de distribución acumulativa bivariante satisfacen un conjunto de propiedades similares a las especificadas para funciones de distribución acumulativa univariante.


Teorema 5.2

Si \(Y_1\) y \(Y_2\) son variables aleatorias con función de distribución conjunta \(F(y_1, y_2)\), entonces 1. \(F(−\infty, −\infty) = F(−\infty, y_2) = F(y_1, −\infty) = 0.\) 2. \(F(\infty,\infty)=1.\) 3. Si \(y_1^∗ ≥y_1\) y \(y_2^∗ ≥y_2\),entonces

\(F(y_1^∗, y_2∗) − F(y_1^∗, y_2) − F(y_1, y_2^∗) + F(y_1, y_2) ≥ 0.\)


La parte 3 resulta de que

\(F(y_1^∗, y_2^∗) − F(y_1^∗, y_2) − F(y_1, y_2^∗) + F(y_1, y_2)\) \(=P(y_1 <Y_1 ≤y_1^∗,y_2 <Y_2 ≤y_2^∗)≥0.\)

Observe que \(F(\infty, \infty) ≡ \lim_{y_1\to\ \infty}\lim_{y_2\to\ \infty} F(y_1, y_2) = 1\) implica que la función de densidad conjunta \(f(y_1, y_2)\) debe ser tal que la integral de \(f(y_1, y_2)\) para todos los valores de \((y_1, y_2)\) es 1.


Teorema 5.3

Si \(Y_1\) y \(Y_2\) son variables aleatorias continuas conjuntas con una función de densidad conjunta dada por \(f(y_1, y_2)\), entonces

  1. \(f (y_1, y_2) ≥ 0\) para toda \(y_1, y_2\).
  2. \(\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(y_1,y_2)dy_1dy_2=1\)

Al igual que en el caso continuo univariante que se estudia en el Capítulo 4, la función de densidad conjunta puede ser interpretada de manera intuitiva como un modelo para el histograma de frecuencia relativa conjunta para \(Y_1\) y \(Y_2\).

Para el caso continuo univariante, las áreas bajo la densidad de probabilidad para un inter- valo corresponden a probabilidades. De igual manera, la función de densidad de probabilidad bivariante \(f(y_1, y_2)\) traza una superficie de densidad de probabilidad sobre el plano \((y_1, y_2)\). (Figura 5.2).

Los volúmenes bajo esta superficie representan probabilidades. Así, \(P(a1 ≤ Y_1 ≤ a2, b1 ≤ Y_2 ≤ b2)\) es el volumen sombreado que se ve en la Figura 5.2 y es igual a

\(\int_{b_1}^{b_2}\int_{a_1}^{a_2}f (y_1, y_2) dy_1 dy_2.\)


Ejemplo 5.3

Suponga que una partícula radiactiva se localiza aleatoriamente en un cuadrado con lados de longitud unitaria. Esto es, si se consideran dos regiones de igual área y dentro del cuadrado unitario es igualmente probable que la partícula se encuentre en cualquiera de las dos. Denote con \(Y_1\) y \(Y_2\) las coordenadas de la ubicación de la partícula. Un modelo razonable para el his- tograma de frecuencia relativa para \(Y_1\) y \(Y_2\) es la análoga bivariante de la función de densidad uniforme univariante:

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 1, & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

a Trace la superficie de densidad de probabilidad. b Encuentre \(F(.2, .4)\). c Encuentre \(P(.1 ≤ Y_1 ≤ .3, 0 ≤ Y_2 ≤ .5)\).

Solucion

  1. El trazo se muestra en la Figura 5.3.
  2. \(F(.2,.4)=\int_{-\infty}^{.4}\int_{-\infty}^{.2}f(y_1,y_2)dy_1dy\)\(=\int_{0}^{.4}\int_{0}^{.2}(1)dy_1dy_2\)\(=\int_{0}^{.4}\Big(y_1\Big|_{0}^{.2}\Big)dy_2=\int{0}^{.4}dy_2=.08.\)

La probabilidad \(F(.2, .4)\) corresponde al volumen bajo \(f(y_1, y_2)= 1\), que está sombreado en la Figura 5.3. Como lo indican consideraciones geométricas, la probabilidad deseada (volumen) es igual a .08, que obtuvimos mediante integración al principio de esta sección.

  1. \(P(.1≤Y_1≤.3,0≤Y_2≤5)=\int_{0}^{.5}\int_{.1}^{.3}f(y_1,y_2)dy_1dy_2=\int_{0}^{.5}\int_{.1}^{.3}1dy_1dy_2=.10\)

Esta probabilidad corresponde al volumen bajo la función de densidad \(f(y_1, y_2)= 1\) que está arriba de la región \(.1 ≤ y_1 ≤ .3\), \(0 ≤ y_2 ≤ .5\). Al igual que la solución del inciso b, la solución actual se puede obtener con el uso de conceptos de geometría elemental. La densidad o altura de la superficie es igual a 1 y por tanto la probabilidad deseada (volumen) es

\(P(.1≤Y_1 ≤.3,0≤Y_2 ≤.5)=(.2)(.5)(1)=.10.\)


En el siguiente ejemplo se ilustra un modelo bivariante ligeramente más complicado


Ejemplo 5.4

Se ha de almacenar gasolina en un enorme tanque una vez al principio de cada semana y luego se vende a clientes individuales. Denote con \(Y_1\) el nivel de gasolina (proporción) que alcanza el tanque después de surtirlo. Debido a suministros limitados, \(Y_1\) varía de una semana a otra. Denote con \(Y_2\) la proporción de la capacidad del tanque que se vende durante la semana. Como \(Y_1\) y \(Y_2\) son proporciones, estas dos variables toman valores entre 0 y 1. Además, la cantidad de gasolina vendida, \(y_2\), no puede ser mayor que la cantidad disponible, \(y_1\). Suponga que la función de densidad conjunta para \(Y_1\) y \(Y_2\) está dada por

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 3y_1 & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

En la Figura 5.4 se muestra una gráfica de esta función. Encuentre la probabilidad de que menos de la mitad del tanque tenga gasolina y más de un cuarto del tanque se venda.

Solución

Buscamos \(P(0 ≤ Y_1 ≤ .5, Y_2 > .25)\). Para cualquier variable aleatoria continua, la probabilidad de observar un valor en una región es el volumen bajo la función de densidad por arriba de la región de interés. La función de densidad \(f (y_1, y_2)\) es positiva sólo en la región triangular

grande del plano \((y_1, y_2)\) que se ve en la Figura 5.5. Estamos interesados sólo en valores de \(y_1\) y \(y_2\) tales que 0 ≤ y_1 ≤ .5 y \(y_2 > .25\). La intersección de esta región y la región donde la función de densidad es positiva está dada por el pequeño triángulo (sombreado) de la Figura 5.5. En consecuencia, la probabilidad que deseamos es el volumen bajo la función de densidad de la Figura 5.4 arriba de la región sombreada del plano \((y_1, y_2)\) que se ve en la Figura 5.5.

Entonces, tenemos

\(P(0≤Y_1≤.5,.25 ≤ Y_2)=\int_{1/4}^{1/2}\int_{1/4}^{y_1}3y_1dy_2dy_1\)

\(=\int_{1/4}^{1/2}3y_1\Big(y_2\Big|_{1/4}^{y_1}\Big)dy_1\) \(=\int_{1/4}^{1/2}3y_1(y_1-1/4)dy_1\) \(=[y_1^3-(3/8)y_1^2]\Big]_{1/4}^{1/2}\) \(=[(1/8)-(3/8)(1/4)]-[(1/64)-(3/8)(1/16)]\) \(=5/128\)


El cálculo de la probabilidad especificada en el Ejemplo 5.4 comprendió integrar la función de densidad conjunta para \(Y_1\) y \(Y_2\) sobre la región apropiada. La especificación de los límites de integración se hizo más fácil al trazar la región de integración en la Figura 5.5. Este método, trazando la región apropiada de integración, con frecuencia facilita establecer la integral apropiada.

Los métodos estudiados en esta sección se pueden usar para calcular la probabilidad de la intersección de dos eventos \((Y_1 = y_1, Y_2 = y_2)\). De igual modo podemos definir una función de probabilidad (o función de densidad de probabilidad) para la intersección de \(n\) eventos \((Y_1 = y_1, Y_2 = y_2, . . . , Y_n = y_n)\). La función de probabilidad conjunta correspondiente al caso discreto está dada por

\(p(y_1, y_2,..., y_n) = P(Y_1 = y_1, Y_2 = y_2,..., Y_n = y_n).\)

La función de densidad conjunta de \(Y_1, Y_2, . . . , Y_n\) está dada por \(f(y_1, y_2, . . . , y_n)\). Al igual que en el caso bivariante, estas funciones dan modelos para las distribuciones de frecuencia relativa conjunta de las poblaciones de observaciones conjuntas \((y_1, y_2, . . . , y_n)\) para el caso discreto y el caso continuo, respectivamente. En el caso continuo,

\(P(Y_1≤y_1, Y_2≤y_2,...,Y_n≤y_n) = F(y_1,...,y_n)\)

\(=\int_{-\infty}^{y_1}\int_{-\infty}^{y_2}\dots \int_{-\infty}^{y_n}f(t_1,t_2,...,t_n)dt_n...dt_1\)

para todo conjunto de números reales \((y_1, y_2, . . . , y_n)\). Las funciones de distribución multiva- riantes definidas por esta igualdad satisfacen propiedades semejantes a las especificadas para el caso bivariante.

5.3 Distribuciones de probabilidad marginal y condicional

Recuerde que los valores distintos tomados por una variable aleatoria discreta representan even- tos mutuamente excluyentes. De manera análoga, para todos los distintos pares de valores \(y_1\), \(y_2\), los eventos bivariantes \((Y_1 = y_1, Y_2 = y_2)\), representados por \((y_1, y_2)\), son eventos mutuamente excluyentes. Se deduce que el evento univariante \((Y_1 = y_1)\) es la unión de eventos bivariantes del tipo \((Y_1 = y_1, Y_2 = y_2)\), con la unión tomada para todos los posibles valores de \(y_2\).

Por ejemplo, reconsidere el experimento de tirar un dado de la Sección 5.2, donde

Entonces

\(P(Y_1 = 1) = p(1, 1) + p(1, 2) + p(1, 3) + . . .+p(1, 6)\)

\(= 1/36 + 1/36 + 1/36 + . . .+1/36 = 6/36 = 1/6\)

\(P(Y_1 = 2) = p(2, 1) + p(2, 2) + p(2, 3) + . . .+p(2, 6) = 1 6\)

.

.

.

\(P(Y_1 = 6) = p(6, 1) + p(6, 2) + p(6, 3) + . . .+p(6, 6) = 1/6.\)

Expresadas en notación de sumatoria, las probabilidades acerca de la variable \(Y_1\) sola son

\(P(Y_1 = y_1)= p_1(y_1)=\sum_{y_2=1}^{6}p(y_1,y_2)\)

Del mismo modo, las probabilidades correspondientes a valores de la variable \(Y_2\) sola están dadas por

\(p_2(y_2) = P(Y_2=y_2) = \sum_{y_1=1}^{6}p(y_1,y_2)\)

La sumatoria en el caso discreto corresponde a la integración en el caso continuo, que nos lleva a la siguiente definición.


Definicion 5.4

a Sean \(Y_1\) y \(Y_2\) variables aleatorias discretas conjuntas con función de probabilidad \(p(y_1, y_2)\). Entonces las funciones de probabilidad marginal de \(Y_1\) y \(Y_2\), respectivamente, están dadas por

\(p1(y_1) =\sum_{\text{todos }y_2} p(y_1, y_2)\) y \(p2(y_2) =\sum_{\text{todos }y_1}p(y_1, y_2)\)

b Sean \(Y_1\) y \(Y_2\) variables aleatorias continuas conjuntas con función de densidad conjunta \(f(y_1, y_2)\). Entonces las funciones de densidad marginal de \(Y_1\) y \(Y_2\), respectivamente, están dadas por

\(f_1(y_1) = \int_{-\infty}^{infty} f (y_1, y_2)dy_2\) y \(f_2(y_2) =\int_{-\infty}^{\infty} f (y_1, y_2) dy_1.\)


El término marginal, como se aplica a las funciones de probabilidad univariante de \(Y_1\) y \(Y_2\), tiene signi cado intuitivo. Para hallar \(p_1(y_1)\), sumamos \(p(y1, y2)\) para todos los valores de \(y_2\) y por tanto acumulamos las probabilidades en el eje \(y_1\) (o margen). Los casos discretos y continuos se ilustran en los siguientes dos ejemplos.


Ejemplo 5.5

De un grupo de tres republicanos, dos demócratas y uno independiente se ha de seleccionar aleatoriamente un comité de dos personas. Denote con \(Y_1\) el número de republicanos y con \(Y_2\) el número de demócratas del comité. Encuentre la función de probabilidad conjunta de \(Y_1\) y \(Y_2\) y luego encuentre la función de probabilidad marginal de \(Y_1\).

Solución

Las probabilidades buscadas aquí son semejantes a las probabilidades hipergeométricas del Capítulo 3. Por ejemplo,

\(P(Y_1 =1, Y_2 = 1)= p(1,1)=\frac{\Big(_{1}^{3}\Big)\Big(_{1}^{2}\Big)\Big(_{1}^{0}\Big)}{\Big(_{2}^{6}\Big)}=\frac{3(2)}{15}=\frac{6}{15}\)

debido a que hay 15 puntos muestrales igualmente probables; para el evento en cuestión de- bemos seleccionar un republicano de entre los tres, un demócrata de entre los dos y cero inde- pendientes. Cálculos semejantes llevan a las otras probabilidades que se ven en la Tabla 5.2.

Para hallar \(p_1(y_1)\), debemos sumar los valores de \(Y_2\), como indica la Definición 5.4. Por tanto, estas probabilidades están dadas por los totales de columna de la Tabla 5.2. Esto es,

\(p1(0)=p(0, 0)+p(0, 1)+p(0, 2)=0+2/15+1/15=3/15\).

Del mismo modo,

\(p1(1) = 9/15\) y \(p_1(2) = 3/15.\)

En forma análoga, la función de probabilidad marginal de \(Y_2\) está dada por los totales de fila.

\(y_1\) \(y_1\) \(y_1\)
\(y_2\) 0 1 2 Total
0 0 3/15 3/15 6/15
1 2/15 6/15 0 8/15
2 1/5 0 0 1/15
Total 3/15 9/15 3/15 1

Ejemplo 5.6

Sea

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Grafique que \(f(y_1, y_2)\) y encuentre las funciones de densidad marginal para \(Y_1\) y \(Y_2\).

Solución

Geométricamente, \(f(y_1, y_2)\) describe una superficie en forma de cuña, como se ve en la Figura 5.6.

Antes de aplicar la definición 5.4 para hallar \(f_1(y_1)\) y $f2(y_2), usaremos la Figura 5.6 para visualizar el resultado. Si la probabilidad representada por la cuña estuviera acumulada en el eje \(y_1\) (acumulando probabilidad a lo largo de líneas paralelas al eje \(y_2\)), el resultado sería una

densidad de probabilidad triangular que se vería como el lado de la cuña de la Figura 5.6. Si la probabilidad estuviera acumulada a lo largo del eje \(y_2\) (acumulándose a lo largo de líneas paralelas al eje \(y_1\)), la densidad resultante sería uniforme. Confirmaremos estas soluciones visuales mediante la aplicación de la Definición 5.4. Entonces, si \(0 ≤ y_1 ≤ 1\),

\(f_1(y_1)=\int_{-\infty}^{\infty}f(y_1,y_2)dy_2 = \int_{0}^{1}2y_1dy_2 = 2y_1\Big(y_2\Big]_{0}^{1}\Big)\)

y si \(y_1<0\) o \(y_1>1\)

\(f_1(y_1)=\int_{-\infty}^{\infty}f(y_1,y_2)dy_2 = \int_{0}^{1}0dy_2=0\)

Entonces,

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Del mismo modo, si \(0≤y_2≤1\),

\(f_2(y_2)=\int_{-\infty}^{\infty}f(y_1,y_2)dy_1 = \int_{0}^{1}2y_1dy_1 = y_1^2\Big]_{0}^{1}=1\)

y si\(y_2<0\) o \(y_2>1\),

\(f_2(y_2)=\int_{-\infty}^{\infty}f(y_1,y_2)dy_1 = \int_{0}^{1}0dy_1=0\)

Resumiendo,

\(f_2(y_2)=\left\{ \begin{array}{cl}\ 1 ,& 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Las gráficas de \(f_1(y_1)\) y \(f_2(y_2)\) trazan densidades de probabilidad triangulares y uniformes, respectivamente, como es de esperarse.


Llevemos ahora nuestra atención a distribuciones condicionales, viendo primero al caso discreto.

La ley multiplicativa (Sección 2.8) da la probabilidad de la intersección \(A ∩ B\) como

\(P(A∩B) = P(A)P(B|A)\),

donde \(P(A)\) es la probabilidad incondicional de \(A\) y \(P(B|A)\) es la probabilidad de \(B\) dado que \(A\) ha ocurrido. Ahora considere la intersección de los dos eventos numéricos, \((Y_1 = y_1)\) y \((Y_2 = y_2)\), representada por el evento bivariante \((y_1, y_2)\). Se deduce directamente de la ley multiplicativa de probabilidad que la probabilidad bivariante para la intersección \((y_1, y_2)\) es

\(p(y_1, y_2) = p_1(y_1)p(y_2| y_1) = p_2(y_2)p(y_1|y_2).\)

Las probabilidades \(p_1(y_1)\) y \(p_2(y_2)\) están asociadas con las distribuciones de probabilidad univariantes para \(Y_1\) y \(Y_2\) individualmente (recuerde el Capítulo 3). Usando la interpretación de probabilidad condicional estudiada en el Capítulo 2, \(p(y_1|y_2)\) es la probabilidad de que la variable aleatoria \(Y_1\) sea igual a \(y_1\), dado que \(Y_2\) toma el valor \(y_2\).


Definicion 5.5

Si \(Y_1\) y \(Y_2\) son variables aleatorias discretas conjuntas con función de probabilidad con- junta \(p(y_1, y_2)\) y funciones de probabilidad marginal \(p_1(y_1)\) y \(p_2(y_2)\), respectivamente, entonces la función de probabilidad discreta condicional de \(Y_1\) dada \(Y_2\) es

\(p(y_1 |y_2)=P(Y_1 =y_1 |Y_2 =y_2)= \frac{P(Y_1 =y_1,Y_2 =y_2)}{P(Y_2 = y_2)} = \frac{p(y_1,y_2)}{p_2(y_2)}\) siempre que \(p_2(y_2) > 0\)


Entonces, \(P(Y_1 = 2|Y_2 = 3)\) es la probabilidad condicional de que \(Y_1 = 2\) dado que \(Y_2 = 3\). Una interpretación similar se puede unir a la probabilidad condicional \(p(y_2|y_1)\). Observe que \(p(y_1|y_2)\) es indefinida si \(p_2(y_2) = 0\).


Ejemplo 5.7

Consulte el Ejemplo 5.5 y encuentre la distribución condicional de \(Y_1\) dado que \(Y_2 = 1\). Esto es, dado que una de las dos personas del comité es demócrata, encuentre la distribución con- dicional para el número de republicanos seleccionados para el comité.

Solución

Las probabilidades conjuntas están dadas en la Tabla 5.2. Para hallar \(p(y_1|Y_2 = 1)\), nos concen- tramos en lafila correspondiente a \(Y_2 = 1\). Entonces

\(P(Y_1 =0| Y_2 =1) = \frac{p(0, 1)}{p_2(1)} = \frac{2/15}{8/15} = \frac{1}{4}\),

\(P(Y_1 = 1|Y_2 = 1) = \frac{p(1,1)}{p_2(1)}=\frac{6/15}{8/15}=\frac{3}{4}\)

\(P(Y_1 ≥2| Y_2 = 1)= \frac{p(2,1)}{p_2(1)} = \frac{0}{8/15}=0\)

En el comité seleccionado aleatoriamente, si una persona es demócrata (o, lo que es lo mismo, si \(Y_2 = 1\)), hay una alta probabilidad de que el otro sea republicano (o sea \(Y_1 = 1\)).

En el caso continuo podemos obtener una analogía apropiada de la función de probabilidad condicional \(p(y_1|y_2)\), pero no se obtiene en una forma tan sencilla. Si \(Y_1\) y \(Y_2\) son continuas, \(P(Y_1 = y_1|Y_2 = y_2)\) no se puede definir como en el caso discreto porque \((Y_1 = y_1)\) y \((Y_2 = y_2)\) son eventos con probabilidad cero. Las siguientes consideraciones, sin embargo, llevan a una definición útil y consistente para una función de densidad condicional.

Suponiendo que \(Y_1\) y \(Y_2\) son continuas conjuntas con función de densidad \(f(y_1, y_2)\), podríamos estar interesados en una probabilidad de la forma \(P(Y_1 ≤ y_1|Y_2 = y_2) = F(y_1|y_2)\), que, como función de \(y_1\) para una \(y_2\) fija, se denomina función de distribución condicional de \(Y_1\), dado que \(Y_1 = y_2\).


Definicion 5.6

Si \(Y_1\) y \(Y_2\) son variables aleatorias continuas conjuntas con función de densidad conjunta \(f(y_1, y_2)\), entonces la función de distribución condicional de \(Y_1\) dado que \(Y_2 = y_2\) es \(F(y_1|y_2) = P(Y_1 ≤ y_1|Y_2 = y_2)\)


Observe que \(F(y_1|y_2)\) es una función de \(y_1\) para un valor fijo de \(y_2\). Si pudiéramos tomar \(F(y_1|y_2)\), multiplicarlo por \(P(Y_2 = y_2)\) para cada posible valor de \(Y_2\) y sumar todas las probabilidades resultantes, podríamos obtener \(F(y_1)\). Esto no es posible por- que el número de valores para \(y_2\) es incontable y todas las probabilidades \(P(Y_2 = y_2)\) son cero. Pero podemos hacer algo análogo al multiplicarlo por \(f_2(y_2)\) y luego integrar para obtener

\(F(y_1) = \int_{-\infty}^\infty F(y_1|y_2)f_2(y_2)dy_2\)

La cantidad \(f_2(y_2)dy_2\) se puede considerar como la probabilidad aproximada de que \(Y_2\) tome un valor en un pequeño intervalo alrededor de \(y_2\), y la integral es una suma generalizada. Ahora, de consideraciones previas, sabemos que

\(F(y_1) = \int_{-\infty}^{y_1}f_1(t_1)dt_1 = \int_{-\infty}^{y_1}[\int_{-\infty}^{\infty} f(t_1,y_2)dy_2]dt_1\)

\(= \int_{-\infty}^{\infty} \int_{-\infty}^{y_1} f(t_1, y_2)dt_1dy_2\)

De estas dos expresiones para \(F(y_1)\), debemos tener

\(F(y_1|y_2)f_2(y_2) = \int_{-\infty}^{y_1}f(t_1,y_2)dt_1\)

o bien

\(F(y_1|y_2) = \int_{\infty}{y_1} \frac{f(t_1, y_2)}{f_2(y_2)}dt_1\)

Al integrando de esta expresión lo llamaremos función de densidad condicional de \(Y_1\) dado que \(Y_2 = y_2\), y lo denotaremos por \(f(y_1|y_2)\).


Definición 5.7

Sean \(Y_1\) y \(Y_2\) variables aleatorias continuas conjuntas con densidad conjunta \(f(y_1, y_2)\) y densidades marginales \(f_1(y_1)\) y \(f_2(y_2)\), respectivamente. Para cualquier \(y_2\) tal que \(f_2(y_2)\) > 0, la densidad condicional de \(Y_1\) dada \(Y_2 = y_2\) está dada por

\(f (y_1|y_2) = \frac{f (y_1, y_2)}{f_2(y_2)}\)

y, para cualquier \(y_1\) tal que \(f_1(y_1)> 0\), la densidad condicional de \(Y_2\) dada \(Y_1 = y_1\) está dada por \(f(y_2|y_1)= \frac{f(y_1,y_2)}{ f_1(y_1)}\)


Ejemplo 5.8

Una máquina automática expendedora de bebidas tiene una cantidad aleatoria \(Y_2\) de bebida en existencia al principio de un día determinado y dosi ca una cantidad aleatoria \(Y_1\) durante el día (con cantidades expresadas en galones). La máquina no se reabastece durante el día y, en consecuencia, \(Y_1 ≤ Y_2\). Se ha observado que \(Y_1\) y \(Y_2\) tienen una densidad conjunta dada por

\(f(y_1,y_2)=\left\{ \begin{array}{cl}1/2 & 0≤y_1≤y_2≤2\\ 0 & \text{en cualquier otro punto}\end{array}\right.\)

Esto es, los puntos \((y_1, y_2)\) están uniformemente distribuidos en el triángulo con las fronteras dadas. Encuentre la densidad condicional de \(Y_1\) dada \(Y_2 = y_2\). Evalúe la probabilidad de que se venda menos de 1/2 galón, dado que la máquina contiene 1.5 galones al empezar el día.

La densidad marginal de \(Y_2\) está dada por

\(f_2(y_2) =\int_{-\infty}^{\infty} f(y_1,y_2)dy_1\)

Entonces,

\(f_2(y_2) = \left\{\begin{array}{cl} \int_{0}^{y_2}(1/2)dy_1 = (1/2)y_2, & 0≤y_2 ≤2,\\ \int_{-\infty}^{\infty}0dy_1=0,& \text{en cualquier otro punto.}\end{array}\right.\)

Observe que \(f_2(y_2)\) > 0 si y sólo si \(0 < y_2 ≤ 2\). Entonces, para cualquier \(0 < y_2 ≤ 2\), usando la Definición 5.7,

\(f(y_1|y_2) = \frac{f(y_1,y_2)}{f_2(y_2)}=\frac{1/2}{(1/2)y_2}=\frac{1}{y_2},{0≤y_1 ≤y_2}\)

También, \(f(y_1|y_2)\) es indefinida si \(y_2 ≤ 0\) o \(y_2 > 2\). La probabilidad de interés es

\(P(Y_1 \leq 1/2| Y_2 = 1.5) = \int_{-\infty}^{1/2} f(y_1|y_2 = 1.5)dy_1 = \int_{0}^{1/2} \frac{1}{1.5}dy_1 = \frac{1/2}{1.5}=\frac{1}{3}\)

Si la máquina contiene 2 galones al empezar el día, entonces

\(P(Y_1 \leq 1/2| Y_2 = 2) \int_{0}^{1/2} \frac{1}{2}dy_1 = \frac{1}{4}\)

Por tanto, la probabilidad condicional de que \(Y_1 ≤ 1/2\) dado que \(Y_2 = y_2\) cambia de manera apreciable dependiendo de la selección particular de \(y_2\).

5.4 Variables aleatorias independientes

En el Ejemplo 5.8 vimos dos variables aleatorias dependientes, para las cuales las probabili- dades asociadas con \(Y_1\) dependían del valor observado de \(Y_2\). En el Ejercicio 5.24 (y algunos otros) éste no fue el caso: las probabilidades asociadas con \(Y_1\) eran iguales, cualquiera que fuera el valor observado de \(Y_2\). Ahora presentamos una definición formal de independencia de variables aleatorias.

Dos eventos A y B son independientes si \(P(A ∩ B) = P(A) × P(B)\). Cuando estudiemos variables aleatorias, si \(a < b\) y \(c < d\) es frecuente que nos interesemos en eventos del tipo \((a < Y_1 ≤ b) ∩ (c < Y_2 ≤ d)\). Por consistencia con la definición anterior de eventos independientes, si \(Y_1\) y \(Y_2\) son independientes, nos gustaría tener

\(P(a<Y_1 ≤b, c<Y_2 ≤d)=P(a<Y_1 ≤b)×P(c<Y_2 ≤d)\)

para cualquier elección de números reales \(a < b\) y \(c < d\). Esto es, si \(Y_1\) y \(Y_2\) son independientes, la probabilidad conjunta se puede escribir como el producto de las probabilidades marginales. Esta propiedad se satisface si \(Y_1\) y \(Y_2\) son independientes en el sentido detallado en la siguiente definición.


Definición 5.8

Sea \(Y_1\) que tiene una función de distribución \(F_1(y_1)\) y sea \(Y_2\) que tiene una función de distribución \(F_2(y_2)\), y \(F(y_1, y_2)\) es la función de distribución conjunta de \(Y_1\) y \(Y_2\). Entonces se dice que \(Y_1\) y \(Y_2\) son independientes si y sólo si

\(F(y_1, y_2) = F_1(y_1)F_2(y_2)\)

para todo par de números reales \((y_1, y_2)\). Si \(Y_1\) y \(Y_2\) no son independientes, se dice que son dependientes.


Por lo general es cómodo establecer la presencia o ausencia de independencia, por medio del resultado del siguiente teorema. Se omite la demostración; vea “Bibliografía y lecturas adicionales” al final del capítulo.


Teorema 5.4

Si \(Y_1\) y \(Y_2\) son variables aleatorias discretas con función de probabilidad conjunta \(p(y_1, y_2)\) y funciones de probabilidad marginal \(p_1(y_1)\) y \(p_2(y_2)\), respectivamente, entonces \(Y_1\) y \(Y_2\) son independientes si y sólo si

\(p(y_1, y_2) = p_1(y_1)p_2(y_2)\)

para todos los pares de números reales \((y_1, y_2)\).

Si \(Y_1\) y \(Y_2\) son variables aleatorias continuas con función de densidad conjunta \(f_1(y_1, y_2)\) y funciones de densidad marginal \(f_1(y_1)\) y \(f_2(y_2)\), respectivamente, entonces \(Y_1\) y \(Y_2\) son independientes si y sólo si \(f(y_1, y_2) = f_1(y_1) f_2(y_2)\)

para todos los pares de números reales \((y_1, y_2)\).


A continuación ilustramos el concepto de independencia con algunos ejemplos.


Ejemplo 5.9

Para el problema de tirar un dado de la Sección 5.2, demuestre que \(Y_1\) y \(Y_2\) son independientes.

Solución

En este problema a cada uno de los 36 puntos muestrales se le dio probabilidad 1/36. Considere, por ejemplo, el punto (1, 2). Sabemos que \(p(1, 2) = 1/ 36\). También, \(p_1(1) = P(Y_1 = 1) = 1/6\) y \(p_2(2) = P(Y_2 = 2) = 1/6\). Por tanto,

\(p(1, 2) = p_1(1) p_2(2).\)

Lo mismo es cierto para todos los demás valores de \(y_1\) y \(y_2\), de lo cual se deduce que \(Y_1\) y \(Y_2\) son independientes.


Ejemplo 5.10

Consulte el Ejemplo 5.5. ¿El número de republicanos en la muestra es independiente del número de demócratas? (¿Es \(Y_1\) independiente de \(Y_2\)?)

Solución

La independencia de variables aleatorias discretas requiere que \(p(y_1, y_2) = p_1(y_1) p_2(y_2)\) para toda selección \((y_1, y_2)\). Entonces, si esta igualdad es violada para cualquier par de valores \((y_1, y_2)\), las variables aleatorias son dependientes. Al observar la esquina superior izquierda de la Tabla 5.2, veremos que

\(P(0, 0) = 0.\)

Pero \(p_1(0) = 3/15\) y \(p_2(0) = 6/15\). En consecuencia, \(p(0, 0) ≠ p1(0) p2(0)\), de modo que \(Y_1\) y \(Y_2\) son dependientes.



Ejemplo 5.11

Sea

\(f(y_1,y_2)=\left\{ \begin{array}{cl}6y_1y_2^2, & 0≤y_1≤1,0≤y_2≤1,\\0, & \text{en cualquier otro punto}\end{array}\right.\)

Demuestre que \(Y_1\) y \(Y_2\) son independientes.

Solución

\(f(y_1,y_2)=\left\{ \begin{array}{cl}\int_{-\infty}^{\infty} f(y_1,y_2)dy_2=\int_{0}^{1}6y_1y_2^2dy_2=6y_1(\frac{y_2^3}{3}\Big|_0^1)=2y_1,, & 0≤y_1≤1,\\ \int_{-\infty}^{\infty}f(y_1,y_2)dy_2=\int_{-\infty}^{\infty}0dy_1 = 0, & \text{en cualquier otro punto}\end{array}\right.\)

Del mismo modo,

\(f(y_1,y_2)=\left\{ \begin{array}{cl}\int_{-\infty}^{\infty} f(y_1,y_2)dy_1=\int_{0}^{1}6y_1y_2^2dy_1=3y_2^2, & 0≤y_2≤1,\\ \int_{-\infty}^{\infty}f(y_1,y_2)dy_1=\int_{-\infty}^{\infty}0dy_1 = 0, & \text{en cualquier otro punto}\end{array}\right.\)

En consecuencia

\(f(y_1, y_2)= f_1(y_1)f_2(y_2)\)

para todos los números reales \((y_1, y_2)\) y, por tanto, \(Y_1\) y \(Y_2\) son independientes.



Ejemplo 5.12

Sea

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2, & 0≤y_2≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Demuestre que \(Y_1\) y \(Y_2\) son dependientes.

Solución

Vemos que \(f(y_1, y_2) = 2\) sobre la región sombreada que se ve en la Figura 5.7. Por tanto

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ \int_{0}^{y_1}2dy_2 = 2y_2 = 2y_2\Big|_0^{y_1}=2y_1, & 0≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Del mismo modo,

\(f_2(y_2) =\left\{ \begin{array}{cl}\ \int_{y_2}^{1}2dy_1 = 2y_1\Big|_{y_2}^{1}=2(1-y_2), & 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Por tanto,

\(f (y_1, y_2) = f_1(y_1) f_2(y_2)\)

para algún par de números reales \((y_1, y_2)\) y, por tanto, \(Y_1\) y \(Y_2\) son dependientes.


Observará una diferencia distinta en los límites de integración empleados para hallar las funciones de densidad marginal obtenidas en los Ejemplos 5.11 y 5.12. Los límites de integración para \(y_2\), comprendidos en hallar la densidad marginal de \(Y_1\) en el Ejemplo 5.12, dependían de \(y_1\). En contraste, los límites de integración fueron constantes cuando determinamos las funciones de densidad marginal del Ejemplo 5.11. Si los límites de integración son constantes, el siguiente teorema proporciona una forma fácil de demostrar la independencia de dos variables aleatorias.


Teorema 5.5

Sean \(Y_1\) y \(Y_2\) que tienen una densidad conjunta \(f(y_1, y_2)\) que es positiva si y sólo si \(a ≤ y_1 ≤b\) y \(c≤y_2\)≤d, para constantes a,b,c y d; y \(f(y_1,y_2)=0\) en otro caso.Entonces \(Y_1\) y \(Y_2\) son variables aleatorias independientes si y sólo si

\(f(y_1, y_2) = g(y_1)h(y_2)\)

donde \(g(y_1)\) es una función no negativa de \(y_1\) solamente y \(h(y_2)\) es una función no negativa de \(y_2\) solamente.


La demostración de este teorema se omite. (Vea “Bibliografía y lecturas adicionales” al nal del capítulo.) El bene cio clave del resultado dado en el Teorema 5.5 es que en realidad no necesitamos obtener las densidades marginales. De hecho, las funciones \(g(y_1)\) y \(h(y_2)\) no necesitan ser funciones de densidad (aun cuando sean múltiplos constantes de las densidades marginales, deberíamos tomarnos la molestia de determinar éstas).


Ejemplo 5.13

Sean \(Y_1\) y \(Y_2\) que tienen una densidad conjunta dada por

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1, 0≤y_2≤1 ,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

¿\(Y_1\) y \(Y_2\) son variables independientes?

Solución

Observe que \(f(y_1,y_2)\) es positiva si y sólo si \(0≤y_1≤1\) y \(0 ≤y_2 ≤1\).Además, \(f(y_1,y_2)=g(y_1)h(y_2)\),

donde

\(g(y_1) =\left\{ \begin{array}{cl}\ y_1 & 0≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

y

\(h(y_2) =\left\{ \begin{array}{cl}\ 2 & 0≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Por tanto, \(Y_1\) y \(Y_2\) son variables aleatorias independientes. Observe que \(g(y_1)\) y \(h(y_2)\), como aquí se de nen, no son funciones de densidad, aun cuando \(2g(y_1)\) y \(h(y_2)/2\) sean densidades.


Ejemplo 5.14

Consulte el Ejemplo 5.4. ¿\(Y_1\), la cantidad en existencia, es independiente de \(Y_2\), la cantidad vendida?

Solución

Como la función de densidad es positiva si y sólo si \(0 ≤ y_2 ≤ y_1 ≤ 1\), no existen constantes a,b,c y d tal es que la densidad sea positiva en la región \(a≤y_1 ≤b,c≤y_2 ≤d\).Entonces,el Teorema 5.5 no se puede aplicar. No obstante, se puede demostrar que \(Y_1\) y \(Y_2\) son variables aleatorias dependientes porque la densidad conjunta no es el producto de las densidades marginales.


Las definiciones 5.8 fácilmente se pueden generalizar a \(n\) dimensiones. Suponga que tenemos \(n\) variables aleatorias, \(Y_1, . . . , Y_n\),donde \(Y_i\) tiene función de distribución \(F_i(y_i)\), para \(i = 1,2, ...,n\) ; y donde \(Y_1,Y_2,...,Y_n\) tienen función de distribución conjunta \(F(y_1,y_2, ...,y_n)\). Entonces \(Y_1, Y_2, . . . , Y_n\) son independientes si y sólo si

\(F(y_1, y_2,..., y_n) = F_1(y_1)··· F_n(y_n)\)

para todos los números reales \(y_1, y_2, . . . , y_n\), con las formas equivalentes obvias para los casos discretos y continuos.


5.5 El valor esperado de una función de variables aleatorias

Para justi car la siguiente definición sólo se necesita construir el equivalente multivariante del caso univariante.


Definición 5.9

Sea \(g(Y_1, Y_2, . . . , Y_k)\) una función de las variables aleatorias discretas, \(Y_1, Y_2, . . . , Y_k\), que tienen función de probabilidad \(p(y_1, y_2, . . . , y_k)\). Entonces el valor esperado de \(g(Y_1, Y_2, . . . , Y_k)\) es

\(E[g(Y_1,Y_2,...,Y_k)]= \sum_{\text{toda }y_k} \dots \sum_{\text{toda }y_2} \sum_{\text{toda }y_1} g(y_1,y_2, ..., y_k)p(y_1,y_2,...,y_k).\)

Si \(Y_1, Y_2, . . . , Y_k\) son variables aleatorias continuas con función de densidad conjunta \(f(y_1, y_2, . . . , y_k)\), entonces

\(E[g(Y_1,Y_2,...,Y_k)] = \int_{-\infty}^{\infty} \dots \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(y_1,y_2,...,y_k) \times f(y_1,y_2,...,y_k)dy_1dy_2...dy_k\)


Ejemplo 5.15

Considere que \(Y_1\) y \(Y_2\) tienen una densidad conjunta dada por

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Encuentre \(E(Y_1,Y_2)\).

Solución

De la Definición 5.9 obtenemos

\(E[g(Y_1,Y_2)] = \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}y_1y_2f(y_1,y_2)dy_1dy_2=\int_{0}^{1}\int_{0}^{1}y_1y_2(2y_1)dy_1dy_2=\int_{0}^{1}y_2\Big(\frac{2y_1^3}{3}\Big|_{0}^{1}\Big)dy_2=\int_{0}^{1}\Big(\frac{2}{3}\Big)y_2dy_2 = \frac{2}{3}\frac{y_2^2}{2}\Big|_{0}^{1}=\frac{1}{3}.\)

Demostraremos que la Definición 5.9 es consistente con la Definición 4.5, en la que definimos el valor esperado de una variable aleatoria univariante. Considere dos variables aleatorias \(Y_1\) y \(Y_2\) con función de densidad \(f(y_1, y_2)\). Deseamos hallar el valor esperado de \(g(Y_1, Y_2) = Y_1\). De la Definición 5.9 tenemos

\(E(Y_1)=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} y_1f(y_1,y_2)dy_2dy_1=\int_{-\infty}^{\infty} y_1 \Big[\int_{-\infty}^{\infty}f(y_1,y_2)dy_2 \Big]dy_1.\)

La cantidad dentro de paréntesis rectangulares, por definición, es la función de densidad marginal para \(Y_1\). Por tanto, obtenemos

\(E(Y_1)=\int_{-\infty}^{\infty} y_1f_1(y_1)dy_1,\)

que está acorde con la Definición 4.5.


Ejemplo 5.16

Considere que \(Y_1\) y \(Y_2\) que tienen una densidad conjunta dada por

\(f(y_1,y_2) =\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Encuentre el valor esperado de \(Y_1\)

Solución

\(E(Y_1) = \int_{0}^{1}\int_{0}^{1} y_1(2y_1)dy_1dy_2=\int_{0}^{1} \Big(\frac{2y_1^3}{3}\Big|_{0}^{1}\Big)dy_2=\int_{0}^{1}\frac{1}{3}y_2\Big|_{0}^{1}=\frac{2}{3}\)

Consulte la Figura 5.6 y calcule el valor esperado de \(Y_1\). El valor \(E(Y_1) = 2/3\) parece ser bastante razonable.



Ejemplo 5.17

En la Figura 5.6 el valor medio de \(Y_2\) parece ser igual a .5. Con rmemos este cálculo visual. Encuentre \(E(Y_2)\).

Solución

\(E(Y_2) = \int_{0}^{1}\int_{0}^{1} y_2(2y_1)dy_1dy_2 = \int_{0}^{1}y_2\Big(\frac{2y_1^2}{2}\Big|_{0}^{1}\Big)dy_2=\int_{0}^{1}y_2dy_2=\frac{y_2^2}{2}\Big|_{0}{1} = \frac{1}{2}\)



Ejemplo 5.18

Sean Y_1 y Y_2 variables aleatorias con función de densidad

\(f(y_1, y_2)=\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1, 0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Encuentre \(V(Y_1)\)

Solución

La densidad marginal para \(Y_1\) obtenida en el Ejemplo 5.6 es

\(f(y_1)=\left\{ \begin{array}{cl}\ 2y_1 & 0≤y_1≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Entonces\(V(Y_1)=E (Y_1^2) −[E(Y_1)]^2\), y

\(E(Y_1^k)= \int_{-\infty}^{\infty}y_1^kf_1(y_1)dy_1 = \int_{0}^{1} y_1^k*(2y_1)dy_1 = \frac{2y_1^{k+2}}{k+2}\big|_{0}^{1} = \frac{2}{k+2}.\)

Si hacemos \(k = 1\) y \(k = 2\), se deduce que \(E(Y_1)\) y \(E(Y_1^2\) son 2/3 y 1/2, respectivamente. Entonces \(V(Y_1)=E(Y_2^1) −[E(Y_1)]^2 =1/2−(2/3)^2 =1/18\).



Ejemplo 5.19

Del proceso para producir una sustancia química industrial se obtiene un producto que contiene dos tipos de impurezas. Para una muestra específica proveniente de este proceso, denotemos con \(Y_1\) la proporción de impurezas en la muestra y con \(Y_2\) la proporción de impurezas tipo I entre todas las impurezas halladas. Suponga que la distribución conjunta de \(Y_1\) y \(Y_2\) puede ser modelada con la siguiente función de densidad de probabilidad:

\(f(y_1,y_2)=\left\{ \begin{array}{cl}\ 2(1-y_1) & 0≤y_1≤1,0≤y_2≤1,\\ 0, & \text{en cualquier otro punto}\end{array}\right.\)

Encuentre el valor esperado de la proporción de impurezas tipo I de la muestra.

Solución

Como \(Y_1\) es la proporción de impurezas en la muestra y \(Y_2\) es la proporción de impurezas tipo I entre las impurezas muestrales, se deduce que \(Y_1Y_2\) es la proporción de impurezas tipo I en toda la muestra. Entonces, buscamos hallar \(E(Y_1Y_2)\):

\(E(Y_1Y_2)= \int_{0}^{1}\int_{0}^{1} 2y_1y_2(1-y_1)dy_2dy_1 = 2 \int_{0}^{1}y_1(1-y_1(\frac{1}{2})dy_1=\int_{0}^{1}(y_1-y_1^2)dy_1=\Big(\frac{y_1^2}{2}-\frac{y_1^3}{3}\Big)\Big|_{0}^{1}= \frac{1}{2}-\frac{1}{3}=\frac{1}{6}\)

Por tanto, esperaríamos que 1/6 de la muestra estuviera formado por impurezas tipo I.


5.6 Teoremas especiales

Los teoremas que facilitan el cálculo del valor esperado de una constante, el valor esperado de una constante por una función de variables aleatorias y el valor esperado de la suma de funciones de variables aleatorias son semejantes a los del caso univariante.


Teorema 5.6

Sea c una constante. Entonces \(E(c) = c.\)


Teorema 5.7

Sea \(g(Y_1, Y_2)\) una función de las variables aleatorias \(Y_1\) y \(Y_2\) y sea \(c\) una constante. Entonces \(E[cg(Y_1, Y_2)] = cE[g(Y_1, Y_2)].\)


Teorema 5.8

Sean \(Y_1\) y \(Y_2\) variables aleatorias y \(g_1(Y_1, Y_2), g_2 (Y_1, Y_2), . . . , g_k(Y_1, Y_2)\) funciones de \(Y_1\) y \(Y_2\). Entonces

\(E[g_1(Y_1, Y_2) + g_2(Y_1, Y_2) + . . . +g_k(Y_1, Y_2)] = E[g_1(Y_1, Y_2)] + E[g_2(Y_1, Y_2)] + . . . + E[g_k(Y_1, Y_2)].\)

Las demostraciones de estos tres teoremas son análogas a los casos univariantes estudiados en los Capítulos 3 y 4.


Ejemplo 5.20

Consulte el Ejemplo 5.4. La variable aleatoria \(Y_1 − Y_2\) denota la cantidad proporcional de gasolina remanente al final de la semana. Encuentre \(E(Y_1 – Y_2)\).

Solución

Empleando el Teorema 5.8 con \(g_1(Y_1, Y_2) = Y_1\) y \(g(Y_1, Y_2) = –Y_2\), vemos que \(E(Y_1 − Y_2) = E(Y_1) + E(−Y_2)\).

Se aplica el Teorema 5.7, dando \(E(–Y_2) = –E(Y_2)\); por tanto, \(E(Y_1 − Y_2) = E(Y_1) − E(Y_2)\).

También,

\(E(Y_1) = \int_{0}^{1}\int_{0}^{y_1} y_1(3y_1)dy_2dy_1 = \int_{0}^{1} 3y_1^3dy_1 = \frac{3}{4}y_1^4\Big|_{0}^{1}= \frac{3}{4},\)

\(E(Y_2) = \int_{0}^{1}\int_{0}^{y_1} y_2(3y_1)dy_2dy_1 = \int_{0}^{1}3y_1\Big(\frac{y_2^2}{2}\Big|_{0}^{y_1}\Big)dy_1=\int_{0}^{1}\frac{3}{2}y_1^3dy_1= \frac{3}{8}y_1^4\Big|_{0}^{1}=\frac{3}{8}\)

Entonces,

\(E(Y_1 − Y_2) = (\frac{3}{4}) − (\frac{3}{8}) = \frac{3}{8}\)

de modo que esperaríamos que 3/8 del tanque esté lleno al final de las ventas de la semana.


Si las variables aleatorias motivo de estudio son independientes, en ocasiones podemos simpli car el trabajo necesario para hallar valores esperados. El siguiente teorema es muy útil en este sentido.


Teorema 5.9

Sean \(Y_1\) y \(Y_2\) variables aleatorias independientes y sean \(g(Y_1)\) y \(h(Y_2)\) funciones sólo de \(Y_1\) y \(Y_2\), respectivamente. Entonces \(E[g(Y_1)h(Y_2)] = E[g(Y_1)]E[h(Y_2)]\), siempre que existan los valores esperados

Demostración

Daremos la demostración del resultado para el caso continuo. Denotemos con \(f(y_1, y_2)\) la densidad conjunta de \(Y_1\) y \(Y_2\). El producto \(g(Y_1)h(Y_2)\) es una función de \(Y_1\) y \(Y_2.\) Entonces, por la Definición 5.9 y la suposición de que \(Y_1\) y \(Y_2\) son independientes,

\(E[g(Y_1)h(Y_2)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}g(y_1)h(y_2)f(y_1,y_2)dy_2dy_1\) \(=\int_{-\infty}^{\infty} \int_{-\infty}^{\infty}g(y_1)h(y_2)f_1(y_1)f_2(y_2)dy_2dy_1\)

\(=\int_{-\infty}^{\infty}g(y_1)f_1(y_1) \Big[\int_{-\infty}^{\infty}h(y_2)f_2(y_2)dy_2\Big]dy_1\)

\(=\int_{-\infty}^{\infty}g(y_1)f_1(y_1)E[h(Y_2)]dy_1\)

\(=E[h(Y_2)]\int_{-\infty}^{\infty}g(y_1)f_1(y_1)dy_1 = E[g(Y_1)]E[h(Y_2)]\)

La demostración para el caso discreto sigue un modo análogo.


5.7 Covarianza de dos variables aleatorias

Intuitivamente consideramos la dependencia de dos variables aleatorias \(Y_1\) y \(Y_2\) como un proceso en el que una de las variables, por ejemplo \(Y_1\), aumenta o disminuye cuando \(Y_2\) cambia. Concentraremos nuestra atención en dos medidas de dependencia: la covarianza entre dos variables aleatorias y su coeficiente de correlación. En la Figura 5.8(a) y (b), se muestran las gráficas de los valores observados de dos variables, \(Y_1\) y \(Y_2\), para muestras de \(n = 10\) unidades experimentales tomadas de cada una de las dos poblaciones. Si todos los puntos caen a lo largo de una recta, como indica la Figura 5.8(a), \(Y_1\) y \(Y_2\) son obviamente dependientes. En contraste, la Figura 5.8(b) indica poca o ninguna dependencia entre \(Y_1\) y \(Y_2\). Suponga que conocemos los valores de \(E(Y_1) = \mu_1\) y \(E(Y_2) = \mu_2\) y localizamos este punto en la gráfica de la Figura 5.8. Ahora localizamos un punto graficado, \((y_1, y_2)\), en la Figura 5.8(a) y medimos las desviaciones \((y_1 − \mu_1)\) y \((y_2 − \mu_2)\). Ambas desviaciones toman el mismo signo algebraico para cualquier punto, \((y_1, y_2)\), y su producto \((y_1 − \mu_1)(y_2 − \mu_2)\) es positivo. Los puntos a la derecha de \(\mu_1\) generan pares de desviaciones positivas; los puntos a la izquierda producen pares de desviaciones negativas; y el promedio del producto de las desviaciones \((y_1 − \mu_1)(y_2 − \mu_2)\) es grande y positivo. Si la relación lineal indicada en la Figura 5.8(a) se hubiera inclinado hacia abajo a la derecha, todos los pares de desviaciones correspondientes hubieran sido de signo contrario y el valor promedio de \((y_1 − \mu_1)(y_2 − \mu_2)\) hubiera sido un número negativo grande.

La situación que acabamos de describir no ocurre para la Figura 5.8(b), donde existe poca dependencia entre \(Y_1\) y \(Y_2\). Sus desviaciones correspondientes \((y_1 − \mu_1)\) y \((y_2 − \mu_2)\) tomarán el mismo signo algebraico para algunos puntos y signos opuestos para otros. Entonces, el producto \((y_1 − \mu_1)(y_2 − \mu_2)\) será positivo para algunos puntos, negativo para otros y promediará algún valor cercano a cero. Es evidente que el valor promedio de \((Y_1 − \mu_1)(Y_2 − \mu_2)\) proporciona una medida de la dependencia lineal entre \(Y_1\) y \(Y_2\). Esta cantidad, \(E[(Y_1 − \mu_1)(Y_2 − \mu_2)]\), se denomina covarianza de \(Y_1\) y \(Y_2\).


Definición 5.10

Si \(Y_1\) y \(Y_2\) son variables aleatorias con medias \(\mu_1\) y \(\mu_2\), respectivamente, la covarianza de \(Y_1\) y \(Y_2\) es \(Cov(Y_1, Y_2) = E [(Y_1 − \mu_1)(Y_2 − \mu_2)]\) .


Cuanto mayor sea el valor absoluto de la covarianza de \(Y_1\) y \(Y_2\), mayor será la dependencia lineal entre \(Y_1\) y \(Y_2\). Los valores positivos indican que \(Y_1\) aumenta cuando \(Y_2\) aumenta; los valores negativos indican que \(Y_1\) disminuye cuando \(Y_2\) aumenta. Un valor cero de la covarianza indica que las variables son no correlacionadas y que no hay dependencia lineal entre \(Y_1\) y \(Y_2\).

Desafortunadamente, es difícil utilizar la covarianza como medida absoluta de dependencia porque su valor depende de la escala de medición. En consecuencia, es difícil determinar a primera vista si una covarianza particular es grande o pequeña. Este problema se puede eli- minar al estandarizar su valor y usar el coeficiente de correlación, \(\rho\), una cantidad relacionada con la varianza y que se de ne como

\(\rho = \frac{Cov(Y_1-Y_2)}{\sigma_1 \sigma_2}\)

donde \(\sigma_1\) y \(\sigma_2\) son desviaciones estándar de \(Y_1\) y \(Y_2\), respectivamente. Se pueden hallar más exposiciones del coeficiente de correlación en la obra de Hogg, Craig y McKean (2005) y Myers (2000).

Una demostración del coeficiente de correlación \(\rho\) satisface la desigualdad \(–1 ≤ \rho ≤ 1\) está resumida en el Ejercicio 5.167.

El signo del coeficiente de correlación es igual al signo de la covarianza. Entonces, \(\rho > 0\) indica que \(Y_2\) aumenta a medida que \(Y_2\) aumenta y \(\rho = +1\) implica correlación perfecta, con todos los puntos cayendo en una recta con pendiente positiva. Un valor de \(\rho = 0\) implica cero covarianza y que no hay correlación. Un coe ciente negativo de correlación implica una disminución en \(Y_2\) cuando \(Y_1\) aumenta, y \(\rho= –1\) implica correlación perfecta, con todos los puntos cayendo en una recta con pendiente negativa. Una fórmula computacional conveniente para la covarianza se especifica en el siguiente teorema.


Teorema 5.10

Si \(Y_1\) y \(Y_2\) son variables aleatorias con medias \(\mu_1\) y \(\mu_2\), respectivamente, entonces

\(Cov(Y_1, Y_2) = E [(Y_1 − \mu_1)(Y_2 − \mu_2)] = E(Y_1Y_2) − E(Y_1)E(Y_2)\).

\(Cov(Y_1, Y_2) = E [(Y_1 − \mu_1)(Y_2 − \mu_2)]\) \(= E(Y_1Y_2 − \mu_1Y_2 − \mu_2Y_1 + \mu_1\mu_2).\)

Del Teorema 5.8, el valor esperado de una suma es igual a la suma de los valores espera- dos; y del Teorema 5.7, el valor esperado de una constante multiplicado por una función de variables aleatorias es la constante por el valor esperado. Entonces,

\(Cov(Y_1, Y_2) = E(Y_1Y_2) − \mu_1 E(Y_2) − \mu_2 E(Y_1) + \mu_1\mu_2\).

Como \(E(Y_1) = \mu_1\) y \(E(Y_2)= \mu_2\), se deduce que

\(Cov(Y_1, Y_2) = E(Y_1Y_2) − E(Y_1)E(Y_2) = E(Y_1Y_2) − \mu_1\mu_2.\)


Ejemplo 5.22

Consulte el Ejemplo 5.4. Encuentre la covarianza entre la cantidad en existencia \(Y_1\) y la cantidad de ventas \(Y_2\).

Solución

Recuerde que \(Y_1\) y \(Y_2\) tienen función de densidad conjunta dada por

\(f(y_1,y_2)=\left\{ \begin{array}{cl}3y_1 & 0≤y_2≤y_1≤1;\\ 0 & \text{en cualquier otro punto}\end{array}\right.\)

Entonces,

\(E(Y_1Y_2) = \int_{0}^{1}\int_{0}^{y_1} y_1y_2(3y_1)dy_2dy_1 = \int_{0}^{1} 3y_1^2\Big(\frac{y_2^2}{2}\Big|_{0}^{y_1}\Big)dy_1=\int_{0}^{1}\frac{3}{2}y_1^4dy_1 = \frac{3}{2}\Big(\frac{y_1^5}{5}\Big|_{0}^{1}\Big)=\frac{3}{10}.\)

Del Ejemplo 5.20, sabemos que \(E(Y_1) = 3/4\) y \(E(Y_2) = 3/8\). Entonces, usando el Teorema 5.10, obtenemos

\(Cov(Y_1, Y_2) = E(Y_1Y_2) − E(Y_1)E(Y_2) = (3/10) − (3/4)(3/8) = .30 − .28 = .02.\)

En este ejemplo, valores grandes de \(Y_2\) pueden presentarse sólo con valores grandes de \(Y_1\) y la densidad, \(f(y_1, y_2)\), es más grande para valores más grandes de \(Y_1\) (vea la Figura 5.4). Entonces, intuimos que la covarianza entre \(Y_1\) y \(Y_2\) debe ser positiva.


Ejemplo 5.23

Tengan \(Y_1\) y \(Y_2\) densidad conjunta dada por

\(f(y_1,y_2)=\left\{ \begin{array}{cl}2y_1 & 0≤y_1≤1, 0≤y_2≤1;\\ 0 & \text{en cualquier otro punto}\end{array}\right.\)

Encuentre la covarianza de \(Y_1\) y \(Y_2\).

Solución

Del Ejemplo 5.15, \(E(Y_1Y_2) = 1/3\). También, de los Ejemplos 5.16 y 5.17, \(\mu_1 = E(Y_1) = 2/3\) y \(\mu_2 = E(Y_2) = 1/2\), y \(Cov(Y_1, Y_2) = E(Y_1Y_2) − \mu_1\mu_2 = (1/3) − (2/3)(1/2) = 0\).


El Ejemplo 5.23 proporciona un caso específico del resultado general dado en el Teorema 5.11.


Teorema 5.11

Si Y_1 y Y_2 son variables aleatorias independientes, entonces

\(Cov(Y_1, Y_2) = 0.\)

Así, las variables aleatorias independientes deben ser no correlacionadas.

Demostración

El Teorema 5.10 establece que

\(Cov(Y_1, Y_2) = E(Y_1Y_2) −\mu_1\mu_2.\)

Como \(Y_1\) y \(Y_2\) son independientes, el Teorema 5.9 implica que

\(E(Y_1Y_2) = E(Y_1)E(Y_2) = \mu_1\mu_2\),

y el resultado deseado se deduce de inmediato.


Observe que las variables aleatorias \(Y_1\) y \(Y_2\) del Ejemplo 5.23 son independientes; en consecuencia, por el Teorema 5.11, su covarianza debe ser cero. El recíproco del Teorema 5.11 no es verdadero, como se ilustra en el ejemplo siguiente.


Ejemplo 5.24

Sean \(Y_1\) y \(Y_2\) variables aleatorias discretas con distribución de probabilidad conjunta como se ve en la Tabla 5.3. Demuestre que \(Y_1\) y \(Y_2\) son dependientes pero tienen covarianza cero.

Solución

El cálculo de probabilidades marginales da \(p_1(–1) = p_1(1) = 5/16 = p_2(–1) = p_2(1)\) y \(p_1(0) = 6/16 = p_2(0)\). El valor \(p(0, 0) = 0\) en la celda del centro se destaca. Obviamente,

\(y_1\) \(y_1\) \(y_1\)
\(y_2\) -1 0 +1
-1 1/16 3/16 1/16
0 3/16 0 3/16
+1 1/16 3/16 1/16

\(p(0, 0) ≠ p_1(0) p_2(0),\)

y esto es su ciente para demostrar que \(Y_1\) y \(Y_2\) son dependientes. Observando de nuevo las probabilidades marginales, vemos que \(E(Y_1) = E(Y_2) = 0\).

También,

\(E(Y_1Y_2)=\sum_{\text{toda }y_1}\sum_{\text{toda }y_2} y_1y_2p(y_1,y_2)\) \(=(-1)(-1)(1/16)+(-1)(0)(3/16)+(-1)(1)(1/16)\) \(+(0)(-1)(3/16)+(0)(0)(0)+(0)(1)(3/16)\) \((1)(-1)(1/16)+(1)(0)(3/16)+(1)(1)(1/16)\) \(=(1/16)-(1/16)-(1/16)+(1/16)=0\)

Entonces,

\(Cov(Y_1,Y_2)=E(Y_1Y_2)-E(Y_1)E(Y_2) = 0-0(0)=0\)

Este ejemplo demuestra que el recíproco del Teorema 5.11 no es verdadero. Si la covarian- za de dos variables aleatorias es cero, las variables no necesitan ser independientes.

