#install.packages("gtools")
#install.packages("ggforce")  
#install.packages("mosaicCalc")
require(gtools)
require(tidyverse)
require(ggforce)  
options(kableExtra.latex.load_packages = TRUE)
require(kableExtra)
require(mosaicCalc)
require(gridExtra)
require(numDeriv)
require(pracma)
require(DT)
#devtools::install_github("AckerDWM/gg3D") 
require(gg3D)
#Para numerar tabelas e figuras:
require(captioner)
fig_nums <- captioner(prefix = "Figura")
table_nums <- captioner(prefix = "Tabela")
quadro_nums<- captioner(prefix="Quadro")

1 Vetores Aleatórios

Em diversas áreas do conhecimento é natural que o pesquisador planeje sua pesquisa estatística buscando responder questões práticas. Essas questões eventualmente consistem em trabalhar conjuntamente com duas ou mais variáveis. Nesta seção, apresenta-se o tratamento probabilístico para um conjunto de variáveis aleatórias.

Definição: Vetor Aleatório Seja (\(\small \Omega, \mathscr{A}, P\)) um espaço de probabilidade e \(\small \boldsymbol{X}=X_1,X_2,\ldots,X_m\) uma função de \(\small \Omega\) em \(\small \mathbb{R}^m\). Definimos como vetor aleatório, variável aleatória multidimensional ou variável aleatória multivariada a função representada por \(\small \boldsymbol{X}(\omega) = (X_1(\omega), X_2(\omega), \cdots, X_m(\omega))\) tal que para todo \(\small i=1, 2, \ldots,m\) e todo \(\small I_i \subset \mathbb{R}\), temos \(\small X_i^{-1}(I_i) \in \mathscr{A}\).

1.1 Função de Distribuição Conjunta

A função distribuição conjunta de \(\small \boldsymbol{X}=X_1,X_2,\ldots,X_m\) é definida por \[ \small F(x_1,x_2,\ldots,x_m) = P(X_1\leq x_1, X_2\leq x_2, \ldots, X_m\leq x_m),\] para quaisquer \((x_1,x_2,\ldots,x_m) \in \mathbb{R}^m.\)

1.2 Propriedades da Função de Distribuição Conjunta

Seja \(\boldsymbol{X}\) um vetor aleatório em (\(\Omega, \mathscr{A}, P\)) então para qualquer \(\boldsymbol{x} \in \mathbb{R}^m\), \(\small F(\boldsymbol{x})\) satisfaz as seguintes propriedades:

  • \(\small F(x_1,x_2,\ldots,x_m)\) é não decrescente em cada uma de suas coordenadas;
  • \(\small F(x_1,x_2,\ldots,x_m)\) é contínua à direita em cada uma de suas coordenadas;
  • Se para algum \(j\), \(x_j \rightarrow -\infty\), então \(\small F(x_1,x_2,\ldots,x_m)\rightarrow 0\) e, ainda, se para todo \(j\), \(x_j \rightarrow \infty\), então \(F(x_1,x_2,\ldots,x_m)\rightarrow 1\);
  • \(\small F(x_1,x_2,\ldots,x_m)\) é tal que, \(\forall a_i, b_i \in \mathbb{R}, a_i<b_i, i = 1, \ldots,m,\) temos \[\small P(a_1<X_1 \leq b_1, a_2<X_2 \leq b_2,\ldots, a_m<X_m \leq b_m) \geq 0.\]

Vetor Discreto: Probabilidade Conjunta Se as variáveis do vetor aleatório são discretas, temos um vetor aleatório discreto. Sua função de probabilidade conjunta é definida da seguinte forma: \[ \small P(\boldsymbol{X}=\boldsymbol{x})=P(X_1=x_1,X_2=x_2,\ldots,X_m=x_m).\]

Propriedades da Função de Probabilidade Conjunta Seja \(X_1,X_2,\ldots,X_m\) um vetor aleatório discreto em (\(\Omega, \mathscr{A}, P\)). Então sua função de probabilidade conjunta satisfaz as propriedades:

  • \(P(\boldsymbol{X}=\boldsymbol{x}) \geq 0, \forall \boldsymbol{x} \in \mathbb{R}^m;\)
  • \(\sum\limits_{\boldsymbol{x}} P(\boldsymbol{X}=\boldsymbol{x}) = 1.\)

Definição: Vetor Discreto: Probabilidade Marginal A função de probabilidade marginal de \(X_k, k = 1, 2, \ldots,m\) é dada por: \[ \small P(X_k=x_k) = \sum\limits_{x_i,\forall i\neq k}P(\boldsymbol{X}=\boldsymbol{x}) = \sum\limits_{x_i,\forall i\neq k}P(X_1 = x_1, X_2 = x_2, \ldots, X_m = x_m);\] ou seja, a marginal vem da soma em todas as coordenadas, exceto \(k\).

Para o caso bidimensional a função de probabilidade conjunta é dada por: \[\small P(X_1=x_1,X_2=x_2) = P\left[(X_1 = x_1) \cap (X_2 = x_2)\right] = P(X_1 = x_1, X_2 = x_2).\] A partir da função de probabilidade conjunta é possível obter as

Funções marginais de \(X_1\) e \(X_2\), através da soma de uma das coordenadas. Assim, \(\small P(X_1=x_1) = \sum\limits_{x_2}P(X_1=x_1,X_2=x_2)\) e \(P(X_2=x_2) = \sum\limits_{x_1}P(X_1=x_1,X_2=x_2)\).

Exemplo: Duas moedas equilibradas são lançadas de forma independente e definiu-se as variáveis aleatórias \(X\): contagem do número de caras nos dois lançamentos e \(Y:\) função indicadora de faces iguais nos dois lançamentos. \[ \small \begin{array}{|llll|} \hline \begin{array}{llll} \mbox{Função probabilidade conjunta:}\\ \begin{array}{lll|l} \hline x\setminus y & 0 & 1 & P(X=x) \\ \hline 0 & 0 & 0.25 & 0.25\\ 1 & 0.5 & 0 & 0.5\\ 2 & 0 & 0.25 & 0.25\\ \hline P(Y=y) & 0.5 & 0.75 & 1\\ \hline \end{array} \end{array} \Rightarrow \begin{array}{lll|l} \mbox{Função de probabilidade marginal de X:}\\ \begin{array}{c|cc} \hline x & 0 & 1 & 2 & \mbox{Total} \\ \hline P(X=x) & 0.25 & 0.5 & 0.75 & 1\\ \hline \end{array}\\ \\ \mbox{Função de probabilidade marginal de Y:}\\ \begin{array}{c|cc} \hline y & 0 & 1 & \mbox{Total} \\ \hline P(Y=y) & 0.5 & 0.75 & 1\\ \hline \end{array} \end{array}\\ \hline \end{array} \] Em fórmulas de probabilidade, a função de probabilidade marginal de \(X\) é obtida como: \[ \small \begin{array}{|ll|} \hline P(X=x) = \sum\limits_{\mbox{em y}} P(X=x,Y=y)\\ \mbox{logo:}\\ \begin{array}{ll} P(X=0) = P(X=0,Y=0)+P(X=0,Y=1) = 0 + \frac{1}{4} = \frac{1}{4},\\ P(X=1) = P(X=1,Y=0)+P(X=1,Y=1) = \frac{1}{2} + 0 = \frac{1}{2},\\ P(X=2) = P(X=2,Y=0)+P(X=2,Y=1) = 0 + \frac{1}{4} = \frac{1}{4}. \end{array}\\ \hline \end{array} \] Análogo para a probabilidade marginal de \(Y\).

Definição: Vetor Contínuo, Densidade Conjunta e Marginal Denominamos vetor aleatório contínuo o vetor aleatório cujas componentes são variáveis aleatórias contínuas. Em outras palavras, um vetor aleatório é contínuo se, dada a função de distribuição \(F\), existe uma função \(f: \mathbb{R}^m \rightarrow \mathbb{R}^{+}\), denominada função densidade conjunta, tal que \[\small F(x_1,x_2,\ldots,x_m) = \int\limits_{-\infty}^{x_1}\ldots\int\limits_{-\infty}^{x_m} f(u_1,u_2,\ldots,u_m) du_1\ldots du_m.\]

A função densidade marginal é dada pela expressão: \[\small f_{X_k}(x_k) = \int\limits_{x_1}\ldots \int\limits_{x_m} f(\textbf{x})dx_1\ldots dx_m, \forall i\neq k.\]

1.3 Propriedades da Função Densidade Conjunta

Seja X um vetor aleatório contínuo em (\(\Omega, \mathscr{A}, P\)). Então sua função densidade conjunta satisfaz as propriedades:

  • \(\small f(\textbf{x}) \geq 0, \forall \textbf{x} \in \mathbb{R}^m;\)
  • \(\small \int\limits_{-\infty}^{\infty}\ldots\int\limits_{-\infty}^{\infty} f(\textbf{x})dx_1\ldots dx_m = 1.\)

Exemplo 2: Obtenha o valor de \(k\), de modo que a função abaixo seja a densidade conjunta de três variáveis aleatórias contínuas \(X\), \(Y\) e \(Z\). Dado o valor de \(k\) obtenha as marginais de \(X\), \(Y\) e \(Z\). \[ \small f(x,y,z) = \left\{ \begin{array}{ll} kxy^2z,& \mbox{ se } 0\leq x\leq 1 \mbox{ e } 0\leq y\leq 1 \mbox{ e } 0\leq z\leq \sqrt{2}; \\ 0, & \mbox{ caso contrário}. \end{array} \right. \] \[ \small \begin{array}{|llll|} \hline &&\int\limits_0^1 \int\limits_0^1 \int\limits_0^{\sqrt{2}} k.x.y^2.z. dzdydx=1\\ &&\Rightarrow k=\frac{1}{V}\approx 6 \\ &&\mbox{pois }V=\int\limits_0^1 \int\limits_0^1 \int\limits_0^{\sqrt{2}} x.y^2.z. dzdydx \\ &&\approx 0,1667\\ \hline &&\mbox{ Marginal de X:}\\ &&f_X(x)=6.x \int\limits_0^1 y^2 \int\limits_0^{\sqrt{2}} z. dzdy\\ &&=6.x \int\limits_0^1 y^2 dy\\ &&=6.x \frac{1}{3}\\ &&=2.x \Rightarrow X \sim Beta (2,1)\\ \hline &&\mbox{ Marginal de Y:}\\ &&f_Y(y)=6 y^2 \int\limits_0^1 x \int\limits_0^{\sqrt{2}} z dzdx \\ &&=6.y^2 \int\limits_0^1 x dx\\ &&=6.y^2 \frac{1}{2}\\ &&=3.y^2 \Rightarrow Y \sim Beta (3,1)\\ \hline \end{array} \begin{array}{|lllllll|} \hline &&\mbox{Cálculo de V (detalhado):}\\ &&V=\int\limits_0^1 x \int\limits_0^1 y^2 \int\limits_0^{\sqrt{2}}z. dzdydx\\ &&=\int\limits_0^1 x \int\limits_0^1 y^2 \left.\frac{z^2}{2}\right|_0^{\sqrt{2}} dydx\\ &&= \int\limits_0^1 x \int\limits_0^1 y^2 dydx\\ &&= \int\limits_0^1 x \left. \frac{y^3}{3}\right|_0^1 dx\\ &&= \frac{1}{3}\int\limits_0^1 x dx\\ &&= \frac{1}{3} \left.\frac{x^2}{2}\right|_0^1\\ &&= \frac{1}{6}\\ \hline &&\mbox{ Marginal de Z}\\ &&f_Z(z)=6.z \int\limits_0^1 x \int\limits_0^1 y^2dydx\\ &&=6.z.\frac{1}{3} \int\limits_0^1 x dx\\ &&=6.z.\frac{1}{3} \frac{1}{2} \\ &&=z \Rightarrow Z \mbox{ não tem expressão conhecida!}\\ \hline \end{array} \]

Integração numérica tripla do pacote pracma:

f=function(x,y,z){
  x*y^2*z
}
V=integral3(f, xmin=0, xmax=1, ymin=0, ymax=1, zmin=0, zmax=sqrt(2))
paste0("valor de V = ",V)
## [1] "valor de V = 0.166666666666667"
k=1/V
paste0("valor de k= ",k)
## [1] "valor de k= 6"

As densidades marginais integram em 1!

Areax=antiD(2*x ~ x)
Areay=antiD(3*y^2 ~ y)
Areaz=antiD(z ~ z)
paste0("Area sob a função fx =", Areax(1)-Areax(0))
## [1] "Area sob a função fx =1"
paste0("Area sob a função fy =", Areay(1)-Areay(0))
## [1] "Area sob a função fy =1"
paste0("Area sob a função fz =", Areaz(sqrt(2))-Areaz(0))
## [1] "Area sob a função fz =1"

Gráficos das marginais: (note que não é possível a visualização da \(\small f_{X,Y,Z}(x,y,z)\) graficamente, pois esta reside na dimensão 4D!

x=seq(0,1,0.1)
y=seq(0,1,0.1)
z=seq(0,sqrt(2),0.1)
fx=dbeta(x,shape1=2,shape2=1)
fy=dbeta(y,shape1=3,shape2=1)
fz=z

a=ggplot(data.frame(x,fx), aes( x=x, y=fx)) +
geom_line(size=1.2,color="orange") +
labs(x="x",y="f(x)",title="densidade de X: Beta(2,1)")
 
b=ggplot(data.frame(y,fy), aes( x=y, y=fy)) +
geom_line(size=1.2,color="orange") +
labs(x="y",y="f(y)",title="densidade de Y: Beta(3,1)")
  
c=ggplot(data.frame(z,fz), aes( x=z, y=fz)) +
geom_line(size=1.2,color="orange") +
labs(x="z",y="f(z)",title="densidade de Z: f(z)=z")

grid.arrange(a, b, c, ncol = 2, nrow = 2)
Figura  1: Exemplo 2 - Gráficos das marginais

Figura 1: Exemplo 2 - Gráficos das marginais

Exemplo 3: A função mista de probabilidade conjunta de \(X\) e \(Y\) é dada por: \[ \small f(x,y) = \left\{ \begin{array}{lll} \frac{xy^{x-1}}{3},& \mbox{ se } x = 1,2,3 \mbox{ e } 0\leq y\leq 1; \\ 0, & \mbox{ caso contrário}. \end{array} \right. \] - Verifique se essa função poderá gerar probabilidades; - Calcule a probabilidade conjunta de \(X\geq 2\) e \(Y\geq 1/2\). - Calcule as marginais de \(X\) e \(Y\).

Solução \[ \small \begin{array}{|lll|} \hline &&\mbox{Pode gerar probabilidades pois as }\\ &&\mbox{propriedades da função de densidade são satisfeitas: }\\ &&\square \mbox{assume somente valores }\geq 0:\\ && \frac{1}{3} x.y^{x-1} \geq 0, \forall x=1,2,3 \mbox{ e } 0\leq y\leq 1\\ &&\square \mbox{integrando em y e somando em x resulta em 1:}\\ && \frac{1}{3} \int\limits_0^1 \sum\limits_{x=1}^3 x.y^{x-1}dy\\ && = \frac{1}{3} \int\limits_0^1 (1 + 2.y + 3.y^2)dy\\ &&= \frac{1}{3} \left.y+2.\frac{y^2}{2}+3.\frac{y^3}{3}\right|_0^1=1\\ \hline \end{array} \begin{array}{|lll|} \hline &&\mbox{Probabilidade conjunta: }\\ && \int\limits_0^\frac{1}{2} \sum\limits \limits_{x=1}^2 x.y^{x-1}dy\\ && = \frac{1}{3} \int\limits_0^1 (1 + 2.y)dy\\ &&= \frac{1}{3} \left.y+2.\frac{y^2}{2}\right|_0^\frac{1}{2}\\ &&=\frac{1}{3} \left(\frac{1}{2}+2.\frac{1}{8}\right)\\ &&=\frac{1}{4}\\ \hline \end{array}\\ \begin{array}{|lll|} \hline &&\mbox{Marginal de X: }\\ && \frac{1}{3} x \int\limits_0^1 y^{x-1}dy\\ && = \frac{1}{3} x \left.\frac{y^x}{x}\right|_0^1 = \\ && = \frac{1}{3}\\ \hline \end{array} \begin{array}{|lll|} \hline &&\mbox{Marginal de Y: }\\ &&= \frac{1}{3} \sum\limits_{x=1}^3 x y^{x-1}\\ && =\frac{1}{3} (1 + 2.y + 3.y^2)\\ &&= y^2 + \frac{2y}{3}+\frac{1}{3}\\ \hline \end{array} \]

Integral numérica no R, sendo necessário desenvolver o somatório primeiro:

x=c(1,2,3)
f=function(y){
  1/3*(x[1]*y^(x[1]-1)+x[2]*y^(x[2]-1)+x[3]*y^(x[3]-1))
}
Area=integrate(f,0,1)
Area
## 1 with absolute error < 1.1e-14
g=function(y){
  1/3*(x[1]*y^(x[1]-1)+x[2]*y^(x[2]-1))
}
Area2=integrate(g,0,1/2)
Area2
## 0.25 with absolute error < 2.8e-15

A marginal de X soma 1 e a marginal de Y integra 1:

px=rep(1/3,3)
paste0("Soma de P(X=x) nos valores de x =",sum(px))
## [1] "Soma de P(X=x) nos valores de x =1"
areay=antiD(y^2+2*y/3+1/3 ~ y)
paste0("Àrea sob a parábola de y =",areay(1)-areay(0))
## [1] "Àrea sob a parábola de y =1"

Gráficos:

y=seq(0,1,0.1)
x=c(1,2,3)
px=c(1/3,1/3,1/3)
fy=y^2+2*y/3+1/3

data=data=data.frame(y)%>%
  mutate(f_1=1/3*x[1]*y^(x[1]-1),
         f_2=1/3*x[2]*y^(x[2]-1),
         f_3=1/3*x[3]*y^(x[3]-1)) 

datatable(data,cap=quadro_nums("quadro1","Visualização dos valores"),
options = list(list(pageLength = 5),columnDefs=list(list(class="dt-center",targets=list(1,2,3,4)),
                                    list(width = '20%', targets = list(1,2,3,4)))))

Figura 2: Gráficos do exemplo 3

colors <- c("f_1"="blue", "f_2"="red", "f_3"="green")
a=ggplot(data, aes(x = y,y = f_1, color = "f_1")) +
    geom_line(size=1.2) +
    geom_line(size=1.2,aes(x = y,y = f_2, color = "f_2")) +
    geom_line(size=1.2,aes(x = y,y = f_3, color = "f_3")) +
    labs(x="y",
         y=expression(f[XY](x,y)),
         title="Densidade conjunta em três cenários",
         color = "Valores de x") +
    scale_color_manual(labels=c(expression(x==1),expression(x==2),expression(x==3)),values = colors)

b=ggplot(data.frame(x,px), aes( x=x, y=px )) +
geom_point(size=3,color="orange")+
labs(x="x",y="P(X=x)",title="Função de probabilidade de X")

c=ggplot(data.frame(y,fy), aes( x=y, y=fy)) +
geom_line(size=1.2,color="orange") +
labs(x="y",y="f(y)",title="densidade de Y")

grid.arrange(a, b,c, ncol = 2, nrow = 2)
Figura  2: Gráficos do exemplo 3

Figura 2: Gráficos do exemplo 3

1.4 Função de Distribuição Condicional

Caso 1: \(X\) e \(Y\) variáveis contínuas:

    A função de distribuição condicional de $X$ dado $Y=y$ é dada por:

\[ \small F_{X|Y}(x|y) = P(X\leq x| Y\leq y) = \frac{P(\left[X\leq x\right]\cap \left[Y\leq y\right])}{P(Y\leq y)}. \]

Caso 2 - \(X\) contínua e \(Y\) discreta:

A função de distribuição condicional de $X$ dado $Y=y$ ($Y$ uma variável aleatória discreta) é dada por:

\[ \small F_{X|Y}(x|Y=y) = \frac{P(\left[X\leq x\right]\cap \left[Y=y\right])}{P(Y=y)}. \]

Como consequência temos: \[ \small F_X(x) = \sum\limits_{y} P(Y=y)F_{X|Y}(x|Y=y). \]

Função de Probabilidade Condicional - Caso Discreto \[ \small P_{X|Y}(x|y) = \frac{P_{X,Y}(x,y)}{P_Y(y)}. \]

Função de Densidade Condicional - Caso Contínuo \[ \small f_{X|Y}(x|y) = \frac{f_{X,Y}(x,y)}{f_Y(y)}. \]

Exemplo 4: Duas variáveis \(X\) e \(Y\) têm densidade dada pela fórmula abaixo. Obtenha a densidade condicional \(f_{X|Y}(x|y)\). \[ \small f_{X,Y}(x,y) = (x+y), \quad 0\leq x\leq 1, \quad 0\leq y\leq 1. \]

Solução: \[ \small \begin{array}{|llll|} \hline &&\mbox{marginal de X: integra-se no conjunto de valores de Y:}\\ f_X(x)&&=\int\limits_0^1 f_{x,y}(x,y) dy \\ &&=\int\limits_0^1 (x+y) dy\\ &&=x \int\limits_0^1 dy + \int\limits_0^1 ydy\\ &&=x.y|_0^1+\frac{1}{2}\left.y^2\right|_0^1\\ && = x+\frac{1}{2} \\ &&\mbox{análogo para a marginal de Y pois o conjunto de valores de x é idêntico!}\\ f_Y(y)&&=y+\frac{1}{2}\\ &&\mbox{condicional:}\\ f_{X|Y}(x|y) &&= \frac{f_{X,Y}(x,y)}{f_Y(y)}\\ && = \frac{x+y}{y+\frac{1}{2}}\\ \hline \end{array} \]

Integral não definida no R para encontrar as marginais: só faltando aplicar nos limites de integração!

antiD(x+y ~ y)
## function (y, C = 0, x = 1) 
## x * y + 1/2 * y^2 + C

Integrais no R para verificar que as integrais são iguais a 1:

  • A integral da condicional de x dado y é igual a 1 para valores fixados de y (dado y):
fxy=function(x,y){
  x+y
}

fx=function(x){
  x+1/2
}

fy=function(y){
  y+1/2
}

f1=function(x){
  (x+1/3)/(1/3+1/2)
}

f2=function(x){
  (x+1/2)/(1/2+1/2)
}

f3=function(x){
  (x+1)/(1+1/2)
}
Ixy=integral2(fxy, xmin=0, xmax=1, ymin=0, ymax=1)
Ix=integrate(fx,0, 1)
Iy=integrate(fy,0, 1)

Ix1=integrate(f1,0, 1)
Ix2=integrate(f2,0, 1)
Ix3=integrate(f3,0, 1)

paste0("Integral da conjunta= ",Ixy$Q)
## [1] "Integral da conjunta= 1"
"Integral de fx= "
## [1] "Integral de fx= "
Ix
## 1 with absolute error < 1.1e-14
"Integral de fy= "
## [1] "Integral de fy= "
Iy
## 1 with absolute error < 1.1e-14
"Integral da condicional com y=1/3 = "
## [1] "Integral da condicional com y=1/3 = "
Ix1
## 1 with absolute error < 1.1e-14
"Integral da condicional com y=1/2 = "
## [1] "Integral da condicional com y=1/2 = "
Ix2
## 1 with absolute error < 1.1e-14
"Integral da condicional com y=1 = "
## [1] "Integral da condicional com y=1 = "
Ix3
## 1 with absolute error < 1.1e-14

Gráficos

x=seq(0,1,0.1)
y=seq(0,1,0.1)
data=data=data.frame(x)%>%
  mutate(f_1=x+y[1],
         f_2=x+y[2],
         f_3=x+y[3],
         f_4=x+y[4],
         f_5=x+y[5],
         f_6=x+y[6],
         f_7=x+y[7],
         f_8=x+y[8],
         f_9=x+y[9],
         f_10=x+y[10],
         f_11=x+y[11])
data=data %>% 
  `colnames<-`(c("x","0","0.1","0.2","0.3","0.4","0.5","0.6","0.7","0.8","0.9","1")) %>%
pivot_longer(!x, names_to = "y", values_to = "dens") %>%
mutate(y = as.numeric(y))

datatable(data,cap=quadro_nums("quadro2","Visualização dos valores de forma discretizada"),
options = list(list(pageLength = 5),columnDefs=list(list(class="dt-center",targets=list(1,2,3)),
                                    list(width = '20%', targets = list(1,2,3)))))

Figura 3: Gráficos do exemplo 4

a=ggplot(data, aes(x=x, y=y, z=dens))+ 
  theme_void() +
  axes_3D() +
  stat_3D()+
  labs(x="x",y="y",z="f",title="Função de densidade de X e Y, discretizada")

b=data.frame(x,fx=x+1/2)%>%
ggplot(aes( x=x, y=fx )) +
geom_line( size=1.2,color="orange")+
labs(x="x",y="f(x)",title="Densidade de X")

c=data.frame(y,fy=y+1/2)%>%
ggplot(aes( x=y, y=fy )) +
geom_line( size=1.2,color="orange")+
labs(x="y",y="f(y)",title="Densidade de Y")

colors <- c("f1"="blue", "f2"="red", "f3"="green")
d=data.frame(x,f1=(x+1/3)/(1/3+1/2),
               f2=(x+1/2)/(1/2+1/2),
               f3=(x+1)/(1+1/2))%>%
ggplot(aes( x=x, y=f1,color="f1" )) +
    geom_line(size=1.2) +
    geom_line(size=1.2,aes(x = x,y = f2, color = "f2")) +
    geom_line(size=1.2,aes(x = x,y = f3, color = "f3")) +
    labs(x="x",
         y=expression(f[X|Y](x|y)),
         title="Densidade condicional em três cenários",
         color = "Valores de y") +
    scale_color_manual(labels=c(expression(y==1/3),expression(y==1/2),expression(y==1)),values = colors)
grid.arrange(a, b, c,d, ncol = 2, nrow = 2)
Figura  3: Gráficos do exemplo 4

Figura 3: Gráficos do exemplo 4

Definição: Independência entre Variáveis Duas variáveis aleatórias, \(X\) e \(Y\) em (\(\Omega, \mathscr{A}, P\)), são independentes se a informação sobre uma delas não altera a probabilidade de ocorrência da outra. Em termos de função distribuição temos: \[ \small X, Y \mbox{ independentes} \Leftrightarrow F_{X,Y}(x,y) = F_X(x)F_Y(y), \forall (x,y) \in \mathbb{R}^2. \]

Para as discretas, podemos escrever uma definição equivalente com o uso de funções de probabilidade: \[ \small X, Y \mbox{ independentes} \Leftrightarrow P_{X,Y}(x,y) = P_X(x)P_Y(y), \forall (x,y) \in \mathbb{R}^2.\] Para as contínuas, a condição de independência usa as densidades: \[ \small X, Y \mbox{ independentes} \Leftrightarrow f_{X,Y}(x,y) = f_X(x)f_Y(y), \forall (x,y) \in \mathbb{R}^2. \] %% pg 134 - Magalhães (capa rosa)

Exemplo 5: Com base em resultados do posto de saúde do bairro, estabeleceu-se a função de probabilidade conjunta entre os números diários de crianças atendidas com alergia (\(X\)) e com pneumonia (\(Y\)). Na tabela abaixo, apresentamos a conjunta e as marginais para essas variáveis.

\[ \small \begin{array}{|llll|} \hline \begin{array}{llll} \mbox{Função probabilidade conjunta:}\\ \begin{array}{llll|l} \hline x\setminus y & 0 & 1 & 2 & P(X=x) \\ \hline 0 & \frac{1}{16} & \frac{1}{16} & \frac{1}{8} & \frac{1}{4}\\ 1 & \frac{1}{8} & \frac{1}{8} & 0 & \frac{1}{4}\\ 2 & \frac{1}{16} & \frac{1}{8} & \frac{1}{8} & \frac{5}{16}\\ 3 & 0 & \frac{1}{8} & \frac{1}{16} & \frac{3}{16}\\ \hline P(Y=y) & \frac{1}{4} & \frac{7}{16} & \frac{5}{16} & 1\\ \hline \end{array} \end{array} \Rightarrow \begin{array}{lll|l} \mbox{Função de probabilidade marginal de X:}\\ \begin{array}{c|ccc} \hline x & 0 & 1 & 2 & 3 & \mbox{Total} \\ \hline P(X=x) & \frac{1}{4} & \frac{1}{4} & \frac{5}{16} & \frac{3}{16} & 1\\ \hline \end{array}\\ \\ \mbox{Função de probabilidade marginal de Y:}\\ \begin{array}{c|ccc} \hline y & 0 & 1 & 2 & \mbox{Total} \\ \hline P(Y=y) & \frac{1}{4} & \frac{7}{16} & \frac{5}{16} & 1\\ \hline \end{array} \end{array}\\ \hline \end{array} \] - a) Verifique se as variáveis \(X\) e \(Y\) são independentes. - b) Condicionado a ocorrência de casos nulos ou não nulos de pneumonia, qual é a probabilidade de não haver crianças alérgicas?

Solução: As variáveis não são independentes! Basta dar um contra exemplo em que \[ \small \begin{array}{|lll|} \hline \small a) P(X=x,Y=y)\ne P(X=x).P(Y=y):\\ \mbox{ por exemplo: }\\ P(X=0,Y=1)=\frac{1}{16}\ne \frac{1}{4}.\frac{7}{16} = P(X=0).P(Y=1):\\ \hline b) \mbox{ Calcular } P(X=0 | Y=y), y=0,1,2:\\ P(X=0 | Y=0)=\frac{P(X=0,Y=0)}{P(Y=0)}=\frac{\frac{1}{16}}{\frac{1}{4}}=\frac{1}{4}\\ P(X=0 | Y=1)=\frac{P(X=0,Y=1)}{P(Y=1)}=\frac{\frac{1}{16}}{\frac{7}{16}}=\frac{1}{7}\\ P(X=0 | Y=2)=\frac{P(X=0,Y=2)}{P(Y=2)}=\frac{\frac{1}{8}}{\frac{5}{16}}=\frac{2}{5}\\ \mbox{ e a soma não é igual a 1,}\\ \mbox{pois a união destes eventos não constitui todas as possibilidades! }\\ \hline \end{array} \]

Interpretação gráfica: pacote gg3D

x=c(0,1,2,3)
y_0=c(1/16,1/8,1/16,0)
y_1=c(1/16,1/8,1/8,1/8)
y_2=c(1/8,0,1/8,1/16)

data=data=data.frame(x,y_0,y_1,y_2)%>%
  `colnames<-`(c("x","0","1","2")) %>%
pivot_longer(!x, names_to = "y", values_to = "probs") %>%
mutate(y = as.numeric(y))

datatable(data,cap=quadro_nums("quadro3","Visualização dos valores"),
options = list(list(pageLength = 5),columnDefs=list(list(class="dt-center",targets=list(1,2,3)),
                                    list(width = '20%', targets = list(1,2,3)))))

Figura 4: Gráficos do Exemplo 5

a=ggplot(data, aes(x=x, y=y, z=probs,color=as.factor(y))) + 
  theme_void() +
  axes_3D() +
  stat_3D()+
  labs(x="x",y="y",z="P",title="Função de probabilidade de X e Y")

b=data.frame(x,px=c(1/4,1/4,5/16,3/16))%>%
ggplot(aes( x=x, y=px )) +
geom_point( size=3,color="orange")+
labs(x="x",y="P(X=x)",title="Função de probabilidade de X")

c=data.frame(y=c(0,1,2),py=c(1/4,7/16,5/16))%>%
ggplot(aes( x=y, y=py )) +
geom_point(size=3,color="orange")+
labs(x=y,y="P(Y=y)",title="Função de probabilidade de Y")
grid.arrange(a, b, c,ncol = 2, nrow = 2)
Figura  4: Gráficos do Exemplo 5

Figura 4: Gráficos do Exemplo 5