require(gtools)
require(tidyverse)
require(ggforce)  
options(kableExtra.latex.load_packages = TRUE)
require(kableExtra)
require(mosaicCalc)
require(gridExtra)
require(numDeriv)
require(DT)
require(gg3D)
#Para numerar tabelas e figuras:
require(captioner)
fig_nums <- captioner(prefix = "Figura")
table_nums <- captioner(prefix = "Tabela")
quadro_nums<- captioner(prefix="Quadro")

1 Distribuição da Soma e da Diferença de Variáveis Aleatórias

Sendo \(X\) uma variável aleatória em \((\Omega,\mathscr{A},P)\), a função ou transformação \(h:X\rightarrow \mathbb{R}\) também será uma variável aleatória no mesmo espaço de probabilidade. Dado o conhecimento de \(X\) através de, por exemplo, sua função de distribuição, desejamos obter o comportamento de \(h(X)\).

1.1 Caso Discreto

Exemplo 1: A função de probabilidade conjunta de \(X\) e \(Y\) pela tabela abaixo. Obtenha a distribuição conjunta de \(Z=X+Y\) e \(W=X-Y\).

\[ \small \begin{array}{cccc|c} \hline x\setminus y & 0 & 1 & 2 & P(X=x) \\ \\ \hline 0 & \frac{1}{4} & \frac{1}{8} & \frac{1}{8} & \frac{1}{2}\\ 1 & \frac{1}{4} & 0 & \frac{1}{4} & \frac{1}{2} \\ \hline P(Y=y) & \frac{1}{2} & \frac{1}{8} & \frac{5}{8} & 1\\ \hline \end{array} \]

Solução: A variável \(X+Y\) assume valores z=0,1,2 ou 3, e a variável \(X-Y\) assume valores w=-2,-1,0 ou 1, com probabilidades tomadas da tabela original: \[ \small \begin{array}{c|ccc} \hline z\setminus w & -2 & -1 & 0 & 1 \\ \hline 0 & & & P(X=0,Y=0) & \\ 1 & & P(X=0,Y=1) & & P(X=1,Y=0) \\ 2 & P(X=0,Y=2) & & P(X=1,Y=1) & \\ 3 & & P(X=1,Y=2) & & \\ \hline \end{array} \\ \Downarrow\\ \begin{array}{c|cccc|c} \hline z\setminus w & -2 & -1 & 0 & 1 & P(X+Y=z)\\ \hline 0 & 0 & 0 & \frac{1}{4} & 0 & \frac{1}{4}\\ 1 & 0 & \frac{1}{8} & 0 & \frac{1}{4} & \frac{3}{8}\\ 2 & \frac{1}{8} & 0 & 0 & 0 & \frac{1}{8}\\ 3 & 0 & \frac{1}{4} & 0 & 0 & \frac{1}{4} \\ \hline P(X-Y=w) & \frac{1}{8} & \frac{3}{8} & \frac{1}{4} & \frac{1}{4} & 1\\ \hline \end{array} \]

Visualização no R:

x=c(0,1)
y0=c(1/4,1/4)
y1=c(1/8,0)
y2=c(1/8,1/4)

data=data.frame(x,y0,y1,y2)%>%
  `colnames<-`(c("x","0","1","2")) %>%
pivot_longer(!x, names_to = "y", values_to = "probs") %>%
mutate(y = as.numeric(y),
       soma=x+y,
       dif=x-y)

data
## # A tibble: 6 × 5
##       x     y probs  soma   dif
##   <dbl> <dbl> <dbl> <dbl> <dbl>
## 1     0     0 0.25      0     0
## 2     0     1 0.125     1    -1
## 3     0     2 0.125     2    -2
## 4     1     0 0.25      1     1
## 5     1     1 0         2     0
## 6     1     2 0.25      3    -1
"Marginal de X+Y = "
## [1] "Marginal de X+Y = "
  pz=data %>% 
  group_by(soma) %>% 
  summarise(prob = sum(probs))
  pz
## # A tibble: 4 × 2
##    soma  prob
##   <dbl> <dbl>
## 1     0 0.25 
## 2     1 0.375
## 3     2 0.125
## 4     3 0.25
 "Marginal de X-Y = "
## [1] "Marginal de X-Y = "
  pw=data %>% 
  group_by(dif) %>% 
  summarise(prob = sum(probs)) 
  pw
## # A tibble: 4 × 2
##     dif  prob
##   <dbl> <dbl>
## 1    -2 0.125
## 2    -1 0.375
## 3     0 0.25 
## 4     1 0.25

Gráficos:

a=ggplot(data, aes(x=x, y=y, z=probs,color=as.factor(y))) + 
  theme_void() +
  axes_3D() +
  stat_3D()+
  labs(x="x",y="y",z="P",title="Prob. conjunta de X e Y")

b=data.frame(x,px=c(1/2,1/2))%>%
ggplot(aes( x=x, y=px )) +
geom_point( size=3,color="orange")+
labs(x="x",y="P(X=x)",title="Prob.Marginal de X")

c=data.frame(y=c(0,1,2),py=c(1/2,1/8,5/8))%>%
ggplot(aes( x=y, y=py )) +
geom_point(size=3,color="orange")+
labs(x="y",y="P(Y=y)",title="Prob.Marginal de Y")

d=ggplot(data, aes(x=soma, y=dif, z=probs,color=as.factor(soma))) + 
  theme_void() +
  axes_3D() +
  stat_3D()+
  labs(x="x",y="y",z="P",title="Prob. conjunta de X+Y e X-Y")

e=ggplot(pz,aes( x=soma, y=prob )) +
geom_point(size=3,color="orange")+
labs(x="z",y="P(X+Y=z)",title="Prob.Marginal de X+Y")

f=ggplot(pw,aes( x=dif, y=prob )) +
geom_point(size=3,color="orange")+
labs(x="w",y="P(X-Y=w)",title="Prob.Marginal de X-Y")
grid.arrange(a, b, c,d,e,f,ncol = 2, nrow = 3)
Figura  1: Gráficos do exemplo 1

Figura 1: Gráficos do exemplo 1

1.2 Caso Contínuo

Sejam \(X\) e \(Y\) duas variáveis aleatórias contínuas com função densidade conjunta \(f_{X,Y}\).
Definindo \(Z=X+Y\) e \(W=X-Y\) as funções densidades da soma e da diferença são dadas por: \[ \small f_{X+Y}(z) = \int\limits_{-\infty}^{\infty}f(x,z-x)dx, -\infty<z<\infty. \] \[ \small f_{X-Y}(w) = \int\limits_{-\infty}^{\infty}f(w+y,y)dy, -\infty<w<\infty. \] Em muitas aplicações \(X\) e \(Y\) são independentes e as equações acima são definidas por: \[ \small f_{X+Y}(z) = \int\limits_{-\infty}^{\infty}f_X(x)f_Y(z-x)dx, -\infty<z<\infty. \]

\[ \small f_{X-Y}(w) = \int\limits_{-\infty}^{\infty}f_X(w+y)f_Y(y)dy, -\infty<w<\infty. \] Se \(X\) e \(Y\) forem variáveis aleatórias independentes não-negativas, então \(f_{X+Y}(z) = 0\) para \(z\leq 0\) e \[ \small f_{X+Y}(z) = \int\limits_{0}^{z}f_X(x)f_Y(z-x)dx, 0<z<\infty. \]

Prova: Seja \(Z=X+Y\). Graficamente temos:

Em que \(A_z = \left\{(x,y)|x+y\leq z\right\}\). O conjunto \(A_z\) representa o semi-plano à esquerda inferior da reta \(z=x+y\). Assim, \[ \small \begin{array}{lll} F_Z(z) &= P(Z\leq z) = P(X+Y\leq z) = P((X,Y)\in A_z)\\ F_Z(z) &= \int\limits\int\limits_{A_z}f_{X,Y}(x,y)dxdy =\\ \int\limits_{-\infty}^{\infty}\left(\int\limits_{-\infty}^{z-x}f_{X,Y}(x,y)dy\right)dx. \end{array} \] Fazendo a mudança de variável \(y=v-x\) na integral interna temos: \[ \small \begin{array}{lll} F_Z(z) &= \int\limits_{-\infty}^{\infty}\left(\int\limits_{-\infty}^{z}f_{X,Y}(x,v-x)dv\right)dx,\\ &= \int\limits_{-\infty}^{z}\left(\int\limits_{-\infty}^{\infty}f_{X,Y}(x,v-x)dx\right)dv,\\ &= \int\limits_{-\infty}^{z}g(v)dv, \end{array} \] em que \(g(v) = \int\limits_{-\infty}^{\infty}f_{X,Y}(x,v-x)dx.\) Assim, a densidade de \(Z=X+Y\) é dada por: \[ \small f_{X+Y}(z) = \int\limits_{-\infty}^{\infty}f_{X,Y}(x,z-x)dx, -\infty<z<\infty. \] Para \(W=X-Y\) a prova segue de forma análoga.

Exemplo 2: Sejam \(X\) e \(Y\) variáveis aleatórias independentes, cada uma com densidade exponencial de parâmetro \(\lambda\). Obtenha a distribuição de \(X+Y\).

Solução: Utilize a fórmula da soma para variáveis independentes e não negativas: \[ \begin{array}{lll} f_{X+Y}(z)&=& \int \limits_0^z f_X(x).f_Y(z-x)dx, \mbox{com } 0\leq z <\infty\\ &=& \int \limits_0^z \lambda \exp[-\lambda.x] .\lambda \exp[-\lambda.(z-x)]dx\\ &=& \int \limits_0^z \lambda^2 \exp[-\lambda.z] .dx\\ &=& \lambda^2 \exp[-\lambda.z] \int \limits_0^z dx\\ &=& \lambda^2 \exp[-\lambda.z] \left.x\right|_0^z \\ &=& \lambda^2 \exp[-\lambda.z] z \\ &&\therefore X+Y \sim \mbox{Gamma}(\lambda,2) \end{array} \]

No caso geral: \[\small X_1,X_2,\ldots,X_n \sim Exp(\lambda) \Rightarrow X_1+X_2+\ldots X_n \sim Gamma(\lambda,n)\]

Gráfico: Considerando \(\lambda=3\) e n=5.

n=5
x = seq(0,5,0.01)
lambda=3
f_x=dexp(x,rate=lambda)
f_soma=dgamma(x,shape=n,scale=1/lambda)

data = data.frame(x,f_x,f_soma)

a=ggplot(data, aes( x=x, y=f_x)) +
geom_line(size=1.2,color="orange")+
  xlim(0,2)+
labs("x",y="f(x)",title="X1,X2,...,X5 ~ Exp(3)")

b=ggplot(data, aes( x=x, y=f_soma)) +
geom_line(size=1.2,color="orange")+
labs(x="z",y="f(z)",title="X1+X2+...+X5 ~ Gamma(3,5)")

grid.arrange(a, b,ncol = 2, nrow = 1)
Figura  2: Gráficos do exemplo 2

Figura 2: Gráficos do exemplo 2

Estudo de simulação: Foram gerados 5 vetores de tamanhos iguais a 1000, provenientes da distribuição exponencial, e foram calculadas as somas para cada 5 valores gerados, conforme vemos na tabela abaixo, e verificamos que os histogramas e as curva de densidade aproximam-se das distribuições teóricas!

set.seed(25112020)
lambda=3
N=1000
n=5
i=1
x=matrix(nrow=N,ncol=n)
while(i<=n){
x[,i]=rexp(N,rate=lambda)
i=i+1
}
z=rowSums(x)

data=data.frame(x,z) 
head(data)
##          X1          X2         X3          X4         X5         z
## 1 1.3347068 0.113824911 0.14048621 0.283177312 0.04196604 1.9141612
## 2 0.3319679 0.935505056 0.02017808 0.135299337 0.12502106 1.5479714
## 3 0.1169381 0.102621084 0.07039444 0.536415887 0.52124058 1.3476101
## 4 0.9965904 0.174610324 0.11217550 0.094921843 0.43123026 1.8095284
## 5 0.1087760 0.006485326 0.15269416 0.467129410 0.24602268 0.9811076
## 6 0.4290536 0.096069340 0.38232897 0.002790091 0.08644880 0.9966908
a=list()
i=1
while(i<=n){
a[[i]]=data.frame(x[,i],z) %>%
 `colnames<-`(c("x","z")) %>%
ggplot(aes(x=x)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title=paste0("densidade de X",i))
i=i+1
}

b=data %>% 
ggplot(aes( x=z)) +
  geom_histogram(aes(y=..density..), colour="gray", fill="gray")+
   geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="z",y="f(z)",title="densidade de X1+X2+...+X5")

grid.arrange(a[[1]], a[[2]],a[[3]],a[[4]],a[[5]],b, ncol = 2, nrow = 3)
Figura  3: Gráficos do exemplo 2 - Estudo de simulação

Figura 3: Gráficos do exemplo 2 - Estudo de simulação

Exemplo 3: Sejam \(X\) e \(Y\) variáveis aleatórias independentes, cada uma com distribuição normal padrão. Obtenha a distribuição de \(X+Y\).\

Solução: Como \(X\) e \(Y\) são independentes temos:

\[ \begin{array}{|llll|} \hline \begin{array}{lll} f_{X+Y}(z) &&= \int_{-\infty}^{\infty}f_X(x)f_Y(z-x)dx \\ &&= \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\times \frac{1}{\sqrt{2\pi}}e^{-\frac{(z-x)^2}{2}}dx,\\\\ &&= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}(x^2+z^2-2xz+x^2)}dx\\ &&= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}(2x^2-2xz+z^2)}dx,\\\\ &&= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\left(x^2-2x\frac{z}{2}+\frac{z^2}{2}\right)}dx\\ \end{array} \begin{array}{llll} &&= \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty}\frac{e^{-\frac{z^2}{2}}}{\sqrt{2\pi}}e^{-\left(x^2-2x\frac{z}{2} +\frac{z^2}{4} -\frac{z^2}{4}\right)}dx, \\\\ &&= \frac{1}{\sqrt{2\pi}}e^{-\left(\frac{z^2}{2} - \frac{z^2}{4}\right)} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\left(x^2-2x\frac{z}{2}+\frac{z^2}{4}\right)}dx\\ &&= \frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{4}} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\left(x-\frac{z}{2}\right)^2}dx, \\\\ &&= \frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{2}}e^{-\frac{z^2}{4}} \int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}\frac{1}{\frac{1}{\sqrt{2}}}e^{-\frac{1}{2}\left(\frac{x-\frac{z}{2}}{\sqrt{1/2}}\right)^2}dx\\ &&= \frac{1}{\sqrt{2\pi}}\frac{1}{\sqrt{2}}e^{-\frac{1}{2}\frac{z^2}{2}}, -\infty<z<\infty. \end{array}\\ \hline \end{array} \] O integrando corresponde à densidade de uma normal com \(\mu=\frac{z}{2}\) e \(\sigma^2 = \frac{1}{2}.\) Logo, a integral vale 1 e o termo restante corresponde a densidade de uma \(N(0,2)\). No caso geral: \(X_1,X_2,\ldots,X_n\sim N(0,1)\Rightarrow X_1+X_2+\ldots X_n\sim N(0,n)\).

cálculo da integral definida no onsolver
Figura  4: Densidade de X+Y no onsolver

Figura 4: Densidade de X+Y no onsolver

Gráfico: Considerando n=3

n=3
x = seq(-5,5,0.1)
f_x=dnorm(x)
f_soma=dnorm(x,mean=0,sd=sqrt(n))

data = data.frame(x,f_x,f_soma)

a=ggplot(data, aes( x=x, y=f_x)) +
geom_line(size=1.2,color="orange")+
labs("x",y="f(x)",title="X1,X2,X3 ~ N(0,1)")

b=ggplot(data, aes( x=x, y=f_soma)) +
geom_line(size=1.2,color="orange")+
  ylim(0,0.4)+
labs(x="z",y="f(z)",title="X1+X2+X3 ~ N(0,3)")

grid.arrange(a, b,ncol = 2, nrow = 1)
Figura  5: Gráficos do exemplo 3

Figura 5: Gráficos do exemplo 3

Estudo de simulação: Foram gerados 3 vetores de tamanhos iguais a 1000, provenientes da distribuição exponencial, e foram calculadas as somas para cada 5 valores gerados, conforme vemos na tabela abaixo, e verificamos que os histogramas e as curva de densidade aproximam-se das distribuições teóricas!

set.seed(25112020)
N=1000
n=3
i=1
x=matrix(nrow=N,ncol=n)
while(i<=n){
x[,i]=rnorm(N)
i=i+1
}
z=rowSums(x)

data=data.frame(x,z) 
head(data)
##           X1         X2         X3           z
## 1 -1.9767093  0.3081352  1.7913101  0.12273597
## 2  0.4548937  0.1122567  0.6042614  1.17141180
## 3 -0.4864383  0.6275813 -0.1877593 -0.04661637
## 4  0.4211139 -2.1573232  0.1884421 -1.54776712
## 5  0.7674893  0.3216038  1.3418675  2.43096058
## 6  1.0585184  0.1272626  0.9988469  2.18462792
a=list()
i=1
while(i<=n){
a[[i]]=data.frame(x[,i],z) %>%
 `colnames<-`(c("x","z")) %>%
ggplot(aes(x=x)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title=paste0("densidade de X",i))
i=i+1
}

b=data %>% 
ggplot(aes( x=z)) +
      ylim(0,0.4)+
  geom_histogram(aes(y=..density..), colour="gray", fill="gray")+
   geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="z",y="f(z)",title="densidade de X1+X2+X3")

grid.arrange(a[[1]], a[[2]],a[[3]],b, ncol = 2, nrow = 2)
Figura  6: Gráficos do exemplo 3 - Estudo de simulação

Figura 6: Gráficos do exemplo 3 - Estudo de simulação

Resultados Importantes:

  • Sejam \(X\) e \(Y\) variáveis aleatórias independentes tais que \(X\) tem densidade Gama(\(r_1,\lambda\)) e \(Y\) tem densidade Gama(\(r_2,\lambda\)). Logo, \(X+Y\) tem densidade Gama(\(r_1+r_2,\lambda\));
  • Sejam \(X\) e \(Y\) variáveis aleatórias independentes normalmente distribuídas com densidades \(N(\mu_1,\sigma_1^2)\) e \(N(\mu_2,\sigma_2^2)\), respectivamente. A densidade de \(X+Y\) tem distribuição Normal, ou seja, \(X+Y \sim N(\mu_1 + \mu_2,\sigma_1^2+\sigma_2^2)\) e a densidade de \(X-Y\) tem distribuição Normal, ou seja, \(X-Y \sim N(\mu_1 - \mu_2,\sigma_1^2+\sigma_2^2)\);

2 Densidade do Produto e do Quociente de Variáveis Aleatórias

Sejam \(X\) e \(Y\) duas variáveis aleatórias contínuas com densidade conjunta \(f_{X,Y}\). As funções densidades do produto e do quociente são, respectivamente, dadas por: \[ \small \begin{array}{ll} f_{XY}(u) &= \int\limits_{-\infty}^{\infty}\frac{1}{\left|x\right|}f_{X,Y}\left(x,\frac{u}{x}\right)dx\\ f_{\frac{X}{Y}}(v) &= \int\limits_{-\infty}^{\infty}\left|y\right|f_{X,Y}(vy,y)dy. \end{array} \] No caso especial em que \(X\) e \(Y\) são variáveis aleatórias independentes positivas, a densidade do quociente, definida na equação (\(\ref{eq3}\)), reduz-se a \(f_{\frac{X}{Y}}(v)=0\) para \(v\leq 0\) e \[ \small f_{\frac{X}{Y}}(v) = \int\limits_{0}^{\infty}yf_{X}(vy)f_{Y}(y)dy, 0<v<\infty. \] As provas destas expressões podem ser encontradas no livro Probabilidade e Variáveis Aleatórias de Marcos Nascimento Magalhães e no livro Introdução à Teoria da Probabilidade de Hoel Port Stone.

Exemplo 5: Quociente de duas variáveis Normais padrão: \[ \begin{array} a \end{array} \]

cálculo da integral definida no onsolver . Veja como inserir o módulo na fórmula
Figura  7: densidade de X+Y no onlsolver

Figura 7: densidade de X+Y no onlsolver

Gráfico:

x = seq(-6,6,0.1)
f_x=dnorm(x)
f_quo=dcauchy(x,location=0,scale=1)

data = data.frame(x,f_x,f_quo)

a=ggplot(data, aes( x=x, y=f_x)) +
geom_line(size=1.2,color="orange")+
labs("x",y="f(x)",title="X1,X2 ~ N(0,1)")

b=ggplot(data, aes( x=x, y=f_quo)) +
geom_line(size=1.2,color="orange")+
  ylim(0,0.4)+
labs(x="v",y="f(v)",title="X1/X2 ~ Cauchy(0,1)")

grid.arrange(a, b,ncol = 2, nrow = 1)
Figura  8: Gráficos do exemplo 5

Figura 8: Gráficos do exemplo 5

Estudo de simulação: Foram gerados 2 vetores de tamanhos iguais a 1000, provenientes da distribuição normal padrão, e foram calculados os quocientes para cada 2 valores gerados, conforme vemos na tabela abaixo, e verificamos que os histogramas e as curva de densidade aproximam-se das distribuições teóricas - vemos que a Cauchy possui uma calda mais pesada do que a normal!

set.seed(25112020)
N=1000
x1=rnorm(N)
x2=rnorm(N)
data=data.frame(x1,x2) %>%
  mutate(quo=x1/x2) 

data %>% 
  head()%>%
  datatable(cap=quadro_nums("quadro1","Visualização dos vetores X1, X2, e quociente (somente as 6 primeiras observações)"),
options = list(columnDefs=list(list(class="dt-center",targets=list(1:4)),
                                    list(width = '20%', targets = list(1:3)))))
a=data %>% 
ggplot(aes( x=x1)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
  xlim(-6,6)+
labs(x="x",y="f(x)",title="Histograma de X_1")

b=data %>% 
ggplot(aes( x=x2)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
  xlim(-6,6)+
labs(x="x",y="f(x)",title="Histograma de X_2")

c=data %>% 
ggplot(aes( x=quo)) +
  geom_histogram(aes(y=..density..), colour="gray", fill="gray")+
   geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
   xlim(-6,6)+
labs(x="v",y="f(v)",title="Histograma de X1/X2")

grid.arrange(a, b,c, ncol = 2, nrow = 2)
Figura  9: Gráficos do exemplo 5 - estudo de simulação

Figura 9: Gráficos do exemplo 5 - estudo de simulação

2.1 Distribuição do Mínimo e do Máximo

Considere o conjunto \(X_1, X_2, \ldots,X_n\) de variáveis aleatórias independentes, cujas funções de distribuição são \(F_1,F_2,\ldots,F_n\), respectivamente. As expressões da função de distribuição de \(Y_1 = \mbox{min}(X_1,X_2,\ldots,X_n)\) e \(Y_n = \mbox{max}(X_1,X_2,\ldots,X_n)\) são dadas, respectivamente, por: \[ \small \begin{array}{ll} F_{Y_1}(y_1) &= 1-\prod_{i=1}^{n}\left[1-F_{X_i}(y_1)\right];\\ F_{Y_n}(y_n) &= \prod_{i=1}^{n}F_{X_i}(y_n). \end{array} \]

Exemplo 6: Sejam \(X_1\) e \(X_2\) variáveis aleatórias independentes com distribuição uniforme (0,1). Qual a distribuição de \(X_{min} = \mbox{mín}(X_1,X_2)\) e \(Y_{max} = \mbox{máx}(X_1,X_2)\).

Solução: \[ \small f_{X_1}(x) = \left\{ \begin{array}{ll} 0,& \mbox{se } x < 0;\\ x, & \mbox{se } 0 \leq x < 1;\\ 0, & \mbox{caso contrário.} \end{array} \right. \] Análogo para \(F_{X_2}(x)\). Sendo assim:

\[ \small \begin{array}{lll} F_{X_{max}}(x)&=1-\prod_{i=1}^2 [1-F_{X_i}(x)]\\ &=1-\prod_{i=}^2 (1-x)\\ &=1-(1-x)^2\\ &=1-(1-2.x+x^2)\\ &=2.x-x^2 \end{array} \Rightarrow \begin{array}{lll} f_{X_{min}}(x)&=\frac{\partial F_{X_{min}}(x)}{\partial x}\\ &=2-2.x=\\ &=2(1-x).I_{(0,1)}(x) \mbox{ com o indicador de domínio!}\\ &\therefore X_{min} \sim Beta(a=1,b=2)\\ &\mbox{ basta olhar o núcleo da densidade no apêndice!} \end{array} \] Com relação ao máximo: \[ \small \begin{array}{lll} F_{X_{max}}(x)&=\prod_{i=1}^2 F_{X_i}(x)\\ &=\prod_{i=1}^2 x\\ &=x^2\\ \end{array} \Rightarrow \begin{array}{lll} f_{X_{max}}(x)&=\frac{\partial F_{X_{max}}(x)}{\partial x}\\ &=2.x.I_{(0,1)}(x) \mbox{ com o indicador de domínio!}\\ &\therefore X_{max} \sim Beta(a=2,b=1) \end{array} \] E as áreas sob a curva são iguais a 1!

f_min=function(x){
  2*(1-x)
}
integrate(f_min,0,1)
## 1 with absolute error < 1.1e-14
f_max=function(x){
  2*x
}
integrate(f_max,0,1)
## 1 with absolute error < 1.1e-14

Gráficos no R:

x = seq(0,1,0.01)
fx = dunif(x)
f_mi=dbeta(x,shape1=1,shape2=2)
f_ma=dbeta(x,shape1=2,shape2=1)

data = data.frame(x,fx,f_mi,f_ma)

a=ggplot(data, aes( x=x, y=fx)) +
geom_line(size=1.2,color="orange")+
 ylim(0,1)+
labs(x="x",y="f(x)",title="densidade de X ~ U(0,1)")

b=ggplot(data, aes( x=x, y=f_mi)) +
geom_line(size=1.2,color="orange")+
labs(x="x",y="f_min(x)",title="densidade de X_min ~ Beta(1,2)")

c=ggplot(data, aes( x=x, y=f_ma)) +
geom_line(size=1.2,color="orange")+
labs(x="x",y="f_max(x)",title="densidade de X_max ~ Beta(2,1)")

grid.arrange(a, b,c, ncol = 2, nrow = 2)
Figura  10: Gráficos do exemplo 6

Figura 10: Gráficos do exemplo 6

Estudo de simulação: Foram gerados dois vetores de tamanhos iguais a 1000, provenientes da distribuição uniforme, foram calculados os valores mínimo e máximo para cada valor gerado, conforme vemos na tabela abaixo, e verificamos que os histogramas e as curva de densidade aproximam-se das distribuições teóricas!

set.seed(22112020)
x1=runif(1000)
x2=runif(1000)
data=data.frame(x1,x2) %>%
  mutate(x_min=ifelse(x1<x2,x1,x2),
         x_max=ifelse(x1<x2,x2,x1)) 

data %>% 
  head()%>%
  datatable(cap=quadro_nums("quadro2","Visualização dos vetores X1, X2, mínimo & máximo (somente as 6 primeiras observações)"),
options = list(columnDefs=list(list(class="dt-center",targets=list(1:4)),
                                    list(width = '20%', targets = list(1:4)))))

Figura 11: Gráficos do exemplo 6 - estudo de simulação

a=data %>% 
ggplot(aes( x=x1)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title="Histograma de X_1")

b=data %>% 
ggplot(aes( x=x2)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title="Histograma de X_2")

c=data %>% 
ggplot(aes( x=x_min)) +
 geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title="Histograma de X_min")

d=data %>% 
ggplot(aes( x=x_max)) +
  geom_histogram(aes(y=..density..), colour="gray", fill="gray")+
   geom_histogram(aes(y=..density..), colour="black", fill="gray")+
  geom_density(size=1.2,color="green") +
labs(x="x",y="f(x)",title="Histograma de X_max")

grid.arrange(a, b,c,d, ncol = 2, nrow = 2)
Figura  11: Gráficos do exemplo 6 - estudo de simulação

Figura 11: Gráficos do exemplo 6 - estudo de simulação