require(rlang)
require(gtools)
require(tidyverse)
require(ggforce)  
options(kableExtra.latex.load_packages = TRUE)
require(kableExtra)
require(mosaicCalc)
require(gridExtra)
require(numDeriv)
#Para numerar tabelas e figuras:
require(captioner)
fig_nums <- captioner(prefix = "Figura")
table_nums <- captioner(prefix = "Tabela")
quadro_nums<- captioner(prefix="Quadro")

Variáveis Aleatorias

Muitos experimentos aleatórios produzem resultados não-numéricos. Por exemplo, considere o caso de um questionário, em que uma pessoa é indagada a respeito de uma proposição e as respostas possíveis são “SIM” ou “NAO”. Podemos definir uma variável que tome dois valores, 1 ou 0, por exemplo, correspondentes as respostas “SIM” ou “NAO”. Portanto antes de analisar esse tipo de experimento, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória, que é uma regra de associaçãode um valor numérico a cada ponto do espaço amostral.

A Variável Aleatória é:

  • Discreta: se assume valores num conjunto enumerávell, com certa probabilidade;
  • Contínua: se seu conjunto de valores é qualquer intervalo dos números reais, o que seria um conjunto não enumerável.

Referência:

  • Magalhães, M.N.; Lima, A.C.P. Noções de Probabilidade e Estatística.

Definição: Seja \((\Omega, \mathscr{A}, P)\) um espaço de probabilidade. Denomina-se variável aleatória, qualquer função \(X: \Omega \rightarrow \mathbb{R}\) tal que \[\small X^{-1}(I) = \left\{\omega \in \Omega: X(\omega) \in I\right\} \in \mathscr{A},\] para todo intervalo \(I \subset \mathbb{R}.\) Em palavras, \(X\) é tal que sua imagem inversa de intervalos \(I \subset \mathbb{R}\) pertençam a \(\sigma\)-álgebra \(\mathscr{A}\).

  • Uma variável aleatória é, portanto, uma função do espaço amostral \(\Omega\) nos reais, para a qual é possível calcular a probabilidade de ocorrência de seus valores.
  • Define-se \(\mathscr{P}(\Omega)\) (“partes de \(\Omega\)”) como o conjunto de todos os subconjuntos de \(\Omega\). As \(\mathscr{P}(\Omega)\) sempre são \(\sigma\)-álgebras.

Exemplo 1: \[ \small \begin{array}{lllllll} \mbox{Experimento: lançamento de uma moeda};\\ \mbox{Eventos: c = sair cara e k = sair coroa};\\ \mbox{Espaço Amostral: }\Omega = \{c,k\}\\ \mbox{Defina a variável }X \mbox{ tal que: }X(c) = 0 \mbox{ ou }X(k) = 1;\\ \sigma\mbox{-álgebras: }\mathscr{A}_1 = \{\Omega,\emptyset\} \mbox{ e } \mathscr{A}_2 = \{\Omega,\emptyset, \{c\},\{k\}\};\\ X \mbox{ é uma variável aleatória com relação as } \sigma-\mbox{álgebras} \mathscr{A}_1 \mbox{ e } \mathscr{A}_2?\\ \end{array} \]

Resolução: Vamos começar com a \(\sigma\)-álgebra \(\mathscr{A}_1.\): \[ \small \begin{array}{ll} \square \mbox{Para o intervalo } I_1 = (-1,2) \Rightarrow X^{-1}(I_1) = \{c,k\} \in \mathscr{A}_1;\\ \square \mbox{Para o intervalo } I_2 = (-1,0.5) \Rightarrow X^{-1}(I_2) = \{c\} \notin \mathscr{A}_1. \end{array} \] Logo para a \(\sigma\)-álgebra \(\mathscr{A}_1\), \(X\) não é uma variável aleatória. Agora a \(\sigma\)-álgebra \(\mathscr{A}_2:\) Seja \(I \subset \mathbb{R}\) um intervalo arbitrário. Pela definição de imagem inversa, tem-se que \(X^{-1}(I) \subset \mathscr{A}_2\) e, portanto \(X\) é uma variável aleatória. Por exemplo, se \(I = (2,4)\) temos que \(X^{-1}(I) = \emptyset \in \mathscr{A}_2;\) No entanto, para o intervalo \(I_2 = (-1,0.5)\) temos \(X^{-1}(I_2) = \{c\} \in \mathscr{A}_2\), ou seja, em ambos os casos a imagem inversa pertence a \(\mathscr{A}_2\).

Exemplo 2: Considere \(\Omega = \{1,2,3\}\) e as seguintes coleções de subconjuntos: \[ \small \begin{array}{ll} \mathscr{A}_1 = \{\emptyset, \Omega, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\},\{2,3\}\};\\ \mathscr{A}_2 = \{\emptyset, \Omega, \{3\}, \{1,2\}\}; \end{array} \]

  • Seriam ambas \(\sigma\)-álgebras?
  • Definindo a variável \(X\) tal que: \(X\)(1) = 1, \(X\)(2) = 2 e \(X\)(3) = 3, verifique se \(X\) ? uma variável aleatória com relação a \(\mathscr{A}_1\) e \(\mathscr{A}_2\).

Resolução:

  • Para que \(\mathscr{A}_1\) seja uma \(\sigma\)-álgebra deve satisfazer as seguintes condições:
    • \(\emptyset \in \mathscr{A}_1\); \(\mathscr{A}_1\) satisfaz a propriedade (i);
    • Observe que os complementares dos elementos de \(\mathscr{A}_1\) estão todos também em \(\mathscr{A}_1,\) pois: \[\small \emptyset^c = \Omega; \Omega^c = \emptyset; \{1\}^c = \{2,3\}; \{2\}^c = \{1,3\}; \{3\}^c = \{1,2\}\] \[\small\{1,2\}^c = \{3\}; \{1,3\}^c = \{2\}; \{2,3\}^c = \{1\}\] Logo, \(\mathscr{A}_1\) satisfaz a propriedade (ii); - iii) A união de qualquer elemento de com o vazio é inócua e a com o \(\Omega\) dá o próprio \(\Omega\), portanto vamos verificar as demais uniões: \[\small\{1\}\cup\{2\}=\{1,2\}; \{1\}\cup\{3\}=\{1,3\}; \{2\}\cup\{3\}=\{2,3\}; \{1\}\cup\{2\}\cup\{3\}=\Omega;\] \[\small\{1,2\}\cup\{1,3\}=\{1,2,3\}; \{1,2\}\cup\{2,3\}=\{1,2,3\}; \{1,3\}\cup\{2,3\}=\{1,2,3\};\] Os resultados das uniões pertencem a \(\mathscr{A}_1\), logo \(\mathscr{A}_1\) é uma \(\sigma\)-álgebra. Fica como exercício para o aluno verificar se \(\mathscr{A}_2\) também é uma \(\sigma\)-álgebra.
  • Resolução em sala de aula.

Definição Seja \(X\) uma variável aleatória em \((\Omega, \mathscr{A}, P)\), sua função de distribuição é definida por \[\small F_{X}(x) =P(X \leq x) =P(X \in \left(-\infty,x\right]),\]

com \(x\) percorrendo todos os reais. O conhecimento da função distribuição permite obter qualquer informação sobre a variável. Mesmo que a variável só assuma valores num subconjunto dos reais, a função de distribuição é definida em toda a reta. (Magalhães, M.N.; Lima, A.C.P. Noções de Probabilidade e Estatística). A função distribuição também é denominada por alguns autores de função acumulada, pois acumula as probabilidades dos valores menores ou iguais a \(x\).

Propriedade: Propriedades da Função Distribuição

Uma função de distribuição de uma variável \(X\) em \((\Omega, \mathscr{A}, P)\) obedece às seguintes propriedades:

  • \(\lim_{x\rightarrow -\infty}F_X(x) = 0\) e \(\lim_{x\rightarrow \infty}F_X(x) = 1;\)

  • \(F_X\) é contínua à direita;

  • \(F_X\) é não decrescente, ou seja, \(F_X(x) \leq F_X(y)\) sempre que \(x\leq y, \forall x, y \in \mathbb{R}.\)

    Além dessas propriedades enunciadas temos:

  • \(P(X>a) = 1 - P(X \leq a) = 1 - F_X(a), a \in \mathbb{R};\)

  • \(P(a<X\leq b) =P(X \leq b) - P(X \leq a) = F_X(b) - F_X(a), \forall a, b \in \mathbb{R};\)

  • Para \(I = \left(-\infty,x\right]\), \(P(X \in I) =P(X\leq x) =P(\{\omega \in \Omega: X(\omega) \in I\});\)

Exemplo 3: Para o lançamento de uma moeda, seja \(\Omega = \{c,k\}\), \(\mathscr{A}\) o conjunto das partes de \(\Omega\) e \(X\) uma função de \(\Omega\) em \(\mathbb{R}\) \((X: \Omega \rightarrow \mathbb{R})\) da seguinte forma:

\[ \small X(\omega) = \left\{ \begin{array}{ll} 0, \mbox{se }\omega &=& \mbox{cara}; \\ 1, \mbox{se }\omega &=& \mbox{coroa}. \end{array} \right. \]

Note que \(X \sim \mbox{Bernoulli}(p)\) tal que \(P\)(cara) = \(1-p\) e \(P\)(coroa) = \(p\).

Função de probabilidade & Função distribuição: \[ \small \begin{array}{l | l l} \hline X & P(X=x) \\ \hline 0 & 1-p\\ 1 & p \\ \hline \end{array} \Rightarrow F(x)=\left\{ \begin{array}{lll} 0, \mbox{ se x<0},\\ 1-p \mbox{ se }0 \leq x <1\\ 1 \mbox{ se }x \geq 1 \end{array} \right. \]

Gráfico no R com p=0.4:

prob=0.4
x = seq(-1,2,0.1)
p = ifelse(x==0,1-prob,
           ifelse(x==1,prob,0))
P = ifelse(x<0,0,
            ifelse(x<1,1-prob,1))
data = data.frame(x=x[-length(x)],P=P[-length(x)], xend=x[-1], Pend=P[-length(x)])     

y = ifelse(x<0,0,
            ifelse(x<1,p,1))

a=ggplot(data.frame(x,p), aes( x=x, y=p )) +
geom_point( aes( x=0, y=0.6 ), size=3,color="orange")+
geom_point( aes( x=1, y=0.4 ), size=3,color="orange")+
labs(x="x",y="P(X=x)",title="Função de probabilidade")

b=ggplot(data, aes( x=x, y=P ,xend=xend,yend=Pend)) +
geom_segment(size=1.2,color="orange")+
geom_point( aes( x=0, y=0 ), shape=1, size=3,color="orange")+
geom_point( aes( x=1, y=0.6 ), shape=1, size=3,color="orange") +
labs(x="x",y="F_X(x)",title="Função de distribuição")
grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  1: Exemplo 3: Função de probabilidade e Função de distribuição

Figura 1: Exemplo 3: Função de probabilidade e Função de distribuição

Exemplo 4: O tempo de validade, em meses, de um óleo lubrificante num certo equipamento está sendo estudado. Sendo \(\Omega = \left\{\omega \in \mathbb{R}: 6 < \omega \leq 8\right\}\). Uma função de interesse é o próprio tempo de validade e, nesse caso, definimos \(X(\omega) = \omega, \forall \omega \in \Omega.\) A função \(X\) é variável aleatória e sua função de distribuição é dada por: \[ \small \begin{array}{|lll|} \hline \begin{array}{lll} F_X(x) = \left\{ \begin{array}{lll} 0, & \mbox{ se } x<6; \\ \frac{x-6}{2}, & \mbox{ se } 6 \leq x < 8;\\ 1, & \mbox{ se } x \geq 8. \end{array} \right.\\ \mbox{E a função de densidade:}\\ f_x(x)=\frac{\partial F_X(x)}{\partial x} =\frac{1}{2}.I_{[6,8)}(x) \end{array} \Rightarrow \begin{array}{lll} \mbox{As propriedades da função acumulada são satisfeitas:}\\ \square \mbox{ possui limite igual a zero quando } x\rightarrow -\infty\\ \square \mbox{ possui limite igual a 1 quando } x\rightarrow \infty\\ \square \mbox{ é contínua à direita}\\ \square \mbox{ é não decrescente} \end{array}\\ \hline \end{array} \]

Gráficos:

x = seq(5,9,0.1)
fx = ifelse(x<6,0,
            ifelse(x<8,1/2,0))
Fx = ifelse(x<6,0,
            ifelse(x<8,(x-6)/2,1))
data = data.frame(x=x[-length(x)],fx=fx[-length(x)], xend=x[-1], yend=fx[-length(x)])  

a=ggplot(data, aes( x=x, y=fx ,xend=xend,yend=yend)) +
geom_segment(size=1.2,color="orange")+
geom_point( aes( x=6, y=0 ), shape=1, size=3,color="orange")+
geom_point( aes( x=8, y=0 ), shape=1, size=3,color="orange") +
labs(x="x",y="f(x)",title="Densidade de X")

b=ggplot(data.frame(x,Fx), aes( x=x, y=Fx)) +
geom_line(size=1.2,color="orange")+
  labs(x="x",y="F(x)",title="Densidade acumulada de X")
grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  2: Exemplo 4: Função de densidade e Função de densidade acumulada

Figura 2: Exemplo 4: Função de densidade e Função de densidade acumulada

Variável Aleatória Discreta e Função de Probabilidade

Uma variável aleatória é classificada como discreta, se assume somente um número enumerável de valores (finito ou infinito). A função de probabilidade de uma variável discreta é uma função que atribui probabilidade a cada um dos possíveis valores assumidos pela variável. Isto é, sendo \(X\) uma variável com valores \(x_1, x_2, \ldots,\) tem-se para \(i = 1, 2, \ldots,\) \[\small P(x_i) =P(X=x_i) =P(\{\omega \in \Omega: X(\omega)=x_i\}),\] ou ainda,

Propriedades da Função de Probabilidade

A função de probabilidade de \(X\) em (\(\Omega, \mathscr{A},P\)) satisfaz:

\[ \small \begin{array}{ll} \square 0 \leq P(x_i) \leq 1, \forall i = 1, 2, \ldots;\\ \square \sum\limits_{i} P(x_i) = 1; \end{array} \] com a soma percorrendo todos os possíveis valores (eventualmente infinitos).

Exemplo 5: Lançamento de duas moedas honestas. Seja \(X\) a variável aleatória que conta o número de caras nos dois lançamentos. \[ \small \begin{array}{|l | l l|} \hline \begin{array}{l | l l} X \sim \mbox{Binomial}\left(n,p\right) \mbox{ com } n=2 \mbox{ e } p=\frac{1}{2}\\ P(X=x)=\binom{2}{x}\left(\frac{1}{2}\right)^x\left(1-\frac{1}{2}\right)^{2-x}\\ \mbox{Função de probabilidade:}\\ \begin{array}{l | l l} \hline x & 0 & 1 & 2 & \mbox{Total} \\ \hline P(X=x) & 0.25 & 0.5 & 0.25 & 1\\ \hline \end{array} \end{array} \begin{array}{lll} \mbox{Função distribuição:}\\ F(x)=\left\{ \begin{array}{lll} 0, \mbox{ se x<0},\\ 0.25 \mbox{ se }0 \leq x <1\\ 0.75 \mbox{ se } 1 \leq x < 2\\ 1 \mbox{ se }x \geq 2 \end{array} \right. \end{array}\\ \hline \end{array} \]

Cálculos das probabilidades:

n=2
p=1/2
x=c(0,1,2)
prob=dbinom(x,size=n,prob=p)
F = pbinom(x,size=n,prob=p)
prob
## [1] 0.25 0.50 0.25
F
## [1] 0.25 0.75 1.00

Gráficos:

n=2
p=1/2
x = seq(-1,3,0.1)
prob = ifelse(x==0 | x==1 | x==2,dbinom(x,size=n,prob=p),0)
F = pbinom(x,size=n,prob=p)
data = data.frame(x=x[-length(x)],F=F[-length(x)], xend=x[-1], Fend=F[-length(x)])     

a=ggplot(data.frame(x,prob), aes( x=x, y=prob )) +
geom_point( aes( x=0, y=0.25 ), size=3,color="orange")+
geom_point( aes( x=1, y=0.5 ), size=3,color="orange")+
geom_point( aes( x=2, y=0.25 ), size=3,color="orange")+
labs(x="x",y="P(X=x)",title="Função de probabilidade")

b=ggplot(data, aes( x=x, y=F ,xend=xend,yend=Fend)) +
geom_segment(size=1.2,color="orange")+
geom_point( aes( x=0, y=0 ), shape=1, size=3,color="orange")+
geom_point( aes( x=1, y=0.25 ), shape=1, size=3,color="orange") +
geom_point( aes( x=2, y=0.75 ), shape=1, size=3,color="orange") +
labs(x="x",y="F_X(x)",title="Função de distribuição")
grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  3: Exemplo 5: Função de probabilidade e Função de distribuição

Figura 3: Exemplo 5: Função de probabilidade e Função de distribuição

Exemplo 6: Considere uma urna contendo três bolas vermelhas e cinco bolas pretas. Retiram-se três bolas, sem reposição. A v.a. \(X\) que conta o número de bolas pretas tem distribuição hipergeométrica:

\[ \small P(X=k)=\frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}, \] onde \(N=8\) é o tamanho da urna, \(K=5\) é o número de bolas pretas, \(n=3\) é o tamanho da amostra e \(k=0,1,2\) ou \(3\) é o número de bolas pretas na amostra, \[ \small \begin{array}{|lll|} \hline \begin{array}{lll} P(X=0)=\frac{\binom{5}{0}\binom{3}{3}}{\binom{8}{3}}\approx 1,79\%\\ P(X=1)=\frac{\binom{5}{1}\binom{3}{2}}{\binom{8}{3}}\approx 26,79\%\\ P(X=2)=\frac{\binom{5}{2}\binom{3}{1}}{\binom{8}{3}}\approx 53,57\%\\ P(X=3)=\frac{\binom{5}{3}\binom{3}{0}}{\binom{8}{3}}\approx 17,86\%\\ \end{array} \Rightarrow \begin{array}{lll} \mbox{Função de Probabilidade de }X\\ \begin{array}{lll} \hline k & 0 & 1 & 2 & 3 & \mbox{Total}\\ \hline P(X=k) & 1,79\% & 26,79\% & 53,57\% & 17,86\% & 100\%\\ \hline \end{array}\\ \\ \mbox{Função distribuição:} F_X(k)=\left\{ \begin{array}{ll} 0, \mbox{ se }k<0\\ 1,79\%, \mbox{ se }0\leq k<1\\ 28,57\%, \mbox{ se }1\leq k<2\\ 82,14\%, \mbox{ se }2\leq k<3\\ 100\%, \mbox{ se }k\geq 3\\ \end{array} \right. \end{array}\\ \hline \end{array} \]

N=8 
K=5 
n=3 
k=c(0,1,2,3)
"valores das probabilidades="
## [1] "valores das probabilidades="
dhyper(k,K,N-K,n)
## [1] 0.01785714 0.26785714 0.53571429 0.17857143
paste0("Total=",sum(dhyper(k,K,N-K,n)))
## [1] "Total=1"
"Acumuladas="
## [1] "Acumuladas="
phyper(k,K,N-K,n)
## [1] 0.01785714 0.28571429 0.82142857 1.00000000

Gráficos:

N=8 
K=5 
n=3 
k = seq(-1,4,0.1)
probs = ifelse(k==0 | k==1 | k==2 | k==3, dhyper(k,K,N-K,n),0)
probs_ac = phyper(k,K,N-K,n)
data = data.frame(k=k[-length(k)],probs_ac=probs_ac[-length(k)], kend=k[-1], probs_ac_end=probs_ac[-length(k)])     

a=ggplot(data.frame(k,probs), aes( x=k, y=probs )) +
geom_point( aes( x=0, y=0.01785714), size=3,color="orange")+
geom_point( aes( x=1, y=0.26785714 ), size=3,color="orange")+
geom_point( aes( x=2, y=0.53571429), size=3,color="orange")+
geom_point( aes( x=3, y=0.17857143 ), size=3,color="orange")+
  ylim(0,1)+
labs(x="k",y="P(X=k)",title="Função de probabilidade")

b=ggplot(data, aes( x=k, y=probs_ac ,xend=kend,yend=probs_ac_end)) +
geom_segment(size=1.2,color="orange")+
geom_point( aes( x=0, y=0), shape=1,size=3,color="orange")+
geom_point( aes( x=1, y=0.01785714 ), shape=1,size=3,color="orange")+
geom_point( aes( x=2, y=0.28571429), shape=1,size=3,color="orange")+
geom_point( aes( x=3, y=0.82142857 ), shape=1,size=3,color="orange")+
labs(x="k",y=expression(F[X](k)),title="Função de distribuição")
grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  4: Exemplo 6: Função de probabilidade e Função de distribuição

Figura 4: Exemplo 6: Função de probabilidade e Função de distribuição

Variável Aleatória Contínua e Função Densidade

Uma variável aleatória \(X\) em (\(\Omega, \mathscr{A},P\)), com função de distribuição \(F_X\), será classificada como contínua, se existir uma função não negativa \(f_X\) tal que: \[\small F_X(x) =P(X \leq x) = \int\limits_{-\infty}^{x} f_X(w)dw, \forall x \in \mathbb{R}.\] A função \(f_X\) é denominada função densidade.

Propriedades da Função Densidade

A função densidade de \(X\) em (\(\Omega, \mathscr{A},P\)) satisfaz: \[ \small \begin{array}{ll} \square f_X(x) \geq 0, \forall x \in \mathbb{R};\\ \square \int\limits_{-\infty}^{\infty} f_X(w)dw = 1. \end{array} \]

Para se obter a probabilidade da variável estar num certo intervalo \((a,b],\) faz-se a integral da função densidade nesse intervalo, ou seja, \[ \small P(a<X\leq b) = \int\limits_{a}^{b} f_X(x)dx = F_X(b) - F_X(a). \]

Exemplo: 7 A duração, em anos, de uma certa lâmpada especial é uma variável aleatória contínua com densidade dada por:

\[ \small f_X(x) = \left\{ \begin{array}{ll} 2e^{-2x}, & x \geq 0;\\ 0, & \mbox{ caso contrário} \end{array} \right. \mbox{, ou seja, } f_X(x) = 2e^{-2x} I_{\left[0,\infty\right)}(x). \] A densidade acima também pode ser escrita da seguinte forma: Para se obter a função de distribuição \(F_X(x) =P(X \leq x) = \int\limits_{-\infty}^{x} f_X(w)dw,\) analisa-se dois casos. \[ \small \begin{array}{ll} \square \mbox{Para }x<0, F_X(x) = 0, \mbox{ pois a função densidade é nula nesse intervalo.}\\ \square \mbox{Para } x \geq 0, \mbox{ temos } F_X(x) =P(X \leq x) = \int\limits_{-\infty}^{x} f_X(w)dw = \int\limits_{0}^{x} 2e^{-2w}dw = 1 - e^{-2x}. \end{array} \] Se desejamos saber a probabilidade da lâmpada durar até 2 anos, calcula-se \(F_X(x)\) no ponto 2, ou seja, \(\small F_X(2) = 1 - e^{-4} \approx 0,9817.\)

Aplicação no R: Verificamos que a integral sob a curva é igual a 1.

F=antiD(2*exp(-2*x) ~ x)
paste0("Integral não definida da função:")
## [1] "Integral não definida da função:"
A = F(Inf)-F(0)
paste0("Àrea sob a curva = ",A)
## [1] "Àrea sob a curva = 1"
P=F(2)-F(0)
paste0("probabilidade da lâmpada durar até 2 anos = ",round(P,4))
## [1] "probabilidade da lâmpada durar até 2 anos = 0.9817"
E=antiD(2*exp(-2*x)*x ~ x)
E=E(Inf)-E(0)
paste0("Média da exponencial com parâmetro igual a 2 = ",E)
## [1] "Média da exponencial com parâmetro igual a 2 = NaN"
lambda=2

x = seq(0,10,0.1)
fx = dexp(x,rate=lambda)
Fx = pexp(x,rate=lambda)

dados=data.frame(x,fx,Fx)
a=ggplot(dados, aes( x=x, y=fx)) +
geom_line(size=1.2,color="orange") +
labs(x="x",y="f(x)",title="densidade de X ~ Exp(2)")

b=ggplot(dados, aes( x=x, y=Fx)) +
geom_line(size=1.2,color="orange") +
labs(x="x",y="F(x)",title="densidade acumulada de X")

grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  5: Exemplo 7: Função de densidade e Função de densidade acumulada

Figura 5: Exemplo 7: Função de densidade e Função de densidade acumulada

Função de Distribuição Condicional

Seja \(X\) definida em (\(\Omega, \mathscr{A},P\)) e considere um evento \(A \in \mathscr{A},\) tal que \(P(A)>0.\) A função de distribuição condicional de \(X\) dado que \(A\) ocorreu, é definida por: \[ \small F_X(x|A) =P(X \leq x|A) = \frac{P(\left[X \leq x\right] \cap A)}{P(A)} \].

Exemplo 8: (Magalhães, p.78) O desempenho diário, de um certo conjunto de ações, pode ser medido como a porcentagem de crescimento do preço de venda em relação ao dia anterior. Suponha que este desempenho é uma variável aleatória contínua \(X\) com função densidade dada por: \[ \begin{array}{lll} f_X(x) = \left\{ \begin{array}{cl} 0, & \mbox{ se } x \leq -3 \mbox{ ou } x>4; \\ \frac{x}{12} + \frac{1}{4}, & \mbox{ se } -3< x \leq 0;\\ \frac{x}{4}, & \mbox{ se } 0< x \leq 2;\\ \frac{1}{16},& \mbox{ se } 2< x \leq 4; \end{array} \right. \end{array} \] - a) O desempenho negativo indica que as ações perderam valor de um dia para o outro. Qual seria a probabilidade de se ter um dia com desempenho excepcional, isto é, superior a 3%, dado que o desempenho foi positivo? Resp: \(\frac{1}{10}\).
- b) Seja agora o evento B, desempenho regular, definido por não haver alteração superior a 1\(\%\) em relação ao dia anterior. Supondo que tivemos um desempenho não positivo, qual a probabilidade de termos, ao menos, um dia regular? Resp: \(\frac{5}{9}\).

Solução: Explorando o problema com a construção da função de densidade acumulada: \[ \small F_X(x)=\int\limits_{-\infty}^xf_X(u)du =\left\{ \begin{array}{lll} 0, \mbox{ se } x \leq -3\\ \underbrace{\int\limits_{-3}^x \left(\frac{u}{12}+\frac{1}{4}\right)du}_{I1}, \mbox{ se } -3<x\leq0\\ \underbrace{\int\limits_{-3}^0 \left(\frac{u}{12}+\frac{1}{4}\right)du}_{I2}+\underbrace{\int\limits_{0}^x \frac{u}{4}du}_{I3}, \mbox{ se } 0<x\leq 2\\ \underbrace{\int\limits_{-3}^0 \left(\frac{u}{2}+\frac{1}{4}\right)du}_{I2}+\underbrace{\int\limits_{0}^2 \frac{u}{4}du}_{I4} + \underbrace{\int\limits_{2}^x \frac{1}{16}du}_{I5}, \mbox{ se }2 < x \leq 4\\ 1, \mbox{ se } x \geq 4 \end{array} \right. \]

\[ \small \mbox{onde }II = \left.\frac{u^2}{24}\right|_{-3}^x+\left.\frac{u}{4}\right|_{-3}^x =\frac{x^2}{24}-\frac{9}{24}+\frac{x}{4}+\frac{3}{4} =\frac{x^2-9+6x+18}{24} =\frac{x^2}{24}+\frac{x}{4}+\frac{3}{8}\\ \\ I2 = \left.\frac{u^2}{24}\right|_{-3}^0+\left.\frac{u}{4}\right|_{-3}^0 =-\frac{9}{24}+\frac{3}{4} =\frac{-9+18}{24} =\frac{9}{24}=\frac{3}{8}\\ \begin{array}{lll} I3=\left.\frac{u^2}{8}\right|_0^x=\frac{x^2}{8} \\ I4=\left.\frac{u^2}{8}\right|_{0}^2 =\frac{4}{8}=\frac{1}{2}\\ \\ I5=\left.\frac{u}{16}\right|_2^x =\frac{x}{16}-\frac{1}{8}\\ \end{array} \Rightarrow \begin{array}{lll} F_X(x)=\left\{ \begin{array}{lll} 0, \mbox{ se }x \leq -3\\ \frac{x^2}{24}+\frac{x}{4}+\frac{3}{8}, \mbox{ se }-3 < x \leq 0\\ \frac{x^2}{8}+\frac{3}{8}, \mbox{ se }0 < x \leq 2\\ \frac{x}{16}+\frac{3}{4}, \mbox{ se } 2 < x \leq 4\\ 1, \mbox{ se }x > 4 \end{array} \right. \end{array} \] A densidade integra em 1:

f=function(x){
  ifelse(x <= -3,0,
            ifelse(x <= 0,x/12+1/4,
                  ifelse(x <= 2,x/4,
                         ifelse(x <= 4,1/16,0))))
}
integrate(f,-3,4)
## 0.9999998 with absolute error < 4.4e-05

Os termos I2 e I4 estão corretos:

I2=integrate(f,-3,0)
I2
## 0.375 with absolute error < 4.2e-15
I4=integrate(f,0,2)
I4
## 0.5 with absolute error < 5.6e-15

Gráfico:

x = seq(-4,5,0.001)
fx=f(x)
Fac=function(x){
  ifelse(x <= -3,0,
            ifelse(x <= 0,x^2/24+x/4+3/8,
                  ifelse(x <= 2,x^2/8+3/8,
                         ifelse(x <= 4,x/16+3/4,1))))}
Fx=Fac(x)
  
data = data.frame(x=x[-length(x)],fx=fx[-length(x)], xend=x[-1], fxend=fx[-length(x)])   

a=ggplot(data, aes( x=x, y=fx,xend=xend,yend=fxend)) +
geom_segment(size=1.2,color="orange")+
geom_point( aes( x=0, y=0 ), shape=1, size=3,color="orange")+
geom_point( aes( x=2, y=1/16 ), shape=1, size=3,color="orange") +
geom_point( aes( x=4, y=0 ), shape=1, size=3,color="orange") +
  labs(x="x",y="f(x)",title="Densidade de X")

b=ggplot(data.frame(x,Fx), aes( x=x, y=Fx)) +
geom_line(size=1.2,color="orange")+
  labs(x="x",y="F(x)",title="Densidade acumulada de X")
grid.arrange(a, b, ncol = 2, nrow = 1)
Figura  6: Exemplo 8: Função de densidade e Função de densidade acumulada

Figura 6: Exemplo 8: Função de densidade e Função de densidade acumulada

Solução item a) \[ \begin{array}{lll} P(X>3 | X>0)&&=\frac{P(X>3,X>0)}{P(X>0)} =\frac{P(X>3)}{P(X>0)} =\frac{1-F_X(3)}{1-F_X(0)}\\ &&=\frac{1-\frac{3}{16}-\frac{3}{4}}{1-\frac{0^2}{24}-\frac{0}{4}-\frac{3}{8}} =\frac{\frac{16-3-12}{16}}{\frac{8-3}{8}} =\frac{1}{16}.\frac{8}{5}=\frac{1}{10} \end{array} \] Solução item b) \[ \begin{array}{llll} P(-1<X<1|X<0)\\ &&=\frac{P(-1<X<1,X<0)}{P(X<0)} =\frac{P(-1\leq X \leq 0)}{P(X<0)} =\frac{F_X(0)-F_X(-1)}{F_X(0)}\\ &&=\frac{\frac{0^2}{24}+\frac{0}{4}+\frac{3}{8}-\frac{(-1)^2}{24}-\frac{(-1)}{4}-\frac{3}{8}}{\frac{0^2}{24}+\frac{0}{4}+\frac{3}{8}} =\frac{\frac{9-1+6-9}{24}}{\frac{3}{8}}=\frac{5}{24}.\frac{8}{3}\\ &&=\frac{5}{9} \end{array} \]

Resolução no R:

paste0("letra a =", (1-Fac(3))/(1-Fac(0)))
## [1] "letra a =0.1"
paste0("letra b =", (Fac(0)-Fac(-1))/Fac(0))
## [1] "letra b =0.555555555555556"
paste0("De fato, 5/9 =",5/9)
## [1] "De fato, 5/9 =0.555555555555556"