1) Considere uma variável aleatória com distribuição normal de média 50 e variância 25. Indique:
a)o quantil correspondente à probabilidade de encontrar um valor aleatoriamente de 5% ou menos.
Dados: X ~ N(50, 25), temos:\(P(X \le 0.05)\)
## [1] 41.78
b) o quantil correspondente à probabilidade de encontrar um valor aleatoriamente de 1% ou mais.
Dados: X ~ N(50, 25), temos:\(P(X \ge 0.99)\)
## [1] 61.63
c) o quantil para médias amostrais (de amostras de tamanho 50) correspondente à probabilidade de encontrar um valor de média, de 5% ou menos.
Temos uma média amostral de modo que \(\bar{X}\) ~ \(N(50,{\frac{25}{50}})\). Assim, precisamos calcular \(P(\bar{X} < X_c|\mu=50) = 0,05\), ou seja, \(P(Z<Z_c)=0,05\).
# Quantil correspondente a uma probabilidade de 5% ou menos
c1 = qnorm(0.05, 50, sqrt(25/50))
round(c1,2)## [1] 48.84
2) Considere as distribuições normal padrão \((N(0,1))\), t de Student com 10 graus de liberdade \((t_{10})\), qui-quadrada com 10 graus de liberdade (\(\chi^2_{10}\)), e F com 10 e 100 graus de liberdade (\(F_{10,100}\)). Para cada uma, determina os quantis de 95% (\(\alpha = 0,05\)), 97% (\(\alpha = 0,03\)) e de 99% (\(\alpha = 0,01\)) nas seguintes opções: (1) bilateral, com intervalo acima e abaixo dos quantis iguais em probabilidade; (2) unilateral à direita (ou seja, cobrindo uma área de 95%, 97% ou 99% até o quantil); (3) unilateral à esquerda (ou seja, cobrindo uma área de 95%, 97% ou 99% a partir do quantil). Sugestão: para cada distribuição, faça na tabela abaixo.
Distribuição Normal Padrão
library(kableExtra)
int_1 = round(c(qnorm(0.025), qnorm(0.975), qnorm(0.05),
qnorm(0.95), qnorm(0.95), qnorm(0.05) ),2)
int_2= round(c(qnorm(0.015), qnorm(0.985), qnorm(0.03),
qnorm(0.97), qnorm(0.97), qnorm(0.03) ),2)
int_3= round(c(qnorm(0.005), qnorm(0.995), qnorm(0.01),
qnorm(0.99), qnorm(0.99), qnorm(0.01) ),2)
Dnormal<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))
names(Dnormal)[1:6] <- c("Z(a/2)", "Z(1-a/2)","Z(a)", "Z(Inf)", "Z(0)", "Z(a)")
kable(Dnormal, booktabs = T, caption = "Distribuição Normal") %>%
kable_styling("striped", latex_options = c("hold_position"),full_width = F) %>%
add_header_above(c("Intervalo " = 1, "Bilateral" = 2,
"Unilateral à esquerda" = 2, "Unilateral à direita" = 2))| Z(a/2) | Z(1-a/2) | Z(a) | Z(Inf) | Z(0) | Z(a) | |
|---|---|---|---|---|---|---|
| 0,95 | -1.96 | 1.96 | -1.64 | 1.64 | 1.64 | -1.64 |
| 0,97 | -2.17 | 2.17 | -1.88 | 1.88 | 1.88 | -1.88 |
| 0.99 | -2.58 | 2.58 | -2.33 | 2.33 | 2.33 | -2.33 |
Distribuição t de Student
library(kableExtra)
int_1 = round(c(qt(0.025, 10), qt(0.975, 10), qt(0.05, 10),
qt(0.95, 10), qt(0.95, 10), qt(0.05, 10) ),2)
int_2= round(c(qt(0.015, 10), qt(0.985, 10), qt(0.03, 10),
qt(0.97, 10), qt(0.97, 10), qt(0.03, 10) ),2)
int_3= round(c(qt(0.005, 10), qt(0.995, 10), qt(0.01, 10),
qt(0.99, 10), qt(0.99, 10), qt(0.01, 10) ),2)
DtStud<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))
names(DtStud)[1:6] <- c("t(a/2)", "t(1-a/2)","t(a)", "t(Inf)", "t(0)", "t(a)")
kable(DtStud, booktabs = T, caption = "Distribuição t de Student") %>%
kable_styling("striped",full_width = F) %>%
add_header_above(c("Intervalo " = 1, "Bilateral" = 2,
"Unilateral à esquerda" = 2, "Unilateral à direita" = 2))| t(a/2) | t(1-a/2) | t(a) | t(Inf) | t(0) | t(a) | |
|---|---|---|---|---|---|---|
| 0,95 | -2.23 | 2.23 | -1.81 | 1.81 | 1.81 | -1.81 |
| 0,97 | -2.53 | 2.53 | -2.12 | 2.12 | 2.12 | -2.12 |
| 0.99 | -3.17 | 3.17 | -2.76 | 2.76 | 2.76 | -2.76 |
Distribuição Qui-Quadrado
library(kableExtra)
int_1 = round(c(qchisq(0.025, 10), qchisq(0.975, 10), qchisq(0.05, 10),
qchisq(0.95, 10), qchisq(0.95, 10), qchisq(0.05, 10) ),2)
int_2= round(c(qchisq(0.015, 10), qchisq(0.985, 10), qchisq(0.03, 10),
qchisq(0.97, 10), qchisq(0.97, 10), qchisq(0.03, 10) ),2)
int_3= round(c(qchisq(0.005, 10), qchisq(0.995, 10), qchisq(0.01, 10),
qchisq(0.99, 10), qchisq(0.99, 10), qchisq(0.01, 10) ),2)
DChi<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))
names(DChi)[1:6] <- c("Chi(a/2)", "Chi(1-a/2)","Chi(a)", "Chi(Inf)", "Chi(0)", "Chi(a)")
kable(DChi, booktabs = T, caption = "Distribuição Qui-Quadrado") %>%
kable_styling("striped",full_width = F) %>%
add_header_above(c("Intervalo " = 1, "Bilateral" = 2,
"Unilateral à esquerda" = 2, "Unilateral à direita" = 2))| Chi(a/2) | Chi(1-a/2) | Chi(a) | Chi(Inf) | Chi(0) | Chi(a) | |
|---|---|---|---|---|---|---|
| 0,95 | 3.25 | 20.48 | 3.94 | 18.31 | 18.31 | 3.94 |
| 0,97 | 2.84 | 22.02 | 3.41 | 19.92 | 19.92 | 3.41 |
| 0.99 | 2.16 | 25.19 | 2.56 | 23.21 | 23.21 | 2.56 |
Distribuição F
library(kableExtra)
int_1 = round(c(qf(0.025, 10, 100), qf(0.975, 10, 100), qf(0.05, 10, 100),
qf(0.95, 10, 100), qf(0.95, 10, 100), qf(0.05, 10, 100) ),2)
int_2= round(c(qf(0.015, 10, 100), qf(0.985, 10, 100), qf(0.03, 10, 100),
qf(0.97, 10, 100), qf(0.97, 10, 100), qf(0.03, 10, 100) ),2)
int_3= round(c(qf(0.005, 10, 100), qf(0.995, 10, 100), qf(0.01, 10, 100),
qf(0.99, 10, 100), qf(0.99, 10, 100), qf(0.01, 10, 100) ),2)
DF<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))
names(DF)[1:6] <- c("F(a/2)", "F(1-a/2)","F(a)", "F(Inf)", "F(0)", "F(a)")
kable(DF, booktabs = T, caption = "Distribuição F") %>%
kable_styling("striped",full_width = F) %>%
add_header_above(c("Intervalo " = 1, "Bilateral" = 2,
"Unilateral à esquerda" = 2, "Unilateral à direita" = 2))| F(a/2) | F(1-a/2) | F(a) | F(Inf) | F(0) | F(a) | |
|---|---|---|---|---|---|---|
| 0,95 | 0.32 | 2.18 | 0.39 | 1.93 | 1.93 | 0.39 |
| 0,97 | 0.28 | 2.36 | 0.33 | 2.11 | 2.11 | 0.33 |
| 0.99 | 0.21 | 2.74 | 0.25 | 2.50 | 2.50 | 0.25 |
3) Suponha que uma população tem valores que seguem uma distribuição de Poisson com parâmetro 350.
a) Indique a probabilidade de que uma observação qualquer tenha valor de 318 ou menor.
## [1] 0.04447639
b) Indique a probabilidade de que uma observação qualquer tenha valor de 370 ou maior.
## [1] 0.1369437
c) Considere o seguinte critério de análise: se a probabilidade de aparecer um valor tão extremo quanto determinados valores dados for 0,05 ou menor, dizemos que o evento é improvável. Indique os quantis bilaterais e unilaterais à esquerda e à direita da distribuição acima. Em seguida, analise se os eventos indicados em (a) e (b) são improváveis ou não, segundo os critérios do item c.
pA = round(c(qpois(0.025, 350), qpois(0.975, 350), qpois(0.05, 350),
qpois(0.95, 350), qpois(0.95, 350), qpois(0.05, 350)),2)
Dpois<- data.frame(rbind("0,95" =pA))
names(Dpois)[1:6] <- c("Poi(0.025)", "Poi(0.975)","Poi(0.05)",
"Poi(0.95)", "Poi(0.95)", "Poi(0.05)")
library(kableExtra)
kable(Dpois, booktabs = T, caption = "Distribuição Poisson") %>%
kable_styling("striped",full_width = F) %>%
add_header_above(c("Intervalo " = 1, "Bilateral" = 2,
"Unilateral à esquerda" = 2, "Unilateral à direita" = 2))| Poi(0.025) | Poi(0.975) | Poi(0.05) | Poi(0.95) | Poi(0.95) | Poi(0.05) | |
|---|---|---|---|---|---|---|
| 0,95 | 314 | 387 | 320 | 381 | 381 | 320 |
(a) Comentários: A probabilidade de que uma observação qualquer tenha valor de 318 ou menor só é possível considerando uma probabilidade menor do que 2.5%
(b) Comentários: A probabilidade de que uma observação qualquer seja valor de 370 ou maior é improvável.
4) Suponha novamente que uma população tem valores que seguem uma distribuição de Poisson com parâmetro 350.
a) Indique a probabilidade de que uma amostra de tamanho 20 tenha valor médio de 318 ou menor.
# média (lambda) = 350, variância (lambda) = 350, n = 20, x = 318. Usando uma aproximação normal;
pnorm(318, 350, sqrt(350/20))## [1] 1.009101e-14
## [1] 0.2415587
b) Indique a probabilidade de que uma amostra de tamanho 35 tenha valor médio de 318 ou menor.
# média (lambda) = 350, variância (lambda) = 350, n = 35, x = 318. Usando uma aproximação normal;
pnorm(318, 350, sqrt(350/35))## [1] 2.268508e-24
## [1] 0.1866948
c) Indique a probabilidade de que uma amostra de tamanho 20 tenha valor médio de 370 ou maior.
# média (lambda) = 350, variância (lambda) = 350, n = 20, x = 370. Usando uma aproximação normal;
1 - pnorm(370, 350, sqrt(350/20))## [1] 8.724981e-07
# média (lambda) = 350, Graus de Liberdade = 20 - 1, x = 370. Usando t de Student;
1 - pt(318, 19, 350)## [1] 0.7584413
d) Indique a probabilidade de que uma amostra de tamanho 35 tenha valor médio de 370 ou maior.
# média (lambda) = 350, variância (lambda) = 350, n = 35, x = 370. Usando uma aproximação normal;
1 - pnorm(370, 350, sqrt(350/35))## [1] 1.269814e-10
# média (lambda) = 350, Graus de Liberdade = 35 - 1, x = 370. Usando t de Student;
1 - pt(370, 34, 350)## [1] 0.3501144
e) Considere o seguinte critério de análise: se a probabilidade de aparecer um valor tão extremo quanto um determinado valor dado for 0,05 ou menor, dizemos que o evento é improvável; se for 0,01 ou menor, dizemos que o evento é muito raro; e se for menor que 0,001, dizemos que é muitíssimo raro. Neste sentido, classifique os eventos indicados de (a) até (d) (tome por referência o intervalo bilateral).
Q4E = c(pnorm(318, 350, sqrt(350/20)), pt(318, 19, 350),
pnorm(318, 350, sqrt(350/35)), pt(318, 34, 350),
(1 - pnorm(370, 350, sqrt(350/20))), (1 - pt(318, 19, 350)),
(1 - pnorm(370, 350, sqrt(350/35))), (1 - pt(370, 34, 350)))
criterio<- data.frame(rbind("Critérios" =Q4E))
criterio<-format(criterio, digits = 4, scientific = 5)
names(criterio)[1:8] <- c("Na", "tA", "Nb", "tB", "Nc", "tC", "Nd", "tD")
#Resumo das Probabilidades
options(kableExtra.latex.load_packages = FALSE)
library(kableExtra)
kable(criterio, "latex", booktabs = T,
caption = "Resumo Distribuição Poisson") %>%
kable_styling("striped", "hold_position",full_width = F)5) Variáveis aleatórias com distribuição exponencial possuem, além do processo convencional, ao menos mais duas formas de construção de intervalos de confiança para a média a partir de estatísticas amostrais. A seguir temos as formulações:
O intervalo clássico, baseado no Teorema do limite central, a seguir indicado (supomos a variância desconhecida, como ocorre na prática):
\(IC(\mu;1-\alpha) = [\bar{X}+t_{(\alpha/2,n-1)}\frac{s}{\sqrt(n)};\bar{X}+t_{(1-\alpha/2,n-1)}\frac{s}{\sqrt(n)}\)
O intervalo adaptado com base na distribuição normal, a seguir indicado:
\(IC(\mu;1-\alpha) = [\frac{\bar{X}\sqrt{n}}{\sqrt{n}+Z_{1-\alpha/2}};\frac{\bar{X}\sqrt{n}}{\sqrt{n}-Z_{1-\alpha/2}}]\)
O intervalo adaptado com base na distribuição qui-quadrada, abaixo indicado:
\(IC(\mu;1-\alpha)=[\frac{2n\bar{X}}{\chi^2_{(1-\alpha/2, 2n)}};\frac{2n\bar{X}}{\chi^2_{(\alpha/2, 2n)}}]\)
Faça o que se pede: a) Pesquise sobre a distribuição de exponencial e suas medidas de valor esperado e de variância; analise ao menos uma variável do cotidiano cujos valores ‘podem ser governados’ por distribuições exponenciais.
A distribuição exponencial é um tipo de distribuição contínua de probabilidade, representada por um parâmetro \(\lambda\). É caracterizada por ter uma função de taxa de falha constante (única com esta propriedade). Tem sido usada extensivamente como um modelo para o tempo de vida de certos produtos e materiais. A variável aleatória \(X\) tem distribuição Exponencial com parâmetro \(\lambda\), com \(\lambda > 0\), se tiver função densidade de probabilidade dada por:
\[ f(x;\lambda) = \left \{ \begin{matrix} \lambda e^{-\lambda x}, & \mbox{se }x \ge \mbox{0} \\ 0, & \mbox{se }x < \mbox{ 0} \end{matrix} \right. \] Valor Esperado: \(E(X) = \frac{1}{\lambda}\).
Variância: \(Var(X) = \frac{1}{\lambda^2}\).
Falta de Memória: probabilidade de que seja necessário esperar, por exemplo, mais que 30 segundos até que o evento aconteça, dado que esse evento não aconteceu antes de 20 segundos, é a mesma de que esse evento ocorra depois dos 10 segundos iniciais.
Exemplos de Variáveis X com distribuição exponencial:
b) Gere no R 10000 amostras aleatórias de tamanho 10 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.
Para amostras com Tamanho = 10
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 10
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pDezCla=sum(M[,n+5])/10000; pDezCla #% DE ACERTO## [1] 0.9008
## [1] 0.03412319
## [1] 0.1661971
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezNor=sum(M[,n+4])/10000; pDezNor #% DE ACERTO## [1] 0.9561
## [1] 0.06183507
## [1] 0.2634372
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezQui=sum(M[,n+4])/10000; pDezQui #% DE ACERTO## [1] 0.9531
## [1] 0.05862528
## [1] 0.2088676
c) Gere no R 10000 amostras aleatórias de tamanho 100 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s e comente.
Para amostras com Tamanho = 100
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 100
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pCemCla=sum(M[,n+5])/10000; pCemCla #% DE ACERTO## [1] 0.9424
## [1] 0.08046598
## [1] 0.1198735
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemNorm=sum(M[,n+4])/10000; pCemNorm #% DE ACERTO## [1] 0.9546
## [1] 0.08375423
## [1] 0.1245887
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemQui=sum(M[,n+4])/10000; pCemQui #% DE ACERTO## [1] 0.9552
## [1] 0.08310846
## [1] 0.1231131
d) Gere no R 10000 amostras aleatórias de tamanho 1000 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s.
Para amostras com Tamanho = 1000 y
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 1000
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pMilCla=sum(M[,n+5])/10000; pMilCla #% DE ACERTO## [1] 0.9511
## [1] 0.0938076
## [1] 0.1062115
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilNorm=sum(M[,n+4])/10000; pMilNorm #% DE ACERTO## [1] 0.9521
## [1] 0.09417277
## [1] 0.1066177
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilQui=sum(M[,n+4])/10000; pMilQui #% DE ACERTO## [1] 0.9516
## [1] 0.09408935
## [1] 0.1065095
e) Comente os resultados de b a d. Algum intervalo parece mais apropriado nos diferentes tamanhos de amostra?
Resumo dos Resultados.
RDez = round(c(pDezCla, LiDezCla, LsDezCla, pDezNor,
LiDezNorm, LsDezNorm, pDezQui, LiDezQui, LsDezQui ),2)
RCem = round(c(pCemCla, LiCemCla, LsCemCla, pCemNorm,
LiCemNorm, LsCemNorm, pCemQui, LiCemQui, LsCemQui ),2)
Rmil = round(c( pMilCla, LiMilCla, LsMilCla, pMilNorm,
LiMilNorm, LsMilNorm, pMilQui, LiMilQui, LsMilQui),2)
Amostras<- data.frame(rbind("Amostra Dez" =RDez, "Amostra Cem" = RCem, "Amostra Mil" = Rmil))
names(Amostras)[1:9] <- c("Acerto", "LI","LS",
"Acerto", "LI","LS",
"Acerto", "LI","LS")
library(kableExtra)
kable(Amostras, booktabs = T, caption = "Resumo Distribuição Exponencial")%>%
kable_styling("striped") %>%
add_header_above(c(" "=1, "Clássico " = 3, "Normal" = 3, "Qui-Quadrado" = 3))| Acerto | LI | LS | Acerto | LI | LS | Acerto | LI | LS | |
|---|---|---|---|---|---|---|---|---|---|
| Amostra Dez | 0.90 | 0.03 | 0.17 | 0.96 | 0.06 | 0.26 | 0.95 | 0.06 | 0.21 |
| Amostra Cem | 0.94 | 0.08 | 0.12 | 0.95 | 0.08 | 0.12 | 0.96 | 0.08 | 0.12 |
| Amostra Mil | 0.95 | 0.09 | 0.11 | 0.95 | 0.09 | 0.11 | 0.95 | 0.09 | 0.11 |
Comentários:
f) É razoável esperar que quando o tamanho da amostra cresça os intervalos dos três métodos se aproximem até se sobreporem. Isto ocorre? Explique.
6) Variáveis aleatórias com distribuição de Poisson possuem ao menos 3 formas de construção de intervalos de confiança para a média, a saber:
a) Pesquise sobre a distribuição Poisson e indique suas medidas de valor esperado e de variância; analise ao menos uma variável do cotidiano cujos valores ‘podem ser governados’ por distribuições Poisson.
A distribuição de Poisson é uma distribuição de probabilidade de variável aleatória discreta que expressa a probabilidade de uma série de eventos ocorrer num certo período de tempo se estes eventos ocorrem independentemente de quando ocorreu o último evento. Consideremos uma variáveis aleatórias N que representea o número de ocorrências discretas de um certo fenômeno durante um intervalo de tempo de determinada duração.
A probabilidade de que existam exactamente k ocorrências (k sendo um inteiro não negativo, k = 0, 1, 2, …) é dada por:
\(f(k;\lambda)= \frac{e^{-\lambda}\lambda^k}{k!}\)
onde: e é base do logaritmo natural (\(e = 2.71828...\)); \(k!\) é o fatorial de k; \(\lambda\) é um número real, igual ao número esperado de ocorrências num dado intervalo de tempo.
Exemplo: Se o evento ocorre a uma média de 4 minutos, e estamos interessados no número de eventos que ocorrem num intervalo de 10 minutos, usariámos como modelo a distribuição de Poisson com \(\lambda = 10/4 = 2.5\).
Valor Esperado: \(E[X]=\lambda\)
Variância: \(Var(X) =\lambda\)
b) Gere no R 10000 amostras aleatórias de tamanho 10 de uma variável aleatória X~Pois(5), e construa ostrês intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.
Para amostras com Tamanho = 10
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 10
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pDezClaPois=sum(M[,n+5])/10000; pDezClaPois #% DE ACERTO## [1] 0
## [1] 7.816739
## [1] 12.20216
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezNorPois=sum(M[,n+4])/10000; pDezNorPois #% DE ACERTO## [1] 0
## [1] 6.179455
## [1] 26.32646
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezQuiPois=sum(M[,n+4])/10000; pDezQuiPois #% DE ACERTO## [1] 0
## [1] 5.858686
## [1] 20.87307
c) Gere no R 10000 amostras aleatórias de tamanho 100 de uma variável aleatória X~Pois(5), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s.
Para amostras com Tamanho = 100
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 100
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pCemClaPois=sum(M[,n+5])/10000; pCemClaPois #% DE ACERTO## [1] 0
## [1] 9.370004
## [1] 10.62043
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemNormPois=sum(M[,n+4])/10000; pCemNormPois #% DE ACERTO## [1] 0
## [1] 8.35723
## [1] 12.43181
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemQuiPois=sum(M[,n+4])/10000; pCemQuiPois #% DE ACERTO## [1] 0
## [1] 8.292794
## [1] 12.28457
d) Gere no R 10000 amostras aleatórias de tamanho 1000 de uma variável aleatória X~Pois(10), e construa os três intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.
Para amostras com Tamanho = 1000
MÉTODO CLÁSSICO
#MÉTODO CLÁSSICO - TAM 1000
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pMilClaPois=sum(M[,n+5])/10000; pMilClaPois #% DE ACERTO## [1] 0
## [1] 9.802129
## [1] 10.19443
MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilNormPois=sum(M[,n+4])/10000; pMilNormPois #% DE ACERTO## [1] 0
## [1] 9.414756
## [1] 10.65891
MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilQuiPois=sum(M[,n+4])/10000; pMilQuiPois #% DE ACERTO## [1] 0
## [1] 9.406416
## [1] 10.6481
e) Comente os resultados de b a d. Algum intervalo parece mais apropriado nos diferentes tamanhos de amostra?
RDezPois = round(c(pDezClaPois, LiDezClaPois, LsDezClaPois, pDezNorPois,
LiDezNormPois, LsDezNormPois, pDezQuiPois, LiDezQuiPois, LsDezQuiPois ),2)
RCemPois = round(c(pCemClaPois, LiCemClaPois, LsCemClaPois, pCemNormPois,
LiCemNormPois, LsCemNormPois, pCemQuiPois, LiCemQuiPois, LsCemQuiPois),2)
RmilPois = round(c( pMilClaPois, LiMilClaPois, LsMilClaPois, pMilNormPois,
LiMilNormPois, LsMilNormPois, pMilQuiPois, LiMilQuiPois, LsMilQuiPois),2)
AmostrasPois<- data.frame(rbind("Amostra Dez" =RDezPois, "Amostra Cem" = RCemPois, "Amostra Mil" = RmilPois))
names(AmostrasPois)[1:9] <- c("Acerto", "LI","LS",
"Acerto", "LI","LS",
"Acerto", "LI","LS")
library(kableExtra)
kable(AmostrasPois, booktabs = T, caption = "Resumo Distribuição Poisson")%>%
kable_styling("striped") %>%
add_header_above(c(" "=1, "Clássico " = 3, "Normal" = 3, "Qui-Quadrado" = 3))| Acerto | LI | LS | Acerto | LI | LS | Acerto | LI | LS | |
|---|---|---|---|---|---|---|---|---|---|
| Amostra Dez | 0 | 7.82 | 12.20 | 0 | 6.18 | 26.33 | 0 | 5.86 | 20.87 |
| Amostra Cem | 0 | 9.37 | 10.62 | 0 | 8.36 | 12.43 | 0 | 8.29 | 12.28 |
| Amostra Mil | 0 | 9.80 | 10.19 | 0 | 9.41 | 10.66 | 0 | 9.41 | 10.65 |
f) É razoável esperar que quando o tamanho da amostra cresça os intervalos dos três métodos se aproximem até se sobreporem. Isto ocorre? Explique.
7) Considere a formulação mostrada para o intervalo de confiança para a variância.
a) Gere no R 10000 amostras de tamanho 8 de uma variável aleatória X com distribuição normal X~(40,10), e para cada amostra calcule os limites superiores e inferiores do intervalo de confiança da variância populacional de 95%, e verifique o percentual de vezes em que o intervalo gerado contém o valor verdadeiro.
#----------------------------------------------------------------
#DA NORMAL - TAM =8
#----------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=100 #A VARIÂNCIA - O QUADRADO DE LAMBDA
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rnorm(n,40,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Norm=sum(M[,n+4])/10000; p7Norm #% DE ACERTO## [1] 0.9488
## [1] 43.70406
## [1] 414.1284
b) Repita o mesmo procedimento acima para amostras de tamanho 1000. Analise e compare com os resultados do item a.
#----------------------------------------------------------------
#DA NORMAL - TAM = 1000
#----------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=100 #A VARIÂNCIA - O QUADRADO DE LAMBDA
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rnorm(n,40,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Norm2=sum(M[,n+4])/10000; p7Norm2 #% DE ACERTO## [1] 0.9509
## [1] 91.77323
## [1] 109.3768
c) Repita os procedimentos a e b para amostras extraídas de uma variável aleatória H com distribuição Poisson H~Poisson(50) (a variância é 50). Analise os resultados considerando que a variável aleatória H é bastante simétrica (sugestão para visualização: gere uma amostra aleatória de tamanho 100000 de H e veja seu histograma).
POISSON - TAM =8
#----------------------------------------------------------------
#POISSON - TAM =8
#----------------------------------------------------------------
lambda=50 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda #A VARIÂNCIA - IGUAL A LAMBDA
n=8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Pois=sum(M[,n+4])/10000; p7Pois #% DE ACERTO## [1] 0.947
## [1] 21.67063
## [1] 205.3453
POISSON - TAM = 1000
#----------------------------------------------------------------
#DA POISSON - TAM = 1000
#----------------------------------------------------------------
lambda=50 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda #A VARIÂNCIA - IGUAL A LAMBDA
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Pois2=sum(M[,n+4])/10000; p7Pois2 #% DE ACERTO## [1] 0.9516
## [1] 45.87525
## [1] 54.67487
d) Repita os procedimentos a e b para amostras extraídas de uma variável aleatória Y com distribuição exponencial Y~Exp(0,5) (a variância é 0,25). Analise os resultados considerando que a variável aleatória Y é fortemente assimétrica (sugestão para visualização: gere uma amostra aleatória de tamanho 100000 de Y e veja seu histograma).
EXPONENCIAL - TAM = 8
#----------------------------------------------------------------
#DA EXPONENCIAL - TAM = 8
#----------------------------------------------------------------
lambda=0.5 #PARÂMETRO DA DISTRIBUIÇÃO
medida=1/lambda^2 #A VARIÂNCIA – INVERSO DO QUADRADO DE LAMBDA
n=8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Exp=sum(M[,n+4])/10000; p7Exp #% DE ACERTO## [1] 0.7864
## [1] 1.75157
## [1] 16.59743
EXPONENCIAL - TAM = 1000
#----------------------------------------------------------------
#DA EXPONENCIAL - TAM = 1000
#----------------------------------------------------------------
lambda=0.5 #PARÂMETRO DA DISTRIBUIÇÃO
medida=1/lambda^2 #A VARIÂNCIA – INVERSO DO QUADRADO DE LAMBDA
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Exp2=sum(M[,n+4])/10000; p7Exp2 # % DE ACERTO## [1] 0.6781
## [1] 3.67417
## [1] 4.378935
e) Repita os procedimentos a e b para amostras extraídas de duas variáveis aleatórias Z1 e Z2 com distribuição Bernoulli Z1~Bernoulli(0,30) e Z2~Bernoulli(0,10). Comente os resultados considerando que a variável aleatória Z somente possui valores 0 ou 1 e as variações de 0,10 e 0,30.
BERNOULLI - Z1 TAM 8
#----------------------------------------------------------------
#DA BERNOULLI - Z1 TAM 8
#----------------------------------------------------------------
lambda= 0.10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z1Bern=sum(M[,n+4])/10000; p7Z1Bern #% DE ACERTO## [1] 0.3813
## [1] 0.0390579
## [1] 0.3701026
BERNOULLI - Z1 TAM 1000
#----------------------------------------------------------------
#DA BERNOULLI - Z1 TAM 1000
#----------------------------------------------------------------
lambda= 0.10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z1Bern2=sum(M[,n+4])/10000; p7Z1Bern2 #% DE ACERTO## [1] 0.7092
## [1] 0.08260374
## [1] 0.09844848
BERNOULLI - Z2 TAM 8
#----------------------------------------------------------------
#DA BERNOULLI - Z2 TAM 8
#----------------------------------------------------------------
lambda= 0.30 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z2Bern=sum(M[,n+4])/10000; p7Z2Bern #% DE ACERTO## [1] 0.9426
## [1] 0.09152386
## [1] 0.8672565
BERNOULLI - Z2 TAM 1000
#----------------------------------------------------------------
#DA BERNOULLI - Z2 TAM 1000
#----------------------------------------------------------------
lambda= 0.30 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z2Bern2=sum(M[,n+4])/10000; p7Z2Bern2 #% DE ACERTO## [1] 0.9978
## [1] 0.1927355
## [1] 0.2297054
f) Analise os resultados da comparação do desempenho do intervalo de confiança para a variância populacional considerando as quatro distribuições mostradas e suas variações, em particular considerando o nível de assimetria de cada distribuição.
ResQ7 = round(c(p7Norm, p7Norm2, p7Pois, p7Pois2, p7Exp,
p7Exp2, p7Z1Bern, p7Z1Bern2, p7Z2Bern, p7Z2Bern2 ),2)
LiQ7 = round(c(Li7Norm, Li7Norm2, Li7Pois, Li7Pois2, Li7Exp,
Li7Exp2, Li7Z1Bern, Li7Z1Bern2, Li7Z2Bern, Li7Z2Bern2),2)
LsQ7 = round(c( Ls7Norm, Ls7Norm2, Ls7Pois, Ls7Pois2, Ls7Exp,
Ls7Exp2, Ls7Z1Bern, Ls7Z1Bern2, Ls7Z2Bern, Ls7Z2Bern2),2)
dist<- data.frame(rbind("ACERTO" =ResQ7, "LI" = LiQ7, "LS" = LsQ7))
names(dist)[1:10] <- c("(N8)", "(N1000)","(N8)", "(N1000)",
"(N8)", "(N1000)", "(N8)", "(N1000)",
"(N8)", "(N1000)")
library(kableExtra)
kable(dist, booktabs = T, caption = "Resumo Distribuição")%>%
kable_styling("striped", "scale_down") %>%
add_header_above(c(" "=1, "Normal " = 2, "Poisson" = 2,
"Exponencial" = 2, "Bernoulli Z1"= 2,
"Bernoulli Z2" = 2))| (N8) | (N1000) | (N8) | (N1000) | (N8) | (N1000) | (N8) | (N1000) | (N8) | (N1000) | |
|---|---|---|---|---|---|---|---|---|---|---|
| ACERTO | 0.95 | 0.95 | 0.95 | 0.95 | 0.79 | 0.68 | 0.38 | 0.71 | 0.94 | 1.00 |
| LI | 43.70 | 91.77 | 21.67 | 45.88 | 1.75 | 3.67 | 0.04 | 0.08 | 0.09 | 0.19 |
| LS | 414.13 | 109.38 | 205.35 | 54.67 | 16.60 | 4.38 | 0.37 | 0.10 | 0.87 | 0.23 |
8) Dizemos que um estimador é mais eficiente que outro quando sua variância é menor. Nesse caso, considere a seguinte situação: O valor esperado (ou seja, sua média) de uma distribuição uniforme contínua \(X~Uniforme(a,b)\) é dado pela média aritmética simples dos dois parâmetros \((E(X) = (a+b)/2\). Quando trabalhamos com amostras, temos ao menos cinco possíveis estimadores, que são:
Simule no R a extração de 5000 amostras de tamanhos 10 e 100 (por exemplo, uma uniforme entre 0 a 100), e em cada amostra estime a média pelos cinco métodos, e aponta, para os dois tamanhos de amostra, qual é o estimador mais eficiente.
Estimador Eficiênte
Distribuição Uniforme
#Questão 08
#x-unif(0,10)
ms<- c(); ma10<- c(); med<- c(); mi_ma<- c(); d1_d9<- c()
n=10
k=5000
for(i in 1:k){
amostra=runif(n,0,100)
ms[i]<-mean(amostra)
ma10[i]<- mean(amostra, 0.10)
med[i]<- median(amostra)
mi_ma[i]<- ((min(amostra)+max(amostra))/2)
d1_d9[i]<- quantile(amostra, 0.10)+quantile(amostra,0.90)
}
mean(ms); var(ms)## [1] 50.05247
## [1] 82.19006
## [1] 50.06297
## [1] 107.91
## [1] 50.07742
## [1] 186.4256
## [1] 50.01044
## [1] 36.35383
## [1] 100.1311
## [1] 272.1921