MQA I - Resolução da Lista de Exercícios - Inferência (Prof. Franzé Costa)

Questão 01

1) Considere uma variável aleatória com distribuição normal de média 50 e variância 25. Indique:

a)o quantil correspondente à probabilidade de encontrar um valor aleatoriamente de 5% ou menos.

Dados: X ~ N(50, 25), temos:\(P(X \le 0.05)\)

# Quantil correspondente a uma probabilidade de 5%
a1 = qnorm(0.05, 50, 5)
round(a1,2)

## [1] 41.78

b) o quantil correspondente à probabilidade de encontrar um valor aleatoriamente de 1% ou mais.

Dados: X ~ N(50, 25), temos:\(P(X \ge 0.99)\)

# Quantil correspondente a uma probabilidade de 1%
b1 = qnorm(0.99, 50, 5)
round(b1,2)

## [1] 61.63

c) o quantil para médias amostrais (de amostras de tamanho 50) correspondente à probabilidade de encontrar um valor de média, de 5% ou menos.

Temos uma média amostral de modo que \(\bar{X}\) ~ \(N(50,{\frac{25}{50}})\). Assim, precisamos calcular \(P(\bar{X} < X_c|\mu=50) = 0,05\), ou seja, \(P(Z<Z_c)=0,05\).

# Quantil correspondente a uma probabilidade de 5% ou menos
c1 = qnorm(0.05, 50, sqrt(25/50))
round(c1,2)

## [1] 48.84

Questão 02

2) Considere as distribuições normal padrão \((N(0,1))\), t de Student com 10 graus de liberdade \((t_{10})\), qui-quadrada com 10 graus de liberdade (\(\chi^2_{10}\)), e F com 10 e 100 graus de liberdade (\(F_{10,100}\)). Para cada uma, determina os quantis de 95% (\(\alpha = 0,05\)), 97% (\(\alpha = 0,03\)) e de 99% (\(\alpha = 0,01\)) nas seguintes opções: (1) bilateral, com intervalo acima e abaixo dos quantis iguais em probabilidade; (2) unilateral à direita (ou seja, cobrindo uma área de 95%, 97% ou 99% até o quantil); (3) unilateral à esquerda (ou seja, cobrindo uma área de 95%, 97% ou 99% a partir do quantil). Sugestão: para cada distribuição, faça na tabela abaixo.

Distribuição Normal Padrão

library(kableExtra)
int_1 = round(c(qnorm(0.025), qnorm(0.975), qnorm(0.05), 
                qnorm(0.95),  qnorm(0.95), qnorm(0.05) ),2)
int_2= round(c(qnorm(0.015), qnorm(0.985), qnorm(0.03), 
               qnorm(0.97), qnorm(0.97), qnorm(0.03) ),2)
int_3= round(c(qnorm(0.005), qnorm(0.995), qnorm(0.01), 
               qnorm(0.99), qnorm(0.99), qnorm(0.01) ),2)
Dnormal<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))
names(Dnormal)[1:6] <- c("Z(a/2)", "Z(1-a/2)","Z(a)", "Z(Inf)", "Z(0)", "Z(a)")
kable(Dnormal, booktabs = T, caption = "Distribuição Normal") %>% 
  kable_styling("striped",  latex_options = c("hold_position"),full_width = F) %>%
  add_header_above(c("Intervalo " = 1, "Bilateral" = 2, 
                     "Unilateral à esquerda" = 2, "Unilateral à direita" = 2))

Distribuição Normal
Intervalo	Bilateral		Unilateral à esquerda		Unilateral à direita
	Z(a/2)	Z(1-a/2)	Z(a)	Z(Inf)	Z(0)	Z(a)
0,95	-1.96	1.96	-1.64	1.64	1.64	-1.64
0,97	-2.17	2.17	-1.88	1.88	1.88	-1.88
0.99	-2.58	2.58	-2.33	2.33	2.33	-2.33

Distribuição t de Student

library(kableExtra)
int_1 = round(c(qt(0.025, 10), qt(0.975, 10), qt(0.05, 10), 
                qt(0.95, 10),  qt(0.95, 10), qt(0.05, 10) ),2)
int_2= round(c(qt(0.015, 10), qt(0.985, 10), qt(0.03, 10), 
               qt(0.97, 10), qt(0.97, 10), qt(0.03, 10) ),2)
int_3= round(c(qt(0.005, 10), qt(0.995, 10), qt(0.01, 10), 
               qt(0.99, 10), qt(0.99, 10), qt(0.01, 10) ),2)
DtStud<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))

names(DtStud)[1:6] <- c("t(a/2)", "t(1-a/2)","t(a)", "t(Inf)", "t(0)", "t(a)")
kable(DtStud, booktabs = T, caption = "Distribuição t de Student") %>% 
  kable_styling("striped",full_width = F) %>%
  add_header_above(c("Intervalo " = 1, "Bilateral" = 2, 
                     "Unilateral à esquerda" = 2, "Unilateral à direita" = 2))

Distribuição t de Student
Intervalo	Bilateral		Unilateral à esquerda		Unilateral à direita
	t(a/2)	t(1-a/2)	t(a)	t(Inf)	t(0)	t(a)
0,95	-2.23	2.23	-1.81	1.81	1.81	-1.81
0,97	-2.53	2.53	-2.12	2.12	2.12	-2.12
0.99	-3.17	3.17	-2.76	2.76	2.76	-2.76

Distribuição Qui-Quadrado

library(kableExtra)
int_1 = round(c(qchisq(0.025, 10), qchisq(0.975, 10), qchisq(0.05, 10), 
                qchisq(0.95, 10),  qchisq(0.95, 10), qchisq(0.05, 10) ),2)
int_2= round(c(qchisq(0.015, 10), qchisq(0.985, 10), qchisq(0.03, 10), 
               qchisq(0.97, 10), qchisq(0.97, 10), qchisq(0.03, 10) ),2)
int_3= round(c(qchisq(0.005, 10), qchisq(0.995, 10), qchisq(0.01, 10), 
               qchisq(0.99, 10), qchisq(0.99, 10), qchisq(0.01, 10) ),2)
DChi<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))

names(DChi)[1:6] <- c("Chi(a/2)", "Chi(1-a/2)","Chi(a)", "Chi(Inf)", "Chi(0)", "Chi(a)")
kable(DChi, booktabs = T, caption = "Distribuição Qui-Quadrado") %>% 
  kable_styling("striped",full_width = F) %>%
  add_header_above(c("Intervalo " = 1, "Bilateral" = 2, 
                     "Unilateral à esquerda" = 2, "Unilateral à direita" = 2))

Distribuição Qui-Quadrado
Intervalo	Bilateral		Unilateral à esquerda		Unilateral à direita
	Chi(a/2)	Chi(1-a/2)	Chi(a)	Chi(Inf)	Chi(0)	Chi(a)
0,95	3.25	20.48	3.94	18.31	18.31	3.94
0,97	2.84	22.02	3.41	19.92	19.92	3.41
0.99	2.16	25.19	2.56	23.21	23.21	2.56

Distribuição F

library(kableExtra)
int_1 = round(c(qf(0.025, 10, 100), qf(0.975, 10, 100), qf(0.05, 10, 100), 
                qf(0.95, 10, 100),  qf(0.95, 10, 100), qf(0.05, 10, 100) ),2)
int_2= round(c(qf(0.015, 10, 100), qf(0.985, 10, 100), qf(0.03, 10, 100), 
               qf(0.97, 10, 100), qf(0.97, 10, 100), qf(0.03, 10, 100) ),2)
int_3= round(c(qf(0.005, 10, 100), qf(0.995, 10, 100), qf(0.01, 10, 100), 
               qf(0.99, 10, 100), qf(0.99, 10, 100), qf(0.01, 10, 100) ),2)
DF<- data.frame(rbind("0,95" =int_1, "0,97" = int_2, "0.99" = int_3))

names(DF)[1:6] <- c("F(a/2)", "F(1-a/2)","F(a)", "F(Inf)", "F(0)", "F(a)")
kable(DF, booktabs = T, caption = "Distribuição F") %>% 
  kable_styling("striped",full_width = F) %>%
  add_header_above(c("Intervalo " = 1, "Bilateral" = 2, 
                     "Unilateral à esquerda" = 2, "Unilateral à direita" = 2))

Distribuição F
Intervalo	Bilateral		Unilateral à esquerda		Unilateral à direita
	F(a/2)	F(1-a/2)	F(a)	F(Inf)	F(0)	F(a)
0,95	0.32	2.18	0.39	1.93	1.93	0.39
0,97	0.28	2.36	0.33	2.11	2.11	0.33
0.99	0.21	2.74	0.25	2.50	2.50	0.25

Questão 03

3) Suponha que uma população tem valores que seguem uma distribuição de Poisson com parâmetro 350.

a) Indique a probabilidade de que uma observação qualquer tenha valor de 318 ou menor.

#x~Pois(350)
ppois(318,350)

## [1] 0.04447639

b) Indique a probabilidade de que uma observação qualquer tenha valor de 370 ou maior.

#x~Pois(350)
#P(X>370) =  1- P(X<370)

1- ppois(370,350)

## [1] 0.1369437

c) Considere o seguinte critério de análise: se a probabilidade de aparecer um valor tão extremo quanto determinados valores dados for 0,05 ou menor, dizemos que o evento é improvável. Indique os quantis bilaterais e unilaterais à esquerda e à direita da distribuição acima. Em seguida, analise se os eventos indicados em (a) e (b) são improváveis ou não, segundo os critérios do item c.

pA = round(c(qpois(0.025, 350), qpois(0.975, 350), qpois(0.05, 350), 
                qpois(0.95, 350),  qpois(0.95, 350), qpois(0.05, 350)),2)

Dpois<- data.frame(rbind("0,95" =pA))
names(Dpois)[1:6] <- c("Poi(0.025)", "Poi(0.975)","Poi(0.05)", 
                       "Poi(0.95)", "Poi(0.95)", "Poi(0.05)")

library(kableExtra)
kable(Dpois, booktabs = T, caption = "Distribuição Poisson") %>% 
  kable_styling("striped",full_width = F) %>%
  add_header_above(c("Intervalo " = 1, "Bilateral" = 2, 
                     "Unilateral à esquerda" = 2, "Unilateral à direita" = 2))

Distribuição Poisson
Intervalo	Bilateral		Unilateral à esquerda		Unilateral à direita
	Poi(0.025)	Poi(0.975)	Poi(0.05)	Poi(0.95)	Poi(0.95)	Poi(0.05)
0,95	314	387	320	381	381	320

(a) Comentários: A probabilidade de que uma observação qualquer tenha valor de 318 ou menor só é possível considerando uma probabilidade menor do que 2.5%

(b) Comentários: A probabilidade de que uma observação qualquer seja valor de 370 ou maior é improvável.

Questão 04

4) Suponha novamente que uma população tem valores que seguem uma distribuição de Poisson com parâmetro 350.

a) Indique a probabilidade de que uma amostra de tamanho 20 tenha valor médio de 318 ou menor.

# média (lambda) = 350, variância (lambda) = 350, n = 20, x = 318. Usando uma aproximação normal;

pnorm(318, 350, sqrt(350/20))

## [1] 1.009101e-14

# média (lambda) = 350, Graus de Liberdade = 20 -1, x = 318. Usando t de Student;
pt(318, 19, 350)

## [1] 0.2415587

b) Indique a probabilidade de que uma amostra de tamanho 35 tenha valor médio de 318 ou menor.

# média (lambda) = 350, variância (lambda) = 350, n = 35, x = 318. Usando uma aproximação normal;

pnorm(318, 350, sqrt(350/35))

## [1] 2.268508e-24

# média (lambda) = 350, Graus de Liberdade = 35 - 1, x = 318. Usando t de Student;
pt(318, 34, 350)

## [1] 0.1866948

c) Indique a probabilidade de que uma amostra de tamanho 20 tenha valor médio de 370 ou maior.

# média (lambda) = 350, variância (lambda) = 350, n = 20, x = 370. Usando uma aproximação normal;

1 - pnorm(370, 350, sqrt(350/20))

## [1] 8.724981e-07

# média (lambda) = 350, Graus de Liberdade = 20 - 1, x = 370. Usando t de Student;
1 - pt(318, 19, 350)

## [1] 0.7584413

d) Indique a probabilidade de que uma amostra de tamanho 35 tenha valor médio de 370 ou maior.

# média (lambda) = 350, variância (lambda) = 350, n = 35, x = 370. Usando uma aproximação normal;

1 - pnorm(370, 350, sqrt(350/35))

## [1] 1.269814e-10

# média (lambda) = 350, Graus de Liberdade = 35 - 1, x = 370. Usando t de Student;
1 - pt(370, 34, 350)

## [1] 0.3501144

e) Considere o seguinte critério de análise: se a probabilidade de aparecer um valor tão extremo quanto um determinado valor dado for 0,05 ou menor, dizemos que o evento é improvável; se for 0,01 ou menor, dizemos que o evento é muito raro; e se for menor que 0,001, dizemos que é muitíssimo raro. Neste sentido, classifique os eventos indicados de (a) até (d) (tome por referência o intervalo bilateral).

Q4E = c(pnorm(318, 350, sqrt(350/20)), pt(318, 19, 350), 
        pnorm(318, 350, sqrt(350/35)), pt(318, 34, 350), 
        (1 - pnorm(370, 350, sqrt(350/20))), (1 - pt(318, 19, 350)),
        (1 - pnorm(370, 350, sqrt(350/35))), (1 - pt(370, 34, 350)))

criterio<- data.frame(rbind("Critérios" =Q4E))
criterio<-format(criterio, digits = 4, scientific = 5)
names(criterio)[1:8] <- c("Na", "tA", "Nb", "tB", "Nc", "tC", "Nd", "tD")

#Resumo das Probabilidades
options(kableExtra.latex.load_packages = FALSE)
library(kableExtra)
kable(criterio, "latex", booktabs = T, 
      caption = "Resumo Distribuição Poisson") %>%   
kable_styling("striped", "hold_position",full_width = F)

Questão 05

5) Variáveis aleatórias com distribuição exponencial possuem, além do processo convencional, ao menos mais duas formas de construção de intervalos de confiança para a média a partir de estatísticas amostrais. A seguir temos as formulações:

O intervalo clássico, baseado no Teorema do limite central, a seguir indicado (supomos a variância desconhecida, como ocorre na prática):

\(IC(\mu;1-\alpha) = [\bar{X}+t_{(\alpha/2,n-1)}\frac{s}{\sqrt(n)};\bar{X}+t_{(1-\alpha/2,n-1)}\frac{s}{\sqrt(n)}\)
O intervalo adaptado com base na distribuição normal, a seguir indicado:

\(IC(\mu;1-\alpha) = [\frac{\bar{X}\sqrt{n}}{\sqrt{n}+Z_{1-\alpha/2}};\frac{\bar{X}\sqrt{n}}{\sqrt{n}-Z_{1-\alpha/2}}]\)
O intervalo adaptado com base na distribuição qui-quadrada, abaixo indicado:

\(IC(\mu;1-\alpha)=[\frac{2n\bar{X}}{\chi^2_{(1-\alpha/2, 2n)}};\frac{2n\bar{X}}{\chi^2_{(\alpha/2, 2n)}}]\)

Faça o que se pede: a) Pesquise sobre a distribuição de exponencial e suas medidas de valor esperado e de variância; analise ao menos uma variável do cotidiano cujos valores ‘podem ser governados’ por distribuições exponenciais.

A distribuição exponencial é um tipo de distribuição contínua de probabilidade, representada por um parâmetro \(\lambda\). É caracterizada por ter uma função de taxa de falha constante (única com esta propriedade). Tem sido usada extensivamente como um modelo para o tempo de vida de certos produtos e materiais. A variável aleatória \(X\) tem distribuição Exponencial com parâmetro \(\lambda\), com \(\lambda > 0\), se tiver função densidade de probabilidade dada por:

\[ f(x;\lambda) = \left \{ \begin{matrix} \lambda e^{-\lambda x}, & \mbox{se }x \ge \mbox{0} \\ 0, & \mbox{se }x < \mbox{ 0} \end{matrix} \right. \] Valor Esperado: \(E(X) = \frac{1}{\lambda}\).

Variância: \(Var(X) = \frac{1}{\lambda^2}\).

Falta de Memória: probabilidade de que seja necessário esperar, por exemplo, mais que 30 segundos até que o evento aconteça, dado que esse evento não aconteceu antes de 20 segundos, é a mesma de que esse evento ocorra depois dos 10 segundos iniciais.

Exemplos de Variáveis X com distribuição exponencial:

O tempo entre as avarias de um equipamento.
O tempo entre as chegadas de táxis a uma interseção movimentada.
O tempo entre as chegadas de aeronaves a um aeroporto específico.
A distância entre duas falhas sucessivas em uma fita magnética.
A distância entre grandes buracos em uma rodovia movimentada.

b) Gere no R 10000 amostras aleatórias de tamanho 10 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.

Para amostras com Tamanho = 10

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 10
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pDezCla=sum(M[,n+5])/10000; pDezCla #% DE ACERTO

## [1] 0.9008

LiDezCla = mean(M[,n+3]); LiDezCla

## [1] 0.03412319

LsDezCla = mean(M[,n+4]); LsDezCla

## [1] 0.1661971

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezNor=sum(M[,n+4])/10000; pDezNor #% DE ACERTO

## [1] 0.9561

LiDezNorm = mean(M[,n+2]); LiDezNorm

## [1] 0.06183507

LsDezNorm = mean(M[,n+3]); LsDezNorm

## [1] 0.2634372

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezQui=sum(M[,n+4])/10000; pDezQui #% DE ACERTO

## [1] 0.9531

LiDezQui = mean(M[,n+2]); LiDezQui

## [1] 0.05862528

LsDezQui = mean(M[,n+3]); LsDezQui

## [1] 0.2088676

c) Gere no R 10000 amostras aleatórias de tamanho 100 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s e comente.

Para amostras com Tamanho = 100

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 100
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pCemCla=sum(M[,n+5])/10000; pCemCla #% DE ACERTO

## [1] 0.9424

LiCemCla = mean(M[,n+3]); LiCemCla

## [1] 0.08046598

LsCemCla = mean(M[,n+4]); LsCemCla

## [1] 0.1198735

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemNorm=sum(M[,n+4])/10000; pCemNorm #% DE ACERTO

## [1] 0.9546

LiCemNorm = mean(M[,n+2]); LiCemNorm

## [1] 0.08375423

LsCemNorm = mean(M[,n+3]); LsCemNorm

## [1] 0.1245887

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemQui=sum(M[,n+4])/10000; pCemQui #% DE ACERTO

## [1] 0.9552

LiCemQui = mean(M[,n+2]); LiCemQui

## [1] 0.08310846

LsCemQui = mean(M[,n+3]); LsCemQui

## [1] 0.1231131

d) Gere no R 10000 amostras aleatórias de tamanho 1000 de uma variável aleatória X~Exp(10), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s.

Para amostras com Tamanho = 1000 y

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 1000
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pMilCla=sum(M[,n+5])/10000; pMilCla #% DE ACERTO

## [1] 0.9511

LiMilCla = mean(M[,n+3]); LiMilCla

## [1] 0.0938076

LsMilCla = mean(M[,n+4]); LsMilCla

## [1] 0.1062115

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilNorm=sum(M[,n+4])/10000; pMilNorm #% DE ACERTO

## [1] 0.9521

LiMilNorm = mean(M[,n+2]); LiMilNorm

## [1] 0.09417277

LsMilNorm = mean(M[,n+3]); LsMilNorm

## [1] 0.1066177

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilQui=sum(M[,n+4])/10000; pMilQui #% DE ACERTO

## [1] 0.9516

LiMilQui = mean(M[,n+2]); LiMilQui

## [1] 0.09408935

LsMilQui = mean(M[,n+3]); LsMilQui

## [1] 0.1065095

e) Comente os resultados de b a d. Algum intervalo parece mais apropriado nos diferentes tamanhos de amostra?

Resumo dos Resultados.

RDez = round(c(pDezCla, LiDezCla, LsDezCla, pDezNor,  
               LiDezNorm, LsDezNorm, pDezQui, LiDezQui, LsDezQui ),2)
RCem = round(c(pCemCla, LiCemCla, LsCemCla, pCemNorm, 
               LiCemNorm, LsCemNorm, pCemQui, LiCemQui, LsCemQui ),2)
Rmil = round(c( pMilCla, LiMilCla, LsMilCla, pMilNorm, 
                LiMilNorm, LsMilNorm, pMilQui, LiMilQui, LsMilQui),2)
Amostras<- data.frame(rbind("Amostra Dez" =RDez, "Amostra Cem" = RCem, "Amostra Mil" = Rmil))
names(Amostras)[1:9] <- c("Acerto", "LI","LS", 
                          "Acerto", "LI","LS",
                          "Acerto", "LI","LS")

library(kableExtra)
kable(Amostras, booktabs = T, caption = "Resumo Distribuição Exponencial")%>%
  kable_styling("striped") %>% 
  add_header_above(c(" "=1, "Clássico " = 3, "Normal" = 3, "Qui-Quadrado" = 3))

Resumo Distribuição Exponencial
	Clássico			Normal			Qui-Quadrado
	Acerto	LI	LS	Acerto	LI	LS	Acerto	LI	LS
Amostra Dez	0.90	0.03	0.17	0.96	0.06	0.26	0.95	0.06	0.21
Amostra Cem	0.94	0.08	0.12	0.95	0.08	0.12	0.96	0.08	0.12
Amostra Mil	0.95	0.09	0.11	0.95	0.09	0.11	0.95	0.09	0.11

Comentários:

f) É razoável esperar que quando o tamanho da amostra cresça os intervalos dos três métodos se aproximem até se sobreporem. Isto ocorre? Explique.

Questão 06

6) Variáveis aleatórias com distribuição de Poisson possuem ao menos 3 formas de construção de intervalos de confiança para a média, a saber:

a) Pesquise sobre a distribuição Poisson e indique suas medidas de valor esperado e de variância; analise ao menos uma variável do cotidiano cujos valores ‘podem ser governados’ por distribuições Poisson.

A distribuição de Poisson é uma distribuição de probabilidade de variável aleatória discreta que expressa a probabilidade de uma série de eventos ocorrer num certo período de tempo se estes eventos ocorrem independentemente de quando ocorreu o último evento. Consideremos uma variáveis aleatórias N que representea o número de ocorrências discretas de um certo fenômeno durante um intervalo de tempo de determinada duração.

A probabilidade de que existam exactamente k ocorrências (k sendo um inteiro não negativo, k = 0, 1, 2, …) é dada por:

\(f(k;\lambda)= \frac{e^{-\lambda}\lambda^k}{k!}\)

onde: e é base do logaritmo natural (\(e = 2.71828...\)); \(k!\) é o fatorial de k; \(\lambda\) é um número real, igual ao número esperado de ocorrências num dado intervalo de tempo.

Exemplo: Se o evento ocorre a uma média de 4 minutos, e estamos interessados no número de eventos que ocorrem num intervalo de 10 minutos, usariámos como modelo a distribuição de Poisson com \(\lambda = 10/4 = 2.5\).

Valor Esperado: \(E[X]=\lambda\)

Variância: \(Var(X) =\lambda\)

b) Gere no R 10000 amostras aleatórias de tamanho 10 de uma variável aleatória X~Pois(5), e construa ostrês intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.

Para amostras com Tamanho = 10

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 10
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pDezClaPois=sum(M[,n+5])/10000; pDezClaPois #% DE ACERTO

## [1] 0

LiDezClaPois = mean(M[,n+3]); LiDezClaPois

## [1] 7.816739

LsDezClaPois = mean(M[,n+4]); LsDezClaPois

## [1] 12.20216

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezNorPois=sum(M[,n+4])/10000; pDezNorPois #% DE ACERTO

## [1] 0

LiDezNormPois = mean(M[,n+2]); LiDezNormPois

## [1] 6.179455

LsDezNormPois = mean(M[,n+3]); LsDezNormPois

## [1] 26.32646

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=10 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pDezQuiPois=sum(M[,n+4])/10000; pDezQuiPois #% DE ACERTO

## [1] 0

LiDezQuiPois = mean(M[,n+2]); LiDezQuiPois

## [1] 5.858686

LsDezQuiPois = mean(M[,n+3]); LsDezQuiPois

## [1] 20.87307

c) Gere no R 10000 amostras aleatórias de tamanho 100 de uma variável aleatória X~Pois(5), e construa os três intervalos de confiança da média de 95%, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional. Extraia a média dos LI’s e dos LS’s.

Para amostras com Tamanho = 100

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 100
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pCemClaPois=sum(M[,n+5])/10000; pCemClaPois #% DE ACERTO

## [1] 0

LiCemClaPois = mean(M[,n+3]); LiCemClaPois

## [1] 9.370004

LsCemClaPois = mean(M[,n+4]); LsCemClaPois

## [1] 10.62043

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemNormPois=sum(M[,n+4])/10000; pCemNormPois #% DE ACERTO

## [1] 0

LiCemNormPois = mean(M[,n+2]); LiCemNormPois

## [1] 8.35723

LsCemNormPois = mean(M[,n+3]); LsCemNormPois

## [1] 12.43181

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=100 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pCemQuiPois=sum(M[,n+4])/10000; pCemQuiPois #% DE ACERTO

## [1] 0

LiCemQuiPois = mean(M[,n+2]); LiCemQuiPois

## [1] 8.292794

LsCemQuiPois = mean(M[,n+3]); LsCemQuiPois

## [1] 12.28457

d) Gere no R 10000 amostras aleatórias de tamanho 1000 de uma variável aleatória X~Pois(10), e construa os três intervalos de confiança de 95% da média, indicando, para cada um deles, o percentual de vezes em que o intervalo de confiança contém o valor populacional de média. Extraia a média dos LI’s e dos LS’s.

Para amostras com Tamanho = 1000

MÉTODO CLÁSSICO

#MÉTODO CLÁSSICO - TAM 1000
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+5)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=sd(M[i,1:n])
M[i,n+3]=M[i,n+1]+qt(0.025,n-1)*M[i,n+2]/(n^0.5) #LI
M[i,n+4]=M[i,n+1]+qt(0.975,n-1)*M[i,n+2]/(n^0.5) #LS
M[i,n+5]=media>M[i,n+3] & media<M[i,n+4] #CONFERÊNCIA
}
pMilClaPois=sum(M[,n+5])/10000; pMilClaPois #% DE ACERTO

## [1] 0

LiMilClaPois = mean(M[,n+3]); LiMilClaPois

## [1] 9.802129

LsMilClaPois = mean(M[,n+4]); LsMilClaPois

## [1] 10.19443

MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL

#MÉTODO BASEADO NA DISTRIBUIÇÃO NORMAL
#------------------------------------------------------------------
lambda<-10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(n^.5*M[i,n+1])/(n^.5+qnorm(.975)) #LI
M[i,n+3]=(n^.5*M[i,n+1])/(n^.5-qnorm(.975)) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilNormPois=sum(M[,n+4])/10000; pMilNormPois #% DE ACERTO

## [1] 0

LiMilNormPois = mean(M[,n+2]); LiMilNormPois

## [1] 9.414756

LsMilNormPois = mean(M[,n+3]); LsMilNormPois

## [1] 10.65891

MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA

#MÉTODO BASEADO NA DISTRIBUIÇÃO QUI-QUADRADA
#------------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
media=1/lambda #A MÉDIA É O INVERSO DO PARÂMETRO DA EXPONENCIAL
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=mean(M[i,1:n])
M[i,n+2]=(2*n*M[i,n+1])/qchisq(.975,2*n) #LI
M[i,n+3]=(2*n*M[i,n+1])/qchisq(0.025,2*n) #LS
M[i,n+4]=media>M[i,n+2] & media<M[i,n+3] #CONFERÊNCIA
}
pMilQuiPois=sum(M[,n+4])/10000; pMilQuiPois #% DE ACERTO

## [1] 0

LiMilQuiPois = mean(M[,n+2]); LiMilQuiPois

## [1] 9.406416

LsMilQuiPois = mean(M[,n+3]); LsMilQuiPois

## [1] 10.6481

e) Comente os resultados de b a d. Algum intervalo parece mais apropriado nos diferentes tamanhos de amostra?

RDezPois = round(c(pDezClaPois, LiDezClaPois, LsDezClaPois, pDezNorPois,  
               LiDezNormPois, LsDezNormPois, pDezQuiPois, LiDezQuiPois, LsDezQuiPois ),2)
RCemPois = round(c(pCemClaPois, LiCemClaPois, LsCemClaPois, pCemNormPois, 
               LiCemNormPois, LsCemNormPois, pCemQuiPois, LiCemQuiPois, LsCemQuiPois),2)
RmilPois = round(c( pMilClaPois, LiMilClaPois, LsMilClaPois, pMilNormPois, 
                LiMilNormPois, LsMilNormPois, pMilQuiPois, LiMilQuiPois, LsMilQuiPois),2)
AmostrasPois<- data.frame(rbind("Amostra Dez" =RDezPois, "Amostra Cem" = RCemPois, "Amostra Mil" = RmilPois))
names(AmostrasPois)[1:9] <- c("Acerto", "LI","LS", 
                          "Acerto", "LI","LS",
                          "Acerto", "LI","LS")
library(kableExtra)
kable(AmostrasPois, booktabs = T, caption = "Resumo Distribuição Poisson")%>%
  kable_styling("striped") %>% 
  add_header_above(c(" "=1, "Clássico " = 3, "Normal" = 3, "Qui-Quadrado" = 3))

Resumo Distribuição Poisson
	Clássico			Normal			Qui-Quadrado
	Acerto	LI	LS	Acerto	LI	LS	Acerto	LI	LS
Amostra Dez	0	7.82	12.20	0	6.18	26.33	0	5.86	20.87
Amostra Cem	0	9.37	10.62	0	8.36	12.43	0	8.29	12.28
Amostra Mil	0	9.80	10.19	0	9.41	10.66	0	9.41	10.65

f) É razoável esperar que quando o tamanho da amostra cresça os intervalos dos três métodos se aproximem até se sobreporem. Isto ocorre? Explique.

Questão 07

7) Considere a formulação mostrada para o intervalo de confiança para a variância.

a) Gere no R 10000 amostras de tamanho 8 de uma variável aleatória X com distribuição normal X~(40,10), e para cada amostra calcule os limites superiores e inferiores do intervalo de confiança da variância populacional de 95%, e verifique o percentual de vezes em que o intervalo gerado contém o valor verdadeiro.

#----------------------------------------------------------------
#DA NORMAL - TAM =8
#----------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=100 #A VARIÂNCIA - O QUADRADO DE LAMBDA
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rnorm(n,40,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Norm=sum(M[,n+4])/10000; p7Norm #% DE ACERTO

## [1] 0.9488

Li7Norm = mean(M[,n+2]); Li7Norm

## [1] 43.70406

Ls7Norm = mean(M[,n+3]); Ls7Norm

## [1] 414.1284

b) Repita o mesmo procedimento acima para amostras de tamanho 1000. Analise e compare com os resultados do item a.

#----------------------------------------------------------------
#DA NORMAL - TAM = 1000
#----------------------------------------------------------------
lambda=10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=100 #A VARIÂNCIA - O QUADRADO DE LAMBDA
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rnorm(n,40,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Norm2=sum(M[,n+4])/10000; p7Norm2 #% DE ACERTO

## [1] 0.9509

Li7Norm2 = mean(M[,n+2]); Li7Norm2

## [1] 91.77323

Ls7Norm2 = mean(M[,n+3]); Ls7Norm2

## [1] 109.3768

c) Repita os procedimentos a e b para amostras extraídas de uma variável aleatória H com distribuição Poisson H~Poisson(50) (a variância é 50). Analise os resultados considerando que a variável aleatória H é bastante simétrica (sugestão para visualização: gere uma amostra aleatória de tamanho 100000 de H e veja seu histograma).

POISSON - TAM =8

#----------------------------------------------------------------
#POISSON - TAM =8
#----------------------------------------------------------------
lambda=50 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda #A VARIÂNCIA - IGUAL A LAMBDA
n=8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Pois=sum(M[,n+4])/10000; p7Pois #% DE ACERTO

## [1] 0.947

Li7Pois = mean(M[,n+2]); Li7Pois

## [1] 21.67063

Ls7Pois = mean(M[,n+3]); Ls7Pois

## [1] 205.3453

POISSON - TAM = 1000

#----------------------------------------------------------------
#DA POISSON - TAM = 1000
#----------------------------------------------------------------
lambda=50 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda #A VARIÂNCIA - IGUAL A LAMBDA
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rpois(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Pois2=sum(M[,n+4])/10000; p7Pois2 #% DE ACERTO

## [1] 0.9516

Li7Pois2 = mean(M[,n+2]); Li7Pois2

## [1] 45.87525

Ls7Pois2 = mean(M[,n+3]); Ls7Pois2

## [1] 54.67487

d) Repita os procedimentos a e b para amostras extraídas de uma variável aleatória Y com distribuição exponencial Y~Exp(0,5) (a variância é 0,25). Analise os resultados considerando que a variável aleatória Y é fortemente assimétrica (sugestão para visualização: gere uma amostra aleatória de tamanho 100000 de Y e veja seu histograma).

EXPONENCIAL - TAM = 8

#----------------------------------------------------------------
#DA EXPONENCIAL - TAM = 8
#----------------------------------------------------------------
lambda=0.5 #PARÂMETRO DA DISTRIBUIÇÃO
medida=1/lambda^2 #A VARIÂNCIA – INVERSO DO QUADRADO DE LAMBDA
n=8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Exp=sum(M[,n+4])/10000; p7Exp #% DE ACERTO

## [1] 0.7864

Li7Exp = mean(M[,n+2]); Li7Exp

## [1] 1.75157

Ls7Exp = mean(M[,n+3]); Ls7Exp

## [1] 16.59743

EXPONENCIAL - TAM = 1000

#----------------------------------------------------------------
#DA EXPONENCIAL - TAM = 1000
#----------------------------------------------------------------
lambda=0.5 #PARÂMETRO DA DISTRIBUIÇÃO
medida=1/lambda^2 #A VARIÂNCIA – INVERSO DO QUADRADO DE LAMBDA
n=1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rexp(n,lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Exp2=sum(M[,n+4])/10000; p7Exp2 # % DE ACERTO

## [1] 0.6781

Li7Exp2 = mean(M[,n+2]); Li7Exp2

## [1] 3.67417

Ls7Exp2 = mean(M[,n+3]); Ls7Exp2

## [1] 4.378935

e) Repita os procedimentos a e b para amostras extraídas de duas variáveis aleatórias Z1 e Z2 com distribuição Bernoulli Z1~Bernoulli(0,30) e Z2~Bernoulli(0,10). Comente os resultados considerando que a variável aleatória Z somente possui valores 0 ou 1 e as variações de 0,10 e 0,30.

BERNOULLI - Z1 TAM 8

#----------------------------------------------------------------
#DA BERNOULLI - Z1 TAM 8
#----------------------------------------------------------------
lambda= 0.10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z1Bern=sum(M[,n+4])/10000; p7Z1Bern #% DE ACERTO

## [1] 0.3813

Li7Z1Bern = mean(M[,n+2]); Li7Z1Bern

## [1] 0.0390579

Ls7Z1Bern = mean(M[,n+3]); Ls7Z1Bern

## [1] 0.3701026

#----------------------------------------------------------------

BERNOULLI - Z1 TAM 1000

#----------------------------------------------------------------
#DA BERNOULLI - Z1 TAM 1000
#----------------------------------------------------------------
lambda= 0.10 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z1Bern2=sum(M[,n+4])/10000; p7Z1Bern2 #% DE ACERTO

## [1] 0.7092

Li7Z1Bern2 = mean(M[,n+2]); Li7Z1Bern2

## [1] 0.08260374

Ls7Z1Bern2 = mean(M[,n+3]); Ls7Z1Bern2

## [1] 0.09844848

#----------------------------------------------------------------

BERNOULLI - Z2 TAM 8

#----------------------------------------------------------------
#DA BERNOULLI - Z2 TAM 8
#----------------------------------------------------------------
lambda= 0.30 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 8 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z2Bern=sum(M[,n+4])/10000; p7Z2Bern #% DE ACERTO

## [1] 0.9426

Li7Z2Bern = mean(M[,n+2]); Li7Z2Bern

## [1] 0.09152386

Ls7Z2Bern = mean(M[,n+3]); Ls7Z2Bern

## [1] 0.8672565

#----------------------------------------------------------------

BERNOULLI - Z2 TAM 1000

#----------------------------------------------------------------
#DA BERNOULLI - Z2 TAM 1000
#----------------------------------------------------------------
lambda= 0.30 #PARÂMETRO DA DISTRIBUIÇÃO
medida=lambda*(1-lambda) #A VARIÂNCIA – p(1-p)
n= 1000 #INDICAR O TAMANHO DAS AMOSTRAS
M=matrix(0,10000,n+4)
for (i in 1:10000){
set.seed(i)
M[i,1:n]=rbinom(n,1, lambda)
M[i,n+1]=var(M[i,1:n])
M[i,n+2]=(n-1)*M[i,n+1]/qchisq(.975, n-1) #LI
M[i,n+3]=(n-1)*M[i,n+1]/qchisq(.025, n-1) #LS
M[i,n+4]=medida>M[i,n+2] & medida<M[i,n+3] #CONFERÊNCIA
}
p7Z2Bern2=sum(M[,n+4])/10000; p7Z2Bern2 #% DE ACERTO

## [1] 0.9978

Li7Z2Bern2 = mean(M[,n+2]); Li7Z2Bern2

## [1] 0.1927355

Ls7Z2Bern2 = mean(M[,n+3]); Ls7Z2Bern2

## [1] 0.2297054

#----------------------------------------------------------------

f) Analise os resultados da comparação do desempenho do intervalo de confiança para a variância populacional considerando as quatro distribuições mostradas e suas variações, em particular considerando o nível de assimetria de cada distribuição.

ResQ7 = round(c(p7Norm, p7Norm2, p7Pois, p7Pois2, p7Exp,
                p7Exp2, p7Z1Bern, p7Z1Bern2, p7Z2Bern, p7Z2Bern2 ),2)

LiQ7 = round(c(Li7Norm, Li7Norm2, Li7Pois, Li7Pois2, Li7Exp,
               Li7Exp2, Li7Z1Bern, Li7Z1Bern2, Li7Z2Bern, Li7Z2Bern2),2)


LsQ7 = round(c( Ls7Norm, Ls7Norm2, Ls7Pois, Ls7Pois2, Ls7Exp,
                Ls7Exp2, Ls7Z1Bern, Ls7Z1Bern2, Ls7Z2Bern, Ls7Z2Bern2),2)

dist<- data.frame(rbind("ACERTO" =ResQ7, "LI" = LiQ7, "LS" = LsQ7))
names(dist)[1:10] <- c("(N8)", "(N1000)","(N8)", "(N1000)", 
                      "(N8)", "(N1000)", "(N8)", "(N1000)",
                      "(N8)", "(N1000)")

library(kableExtra)
kable(dist, booktabs = T, caption = "Resumo Distribuição")%>%
  kable_styling("striped", "scale_down") %>% 
  add_header_above(c(" "=1, "Normal " = 2, "Poisson" = 2, 
                     "Exponencial" = 2, "Bernoulli Z1"= 2, 
                     "Bernoulli Z2" = 2))

Resumo Distribuição
	Normal		Poisson		Exponencial		Bernoulli Z1		Bernoulli Z2
	(N8)	(N1000)	(N8)	(N1000)	(N8)	(N1000)	(N8)	(N1000)	(N8)	(N1000)
ACERTO	0.95	0.95	0.95	0.95	0.79	0.68	0.38	0.71	0.94	1.00
LI	43.70	91.77	21.67	45.88	1.75	3.67	0.04	0.08	0.09	0.19
LS	414.13	109.38	205.35	54.67	16.60	4.38	0.37	0.10	0.87	0.23

Questão 08

8) Dizemos que um estimador é mais eficiente que outro quando sua variância é menor. Nesse caso, considere a seguinte situação: O valor esperado (ou seja, sua média) de uma distribuição uniforme contínua \(X~Uniforme(a,b)\) é dado pela média aritmética simples dos dois parâmetros \((E(X) = (a+b)/2\). Quando trabalhamos com amostras, temos ao menos cinco possíveis estimadores, que são:

a média amostral simples;
a média amostral aparada (escolha um nível)
a mediana amostral;
a média aritmética simples do mínimo e do máximo amostrais;
a média aritmética simples do primeiro e do nono decis.

Simule no R a extração de 5000 amostras de tamanhos 10 e 100 (por exemplo, uma uniforme entre 0 a 100), e em cada amostra estime a média pelos cinco métodos, e aponta, para os dois tamanhos de amostra, qual é o estimador mais eficiente.

Estimador Eficiênte

Distribuição Uniforme

#Questão 08
#x-unif(0,10)
ms<- c(); ma10<- c(); med<- c(); mi_ma<- c(); d1_d9<- c()
n=10
k=5000

for(i in 1:k){
  amostra=runif(n,0,100)
  ms[i]<-mean(amostra)
  ma10[i]<- mean(amostra, 0.10)
  med[i]<- median(amostra)
  mi_ma[i]<- ((min(amostra)+max(amostra))/2)
  d1_d9[i]<- quantile(amostra, 0.10)+quantile(amostra,0.90)
}

mean(ms); var(ms)

## [1] 50.05247

## [1] 82.19006

mean(ma10); var(ma10)

## [1] 50.06297

## [1] 107.91

mean(med); var(med)

## [1] 50.07742

## [1] 186.4256

mean(mi_ma); var(mi_ma)

## [1] 50.01044

## [1] 36.35383

mean(d1_d9); var(d1_d9)

## [1] 100.1311

## [1] 272.1921

MQA - Inferência Estatística

Jailson Duarte

14 julho de 2020

MQA I - Resolução da Lista de Exercícios - Inferência (Prof. Franzé Costa)

Questão 01

Questão 02

Questão 03

Questão 04

Questão 05

Questão 06

Questão 07

Questão 08