library(tidyverse)
## -- Attaching packages -------------------------------------------- tidyverse 1.2.1 --
## v ggplot2 3.0.0     v purrr   0.2.5
## v tibble  1.4.2     v dplyr   0.7.6
## v tidyr   0.8.1     v stringr 1.3.1
## v readr   1.1.1     v forcats 0.3.0
## -- Conflicts ----------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(knitr)
library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
library(plot3D)

Introdução

Este mini projeto tem o objetivo de solucionar duas questões. Na primeira questão, fazendo referência a estatística de ordem, as letras de “a” à “f” serão solucionadas por meio de cálculos. Já as letras “g” e “h”, por meio de simulação. A segunda questão está relacionada ao teste do sinal e a solução será através de simulação.

1° Questão

g) Avalie via simulação de Monte Carlo o item (a) para os tamanhos amostrais \(n\) = {10,30,80,500}. Discuta os resultados.

Para solucionar este item, pode-se utilizar a distribuição uniforme(0,1) onde o mínimo = 0, máximo = 1 e a mediana = 0.5

Observa-se nos histogramas de distribuição de mínimo e da mediana, que quanto maior o tamanho amostral, menos poderoso é o teste. Já nos histogramas de distribuição de máximo, quanto maior o tamanho da amostra melhor o teste mostra-se poderoso.

2° Questão

Para \(n =\){5,10,30,80} e \(\alpha=5%\). Avalie a estatística do sinal para testar: \(H_{0}:\theta = 0\) contra \(H_{1}:\theta \neq 0\), Em que \(\theta=\)Mediana, da distribuição. Calcule a potência aproximada do teste do Sinal assumindo que a distribuição amostral é \(N(\mu_0,1)\), \(LogNormal(\mu_0,1)\), \(U(\mu_0-\sqrt3,\mu_0+\sqrt3)\), \(Gama(\mu_0^{2},\mu_0)\) e a distribuição normal contaminada \(CN(\mu,\sigma,\alpha,\lambda)\) definida como: \(CN_{x}(x)=(1-\delta)\Phi(x-\mu_0)+\delta\Phi((x-\mu_0)/\sqrt\lambda)\) em que \(\delta=\){5%,10%} e \(\lambda\)=3.  

Uniforme (\(\mu_0-\sqrt(3)\),\(\mu_0+\sqrt(3)\) )

Normal (\(\mu_0\),1)

Log-Normal (\(\mu_0\),1)

Gamma

Normal Contaminada

Grau de contaminação \(\delta\)={5\(\%\) e 10\(\%\)} e \(\lambda=3\)

Grau de contaminação \(\delta=10%\) e \(\lambda=3\)

Resultados

Através do teste do sinal aplicado as distribuições abaixo, é possível chegar a seguinte conclusão:

Distribuição Uniforme

Levando em consideração os parametros dados, observa-se que quanto maior o tamanho amostral maior é a taxa de rejeição para média quando se distancia de zero, rejeitando assim a hipótese nula. Para a amostra de tamanho \(n=5\) ele não rejeita (p-valor = 0,95).

Distribuição Normal

Quanto maior o tamanho da amostra maior é a taxa de rejeição para média quando se distancia de zero rejeitando a hipótese nula. Para a amostra de tamanho \(n=5\) ele não rejita o (p-valor = 0,95).

Distribuição Log-Normal

Quanto maior o tamanho amostral a sequência se concentra mais próximo de \(\mu = 0\), onde tem-se menor taxa de rejeiço para a hipótese nula e para o \(n = 5\).

Distribuição Gamma

Não sofre alteração, pelo fato da gamma ser sempre positiva, não assume mediana igual a zero.