Cálculo da integral de uma distribuição Normal (\(\mu\), \(\sigma\))

A nota técnica tem por objetivo calcular a integral de uma distribuição Normal(mu, sigma) partindo de uma função integra no R (a,b,\(\mu\), \(\sigma\), n) que possibilite a obtenção da integral definida entre a e b quaisquer, de uma distribuição Normal com esperança matemática mu e desvio padrão sigma, usando o método geométrico por soma de retângulos (n representa o número de retângulos na aproximação). Mostre o desempenho dessa função, comparando com o resultado obtido pelo uso da função pnorm do R, considerando uma Normal(\(\mu\)=100, \(\sigma\)= 30), com avaliação de area embaixo da curva entre os pontos (a=35,b=72) , (a=-\(\infty\),b=10) , (a=200,b=\(\infty\)). Quais seriam os valores mínimos de n requeridos para que a aproximação seja próxima dos valores obtidos por pnorm em cada caso, para garantirpelo menos 4 decimais corretas nos resultados.

A distribuição normal, foi descoberta pelo matemático francês Abraham de Moivre, no século XVIII e adotada por Gauss, no século seguinte. Além de Gauss, outros estatísticos começaram a usar a distribuição normal para explicar vários fenômenos. Essa distribuição pode ser representada pela seguinte expressão:

Nesse caso, \(\mu\) representa a média da distribuição da variável aleatória x, \(\sigma^2\) é a variância da distribuição e “e” é a base dos logaritmos naturais, sendo e=2,7182. A distribuição Normal pode ser mostrada graficamente, como segue:

normal<-rnorm( 1000, mean= 0, sd=1)
plot(normal, dnorm(normal))

Esse caso mostrado acima compreende a normal padrão, com média igual a 0 e desvio padrão 1.

Para calcular a área da distribição normal, pode utilizar como recurso a integral. A integral possibilita o cálculo da área entre o eixo horizontal e a curva da distribuição normal. Um procedimento para facilitar a realização desse cálculo seria analisar a área sobre a curva normal como um somatório de n retângulos. Assim poderá ser representada a área entre dois pontos a e b quaisquer.

A fórmula para esse cálculo é apresentada a seguir:

funcintegral= function (a,b,mu,sigma,n){
  x=seq(a,b,length.out=n)
  z=(x-mu)/sigma
  area= (b-a)/n*(1/(sqrt(2*pi)*sigma))*exp(-0.5*(z^2))
  int=sum(area)
  int
}

Assim é calculada a área de cada retângulo e logo a seguir é feito o somatório da área de n retângulos.

Com o objetivo de verificar o desempenho dessa função, pode fazer a comparação com a função pnorm do R.Considere a função com \(\mu\)=100 e \(\sigma^2\)=30.No primeiro momento, será feito o cálculo utilizando 10000 retângulos.

Utilizando a função do R para a=35, b=72, \(\mu\)=100 e \(\sigma^2\)=30, tem-se:

pnorm(72,100,30,T)-pnorm(35,100,30,T)
## [1] 0.1601938

O próximo passo é fazer o teste para a função que foi definida, encontra-se:

funcintegral (35,72,100,30,10000)
## [1] 0.1601961

O mesmo cálculo será realizado para a=-\(\infty\), b=10

pnorm(10,100,30,T)-pnorm (-10000,100,30,T)
## [1] 0.001349898

Esse cálculo será comparado com a função que foi definida, obtém-se:

funcintegral (-10000,10,100,30,10000)
## [1] 0.001424935

Considere também o conjunto de pontos, com a=200 e b=\(\infty\).Utilizando a função pnorm, tem-se:

pnorm(10000,100,30,T)-pnorm (200,100,30,T)
## [1] 0.0004290603

Comparando com a função definida:

funcintegral (200,10000,100,30,10000)
## [1] 0.0004546651

Os mesmos cálculos serão realizados para n=100 retângulos:

Para a=35, b=72, tem-se:

pnorm(72,100,30,T)-pnorm(35,100,30,T)
## [1] 0.1601938

O próximo passo é fazer o teste para a função que foi definida, encontra-se:

funcintegral (35,72,100,30,100)
## [1] 0.1604206

O mesmo cálculo será realizado para a=-\(\infty\), b=10

pnorm(10,100,30,T)-pnorm (-10000,100,30,T)
## [1] 0.001349898

Esse cálculo será comparado com a função que foi definida, obtém-se:

funcintegral (-10000,10,100,30,100)
## [1] 0.0147876

Considere também o conjunto de pontos, com a=200 e b=\(\infty\).Utilizando a função pnorm, tem-se:

pnorm(10000,100,30,T)-pnorm (200,100,30,T)
## [1] 0.0004290603

Comparando com a função definida:

funcintegral (200,10000,100,30,100)
## [1] 0.005038112

Conclusão

Para valores reduzidos de retângulos, como n=100, os valores da pnorm e da função definida não garantem pelo menos 4 casas decimais corretas nos resultados. Na medida que considera um número maior de retângulos, como n=10000, os valores da pnorm são muito próximos dos valores da função calculada, possibilitando pelo menos 4 casas decimais corretas.