Introdução

A distribuição normal pode ser observada a partir do seguinte histograma, para uma amostra de 1.000.000 de observações.

n<-1000000
x<-rnorm(n)
hist(x)

Na teoria das probabilidades, uma função de densidade de probabilidade é uma função que descreve a probabilidade relativa para essa variável aleatória em assumir um determinado valor. A probabilidade da variável aleatória estar dentro de uma determinada gama de valores é determinada pela integral de densidade de tal variável ao longo desse intervalo, isto é, é dada pela área sob a função de densidade, mas acima do eixo horizontal, e entre o menor e o maior valor do intervalo. A função densidade de probabilidade é não negativa em todos os lugares, e sua integral ao longo de todo o espaço é igual a um.

Função densidade de probabilidade da Normal

A função densidade de probabilidade para uma distribuição Normal é definida por:

Aplicação no R

Para calcular tal probabilidade, estabelece-se o seguinte comando no R :

mnorm<-function(x,m,dp){
1/(sqrt(2*pi)*dp)*exp(-(x-m)^2/(2*dp^2))
}

Para integrar a Normal, tem-se:

intmnorm<-function(x0,x1,m,dp,n){
  delta<-(x1-x0)/n
  vectr<-0:(n-1)
  vectx<-x0+vectr*delta
  vecty<-mnorm(vectx,m,dp)
  sum(vecty*delta)
  
}

Para uma distribuição Normal com média (m) = 100 e desvio-padrão = 30, será feita uma avaliação da área abaixo da curva entre os pontos \(x_{0}\) = 35 e \(x_{1}\) = 72, com n = 500.

intmnorm(35,72,100,30,500)
## [1] 0.1599226

Comparando com a função do R chamada pnorm:

pnorm(72,100,30)-pnorm(35,100,30)
## [1] 0.1601938

Pode-se observar uma grande diferença entre as probabilidades calculadas pelas funções.

Agora, vamos calcular a probabilidade para \(x_{0}\) = 1.000.000 e \(x_{1}\) = 10, com n = 1.000.000:

intmnorm(-1000000,10,100,30,1000000)
## [1] 0.001277264

Comparando com a pnorm:

pnorm(10,100,30)
## [1] 0.001349898

Repetindo o mesmo procedimento para \(x_{0}\) = 200 e \(x_{1}\) = 1.000.000, com n = 10.000.000

intmnorm(200,1000000,100,30,10000000)
## [1] 0.000431635

Comparando com a pnorm:

pnorm(1000000,100,30)-pnorm(200,100,30)
## [1] 0.0004290603

Sendo assim, observa-se que, para que as duas funções tenham uma aproximação de pelo menos 4 casas decimais corretas, é necessário que o n seja maior.

Vamos então refazer os comandos aumentando o n.

Para \(x_{0}\) = 35 e \(x_{1}\) = 72, com n = 10.000.000, tem-se:

intmnorm(35,72,100,30,10000000)
## [1] 0.1601938
pnorm(72,100,30)-pnorm(35,100,30)
## [1] 0.1601938

Agora, vamos calcular a probabilidade para \(x_{0}\) = 1.000.000 e \(x_{1}\) = 10, com n = 10.000.000:

intmnorm(-1000000,10,100,30,10000000)
## [1] 0.001342524
pnorm(10,100,30)
## [1] 0.001349898

Repetindo o mesmo procedimento para \(x_{0}\) = 200 e \(x_{1}\) = 1.000.000, com n = 10.000.000

intmnorm(200,1000000,100,30,10000000)
## [1] 0.000431635
pnorm(1000000,100,30)-pnorm(200,100,30)
## [1] 0.0004290603

É possível observar então que, considerando-se um n consideravelmente grande (10 milhões), o resultado do cálculo das probabilidades por meio das duas diferentes funções começou a se aproximar.