Para la distribución normal usaremos la función: dnorm

dnorm(x, media, desviación típica)

si la media y la desviación típica no son especificados toma los valores de
media=0 y desviación típica igual a 1

Ejemplo 1

dnorm(5, mean = 0, sd = 1)
## [1] 1.48672e-06

Ejemplo 2

dnorm(5)
## [1] 1.48672e-06

Notese que es el ejemplo 1 y el ejemplo 2 dan el mismo resultado. Recordar que

Si la media y la desviación típica no son espicificados toma los valores de media=0 y desviación típica igual a 1.

Ahora veamos otro ejemplo en el cual cambiamos la media y la desviación típica

Ejemplo 3

dnorm(5, mean = 2, sd = 1)
## [1] 0.004431848

Notese que el resultado cambió con respecto a los ejemplos 1 y 2.

Otra cosa interesante a observar es que siempre las probabilidades de un valor específico es igual a cero.
Veamos algunos ejemplos:

dnorm(34, mean = 32, sd = 6)
## [1] 0.0628972
dnorm(8, mean = 7, sd = 2)
## [1] 0.1760327
dnorm(8)
## [1] 5.052271e-15

supongamos que tengo una serie de datos x

valores<- seq(-3, 3, by = .1)
valores
##  [1] -3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6
## [16] -1.5 -1.4 -1.3 -1.2 -1.1 -1.0 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1
## [31]  0.0  0.1  0.2  0.3  0.4  0.5  0.6  0.7  0.8  0.9  1.0  1.1  1.2  1.3  1.4
## [46]  1.5  1.6  1.7  1.8  1.9  2.0  2.1  2.2  2.3  2.4  2.5  2.6  2.7  2.8  2.9
## [61]  3.0

Apliquemos la función densidad para cada uno de esos valores

valoresz<- dnorm(valores)
valoresz
##  [1] 0.004431848 0.005952532 0.007915452 0.010420935 0.013582969 0.017528300
##  [7] 0.022394530 0.028327038 0.035474593 0.043983596 0.053990967 0.065615815
## [13] 0.078950158 0.094049077 0.110920835 0.129517596 0.149727466 0.171368592
## [19] 0.194186055 0.217852177 0.241970725 0.266085250 0.289691553 0.312253933
## [25] 0.333224603 0.352065327 0.368270140 0.381387815 0.391042694 0.396952547
## [31] 0.398942280 0.396952547 0.391042694 0.381387815 0.368270140 0.352065327
## [37] 0.333224603 0.312253933 0.289691553 0.266085250 0.241970725 0.217852177
## [43] 0.194186055 0.171368592 0.149727466 0.129517596 0.110920835 0.094049077
## [49] 0.078950158 0.065615815 0.053990967 0.043983596 0.035474593 0.028327038
## [55] 0.022394530 0.017528300 0.013582969 0.010420935 0.007915452 0.005952532
## [61] 0.004431848

Ahora procedo a hacer un gráfico con esos valores

plot(valoresz, type="l")

La función pnorm es la función de distribución acumulada de la distribución normal. La función devuelve la integral desde −∞ hasta un valor dado.

Al igual que dnomr si la media y la desviación típica no son especificados toma los valores de media=0 y desviación típica igual a 1.

Traten de adivinar la función de distribución acumulada de cero para una distribución normal con media cero y desviación típica igual a 1

pnorm(0) 
## [1] 0.5

Veamos otro ejemplo

pnorm(2, mean = 5, sd = 3, lower.tail = T)
## [1] 0.1586553
1-pnorm(2, mean = 5, sd = 3)
## [1] 0.8413447
pnorm(2, mean = 5, sd = 3, lower.tail = FALSE)
## [1] 0.8413447

El argumento lower.tail=FALSE lo que hace es devolver la integral desde el valor seleccionada hasta +∞ o sea 1-pnomr

Ahora grafico la función de distribución acumulada para el ejemplo anterior.

pvalores<- pnorm(valores)
plot(pvalores,type="l")

La función rnomr sirve para hacer simulaciones

n10 <- rnorm(10, mean = 70, sd = 5)
n100 <- rnorm(100, mean = 70, sd = 5)
n10000 <-  rnorm(10000, mean = 70, sd = 5)

Vemos el resultado de cada una de las simulaciones

n10 
##  [1] 71.61365 75.92186 76.38380 64.27910 69.51695 69.26932 66.31657 76.85105
##  [9] 60.47232 64.64541
n100
##   [1] 71.88869 74.01763 71.02397 65.89693 65.98907 72.36745 70.46254 68.75682
##   [9] 70.69094 72.77304 68.67837 72.45255 62.57358 74.82200 78.77711 77.83145
##  [17] 58.69583 75.15833 69.97148 73.75245 69.53675 67.05091 72.41001 63.92845
##  [25] 73.19293 77.83388 68.41269 65.75032 69.19576 69.57089 64.59399 64.87218
##  [33] 70.18839 71.33799 68.49118 70.68103 63.09418 71.23274 72.55678 72.55840
##  [41] 67.06689 67.86276 72.50705 65.30126 62.59718 66.76831 79.16918 67.60858
##  [49] 64.59910 70.60322 77.70797 68.01249 71.44439 74.65953 71.70896 72.42375
##  [57] 67.17982 61.57500 72.47922 72.94672 64.93937 72.29575 75.85864 70.09144
##  [65] 61.07926 66.84423 67.32771 70.24931 65.81071 75.70609 71.56299 70.83354
##  [73] 72.25280 61.56171 64.22262 66.22302 72.00168 58.97328 76.29117 77.23235
##  [81] 73.46511 68.91844 75.52622 79.11160 70.96340 66.24692 76.92946 62.99365
##  [89] 64.50018 57.42774 67.26055 79.41067 70.76895 70.95868 58.99435 64.35041
##  [97] 63.21116 68.83924 68.02086 62.84273

Ahora procedamos a graficar cada una de las simulaciones

par(mfrow=c(1,3))


hist(n10, breaks = 5)
hist(n100, breaks = 20)
hist(n10000, breaks = 100)

Cúal histograma está más centrado alrededor de 70?

Ahora quiero calcular la esperanza de la variable con media 70 y desviación típica 5

comienzo con la simulación de 10 valores

mean(rnorm(10, mean = 70, sd = 5))
## [1] 70.12686

para calcular la desviación típica

sd(rnorm(10, mean = 70, sd = 5))
## [1] 4.160751

Ahora lo calculo con la simulación de 1000 valores

mean(rnorm(10000, mean = 70, sd = 5))
## [1] 69.95834

para calcular la desviación típica

sd(rnorm(10000, mean = 70, sd = 5))
## [1] 4.96832

Ejercico 1:
La diabetes es una enfermedad que afecta a un porcentaje considerable de la población. Diferentes estudios han determinado que en las personas que padecen esta enfermedad, el nivel de glucosa en sangre en ayunas tiene una distribución aproximadamente normal, con media de 106 mg%ml y desviación típica de 8 mg%ml.

A partir de la información otorgada calcule
1.1 la probabilidad de encontrar niveles de glucosa en sangre menores o igual a 120 mg%ml
1.2 la probabilidad de que el nivel de glucosa en sangre se encuentre entre 106 y 110 mg%ml
1.3 el porcentaje de diabéticos que tienen niveles comprendidos entre 90 y120 mg%ml

1.1 Utilizo la función de distribución acumulada

pnorm(120,106,8)
## [1] 0.9599408

1.2

pnorm(110,106,8)-pnorm(106,106,8)
## [1] 0.1914625

1.3

(pnorm(120,106,8)-pnorm(90,106,8))*100
## [1] 93.71907

2 En una ciudad se estima que la temperatura máxima en el mes de junio sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°

pnorm(27,23,5)
## [1] 0.7881446
pnorm(21,23,5)
## [1] 0.3445783
pnorm(27,23,5)-pnorm(21,23,5)
## [1] 0.4435663
(pnorm(27,23,5)-pnorm(21,23,5))*30
## [1] 13.30699

3 La media de los pesos de 500 estudiantes de un Instituto es 70 kg y la desviación típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:
3.1 Entre 60 kg y 65 kg

(pnorm(65,70,3)-pnorm(60,70,3))*500
## [1] 23.68065

3.2 Exactamente 65 kg

(dnorm(65,70,3))*500
## [1] 16.57952

3.3 64 kg o menos

(pnorm(64,70,3, lower.tail = F))*500
## [1] 488.6249