Objetivo

Calcular probabilidades, determinado la función de densidad y la visualización gráfica de una distribución normal.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad normal a partir de valores iniciales de los ejercicios identificando y visualizando la función de densidad y calculando probabilidades.

Fundamento teórico

La distribución continua de probabilidad más importante en todo el campo de la estadística es la distribución normal. Su gráfica, que se denomina curva normal, es la curva con forma de campana .

La distribución normal a menudo se denomina distribución Gaussiana, en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su ecuación a partir de un estudio de errores en mediciones repetidas de la misma cantidad (walpole2012?).

En a imagen anterior se identifican dos valores que se requieren para suponer una curva de distribución normal, la media μ y la desviación estándar σ de los datos.

Fórmula de la función de densidad

\[ f(x) =\frac{1}{\sigma \cdot \sqrt{2 \cdot \pi}}\cdot e ^{\frac{-1}{2}\cdot ( \frac {x - \mu}{\sigma}) ^2} \]

En donde: π = 3.14159 y e = 2.71828

Ejemplo de calcular la densidad para un valor de x de acuerdo a la distribución normal con media y desviación.

Valor de x = 18 ; media = 20; desv = 2; e = 2.71828; pi = 3.14159

Se utiliza la función f.normal.dens() que se encuentra previamente programada y devuelve precisamente la probabilidad para un valor específico de x.

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20disribuciones%20de%20probabilidad.R")

## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2

## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.

## 
## Attaching package: 'mosaic'

## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally

## The following object is masked from 'package:Matrix':
## 
##     mean

## The following object is masked from 'package:gtools':
## 
##     logit

## The following object is masked from 'package:ggplot2':
## 
##     stat

## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var

## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum

## 
## Attaching package: 'cowplot'

## The following object is masked from 'package:mosaic':
## 
##     theme_map

## 
## Attaching package: 'plotly'

## The following object is masked from 'package:mosaic':
## 
##     do

## The following object is masked from 'package:ggplot2':
## 
##     last_plot

## The following object is masked from 'package:stats':
## 
##     filter

## The following object is masked from 'package:graphics':
## 
##     layout

Se utilizan también las funciones de la distribución normal de los paquete base de R.

Inicializando variables

x= 18
media <- 20
desv <- 2
e <- exp(1)
pi <- pi
x; media; desv; e; pi

## [1] 18

## [1] 20

## [1] 2

## [1] 2.718282

## [1] 3.141593

Calculando la densidad f(x)

La función de f(x) es lo que representa probabilidad de un solo punto de la curva o lo que es lo mismo la densidad. LA densidad es la altura de la curva normal en ese punto en particular.

prob = f.normal.dens(x = x, desv = desv, media = media)
prob

## [1] 0.1209854

Usando dnorm()

Se utiliza dnorm() para calcular la función de densidad o el punto en donde se cruzan el valor de x con su probabilidad en distribución normal.

Debe salir el mismo valor que usando prob = f.normal.dens().

dnorm(x = x, mean = media, sd = desv)

## [1] 0.1209854

Calculando la probabilidad acumulada de un intervalo

Calcular la probabilidad acumulada de un intervalo de x continua entre 16 y 22. Es decir encontrar el área que contiene todas las probabilidades (densidades) de los puntos de la distribución normal desde 16 a 22 con los valores de media y desviación media = 20 y desv = 2

Ahora bien, R dispone de pnorm() para calcular probabilidades acumuladas.

x2 <- 22
pnorm(q = x2, mean = media, sd = desv)

## [1] 0.8413447

x1 <- 16
pnorm(q = x1, mean = media, sd = desv)

## [1] 0.02275013

Restando P(x=22) - P(x=16)

pnorm(q = x2, mean = media, sd = desv) - pnorm(q = x1, mean = media, sd = desv)

## [1] 0.8185946

El 81.85% es el área bajo la curva.

Tabla de probabilidades

No es necesario tabla de probabilidades al tratar con distribuciones normales.

La distribución normal trata con variables aleatorias continuas, del tal forma que el valor de la probabilidad acumulada es el área bajo la curva y la sumatoria de cada punto de la función de densidad.

¿Cómo determinar el área bajo la curva?, con pnorm().

options(scipen=999) # Notación normal
x <- seq(from= 0, to = 18, by = 0.5)
tabla <- data.frame(x = x, f.x=round(dnorm(x = x, mean = media, sd = desv), 6), F.x = round(pnorm(q = x, mean = media, sd = desv), 6))
tabla

##       x      f.x      F.x
## 1   0.0 0.000000 0.000000
## 2   0.5 0.000000 0.000000
## 3   1.0 0.000000 0.000000
## 4   1.5 0.000000 0.000000
## 5   2.0 0.000000 0.000000
## 6   2.5 0.000000 0.000000
## 7   3.0 0.000000 0.000000
## 8   3.5 0.000000 0.000000
## 9   4.0 0.000000 0.000000
## 10  4.5 0.000000 0.000000
## 11  5.0 0.000000 0.000000
## 12  5.5 0.000000 0.000000
## 13  6.0 0.000000 0.000000
## 14  6.5 0.000000 0.000000
## 15  7.0 0.000000 0.000000
## 16  7.5 0.000000 0.000000
## 17  8.0 0.000000 0.000000
## 18  8.5 0.000000 0.000000
## 19  9.0 0.000000 0.000000
## 20  9.5 0.000000 0.000000
## 21 10.0 0.000001 0.000000
## 22 10.5 0.000003 0.000001
## 23 11.0 0.000008 0.000003
## 24 11.5 0.000024 0.000011
## 25 12.0 0.000067 0.000032
## 26 12.5 0.000176 0.000088
## 27 13.0 0.000436 0.000233
## 28 13.5 0.001015 0.000577
## 29 14.0 0.002216 0.001350
## 30 14.5 0.004547 0.002980
## 31 15.0 0.008764 0.006210
## 32 15.5 0.015870 0.012224
## 33 16.0 0.026995 0.022750
## 34 16.5 0.043139 0.040059
## 35 17.0 0.064759 0.066807
## 36 17.5 0.091325 0.105650
## 37 18.0 0.120985 0.158655

Gráfica de probabilidades de 0 a 18

¿Cuánto vale el área bajo la curva hasta 18 ó P(x < 18)?

library(ggplot2)
ggplot(data = tabla, aes(x,f.x) ) +
    geom_point(colour = "red") +
    geom_line(colour = 'blue') +
    geom_hline(yintercept = dnorm(x = max(x), mean = media, sd = desv), col='red') +
  geom_vline(xintercept =  max(x), col='red') +
  ggtitle(label = "Distribución normal", subtitle = paste("Media = ", media, "; Desviación =", desv, "; valor de x de 0 hasta ",max(x)))

Gráfica de campana completa

library("mosaic")
plotDist("norm", mean = media, sd = desv, groups = x <= 18, type = "h", xlab ="Valores de la variable continua X", ylab = "Densidad", main='Densidad',sub = paste('Media= ', media, ' Desv Std=', desv ))

Desarrollo

Las librerías

library(dplyr)
library(mosaic)
library(readr)
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos
library(cowplot) #Imágenes en el mismo renglón
options(scipen=999) # Notación normal

Caso de mediciones del cuerpo humano (Peso y Estatura)

Cargar los datos

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/estatura%20peso%20generos.csv")

# Solo interesan las tres últimas columnas o variables
datos <- select(datos, estatura, peso, genero)

Ver los primeros seis y últimos seis registros

Variables de interés

Estatura, altura en centímetros de una persona
Peso: Peso de una persona medido en kilogramos
Genero: 0 Femenino, 1 Masculino

head(datos)

##   estatura peso genero
## 1    174.0 65.6      1
## 2    175.3 71.8      1
## 3    193.5 80.7      1
## 4    186.5 72.6      1
## 5    187.2 78.8      1
## 6    181.5 74.8      1

tail(datos)

##     estatura peso genero
## 502    157.5 76.8      0
## 503    176.5 71.8      0
## 504    164.4 55.5      0
## 505    160.7 48.6      0
## 506    174.0 66.4      0
## 507    163.8 67.3      0

Dispersión de los datos

Diagrama de dispersión del peso

ggplot(datos, aes(x = peso, y = 1:nrow(datos))) +
  geom_point(colour = "red")

Diagrama de dispersión de la estatura

ggplot(datos, aes(x = peso, y = 1:nrow(datos))) +
  geom_point(colour = "blue")

Histrogramas

Histograma del peso

ggplot(datos) +
  geom_histogram(aes(x = peso), bins = 30)

Histograma de la estatura

ggplot(datos) +
  geom_histogram(aes(x = estatura), , bins = 30)

Medias aritméticas y desviaciones

Estadísticos de la variable peso

Se extraen conjuntos de datos para masculinos y femeninos respectivamente.

datos$genero <- as.factor(datos$genero)
masculinos <- filter(datos, genero == 1)
femeninos <- filter(datos, genero == 0)
media.peso.m <- mean(masculinos$peso)
desv.std.peso.m <- sd(masculinos$peso)
media.peso.m

## [1] 78.14453

desv.std.peso.m

## [1] 10.51289

media.peso.f <- mean(femeninos$peso)
desv.std.peso.f <- sd(femeninos$peso)
media.peso.f

## [1] 60.60038

desv.std.peso.f

## [1] 9.615699

Tabla de distribución peso MASCULINO

Se toman los valores mínimos y máximos de pesos, de esos valores se disminuye en diez a mínimo y aumenta en diez a máximo para contemplar mayor rango.

x <- round(min(masculinos$peso-10),0):round(max(masculinos$peso+10),0)
tabla.peso.masculino <- data.frame(x=x, prob.x = dnorm(x = x, mean = media.peso.m, sd = desv.std.peso.m), f.acum.x = pnorm(q = x, mean = media.peso.m, sd = desv.std.peso.m))
kable(tabla.peso.masculino, caption = "Peso Muestra Masculino")

Peso Muestra Masculino
x	prob.x	f.acum.x
44	0.0001943	0.0005814
45	0.0002635	0.0008087
46	0.0003540	0.0011155
47	0.0004714	0.0015257
48	0.0006220	0.0020694
49	0.0008134	0.0027834
50	0.0010541	0.0037126
51	0.0013536	0.0049111
52	0.0017227	0.0064430
53	0.0021726	0.0083834
54	0.0027153	0.0108191
55	0.0033630	0.0138490
56	0.0041277	0.0175841
57	0.0050206	0.0221471
58	0.0060518	0.0276714
59	0.0072290	0.0342994
60	0.0085574	0.0421798
61	0.0100387	0.0514651
62	0.0116703	0.0623073
63	0.0134449	0.0748534
64	0.0153498	0.0892405
65	0.0173668	0.1055903
66	0.0194718	0.1240034
67	0.0216353	0.1445535
68	0.0238227	0.1672820
69	0.0259950	0.1921939
70	0.0281098	0.2192529
71	0.0301230	0.2483797
72	0.0319895	0.2794500
73	0.0336657	0.3122952
74	0.0351107	0.3467043
75	0.0362878	0.3824272
76	0.0371665	0.4191803
77	0.0377237	0.4566529
78	0.0379443	0.4945154
79	0.0378225	0.5324273
80	0.0373615	0.5700472
81	0.0365736	0.6070412
82	0.0354799	0.6430924
83	0.0341089	0.6779085
84	0.0324955	0.7112293
85	0.0306796	0.7428320
86	0.0287042	0.7725353
87	0.0266142	0.8002022
88	0.0244540	0.8257403
89	0.0222668	0.8491012
90	0.0200926	0.8702783
91	0.0179674	0.8893028
92	0.0159223	0.9062398
93	0.0139828	0.9211827
94	0.0121690	0.9342474
95	0.0104951	0.9455673
96	0.0089699	0.9552872
97	0.0075973	0.9635580
98	0.0063768	0.9705325
99	0.0053041	0.9763609
100	0.0043722	0.9811877
101	0.0035715	0.9851490
102	0.0028912	0.9883708
103	0.0023194	0.9909675
104	0.0018439	0.9930416
105	0.0014527	0.9946834
106	0.0011342	0.9959712
107	0.0008775	0.9969723
108	0.0006728	0.9977436
109	0.0005112	0.9983323
110	0.0003850	0.9987778
111	0.0002873	0.9991117
112	0.0002124	0.9993599
113	0.0001557	0.9995426
114	0.0001130	0.9996759
115	0.0000814	0.9997723
116	0.0000580	0.9998414
117	0.0000410	0.9998905
118	0.0000287	0.9999250
119	0.0000199	0.9999491
120	0.0000137	0.9999657
121	0.0000093	0.9999771
122	0.0000063	0.9999849
123	0.0000042	0.9999901
124	0.0000028	0.9999936
125	0.0000018	0.9999958
126	0.0000012	0.9999973

Tabla de distribución peso FEMENINO

x <- round(min(masculinos$peso-10),0):round(max(masculinos$peso+10),0)
tabla.peso.femenino <- data.frame(x=x, prob.x = dnorm(x = x, mean = media.peso.f, sd = desv.std.peso.f), f.acum.x = pnorm(q = x, mean = media.peso.f, sd = desv.std.peso.f))
kable(tabla.peso.femenino, caption = "Peso Muestra Femenino")

Peso Muestra Femenino
x	prob.x	f.acum.x
44	0.0093485	0.0421392
45	0.0111267	0.0523603
46	0.0131007	0.0644580
47	0.0152589	0.0786232
48	0.0175815	0.0950307
49	0.0200398	0.1138315
50	0.0225960	0.1351430
51	0.0252042	0.1590409
52	0.0278111	0.1855511
53	0.0303575	0.2146430
54	0.0327805	0.2462249
55	0.0350163	0.2801416
56	0.0370021	0.3161741
57	0.0386800	0.3540430
58	0.0399989	0.3934143
59	0.0409180	0.4339075
60	0.0414078	0.4751070
61	0.0414528	0.5165747
62	0.0410515	0.5578638
63	0.0402167	0.5985330
64	0.0389750	0.6381613
65	0.0373654	0.6763603
66	0.0354370	0.7127858
67	0.0332465	0.7471469
68	0.0308559	0.7792121
69	0.0283291	0.8088133
70	0.0257295	0.8358461
71	0.0231171	0.8602681
72	0.0205465	0.8820943
73	0.0180653	0.9013909
74	0.0157128	0.9182679
75	0.0135197	0.9328698
76	0.0115076	0.9453677
77	0.0096895	0.9559498
78	0.0080710	0.9648134
79	0.0066504	0.9721578
80	0.0054210	0.9781780
81	0.0043713	0.9830597
82	0.0034869	0.9869757
83	0.0027516	0.9900833
84	0.0021479	0.9925228
85	0.0016587	0.9944173
86	0.0012671	0.9958727
87	0.0009575	0.9969788
88	0.0007158	0.9978104
89	0.0005294	0.9984289
90	0.0003873	0.9988839
91	0.0002803	0.9992151
92	0.0002007	0.9994536
93	0.0001421	0.9996234
94	0.0000996	0.9997431
95	0.0000690	0.9998265
96	0.0000473	0.9998840
97	0.0000321	0.9999233
98	0.0000215	0.9999498
99	0.0000143	0.9999674
100	0.0000094	0.9999791
101	0.0000061	0.9999867
102	0.0000039	0.9999917
103	0.0000025	0.9999948
104	0.0000016	0.9999968
105	0.0000010	0.9999981
106	0.0000006	0.9999988
107	0.0000004	0.9999993
108	0.0000002	0.9999996
109	0.0000001	0.9999998
110	0.0000001	0.9999999
111	0.0000000	0.9999999
112	0.0000000	1.0000000
113	0.0000000	1.0000000
114	0.0000000	1.0000000
115	0.0000000	1.0000000
116	0.0000000	1.0000000
117	0.0000000	1.0000000
118	0.0000000	1.0000000
119	0.0000000	1.0000000
120	0.0000000	1.0000000
121	0.0000000	1.0000000
122	0.0000000	1.0000000
123	0.0000000	1.0000000
124	0.0000000	1.0000000
125	0.0000000	1.0000000
126	0.0000000	1.0000000

Gráfica de densidad PESO MASCULINO Y FEMENINO

g1 <- ggplot(data = tabla.peso.masculino, aes(x,prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue') +
  ggtitle("Pesos MASCULINO Densidad P(x)", subtitle = paste("media = ",round(media.peso.m, 4), "desv=", round(desv.std.peso.m, 4) )) +
  geom_vline(xintercept = media.peso.m, colour="red")
#g1
g2 <- ggplot(data = tabla.peso.femenino, aes(x,prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue') +
  ggtitle("PESO FEMENINO. Densidad P(x)", subtitle = paste("media = ",round(media.peso.f, 4), "desv=", round(desv.std.peso.f,4) )) +
  geom_vline(xintercept = media.peso.f, colour="red")
#g2
plot_grid(g1, g2)

Estadísticos de la variable estatura

media.estatura.m <- mean(masculinos$estatura)
desv.std.estatura.m <- sd(masculinos$estatura)
media.estatura.m

## [1] 177.7453

desv.std.estatura.m

## [1] 7.183629

media.estatura.f <- mean(femeninos$estatura)
desv.std.estatura.f <- sd(femeninos$estatura)
media.estatura.f

## [1] 164.8723

desv.std.estatura.f

## [1] 6.544602

Tabla de distribución Estaturas MASCULINO

Se toman los valores mínimos y máximos de estaturas, de esos valores se disminuye en diez a mínimo y aumenta en diez a máximo para contemplar mayor rango.

x <- round(min(masculinos$estatura-10),0):round(max(masculinos$estatura+10),0)
tabla.estatura.masculino <- data.frame(x=x, prob.x = dnorm(x = x, mean = media.estatura.m, sd = desv.std.estatura.m), f.acum.x = pnorm(q = x, mean = media.estatura.m, sd = desv.std.estatura.m))
kable(tabla.estatura.masculino, caption = "Estatura Muestra Masculino")

Estatura Muestra Masculino
x	prob.x	f.acum.x
147	0.0000058	0.0000093
148	0.0000105	0.0000173
149	0.0000185	0.0000315
150	0.0000320	0.0000562
151	0.0000543	0.0000984
152	0.0000903	0.0001693
153	0.0001472	0.0002859
154	0.0002355	0.0004741
155	0.0003695	0.0007720
156	0.0005686	0.0012347
157	0.0008582	0.0019393
158	0.0012705	0.0029920
159	0.0018448	0.0045344
160	0.0026273	0.0067510
161	0.0036698	0.0098756
162	0.0050276	0.0141956
163	0.0067555	0.0200542
164	0.0089032	0.0278467
165	0.0115085	0.0380133
166	0.0145906	0.0510229
167	0.0181431	0.0673516
168	0.0221276	0.0874534
169	0.0264692	0.1117262
170	0.0310550	0.1404736
171	0.0357361	0.1738683
172	0.0403336	0.2119183
173	0.0446489	0.2544416
174	0.0484774	0.3010538
175	0.0516240	0.3511688
176	0.0539198	0.4040177
177	0.0552368	0.4586815
178	0.0555000	0.5141393
179	0.0546943	0.5693246
180	0.0528659	0.6231864
181	0.0501179	0.6747493
182	0.0466009	0.7231655
183	0.0424991	0.7677559
184	0.0380145	0.8080361
185	0.0333506	0.8437254
186	0.0286974	0.8747411
187	0.0242194	0.9011789
188	0.0200480	0.9232826
189	0.0162765	0.9414086
190	0.0129609	0.9559880
191	0.0101227	0.9674899
192	0.0077542	0.9763902
193	0.0058259	0.9831453
194	0.0042932	0.9881740
195	0.0031029	0.9918458
196	0.0021997	0.9944755
197	0.0015294	0.9963228
198	0.0010430	0.9975955
199	0.0006976	0.9984556
200	0.0004576	0.9990257
201	0.0002945	0.9993964
202	0.0001858	0.9996328
203	0.0001150	0.9997806
204	0.0000698	0.9998713
205	0.0000416	0.9999259
206	0.0000243	0.9999581
207	0.0000139	0.9999767
208	0.0000078	0.9999873

Tabla de distribución Estaturas FEMENINO

x <- round(min(femeninos$estatura-10),0):round(max(femeninos$estatura+10),0)
tabla.estatura.femenino <- data.frame(x=x, prob.x = dnorm(x = x, mean = media.estatura.f, sd = desv.std.estatura.f), f.acum.x = pnorm(q = x, mean = media.estatura.f, sd = desv.std.estatura.f))
kable(tabla.estatura.femenino, caption = "Estatura Muestra Femenino")

Estatura Muestra Femenino
x	prob.x	f.acum.x
137	0.0000070	0.0000103
138	0.0000133	0.0000201
139	0.0000246	0.0000386
140	0.0000445	0.0000722
141	0.0000787	0.0001323
142	0.0001358	0.0002372
143	0.0002289	0.0004158
144	0.0003770	0.0007132
145	0.0006066	0.0011969
146	0.0009536	0.0019655
147	0.0014644	0.0031586
148	0.0021968	0.0049680
149	0.0032196	0.0076489
150	0.0046097	0.0115295
151	0.0064476	0.0170175
152	0.0088102	0.0245998
153	0.0117607	0.0348342
154	0.0153372	0.0483303
155	0.0195396	0.0657177
156	0.0243190	0.0876024
157	0.0295690	0.1145133
158	0.0351228	0.1468424
159	0.0407569	0.1847861
160	0.0462034	0.2282939
161	0.0511690	0.2770326
162	0.0553606	0.3303735
163	0.0585133	0.3874068
164	0.0604184	0.4469834
165	0.0609459	0.5077833
166	0.0600592	0.5684026
167	0.0578197	0.6274497
168	0.0543791	0.6836408
169	0.0499631	0.7358822
170	0.0448463	0.7833331
171	0.0393246	0.8254399
172	0.0336870	0.8619440
173	0.0281917	0.8928619
174	0.0230484	0.9184454
175	0.0184086	0.9391272
176	0.0143635	0.9554614
177	0.0109487	0.9680648
178	0.0081531	0.9775655
179	0.0059312	0.9845624
180	0.0042153	0.9895967
181	0.0029266	0.9931354
182	0.0019851	0.9955656
183	0.0013153	0.9971961
184	0.0008514	0.9982648
185	0.0005384	0.9989491
186	0.0003327	0.9993773
187	0.0002008	0.9996390
188	0.0001184	0.9997952
189	0.0000682	0.9998864
190	0.0000384	0.9999383
191	0.0000211	0.9999673
192	0.0000113	0.9999830
193	0.0000059	0.9999914

Gráfica de densidad ESTATURA MASCULINO y FEMENINO

g1 <- ggplot(data = tabla.estatura.masculino, aes(x,prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue') +
  ggtitle("ESTATURAS MASCULINO Densidad P(x)", subtitle = paste("media = ",round(media.estatura.m, 4), "desv=", round(desv.std.estatura.m, 4) ))+
geom_vline(xintercept = media.estatura.m, colour="red")
#g1
g2 <- ggplot(data = tabla.estatura.femenino, aes(x,prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue') +
  ggtitle("ESTATURAS FEMENINO. Densidad P(x)", subtitle = paste("media = ",round(media.estatura.f, 4), "desv=", round(desv.std.estatura.f, 4) )) +
  geom_vline(xintercept = media.estatura.f, colour="red")
#g2
plot_grid(g1, g2)

Calcular probabilidades

MASCULINO menor o igual a 60 KGS

¿Cuál es la probabilidad de encontrar a una persona masculino que pese menor o igual de 60 kilogramos?

Graficar la función en donde P(x < 60)
Gráfica de densidad

plotDist("norm", mean = media.peso.m, sd = desv.std.peso.m, groups = x <= 60, type = "h", xlab = "Peso Hombres", ylab = "Densidad", sub=paste("Media = ",round(media.peso.m), " Desv. Std = ", round(desv.std.peso.m,4)) )

Calcular la probabilidad

prob <- pnorm(q = 60, mean = media.peso.m, sd = desv.std.peso.m)
paste("La probabilidad de encontrar a una persona masculino que pese menor de 60 kilogramos es de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino que pese menor de 60 kilogramos es de: 4.218 %"

FEMENINO menor o igual a 60 KGS

¿Cuál es la probabilidad de encontrar a una persona femenino que pese menor o igual de 60 kilogramos?

Graficar la función en donde P(x < 60)
Gráfica de densidad

plotDist("norm", mean = media.peso.f, sd = desv.std.peso.f, groups = x <= 60, type = "h", xlab = "Peso Mujeres", ylab = "Densidad", sub=paste("Media = ",round(media.peso.f), " Desv. Std = ", round(desv.std.peso.f,4)) )

Calcular la probabilidad

prob <- pnorm(q = 60, mean = media.peso.f, sd = desv.std.peso.f)
paste("La probabilidad de encontrar a una persona femenino que pese menor de 60 kilogramos es de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona femenino que pese menor de 60 kilogramos es de: 47.5107 %"

MASCULINO mayor o igual A 180 cms.

¿Cuál es la probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 180 centímetros?

Graficar la función en donde P(x >= 180)
Gráfica de densidad

plotDist("norm", mean = media.estatura.m, sd = desv.std.estatura.m, groups = x >= 180, type = "h", xlab = "Estatura Hombres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.m), " Desv. Std = ", round(desv.std.estatura.m,4)) )

Calcular la probabilidad

prob <- pnorm(q = 180, mean = media.estatura.m, sd = desv.std.estatura.m, lower.tail = FALSE)
paste("La probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 180 de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 180 de: 37.6814 %"

MASCULINO mayor o igual A 190 cms.

¿Cuál es la probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 190 centímetros?

Graficar la función en donde x >= 190
Gráfica de densidad

plotDist("norm", mean = media.estatura.m, sd = desv.std.estatura.m, groups = x >= 190, type = "h", xlab = "Estatura Hombres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.m), " Desv. Std = ", round(desv.std.estatura.m,4)) )

Calcular la probabilidad

prob <- pnorm(q = 190, mean = media.estatura.m, sd = desv.std.estatura.m, lower.tail = FALSE)
paste("La probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 190 de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino que tenga una estatura mayor o igual de 190 de: 4.4012 %"

Masculino estatura entre 160 y 170

¿Cuál es la probabilidad de encontrar a una persona masculino que tenga una estatura entre 160 y 170 centímetros?

Graficar la función en donde P(160 < x < 170)
Gráfica de densidad

plotDist("norm", mean = media.estatura.m, sd = desv.std.estatura.m, groups = x >= 160 & x <= 170, type = "h", xlab = "Estatura Hombres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.m), " Desv. Std = ", round(desv.std.estatura.m,4)))

Calcular la probabilidad

prob <- pnorm(q = 170, mean = media.estatura.m, sd = desv.std.estatura.m) - pnorm(q = 160, mean = media.estatura.m, sd = desv.std.estatura.m)
paste("La probabilidad de encontrar a una persona masculino que tenga una estatura entre 160 y 170 centímeros de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino que tenga una estatura entre 160 y 170 centímeros de: 13.3723 %"

MASCULINO estatura entre 190 y 195

¿Cuál es la probabilidad de encontrar a una persona masculino que tenga una estatura entre 190 y 195 centímetros?

Graficar la función en donde P(190 < x < 195)
Gráfica de densidad

plotDist("norm", mean = media.estatura.m, sd = desv.std.estatura.m, groups = x >= 190 & x <= 195, type = "h", xlab = "Estatura Hombres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.m), " Desv. Std = ", round(desv.std.estatura.m,4)) )

Calcular la probabilidad

prob <- pnorm(q = 195, mean = media.estatura.m, sd = desv.std.estatura.m) - pnorm(q = 190, mean = media.estatura.m, sd = desv.std.estatura.m)
paste("La probabilidad de encontrar a una persona masculino que tenga una estatura entre 190 y 195 centímeros es de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino que tenga una estatura entre 190 y 195 centímeros es de: 3.5858 %"

FEMENINO estatura mayor o igual a 180 cms.

¿Cuál es la probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 180 centímetros?

Graficar la función en donde P(x >= 180)
Gráfica de densidad

plotDist("norm", mean = media.estatura.f, sd = desv.std.estatura.f, groups = x >= 180, type = "h", xlab = "Estatura Mujeres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.f), " Desv. Std = ", round(desv.std.estatura.f,4)) )

Calcular la probabilidad

prob <- pnorm(q = 180, mean = media.estatura.f, sd = desv.std.estatura.f, lower.tail = FALSE)
paste("La probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 180 de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 180 de: 1.0403 %"

FEMENINO estatura mayor o igual 190 cms.

¿Cuál es la probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 190 centímetros?

Graficar la función en donde P(x >= 190)
Gráfica de densidad

plotDist("norm", mean = media.estatura.f, sd = desv.std.estatura.f, groups = x >= 190, type = "h", xlab = "Estatura Mujeres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.f), " Desv. Std = ", round(desv.std.estatura.f,4)) )

Calcular la probabilidad

prob <- pnorm(q = 190, mean = media.estatura.f, sd = desv.std.estatura.f, lower.tail = FALSE)
paste("La probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 190 de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona femenino que tenga una estatura mayor o igual de 190 de: 0.0062 %"

FEMENINO estatura entre 160 y 170 cms

¿Cuál es la probabilidad de encontrar a una persona femenino que tenga una estatura entre 160 y 170 centímetros?

Graficar la función en donde P(160 < x < 170)
Gráfica de densidad

plotDist("norm", mean = media.estatura.f, sd = desv.std.estatura.f, groups = x >= 160 & x <= 170, type = "h", xlab = "Estatura Mujeres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.f), " Desv. Std = ", round(desv.std.estatura.f,4)) )

Calcular la probabilidad

prob <- pnorm(q = 170, mean = media.estatura.f, sd = desv.std.estatura.f) - pnorm(q = 160, mean = media.estatura.f, sd = desv.std.estatura.f)
paste("La probabilidad de encontrar a una persona femenino que tenga una estatura entre 160 y 170 centímeros de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona femenino que tenga una estatura entre 160 y 170 centímeros de: 55.5039 %"

FEMENINO estatura entre 190 y 195 cms

¿Cuál es la probabilidad de encontrar a una persona femenino que tenga una estatura entre 190 y 195 centímetros?

Graficar la función en donde P(190 < x < 195)
Gráfica de densidad

plotDist("norm", mean = media.estatura.f, sd = desv.std.estatura.f, groups = x >= 190 & x <= 195, type = "h", xlab = "Estatura Mujeres", ylab = "Densidad", sub=paste("Media = ",round(media.estatura.f), " Desv. Std = ", round(desv.std.estatura.f,4)) )

Calcular la probabilidad

prob <- pnorm(q = 195, mean = media.estatura.f, sd = desv.std.estatura.f) - pnorm(q = 190, mean = media.estatura.f, sd = desv.std.estatura.f)
paste("La probabilidad de encontrar a una persona femenino que tenga una estatura entre 190 y 195 centímeros es de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona femenino que tenga una estatura entre 190 y 195 centímeros es de: 0.006 %"

MASCULINO o FEMENINO estatura entre 160 y 170 cms

¿Cuál es la probabilidad de encontrar a una persona masculino o femenino que tenga una estatura entre 160 y 170 centímetros?

Graficar la función en donde P(160 < x < 170)
Gráfica de densidad

plotDist("norm", mean = mean(datos$estatura), sd = sd(datos$estatura), groups = x >= 160 & x <= 170, type = "h", xlab = "Estatura Hombres y Mujeres", ylab = "Densidad", sub=paste("Media = ",round(mean(datos$estatura)), " Desv. Std = ", round(sd(datos$estatura),4)) )

Calcular la probabilidad

prob <- pnorm(q = 170, mean = mean(datos$estatura), sd = sd(datos$estatura)) - pnorm(q = 160, mean = mean(datos$estatura), sd = sd(datos$estatura))
paste("La probabilidad de encontrar a una persona masculino o femenino que tenga una estatura entre 160 y 170 centímetros? es de:", round(prob * 100,4), "%")

## [1] "La probabilidad de encontrar a una persona masculino o femenino que tenga una estatura entre 160 y 170 centímetros? es de: 33.3526 %"

Interpretación

Promedios y Dispersión

Peso:

Hombres: Promedio ≈ 78.14 kg, desviación estándar ≈ 10.51 kg

Mujeres: Promedio ≈ 60.60 kg, desviación estándar ≈ 9.62 kg

Interpretación: En promedio, los hombres pesan más que las mujeres, y la variabilidad del peso también es un poco mayor en hombres

Estatura:

Hombres: Promedio ≈ 177.75 cm, desviación estándar ≈ 7.18 cm

Mujeres: Promedio ≈ 164.87 cm, desviación estándar ≈ 6.54 cm

Interpretación: También en estatura los hombres son, en promedio, más altos que las mujeres, con una ligera mayor dispersión.

Distribución del Peso

Masculino: La curva muestra una distribución con forma de campana (aproximadamente normal) centrada alrededor de los 78 kg, con valores frecuentes entre 65 y 90 kg.

Femenino: Similar forma, pero centrada en 60 kg, con la mayoría de los valores entre 50 y 70 kg.

Interpretación: Ambas distribuciones son unimodales (un solo pico) y simétricas. El rango de pesos en mujeres es más estrecho.

Distribución de la Estatura

Masculino: Pico alrededor de los 177-178 cm, con la mayor parte entre 170 y 185 cm.

Femenino: Pico alrededor de 164 cm, mayor densidad entre 155 y 170 cm.

Interpretación: Igual que con el peso, la estatura de los hombres está más dispersa y centrada en valores más altos que en mujeres.

Tendencias Generales por Género

Hombres tienden a ser más altos y más pesados, pero también presentan una mayor dispersión (más variabilidad individual).

Mujeres tienen estaturas y pesos menores en promedio, con una distribución más concentrada.

Conclusión

Las diferencias entre hombres y mujeres en peso y estatura son claras, consistentes y estadísticamente significativas. La forma de las distribuciones sugiere que los datos siguen, en general, distribuciones normales para ambas variables, en ambos géneros

Fábrica de bombillas

Una empresa de material eléctrico fabrica bombillas (focos) de luz que tienen una duración, antes de quemarse (fundirse), que se distribuye normalmente con media igual a 800 horas y una desviación estándar de 40 horas. Encuentre la probabilidad de que una bombilla se queme entre 778 y 834 horas. Walpole, Myers, and Myers (2012)].

Inicializar valores

\[ \mu = 800 \]

\[ \sigma=40 \]

Se busca:

\[ P(778 \leq x \leq 834) \]

media <- 800
desv.stadandar <- 40

La gráfica de la distribución normal

plotDist("norm", mean = media, sd = desv.stadandar, groups = x >= 778 & x <= 834, type = "h", xlab = "Distribución de la duración bombillas (focos)", ylab = "Densidad" )

Cálculo de la probabilidad

La probabilidad de que una bombilla se queme entre 778 y 834 horas.

prob <- pnorm(q = 834, mean = media, sd = desv.stadandar) - pnorm(q = 778, mean = media, sd = desv.stadandar)
paste("La probabilidad de que una bombilla se queme entre 778 y 834 horas es:", round(prob * 100, 4), "%")

## [1] "La probabilidad de que una bombilla se queme entre 778 y 834 horas es: 51.1178 %"

Interpretación

Dado que la probabilidad de el área bajo la curva de una distribución normal es del 100% y solicitan la probabilidad en el intervalo entre 778 y 834, entonces se resta la probabilidad de 834 menos la probabilidad de 778 para encontrar el área bajo la curva de este intervalo de esa variable aleatoria. En la gráfica el color rosa es el área bajo la curva del intervalo.

La probabilidad de que un foco se funda en un rango entre 778 horas y 834 horas es de 51.1178 %

Sueldos mensuales

Los sueldos mensuales en una empresa siguen una distribución normal con media de 1200 soles, y desviación estándar de 200 soles.

¿Qué porcentaje de trabajadores ganan entre 1000 y 1550 soles?(matemovil?).

Inicializar valores

\[ \mu = 1200 \]

\[ \sigma=200 \]

Se busca:

\[ 1000 \leq x \leq 1550 \]

media <- 1200
desv.stadandar <- 200

La gráfica de la distribución normal

plotDist("norm", mean = media, sd = desv.stadandar, groups = x >= 1000 & x <= 1550, type = "h", xlab = "Ganancias de trabajadores en soles", ylab = "Densidad" )

Cálculo de la probabilidad

¿Qué porcentaje de trabajadores ganan entre 1000 y 1550 soles?

prob <- pnorm(q = 1550, mean = media, sd = desv.stadandar) - pnorm(q = 1000, mean = media, sd = desv.stadandar)
paste("La probabilidad de que una persoan gane entre 1000 y 1550 soles es de:", round(prob * 100, 4), "%")

## [1] "La probabilidad de que una persoan gane entre 1000 y 1550 soles es de: 80.1286 %"

Interpretación

La probabilidad de que una persona gane entre 1000 y 1550 soles es de:“, 80.1286,”%” que es el porcentaje de trabajadores que ganan en ese intérvalo.

Ejercicio de contexto en lo general

En una distribución normal

\[ N ( \mu=5, \sigma=2 ) \]

calcula las siguientes probabilidades:

Inicializar valores de media y desviación [anónimo]

media <- 5
desv <- 2

P ( X ≤ 3.25)

Densidad

plotDist("norm", mean = media, sd = desv, groups = x <= 3.25, type = "h", xlab = "Contexto indistinto", ylab = "Densidad" )

Solución

x = 3.25
pnorm(q = x, mean = media, sd= desv)

## [1] 0.190787

P [ X > 4.5 ]

Densidad

plotDist("norm", mean = media, sd = desv, groups = x > 4.5, type = "h", xlab = "Contexto indistinto", ylab = "Densidad" )

Solución

x <- 4.5
pnorm(q = x, mean = media, sd= desv, lower.tail = FALSE)

## [1] 0.5987063

P [X ≤ 7.2]

Densidad

plotDist("norm", mean = media, sd = desv, groups = x <= 7.2, type = "h", xlab = "Contexto indistinto", ylab = "Densidad" )

Solución

x <- 7.2
pnorm(q = x, mean = media, sd= desv)

## [1] 0.8643339

P [ 3 < X ≤ 6]

Densidad

plotDist("norm", mean = media, sd = desv, groups = x > 3 & x<= 6 , type = "h", xlab = "Contexto indistinto", ylab = "Densidad" )

Solución

x1 <- 6
x2 <- 3
pnorm(q = x1, mean = media, sd = desv) - pnorm(q = x2, mean = media, sd = desv)

## [1] 0.5328072

Interpretación

1. P(X ≤ 3.25) = 0.190787

Interpretación:
Hay aproximadamente un 19.08% de probabilidad de que una variable aleatoria X, con distribución normal de media 5 y desviación 2, tome un valor menor o igual que 3.25.
Esto indica que 3.25 está por debajo del promedio, pero no demasiado lejos (apenas 0.875 desviaciones estándar).

2. P(X > 4.5) = 0.5987063

Interpretación:
Hay aproximadamente un 59.87% de probabilidad de que X sea mayor que 4.5.
Como 4.5 está muy cerca del valor medio (a solo 0.25 desviaciones estándar por debajo), la probabilidad de que X esté por encima de 4.5 es ligeramente mayor que el 50%.

3. P(X ≤ 7.2) = 0.8643339

Interpretación:
Existe aproximadamente un 86.43% de probabilidad de que X sea menor o igual que 7.2.
Esto tiene sentido, ya que 7.2 está 1.1 desviaciones estándar por encima de la media, por lo tanto abarca una gran parte del área bajo la curva hacia la izquierda.

4. P(3 < X ≤ 6) = 0.5328072

Interpretación:
Hay una probabilidad del 53.28% de que X esté entre 3 y 6.
Este intervalo cubre una zona importante alrededor de la media (desde 1 desviación estándar por debajo de la media hasta 0.5 desviaciones por encima), por lo que representa más de la mitad del área total bajo la curva.

Es difícil etiquetar la carne empaquetada con su peso correcto debido a los efectos de pérdida de líquido (definido como porcentaje del peso original de la carne). Supongamos que la pérdida de líquido en un paquete de pechuga de pollo se distribuye como normal con media 44 y desviación típica 11. (UC3M, n.d.).

Inicializar valores de media y desviación

media <- 0.04
desv <- 0.01

¿Cuál es la probabilidad de que de que esté entre 3 y 5 porciento.

Gráfica de densidad

plotDist("norm", mean = media, sd = desv, groups = x >= 0.03 & x <= 0.05, type = "h", xlab = "Carne empaquetada", ylab = "Densidad" )

Cálculo de probabilidad

P(3 < x < 5

pnorm(q = 0.05, mean = media, sd = desv) - pnorm(q = 0.03, mean = media, sd = desv)

## [1] 0.6826895

Interpretación

Existe aproximadamente un 68.27% de probabilidad de que la pérdida de líquido en un paquete de pechuga de pollo esté entre el 3% y el 5%.

Esto tiene mucho sentido, porque en una distribución normal:

El intervalo [μ - σ, μ + σ], o sea [4 - 1, 4 + 1] = [3%, 5%], abarca aproximadamente el 68.27% del área bajo la curva.

Referencias bibliográficas

UC3M. n.d. “Introducción a La Estadística y Probabilidad.” http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/Introduction_to_Statistics/intro_continuous2.pdf.

Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.

caso 21 distribucion normal

Miriam Lizeth Borja Berumen

2025-04-12

Objetivo

Descripción

Fundamento teórico

Fórmula de la función de densidad

Inicializando variables

Calculando la densidad f(x)

Usando dnorm()

Calculando la probabilidad acumulada de un intervalo

Restando P(x=22) - P(x=16)

Tabla de probabilidades

Gráfica de probabilidades de 0 a 18

Gráfica de campana completa

Desarrollo

Las librerías

Caso de mediciones del cuerpo humano (Peso y Estatura)

Cargar los datos

Variables de interés

Dispersión de los datos

Histrogramas

Medias aritméticas y desviaciones

Estadísticos de la variable peso

Tabla de distribución peso MASCULINO

Tabla de distribución peso FEMENINO

Gráfica de densidad PESO MASCULINO Y FEMENINO

Estadísticos de la variable estatura

Tabla de distribución Estaturas MASCULINO

Tabla de distribución Estaturas FEMENINO

Gráfica de densidad ESTATURA MASCULINO y FEMENINO

Calcular probabilidades

MASCULINO menor o igual a 60 KGS

FEMENINO menor o igual a 60 KGS

MASCULINO mayor o igual A 180 cms.

MASCULINO mayor o igual A 190 cms.

Masculino estatura entre 160 y 170

MASCULINO estatura entre 190 y 195

FEMENINO estatura mayor o igual a 180 cms.

FEMENINO estatura mayor o igual 190 cms.

FEMENINO estatura entre 160 y 170 cms

FEMENINO estatura entre 190 y 195 cms

MASCULINO o FEMENINO estatura entre 160 y 170 cms

Interpretación

Promedios y Dispersión

Distribución del Peso

Distribución de la Estatura

Tendencias Generales por Género

Fábrica de bombillas

Inicializar valores

La gráfica de la distribución normal

Cálculo de la probabilidad

Interpretación

Sueldos mensuales

Inicializar valores

La gráfica de la distribución normal

Cálculo de la probabilidad

Interpretación

Ejercicio de contexto en lo general

P ( X ≤ 3.25)

Densidad

Solución

P [ X > 4.5 ]

Densidad

Solución

P [X ≤ 7.2]

Densidad

Solución

P [ 3 < X ≤ 6]

Densidad

Solución

Interpretación

1. P(X ≤ 3.25) = 0.190787

2. P(X > 4.5) = 0.5987063

3. P(X ≤ 7.2) = 0.8643339

4. P(3 < X ≤ 6) = 0.5328072

Inicializar valores de media y desviación

Gráfica de densidad

Cálculo de probabilidad

Interpretación