Esta práctica tiene la finalida de utilizar conceptos de la distribución de probabildiad Normal, y comprobar que tan lejos están los valores con respecto a la media
Se requiere simular una distribución con alores de media μ y desviación estaándrad conocidos σ
Objetivos
Simular una muestra aleatoria conforme a la distribucón normal con la función rnorml() de media igual a 175 y desviación estándar de 6, demostrar la lejanía de los datos con respecto a la media.
Demostrar que las probabilidades de los siguientes intérvalos en la muestra simulada se aproximan a los valores siguientes:
p(μ−1σ<x<μ+1σ)≈0.6827
p(μ−2σ<x<μ+2σ)≈0.9545
p(μ−3σ<x<μ+3σ)≈0.9973
1 Alrededor del 68% de las veces, una variable aleatoria normal toma un valor dentro de una desviación estándar de la media. μ±1σ
2 Alrededor del 95% de las veces, una variable aleatoria normal toma un valor dentro de dos desviaciones estándar de la media. μ±2σ
3 Alrededor del 99% de las veces, una variable aleatoria normal toma un valor dentro de tres desviaciones estándar de la media. μ±3σ
Las librerías
library(mosaic)
## Loading required package: dplyr
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Loading required package: lattice
## Loading required package: ggformula
## Loading required package: ggplot2
## Loading required package: ggstance
##
## Attaching package: 'ggstance'
## The following objects are masked from 'package:ggplot2':
##
## geom_errorbarh, GeomErrorbarh
##
## New to ggformula? Try the tutorials:
## learnr::run_tutorial("introduction", package = "ggformula")
## learnr::run_tutorial("refining", package = "ggformula")
## Loading required package: mosaicData
## Loading required package: Matrix
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Note: If you use the Matrix package, be sure to load it BEFORE loading mosaic.
##
## Have you tried the ggformula package for your plots?
##
## Attaching package: 'mosaic'
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
Histograma
Se observa que hay gran cantidad de datos entre 170 y 180, la mayor concentración está en ese intérvalo
hist(estaturas)

Diagrama de caja
El diagrama de caja muestra valores atípicos por encima del 190 y por debajo del 160, la mediana es 175.0961
Estadísticos de la muestra
Se identifica n como el tamaño de la muestra o sea 300
Se obtiene la media de la muestra
Se obtiene la desviación estándar de la muestra
n <- length(estaturas)
media <- mean(estaturas)
desv.std <- sd(estaturas)
n
## [1] 300
media
## [1] 174.7075
desv.std
## [1] 6.817341
Comprobaciones de la distribución normal
1. 1 Alrededor del 68% de las veces, una variable aleatoria normal toma un valor dentro de una desviación estándar de la media.
μ±1σ
Encontar el límite inferior y superior al 68%
li <- media - 1 * desv.std
ls <- media + 1 * desv.std
li
## [1] 167.8902
ls
## [1] 181.5248
¿Cuántas personas hay en esta muestra con estatura entre 167.8901603 y 181.524843?:212
¿Qué porcentaje representa ?: 70.6666667%
Visualizando la gráfica de campana al 68%
m <- round(media,0)
ds <- round(desv.std,0)
lir <- round(li,0)
lsr <- round(ls,0)
plotDist("norm", mean = m, sd = ds, groups = x > lir & x < lsr, type = "h")

¿Cuál es la probabilidad de que una persona x tenga un estatura en el intérvalo de 167.8901603 y 181.524843
Determinar la probabilidad
p(μ−1σ<x<μ+1σ)
Determinar por medio de la función pnorm(). Restar la probabilidad acumulada de la variable aleatoria X con valor igual al límite superior 181.524843 menos la probabilidad acumulada de la variable aletoria x con valor igual a 167.8901603
F(μ+1σ)−F(μ−1σ)
prob.x <- pnorm(q = ls, mean = media, sd = desv.std) - pnorm(q = li, mean = media, sd = desv.std)
prob.x
## [1] 0.6826895
La probabilidad de que un persona varón conforme a la muestra tomada tenga una estatura entre 167.8901603 y 181.524843 es de : 68.27 %
Visualizando la gráfica de campana al 95%
m <- round(media,0)
ds <- round(desv.std,0)
lir <- round(li,0)
lsr <- round(ls,0)
plotDist("norm", mean = m, sd = ds, groups = x > lir & x < lsr, type = "h")

¿Cuál es la probabilidad de que una persona x tenga un estatura en el intérvalo de 161.0728189 y 188.3421844
Determinar la probabilidad
p(μ−1σ<x<μ+1σ)
Determinar por medio de la función pnorm(). Restar la probabilidad acumulada de la variable aleatoria X con valor igual al límite superior 188.3421844 menos la probabilidad acumulada de la variable aletoria x con valor igual a 161.0728189
F(μ+1σ)−F(μ−1σ)
prob.x <- pnorm(q = ls, mean = media, sd = desv.std) - pnorm(q = li, mean = media, sd = desv.std)
prob.x
## [1] 0.9544997
La probabilidad de que un persona varón conforme a la muestra tomada tenga una estatura entre 161.0728189 y 188.3421844 es de : 95.45 %
Visualizando la gráfica de campana al 99%
m <- round(media,0)
ds <- round(desv.std,0)
lir <- round(li,0)
lsr <- round(ls,0)
plotDist("norm", mean = m, sd = ds, groups = x > lir & x < lsr, type = "h")

¿Cuál es la probabilidad de que una persona x tenga un estatura en el intérvalo de 154.2554776 y 195.1595258
Determinar la probabilidad
p(μ−1σ<x<μ+1σ)
Determinar por medio de la función pnorm(). Restar la probabilidad acumulada de la variable aleatoria X con valor igual al límite superior 195.1595258 menos la probabilidad acumulada de la variable aletoria x con valor igual a 154.2554776
F(μ+1σ)−F(μ−1σ)
prob.x <- pnorm(q = ls, mean = media, sd = desv.std) - pnorm(q = li, mean = media, sd = desv.std)
prob.x
## [1] 0.9973002