1 Objetivo

Identificar en una distribución normal, los valores de la curva o los valores de la función de densidad, graficar el área bajo la curva y calcular probabilidades.

2 Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad normal a partir de valores iniciales de los ejercicios identificando y visualizando la función de densidad y calculando probabilidades.

3 Fundamento teórico

La distribución continua de probabilidad más importante en todo el campo de la estadística es la distribución normal. Su gráfica, que se denomina curva normal, es la curva con forma de campana (Walpole, Myers, and Myers 2012a).

La distribución normal a menudo se denomina distribución Gaussiana, en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su ecuación a partir de un estudio de errores en mediciones repetidas de la misma cantidad (Walpole, Myers, and Myers 2012b).

En a imagen anterior se identifican dos valores que se requieren para suponer una curva de distribución normal, la media μμ y la desviación estándar σσ de los datos.

3.1 Fórmula de la función de densidad

  • Para distribución n normal estándar con media igual a 0 y desviación = 1

  • Para distribución normal

En donde: π=3.14159π=3.14159 y e=2.71828e=2.71828

Ejemplo de calcular la densidad para un valor de xx de acuerdo a la distribución normal con media y desviación.

Valor de x=18x=18; media=20media=20; desv=2desv=2;e=2.71828e=2.71828;pi=3.14159

x= 18
media <- 20
desv <- 2
e <- exp(1)
pi <- pi

x; media; desv; e; pi
## [1] 18
## [1] 20
## [1] 2
## [1] 2.718282
## [1] 3.141593
1 / (desv* sqrt(2 * pi)) * (e ^(-(x-media)^2 / (2*desv^2)))
## [1] 0.1209854
dnorm(x = x, mean = media, sd = desv)
## [1] 0.1209854

4 Desarrollo

4.1 Las librerías

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.4
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(mosaic)
## Warning: package 'mosaic' was built under R version 4.0.5
## Registered S3 method overwritten by 'mosaic':
##   method                           from   
##   fortify.SpatialPolygonsDataFrame ggplot2
## 
## The 'mosaic' package masks several functions from core packages in order to add 
## additional features.  The original behavior of these functions should not be affected by this.
## 
## Attaching package: 'mosaic'
## The following object is masked from 'package:Matrix':
## 
##     mean
## The following object is masked from 'package:ggplot2':
## 
##     stat
## The following objects are masked from 'package:dplyr':
## 
##     count, do, tally
## The following objects are masked from 'package:stats':
## 
##     binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
##     quantile, sd, t.test, var
## The following objects are masked from 'package:base':
## 
##     max, mean, min, prod, range, sample, sum
library(readr)
## Warning: package 'readr' was built under R version 4.0.4
library(ggplot2)  # Para gráficos
library(knitr)    # Para formateo de datos

library(cowplot) #Imágenes en el mismo renglón
## Warning: package 'cowplot' was built under R version 4.0.5
## 
## Attaching package: 'cowplot'
## The following object is masked from 'package:mosaic':
## 
##     theme_map
options(scipen=999) # Notación normal

4.2 Caso de mediciones del cuerpo humano (Peso y Estatura)

4.2.1 Cargar los datos

datos <- read.table("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/body.dat.txt", quote="\"", comment.char="")

datos <- as.data.frame(datos)

colnames(datos)[23:25] <- c("peso", "estatura", "genero")

# Solo nos interesan las tres últimas columnas
datos <- select(datos, estatura, peso, genero)

Ver los primeros seis y últimos seis registros

head(datos)
##   estatura peso genero
## 1    174.0 65.6      1
## 2    175.3 71.8      1
## 3    193.5 80.7      1
## 4    186.5 72.6      1
## 5    187.2 78.8      1
## 6    181.5 74.8      1
tail(datos)
##     estatura peso genero
## 502    157.5 76.8      0
## 503    176.5 71.8      0
## 504    164.4 55.5      0
## 505    160.7 48.6      0
## 506    174.0 66.4      0
## 507    163.8 67.3      0

4.2.2 Visualizar la dispersión de los datos

  • Diagrama de dispersión del peso

ggplot(datos, aes(x = 1:nrow(datos), y = peso)) +
  geom_point(colour = "red")