DISTRIBUCIONES DE PROBABILIDAD

1.- Variables aleatorias: Son aquellos resultados del azar en algun evento o experimento

2.- Variables aleatorias discretas: son resultado del conteo de eventos u objetos, numeros enteros.

3.- Variables aleatorias continuas: Son resultado generalmente de la medicion directa de algun fenomeno y sus valores estan dentro de un rango.

Distribucion normal

Es la mas utilizada para entender los fenomenos naturales, biologicos, sociales, sistemas.

Continua

1.- Calcular la probabilidad de \(X\) sea menor a 48, teniendo una media de 50 y una varianza de 25

pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE)
## [1] 0.3445783

La probabilidad de que obtengamos un valor menor a 48 es de 34.4%

Ahora, cual es la probabilidad de obtener un valor mayor a 48

pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE)
## [1] 0.6554217

Segundo ejemplo de distribucion normal utilizando datos continuos de lluvia para la estacion hermosillo II

Datos

her<- c(16.8, 18.3, 20.4, 23.6, 27.3, 31.7, 32.3, 31.8, 30.8, 26.7, 21.1, 17.0)

Media y desviacion estandar

media<-mean(her)
desviacion<-sd(her)

Cual es la probabilidad de que en hermosillo lluevan 30 milimetros o menos en un mes?

Estimar usando la funcion de la densidad de probabilidad normal

pnorm(30, mean=media, sd=desviacion, lower.tail = TRUE)
## [1] 0.8048959

Distribuciones de probabiliad

Funciones en R En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

  • Distribución Alias
  • Distribución binomial binom
  • Distribución de Poisson pois
  • Distribución normal norm
  • Distribución exponencial exp
  • Distribución t de Student t
  • Distribución Chi2 chisq
  • Distribución F f

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{observación}\\ \hline p & \text {probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end {array} \] Distribución Exponencial

curve(dexp(x), from = 0, to = 10)

#Representa la densidad de una exponencial de media 1 entre 0 y 10.

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 0 0 0
#Genera 20 observaciones con distribución B(1, 0.5)

Contando éxitos vs Fracasos

table(x)
## x
##  0  1 
##  8 12

E.g. Distribución normal Si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5, se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
#p probabilidad, norm de distribución normal. sd desviación estándar

*Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir, un valor X tal que

qnorm(0.7)
## [1] 0.5244005

*Para calcular el mismo cuantil, pero para una variable aleatoria normal de media 0 y una desviación tipica/sd 0.5

qnorm(0.7, sd = 0.5)
## [1] 0.2622003

El valor \((z_\alpha \)\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
  • Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x)
x <-rnorm(100, mean = 10, sd=1)
x
##   [1]  8.983996  9.534099 10.808210 10.038588 10.193698  8.417713  9.941997
##   [8]  8.692448 11.625292  9.289569 10.168316  8.195813 10.910039  8.866793
##  [15]  9.068950 10.936298 11.397934  9.910095  9.982920  9.809849  8.066452
##  [22]  9.578982  9.011007  9.407124 10.131803  9.502838 10.155574  9.561223
##  [29]  8.962094 10.671805 10.703627 10.540808 10.399629  9.727289 10.897713
##  [36] 10.406712 10.568181 11.644986  9.697933 10.588741  9.787810  7.665891
##  [43]  9.073381 10.194781 11.450628  9.810912  8.909725  9.575187 10.605669
##  [50] 10.641617  7.703581 10.729878  9.751361 10.138008  9.218761 10.814433
##  [57] 11.660181  9.692645  9.458104 11.707323 10.167825  9.306888 10.716960
##  [64] 11.132272  8.380501  9.748676  9.802044 10.600069 10.573416  9.744906
##  [71]  9.394222  8.832277  7.662658  8.781458 11.229654  9.658526 11.359241
##  [78] 11.303185 10.994732  9.777133  9.024659 10.052243  8.792460 10.077254
##  [85]  9.580283 10.073351  9.599714  9.520405 10.182339  9.868778 10.635826
##  [92] 12.324977  9.964680 10.773134  9.946730 10.210433 11.460281  9.848450
##  [99] 10.399063  8.324672
  • Para estimar el promedio de x
mean(x)
## [1] 9.954134
  • Histograma de frecuencias
hist(x)

  • Gráfico de cajas y bigotes
boxplot(x)

  • Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x,freq = FALSE)
#Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE) 

#densidad normal