DISTRIBUCIONES DE PROBABILIDAD

Tipos de variables

  1. Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.

  2. Aleatoria discreta: Se toman solamente ciertos valores enteros y son principalmente del conteo realizado. integrer

  3. Aleatoria continua: Este tipo de variable generalmente son resultado de una medicion y pueden tomar cualquier valor dentro de un intervalo. double

##Distribucion normal

Es una distribucion muy utilizada y funciona generalmente para variables continuas. Se usa para entender fenomenos naturales, artificiales, sociales.

*Ejemplo 1: Calcular la probabilidad de que \(x\) sea menor a 48, es decir:

\[ P < 48 \] tomando en cuenta que la media es 50 y la varianza es 25

para esto usaremos la funcion de distribucuion de probabilidad

pnorm(48, mean= 50, sd= sqrt(25), lower.tail=TRUE)
## [1] 0.3445783

Entonces es 34% probable que tengamos un valor menor a 48

pnorm(48, mean= 50, sd= sqrt(25), lower.tail=FALSE)
## [1] 0.6554217

La probabilidad de que obtengamos un valor mayora 48 es de 65.5%

Distribuciones de probabilidad

Nos dice de que manera se comportan las frecuencias

Funciones en R:

En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:

$$ \[\begin{array}{l|l|l|c} \text{Funcion} & \text{Significado} & \text{Uso} & \text{Observacion}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Solo uso grafico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios segun una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$

Distribución Exponencial

curve(dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 0 0 0 0 1 0 1 0 0 0 1 0 1 1 1 0 1 0
#Genera 20 observaciones con distribución B(1,0.5)

Contando éxitos vs fracasos

table(x)
## x
##  0  1 
## 12  8

e.g. Distribucion normal

si \(x\) es una variable aleatoria, con distribucion normal de media 3 y du desviacion tipica es de 0.5, la probabilidad de que x sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(Zα\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1 )
x
##   [1] 10.334085  9.674241  8.674552 11.144242 10.599952 10.662882  8.644106
##   [8] 10.201607  8.584456  9.501162  8.780580 10.373964  9.707303  9.949119
##  [15]  9.711561  9.099825  9.389098 11.277286  9.027247  8.934617 10.523180
##  [22]  7.714552 10.711587 10.563687  8.561152 11.800596 10.985859 11.015356
##  [29]  9.760364 10.965068  9.024265  8.694326  9.636708 10.521068 11.591956
##  [36] 10.293428 10.522881  9.070594  8.967740 10.198172  9.095677  9.970020
##  [43]  9.898887  9.763648  9.217472 10.121705 10.368818  9.492214  9.881217
##  [50]  8.985551 11.424925  9.657047  7.505802 12.644694  8.532463  9.535000
##  [57]  9.451524  9.073961  9.395985 10.815748 10.270655  9.969565 11.605758
##  [64]  9.513380  8.334515  8.141804  9.007745 11.462100 10.243767  9.179899
##  [71] 10.378570  8.990404  9.327621 10.379402 10.030907  9.490395  9.437216
##  [78]  8.898682 11.031309  7.610547 10.126684  9.359196  9.908048 11.462286
##  [85]  9.470352  9.646673  9.467866  9.923970  9.377460  9.185568 10.586892
##  [92] 11.685944  9.903284 10.801326 10.498297 11.746491  9.907357  8.949033
##  [99] 10.608970  8.321633
mean(x)
## [1] 9.844684
hist(x)

* Gráfico de cajas y bigote

boxplot(x)

* Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población

hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)

# conclusion con la distribución de probabilidad nos proporciona todos los resultados de los valores que pueden presentarse en un acontecimiento.