distribucion de de probabilidad
aleatorio: resultados que se presentan al azar en cualquier evento o experimento
variable aleatorio discreto: aqui solamente se toman solamente ciertos valopres en y son parte del conteo realizado.
variable aleatorio continuo: este tipod e variables generalmente son resultados de una medicion y pueden tomar cualquier valor dentro de un ontervalo. double
distribucion normal
es una distribucion muy utilizada y funciona generalmente para variables continuas. se usa para comprender fenomenos naturales, sociales, artificiales.
· ejemplo: calcular la probabilidad de \(X\) sea menos a 48 es decir que :
\[ P<48 \] tomando en cuanta que la media y la varianza es 50 y 25 respectivamente. para esto usaremos la funcion de distribucion de probabilidad
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE)## [1] 0.3445783
entonces es un 34% probable de que pase
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE)## [1] 0.6554217
la probabilidad de que x sea mayor a 48 es del 65%
Distribuciones de probabilidad
Nos dice de que manera se comportan las frecuencias
Funciones en R:
En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:
- Distribución Alias
- Distribución binomial binom
- Distribución de Poisson pois
- Distribución normal norm
- Distribución exponencial exp
- Distribución t de Student t
- Distribución Chi2 chisq
- Distribución F f
$$
Distribución Exponencial
curve(dexp(x), from=0, to=10)#representa la densidad de una exponencial de media 1 entre 0 y 10Distribución binomial
x <- rbinom(20, 1, 0.5)
x## [1] 0 0 1 0 0 1 1 0 0 1 1 0 1 1 0 1 0 0 0 1
#Genera 20 observaciones con distribución B(1,0.5)Contando éxitos vs fracasos
table(x)## x
## 0 1
## 11 9
e.g. Distribucion normal
si \(x\) es una variable aleatoria, con distribucion normal de media 3 y du desviacion tipica es de 0.5, la probabilidad de que x sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)## [1] 0.8413447
- Para calcular el cuantil 0.7 de una v.a. normal estándar Z, es decir, un valor X tal que
qnorm(0.7)## [1] 0.5244005
- Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5
qnorm(0.7, sd=0.5)## [1] 0.2622003
El valor \(Zα\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)## [1] 1.959964
- Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):
x <- rnorm(100, mean=10, sd=1 )
x## [1] 9.644627 10.261184 9.213320 8.925021 12.657185 10.737770 10.870661
## [8] 8.244454 9.725994 8.432761 8.694794 13.041393 8.593825 9.653712
## [15] 9.053722 7.755041 11.321334 8.962741 11.797005 10.671791 9.210263
## [22] 12.846166 10.781830 8.779511 11.131293 11.104151 9.938488 9.278937
## [29] 9.957457 10.224476 9.803736 9.978831 9.254237 9.384830 8.819367
## [36] 10.439399 9.585664 9.636116 10.743339 9.626576 10.393170 10.522501
## [43] 9.222898 9.091141 10.080314 11.354212 8.513820 11.664593 11.628340
## [50] 11.108497 9.014728 7.165737 9.975424 8.262790 10.245202 9.830495
## [57] 9.352487 8.497088 9.696345 10.000671 9.372245 9.643496 8.124925
## [64] 11.146462 9.766407 10.147349 8.450465 9.599338 10.079959 9.276499
## [71] 8.976982 11.082171 9.597608 8.637116 12.354606 8.363643 11.286613
## [78] 9.885235 11.761332 10.286299 9.699522 9.728420 9.093642 10.716647
## [85] 9.928462 10.066781 8.803583 9.653009 10.289095 9.349260 10.384520
## [92] 10.480906 8.427650 8.603069 9.797387 10.874436 10.950992 9.403174
## [99] 11.035867 12.161882
- Para estimar el promedio de x
mean(x)## [1] 9.916905
- Histograma de frecuencias
hist(x) * Gráfico de cajas y bigote
boxplot(x) * Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE) # conclusion con la distribución de probabilidad nos proporciona todos los resultados de los valores que pueden presentarse en un acontecimiento.