Aleatoria: Resultados que se presentan al azar en cualquier evento o experimento.
Aleatoria discreta: Se toman solamente ciertos valores enteros y son principalmente del conteo realizado. integrer
Aleatoria continua: Este tipo de variable generalmente son resultado de una medicion y pueden tomar cualquier valor dentro de un intervalo. double
##Distribucion normal
Es una distribucion muy utilizada y funciona generalmente para variables continuas. Se usa para entender fenomenos naturales, artificiales, sociales.
*Ejemplo 1: Calcular la probabilidad de que \(x\) sea menor a 48, es decir:
\[ P < 48 \] tomando en cuenta que la media es 50 y la varianza es 25
para esto usaremos la funcion de distribucuion de probabilidad
pnorm(48, mean= 50, sd= sqrt(25), lower.tail=TRUE)
## [1] 0.3445783
Entonces es 34% probable que tengamos un valor menor a 48
pnorm(48, mean= 50, sd= sqrt(25), lower.tail=FALSE)
## [1] 0.6554217
La probabilidad de que obtengamos un valor mayora 48 es de 65.5%
Nos dice de que manera se comportan las frecuencias
En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:
$$
curve(dexp(x), from=0, to=10)
#representa la densidad de una exponencial de media 1 entre 0 y 10
x <- rbinom(20, 1, 0.5)
x
## [1] 0 1 0 0 0 0 1 0 1 0 0 0 1 0 1 1 1 0 1 0
#Genera 20 observaciones con distribución B(1,0.5)
table(x)
## x
## 0 1
## 12 8
si \(x\) es una variable aleatoria, con distribucion normal de media 3 y du desviacion tipica es de 0.5, la probabilidad de que x sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(Zα\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean=10, sd=1 )
x
## [1] 10.334085 9.674241 8.674552 11.144242 10.599952 10.662882 8.644106
## [8] 10.201607 8.584456 9.501162 8.780580 10.373964 9.707303 9.949119
## [15] 9.711561 9.099825 9.389098 11.277286 9.027247 8.934617 10.523180
## [22] 7.714552 10.711587 10.563687 8.561152 11.800596 10.985859 11.015356
## [29] 9.760364 10.965068 9.024265 8.694326 9.636708 10.521068 11.591956
## [36] 10.293428 10.522881 9.070594 8.967740 10.198172 9.095677 9.970020
## [43] 9.898887 9.763648 9.217472 10.121705 10.368818 9.492214 9.881217
## [50] 8.985551 11.424925 9.657047 7.505802 12.644694 8.532463 9.535000
## [57] 9.451524 9.073961 9.395985 10.815748 10.270655 9.969565 11.605758
## [64] 9.513380 8.334515 8.141804 9.007745 11.462100 10.243767 9.179899
## [71] 10.378570 8.990404 9.327621 10.379402 10.030907 9.490395 9.437216
## [78] 8.898682 11.031309 7.610547 10.126684 9.359196 9.908048 11.462286
## [85] 9.470352 9.646673 9.467866 9.923970 9.377460 9.185568 10.586892
## [92] 11.685944 9.903284 10.801326 10.498297 11.746491 9.907357 8.949033
## [99] 10.608970 8.321633
mean(x)
## [1] 9.844684
hist(x)
* Gráfico de cajas y bigote
boxplot(x)
* Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población
hist(x, freq=FALSE) # Freq=FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from=7, to=13, add=TRUE)
# conclusion con la distribución de probabilidad nos proporciona todos los resultados de los valores que pueden presentarse en un acontecimiento.