**Funciones en R
En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} &v text(---)\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución exponencial
curve(dexp(x), from=0, to=10) #Representa la densidad de un exponencial media 1 entre 0 y 10
Distribución Binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 1 0 1 0 1 1 0 0 0 1 0 1 1 0 0 0 1 0 0 1
#Genera 20 observaciones con distribución B(1, 0.5)
Contando éxitos vs fracasos
table(x)
## x
## 0 1
## 11 9
e.g. Distribución normal Si \(x\) es una variable aleatoria con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(x\) sea menor que 3.5 se cálcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alpha). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean= 10, sd=1 )
x
## [1] 8.614601 10.590290 9.572542 9.631804 10.092124 11.147162 9.999312
## [8] 10.515374 10.186147 10.325033 10.000018 10.440399 9.051004 11.352498
## [15] 9.398446 11.632300 11.846307 9.645021 11.287797 10.030357 9.274890
## [22] 10.146175 9.109741 8.005250 11.121131 9.859475 9.423029 9.587044
## [29] 6.695797 8.872290 10.939310 9.507638 8.911179 8.252958 9.469509
## [36] 8.069003 9.170042 9.396379 10.780124 12.104525 10.004055 8.764855
## [43] 10.732969 10.050062 10.032972 10.717899 10.392724 10.487071 10.133378
## [50] 10.985171 9.780558 10.193969 9.827151 11.100488 9.438628 10.940068
## [57] 10.646834 9.142565 10.188909 9.809964 10.239137 10.505777 9.194562
## [64] 9.244450 11.728724 10.002903 9.550897 10.101887 8.805686 11.105089
## [71] 8.825255 10.784120 10.819836 7.823529 9.573143 9.404697 10.310594
## [78] 7.877876 9.271226 11.735299 10.148403 9.186768 9.602664 8.766155
## [85] 9.570458 8.804777 9.217542 10.872596 10.934139 9.601419 10.053752
## [92] 12.339994 7.903332 9.386476 12.023696 9.986614 11.766227 11.653465
## [99] 9.304538 11.755472
mean(x)
## [1] 9.972075
hist(x)
boxplot(x)
hist(x, freq = FALSE) #freq= FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean=10, sd=1), from= 7, to= 13, add=TRUE)
El ejercicio visto, trata acerca de la distribución de la probabilidad, donde se miran los valores posibles que se pueden presentar en un ejemplo.Aquí aprendimos a hacer los tipos de distribuciones que hay, como la distribución exponinencial, binomial y normal, así como sus descripciones. También se vio cómo representarlas gráficamente mediante tablas, a lo que también se aprendió a crear diferentes tablas.