##Distribuciones de probabilidad.
**Funciones en R En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
“Aqui lo que hacemos es hacer una tabla tipo excel, una manera mas grafica y mas facil de comprender cada punto” \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial
curve(dexp(x), from=0, to=10)
#representa la densidad de una exponencial de media 1 entre 0 y 10
“Representamos la densidad de una exponencial entre el 0 y el 10 con una media de 1”
Distribución binomial
x <- rbinom(20,1, 0.5)
x
## [1] 0 0 0 1 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 0
#Genera 20 observaciones con distribución B(1,0.5)
“Damos rbinom para generar 20 numeros aleatorios, con distribucion establecida”
Contando éxitos vs Fracasos
table(x)
## x
## 0 1
## 10 10
“Hacemos una tabla para mostrar cuantos éxitos y fracasos tuvimos con el e.g. anterior”
e.g. Distribución normal si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:
pnorm(3.5, mean=3, sd=0.5)
## [1] 0.8413447
“De acuerdo a la variable aleatoria X con distribucion normal y una media de 3, sacamos las probabilidades donde X es menor que 3.5”
qnorm(0.7)
## [1] 0.5244005
“Estamos calculando el cuantil de un numero aleatorio normal”
qnorm(0.7, sd=0.5)
## [1] 0.2622003
“Estamos calculando el valor del mismo cuantil pero añadiendo una DT de 0.5”
El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
“Calculamos el valor \(z_\alpha\)”
x <- rnorm(100, mean = 10, sd = 1)
x
## [1] 9.988016 9.521418 9.291193 8.577630 9.238498 9.480184 9.568534
## [8] 9.050906 9.705482 7.856621 11.103622 8.859872 11.298462 8.427703
## [15] 8.935629 8.711687 10.831668 7.161172 9.470375 9.728772 9.697891
## [22] 10.049815 9.694727 9.453713 9.474200 9.395021 7.969578 9.041353
## [29] 11.577137 8.530114 9.286842 11.535272 11.104682 9.214482 10.135261
## [36] 10.724266 8.964319 10.219594 9.669867 10.713033 8.973989 10.616210
## [43] 9.283032 9.992854 8.907598 8.284815 10.044258 9.369477 10.390016
## [50] 9.869712 10.182498 9.483376 7.182994 10.779853 8.445987 8.123440
## [57] 8.594436 10.070863 10.542364 10.375110 9.856741 10.416395 7.914006
## [64] 9.389218 7.723591 12.044520 10.748028 10.267844 12.042900 9.590143
## [71] 8.907003 11.803674 10.694451 11.028573 10.180695 9.533881 11.881723
## [78] 9.399840 10.376680 10.042532 9.258371 10.233192 10.825368 9.864686
## [85] 9.170196 9.615172 11.625584 13.391855 9.355425 11.416202 9.520651
## [92] 8.046960 10.389698 9.256278 11.438890 10.356909 10.218299 10.751123
## [99] 10.840785 9.923724
“Generamos 100 numeros aleatorios con una media de 10 y desviacion tipica de 1”
mean(x)
## [1] 9.821133
“Calculamos el promedio”
hist(x)
“Pasamos los datos a un histograma”
boxplot(x)
hist(x, freq = FALSE) # Freq = FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)
##Como conclusión: pienso que todas las formas de distribucion que existen son importantes ya que cada una tiene su cierta usabilida, en caso de presentarte un problema. a partir de estos ejercicios, nos queda un poco mas claro como manejar los datos usados anteriormente en modo de tablas, graficas, o generando números aleatorios para representar problemas de la vida cotidiana.