U1A5

##Distribuciones de probabilidad.

**Funciones en R En R, cada distribucion de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:

Distribución Alías
Distribución binominal binom
Distribución de Poisson pois
Distribución normal norm
Distribución exponencial exp
Distribución t de Student t
Distribución chi2 chisq
Distribución F f

“Aqui lo que hacemos es hacer una tabla tipo excel, una manera mas grafica y mas facil de comprender cada punto” \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \] Distribución Exponencial

curve(dexp(x), from=0, to=10)

#representa la densidad de una exponencial de media 1 entre 0  y 10

“Representamos la densidad de una exponencial entre el 0 y el 10 con una media de 1”

Distribución binomial

x <- rbinom(20,1, 0.5)
x

##  [1] 0 0 0 1 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 0

#Genera 20 observaciones con distribución B(1,0.5)

“Damos rbinom para generar 20 numeros aleatorios, con distribucion establecida”

Contando éxitos vs Fracasos

table(x)

## x
##  0  1 
## 10 10

“Hacemos una tabla para mostrar cuantos éxitos y fracasos tuvimos con el e.g. anterior”

e.g. Distribución normal si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean=3, sd=0.5)

## [1] 0.8413447

“De acuerdo a la variable aleatoria X con distribucion normal y una media de 3, sacamos las probabilidades donde X es menor que 3.5”

Para calcular el cuantil 0.7 de una v.a. normal estándar z, es decir, un valor x tal que

qnorm(0.7)

## [1] 0.5244005

“Estamos calculando el cuantil de un numero aleatorio normal”

Para calcular el mismo cuantil, pero para una v.a. normal de media 0 y DT 0.5

qnorm(0.7, sd=0.5)

## [1] 0.2622003

“Estamos calculando el valor del mismo cuantil pero añadiendo una DT de 0.5”

El valor \(z_\alpha\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)

## [1] 1.959964

“Calculamos el valor \(z_\alpha\)”

Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x):

x <- rnorm(100, mean = 10, sd = 1)
x

##   [1]  9.988016  9.521418  9.291193  8.577630  9.238498  9.480184  9.568534
##   [8]  9.050906  9.705482  7.856621 11.103622  8.859872 11.298462  8.427703
##  [15]  8.935629  8.711687 10.831668  7.161172  9.470375  9.728772  9.697891
##  [22] 10.049815  9.694727  9.453713  9.474200  9.395021  7.969578  9.041353
##  [29] 11.577137  8.530114  9.286842 11.535272 11.104682  9.214482 10.135261
##  [36] 10.724266  8.964319 10.219594  9.669867 10.713033  8.973989 10.616210
##  [43]  9.283032  9.992854  8.907598  8.284815 10.044258  9.369477 10.390016
##  [50]  9.869712 10.182498  9.483376  7.182994 10.779853  8.445987  8.123440
##  [57]  8.594436 10.070863 10.542364 10.375110  9.856741 10.416395  7.914006
##  [64]  9.389218  7.723591 12.044520 10.748028 10.267844 12.042900  9.590143
##  [71]  8.907003 11.803674 10.694451 11.028573 10.180695  9.533881 11.881723
##  [78]  9.399840 10.376680 10.042532  9.258371 10.233192 10.825368  9.864686
##  [85]  9.170196  9.615172 11.625584 13.391855  9.355425 11.416202  9.520651
##  [92]  8.046960 10.389698  9.256278 11.438890 10.356909 10.218299 10.751123
##  [99] 10.840785  9.923724

“Generamos 100 numeros aleatorios con una media de 10 y desviacion tipica de 1”

Para estimar el promedio de x

mean(x)

## [1] 9.821133

“Calculamos el promedio”

Histograma de frecuencias

hist(x)

“Pasamos los datos a un histograma”

Gráfico de cajas y bigote “Mostramos los datos en un grafico de cajas y bigote”

boxplot(x)

Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población: “Mostramos un hisgograma agregando una linea para representar graficamente las dos cosas en una misma grafica”

hist(x, freq = FALSE) # Freq = FALSE, para que el area del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)

##Como conclusión: pienso que todas las formas de distribucion que existen son importantes ya que cada una tiene su cierta usabilida, en caso de presentarte un problema. a partir de estos ejercicios, nos queda un poco mas claro como manejar los datos usados anteriormente en modo de tablas, graficas, o generando números aleatorios para representar problemas de la vida cotidiana.

U1A5

Kevin

14/9/2020