Distribuciones de probabilidad: Nos dice de que manera se comportan las frecuencias

##Funciones en R:

En R, cada districbucón de probabilidad se nombrea mediante la palabra clave o alias. las palabras clave para las distribuciones mas importantes son:

$$ \[\begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso} & \text{Observación}\\ \hline p & \text{probability} & \text {calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text {calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text {calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text {Genera datos aleatorios según una distribucion especifica} & \text{---}\\ \hline \end{array}\]

$$ Distribucion exponencial

curve(dexp(x), from = 0, to = 10) #representa la densidad de una exponencial de media 1 entre 0 y 10

Distribución binomial

#Generador de numeros aleatorios dentro de una distribución espefica y con numeros especificos a los que se va a ajustar
x <- rbinom(20, 1, 0.5)
x
##  [1] 0 1 1 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 1
#Genera 20 observaciones con distribución B(1, 0.5)

Contando exitos vs Fracasos

table(x)
## x
##  0  1 
## 12  8

Ejemplo: Distribución Normal

si \(x\) es una variable aleatoria, con distribución normal de media 3, y su desviación tipica es 0.5, la prbabilidad de que \(x\) sea menor que 3.5 se calcula en R de esta forma:

pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
qnorm(0.7)
## [1] 0.5244005
qnorm(0.7, sd=0.5)
## [1] 0.2622003

El valor \(z_\alpha\) que aparece en muchas de las formulas para intervalos y contrastes se obtiene del comando qnorm(1-alfa). Algunos ejemplos:

qnorm(0.975)
## [1] 1.959964
x <- rnorm(100, mean = 10, sd = 1)
x
##   [1] 11.068343  9.097974 11.941385  9.084690  9.132100 10.430393 11.551943
##   [8]  9.500111 11.499445 10.266855  9.050553  7.905955 10.020945 10.267678
##  [15]  8.499222  9.565081 11.202459 11.744098 10.294668  8.951099  9.302622
##  [22]  9.943061  8.383153 10.499420 11.280984  9.974493 10.167213 10.908792
##  [29] 11.493293  8.965374 10.115932  8.861327  9.975912 11.186121  9.722239
##  [36]  9.525751 10.698498  9.486382  9.714066 11.369716 10.186840  9.722520
##  [43] 10.411488  7.819084 11.928581  8.213242  9.326921  8.534877  8.712568
##  [50]  9.036233 10.873703 10.677843 10.482220  9.983105  8.944894  7.568426
##  [57]  8.861839  9.235636  9.366915 11.755080 11.184827 11.197638 11.430790
##  [64]  7.580980  9.872627  9.865249  9.830235 12.137374 11.085166 10.968847
##  [71]  9.885518 10.068988 11.697378  9.521054  9.676542  8.426432  8.816510
##  [78] 10.594039  8.553105 11.369302  8.955611 10.000454 10.146651 10.840705
##  [85] 10.742366 10.951382 11.709413 11.403247 10.401125 10.821423  9.962515
##  [92]  8.733587  9.308434 10.228122 10.742786  8.025042 11.736382  8.646083
##  [99]  7.512628  9.118665
mean(x)
## [1] 9.980406
hist(x)

boxplot(x)

# Si salen puntos son valores atipicos
hist(x, freq = FALSE) #freq = false, para que el area del histograma sea 1, es decir, normalizarla

curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE) #add = TRUE, esto empalmara 2 graficas

Ejercicios

  1. Si \(z\) es una variable con distribucion normal estandar, calcula \(\mathbb{P} (-2.34< z < 4.78)\)

  2. Calcula el rango intercuartílico de una poblacion normal estándar

  3. Genera una muestra de tamaño 19 de población normal estandar. ¿cuál es la diferencia entre la media mostral y la poblacional? repite el ejercicio 3 veces y anota las 3 diferencias

  4. Genera 1000 números con distribución de Poisson de parámetro \(\lambda = 1)\). Representa el gráfico de barras de los numeros obtenidos. Calcula la media y la varianza de los números obtenidos. ¿Se parecen a los valores teóricos?

  5. Calcula con R los siguientes valores: \(t_{3,\alpha})\), \(\chi^2_ {3_ \alpha}\), para \(\alpha = 0.05\) y \(\alpha = 0.01\). compara los valores obtenidos con los que aparecen en las correspondientes tablas.

Conclusión Para concluir con este tema en la distribución de probabilidad es una función que asigna a cada suceso sobre la variable la probabilidad de que dicho suceso ocurra, esto se puede ver a traves de las graficas, empalmando las graficas dando información mas o menos clara sobre como se pueden comportar las variables en su frecuencia aleatoria, esto nos sirve para saber como esperar vagamente como se comporten los resultados y saber cuando es mas frecuente la variable.