1.- Variables aleatorias: Son aquellos resultados del azar en algun evento o experimento
2.- Variables aleatorias discretas: son resultado del conteo de eventos u objetos, numeros enteros.
3.- Variables aleatorias continuas: Son resultado generalmente de la medicion directa de algun fenomeno y sus valores estan dentro de un rango.
Es la mas utilizada para entender los fenomenos naturales, biologicos, sociales, sistemas.
Continua
1.- Calcular la probabilidad de \(X\) sea menor a 48, teniendo una media de 50 y una varianza de 25
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE)
## [1] 0.3445783
La probabilidad de que obtengamos un valor menor a 48 es de 34.4%
Ahora, cual es la probabilidad de obtener un valor mayor a 48
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE)
## [1] 0.6554217
Datos
her<- c(16.8, 18.3, 20.4, 23.6, 27.3, 31.7, 32.3, 31.8, 30.8, 26.7, 21.1, 17.0)
Media y desviacion estandar
media<-mean(her)
desviacion<-sd(her)
Cual es la probabilidad de que en hermosillo lluevan 30 milimetros o menos en un mes?
Estimar usando la funcion de la densidad de probabilidad normal
pnorm(30, mean=media, sd=desviacion, lower.tail = TRUE)
## [1] 0.8048959
Funciones en R En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{observación}\\ \hline p & \text {probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end {array} \] Distribución Exponencial
curve(dexp(x), from = 0, to = 10)
#Representa la densidad de una exponencial de media 1 entre 0 y 10.
Distribución binomial
x <- rbinom(20, 1, 0.5)
x
## [1] 0 1 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 0 0 0
#Genera 20 observaciones con distribución B(1, 0.5)
Contando éxitos vs Fracasos
table(x)
## x
## 0 1
## 8 12
E.g. Distribución normal Si \(X\) es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que \(X\) sea menor que 3.5, se calcula en R de esta forma:
pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
#p probabilidad, norm de distribución normal. sd desviación estándar
*Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir, un valor X tal que
qnorm(0.7)
## [1] 0.5244005
*Para calcular el mismo cuantil, pero para una variable aleatoria normal de media 0 y una desviación tipica/sd 0.5
qnorm(0.7, sd = 0.5)
## [1] 0.2622003
El valor \((z_\alpha \)\) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
x <-rnorm(100, mean = 10, sd=1)
x
## [1] 8.983996 9.534099 10.808210 10.038588 10.193698 8.417713 9.941997
## [8] 8.692448 11.625292 9.289569 10.168316 8.195813 10.910039 8.866793
## [15] 9.068950 10.936298 11.397934 9.910095 9.982920 9.809849 8.066452
## [22] 9.578982 9.011007 9.407124 10.131803 9.502838 10.155574 9.561223
## [29] 8.962094 10.671805 10.703627 10.540808 10.399629 9.727289 10.897713
## [36] 10.406712 10.568181 11.644986 9.697933 10.588741 9.787810 7.665891
## [43] 9.073381 10.194781 11.450628 9.810912 8.909725 9.575187 10.605669
## [50] 10.641617 7.703581 10.729878 9.751361 10.138008 9.218761 10.814433
## [57] 11.660181 9.692645 9.458104 11.707323 10.167825 9.306888 10.716960
## [64] 11.132272 8.380501 9.748676 9.802044 10.600069 10.573416 9.744906
## [71] 9.394222 8.832277 7.662658 8.781458 11.229654 9.658526 11.359241
## [78] 11.303185 10.994732 9.777133 9.024659 10.052243 8.792460 10.077254
## [85] 9.580283 10.073351 9.599714 9.520405 10.182339 9.868778 10.635826
## [92] 12.324977 9.964680 10.773134 9.946730 10.210433 11.460281 9.848450
## [99] 10.399063 8.324672
mean(x)
## [1] 9.954134
hist(x)
boxplot(x)
hist(x,freq = FALSE)
#Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)
#densidad normal