1.- Variables aleatorias: Son aquellos resultados del azar en algun evento o experimento
2.- Variables aleatorias discretas: son resultado del conteo de eventos u objetos, numeros enteros.
3.- Variables aleatorias continuas: Son resultado generalmente de la medicion directa de algun fenomeno y sus valores estan dentro de un rango.
Distribucion normal Es la mas utilizada para entender los fenomenos naturales, biologicos, sociales, sistemas.
Continua
1.- Calcular la probabilidad de X sea menor a 48, teniendo una media de 50 y una varianza de 25
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = TRUE)
## [1] 0.3445783
La probabilidad de que obtengamos un valor menor a 48 es de 34.4%
Ahora, cual es la probabilidad de obtener un valor mayor a 48
pnorm(48, mean = 50, sd = sqrt(25), lower.tail = FALSE)
## [1] 0.6554217
Datos
her<- c(16.8, 18.3, 20.4, 23.6, 27.3, 31.7, 32.3, 31.8, 30.8, 26.7, 21.1, 17.0)
Media y desviacion estandar
media<-mean(her)
desviacion<-sd(her)
Cual es la probabilidad de que en hermosillo lluevan 30 milimetros o menos en un mes? Estimar usando la funcion de la densidad de probabilidad normal
pnorm(30, mean=media, sd=desviacion, lower.tail = TRUE)
## [1] 0.8048959
Funciones en R En R, cada distribución de probabilidad se nombra mediante una palabra clave o alias. Las palabras clave para las distribuciones mas importantes son:
$$
FunciónpqdrSignificadoprobabilityquantiledensityrandomUsoCalcula probabilidades acumuladas (cdf)Calcula cuantiles(percentiles)Calcula probabilidades puntualesGenera datos aleatorios segun una distribucion especificaObservación——Solo uso grafico en el caso continuo— $$
curve(dexp(x), from = 0, to = 10)
#Representa la densidad de una exponencial de media 1 entre 0 y 10.
x <- rbinom(20, 1, 0.5)
x
## [1] 1 1 1 0 1 0 1 1 1 0 0 0 1 0 1 1 1 1 1 0
#Genera 20 observaciones con distribución B(1, 0.5)
table(x)
## x
## 0 1
## 7 13
E.g. Distribución normal Si X es una variable aleatoria, con distribución normal de media 3, y su desviación típica es de 0.5, la probabilidad de que X sea menor que 3.5, se calcula en R de esta forma:
pnorm(3.5, mean = 3, sd = 0.5)
## [1] 0.8413447
#p probabilidad, norm de distribución normal. sd desviación estándar
*Para calcular el cuantil 0.7 de una variable aleatoria normal estándar Z, es decir, un valor X tal que
qnorm(0.7)
## [1] 0.5244005
*Para calcular el mismo cuantil, pero para una variable aleatoria normal de media 0 y una desviación tipica/sd 0.5
qnorm(0.7, sd = 0.5)
## [1] 0.2622003
El valor (zα) que aparece en muchas de las fórmulas para intervalos y contrastes se obtiene con el comando qnorm(1-alfa). Algunos ejemplos:
qnorm(0.975)
## [1] 1.959964
Para generar una muestra de tamaño 100 de una población normal de media 10 y desviación típica 1 (y guardarla en un vector x)
x <-rnorm(100, mean = 10, sd=1)
x
## [1] 10.864764 10.761407 12.234735 8.110647 10.782823 11.344952 10.706682
## [8] 10.888963 8.439464 9.349809 9.584532 9.129183 9.766740 11.185015
## [15] 9.283038 9.417492 10.478195 9.630117 10.978555 9.487570 9.481051
## [22] 11.393137 11.545626 10.094095 8.244503 10.572032 8.722897 10.689507
## [29] 9.397691 11.118673 11.576523 9.136801 8.503318 9.798256 8.272225
## [36] 10.983463 9.973546 11.499249 10.762065 11.114225 8.909854 11.002826
## [43] 9.902744 10.195609 9.837625 9.906319 9.743397 10.345357 8.628248
## [50] 10.849140 10.467893 9.903063 10.282319 9.725269 12.096691 9.750293
## [57] 9.783265 11.616240 10.706081 10.100244 10.280936 10.570491 8.377858
## [64] 10.704317 10.460390 8.944516 8.895460 12.403630 8.391006 10.612923
## [71] 11.450569 10.157874 11.107288 8.717716 10.959161 9.901102 9.744509
## [78] 9.671046 9.545391 10.731678 11.684303 10.200290 10.629161 10.087238
## [85] 8.561176 10.293572 10.257528 9.831757 9.280013 10.634712 9.253727
## [92] 8.718740 9.624147 9.611862 10.467113 9.031587 8.241183 11.416926
## [99] 11.583463 10.552804
Para estimar el promedio de x
mean(x)
## [1] 10.10645
Histograma de frecuencias
hist(x)
Gráfico de cajas y bigotes
boxplot(x)
Histograma de la muestra (normalizado para que la suma de las áreas de los rectángulos sea 1) junto con la densidad de la población:
hist(x,freq = FALSE)
#Freq = FALSE, para que el área del histograma sea 1
curve(dnorm(x, mean = 10, sd = 1), from = 7, to = 13, add = TRUE)
#densidad normal