probabilidades

Author

CEC

#| label: librerias

pacman::p_load(tidyverse,openxlsx, Hmisc, DataExplorer, psych, flextable)
#| label: dis_binom

x_bin <- seq(0,200, by=1)  
y_dbib <- dbinom(x_bin, 200, 0.6)

datos_db <- data.frame(x_bin, y_dbib)

0,6 es una probabilidad a priori sobre algo que se supone o de lo que existe cierta creencia.

#| label: graf

ggplot(datos_db, aes(x= x_bin, y=y_dbib))+
  geom_line(colour="blue")+
  ggtitle("Función binomial de densidad")+
  theme_minimal()

#| label: graf
#| label: fig-graf_dbin
#| fig-cap: "Función de densidad de la distribución binomial"

ggplot(datos_db, aes(x= x_bin, y=y_dbib))+
  geom_line(colour="blue")+
  ggtitle("Función binomial de densidad")+
  theme_minimal()

###Distribución de Densidad acumulada

z_pbinom <-  pbinom(x_bin, 200, prob= 0.6)
datos_pbin <- data.frame(x_bin, z_pbinom)
ggplot(datos_pbin, aes(x=x_bin, y=z_pbinom))+
  geom_line(colour="blue")+
ggtitle("Función Binomial Acumulada")

#label: dis_normal 

n<- seq(-4,4,0.1)

dat_n <- data.frame(n=n, densidad= dnorm(n,0,1), distrib= pnorm(n,0,1)) 

#Taller II

Librerías

pacman:: p_load(tidyverse, ggplot2)

Probabilidades - Taller 2

Ejercicio 1

Una reserva natural boscosa cuenta con 13 plataformas de observación de aves repartidas en una gran extensión de terreno. Los naturalistas afirman que, en un momento dado, hay un 75 por ciento de posibilidades de ver aves en cada plataforma.

Suponga que recorre la reserva y visita cada plataforma. Si se supone que se cumplen todas las condiciones pertinentes.Sea X una variable aleatoria binomial que represente el número total número total de plataformas en las que se ven aves.

a. Visualice la función de masa de probabilidad de la distribución binomial de interés.

x_bin1a <- seq(1,13, by=1)
y_dbin1a <- dbinom(x_bin1a, 13, 0.75)   #la probabilidad de cada x
Preg1a <- data.frame(x_bin1a, y_dbin1a)
ggplot(Preg1a, aes(x=x_bin1a, y=y_dbin1a))+
  geom_area()

Figure 1: Función de masa de probabilidad de la distribución binomial

En la Figure 1 se visualiza la función de masa de probabilidad de la distribución binomial de interés

b. ¿Cuál es la probabilidad de ver aves en todos los sitios?

Preg1b <- dbinom(13,13,0.75) #Probabilidad punto
Preg1b <- round(Preg1b,2)
Preg1b
[1] 0.02

La probabilidad de ver aves en todos los sitios es 0.02

c. ¿Cuál es la probabilidad de ver aves en más de 9 plataformas?

Preg1c <- 1- pbinom(9, 13, 0.75) 
#Esta sería la probabilidad del área hasta 9, por eso se resta de uno
Preg1c <- round(Preg1c, 2)
Preg1c
[1] 0.58

La probabilidad de ver aves en más de 9 plataformas sería 0.58

d. ¿Cuál es la probabilidad de ver aves en entre 8 y 11 plataformas (inclusive)? Confirma tu respuesta utilizando sólo la función función d y, a continuación, utilizando sólo la función p.

#utilizando la función d
Preg1d_8 <- dbinom(8,13,0.75) #Probabilidad punto
Preg1d_9 <- dbinom(9,13,0.75)
Preg1d_10 <- dbinom(10,13,0.75)
Preg1d_11 <- dbinom(11,13,0.75)

Preg1d_d <- sum(Preg1d_8, Preg1d_9, Preg1d_10, Preg1d_11)
Preg1d_d 
[1] 0.793082
#usando la función p
Preg1d_p8 <- pbinom(7, 13, 0.75) #7 o menos plataformas
Preg1d_p11 <- pbinom(11, 13, 0.75) #11 o menos plataformas
Preg1d_p <- Preg1d_p11-Preg1d_p8
Preg1d_p
[1] 0.793082

La probabilidad de ver aves entre 8 y 11 plataformas inclusive sería 0.79 usando la función d. Utilizando la función p, el resultado sería 0.79.

e. Digamos que, antes de tu visita, decides que, si ves aves en menos de 9 sitios, hará una escena y exigirá que le devuelvan el dinero de la entrada. ¿Cuál es la probabilidad de que te pongas en evidencia de esta manera?

Preg1e <- pbinom(8, 13, 0.75)

La probabilidad de ver en menos de 9 sitios y hacer una escena es de *r round(Preg1e, 2).

f. Simule realizaciones de X que representen 10 visitas diferentes a la reserva; guarda el vector resultante como un objeto.

set.seed(4042)
x_visitas <- rbinom(10, 13, 0.75)
x_visitas
 [1]  9  7 12 11 11  8 10  9 12  5

g. Calcule la media y la desviación estándar de la distribución de interés.

mean(x_visitas)
[1] 9.4
sd(x_visitas)
[1] 2.270585

Ejercicio 2

Todos los sábados, a la misma hora, un individuo se sitúa al lado de una carretera y cuenta el número de coches que pasan en un intervalo de 120 minutos. Basándose en sus conocimientos previos, cree que la media del número de coches que pasan durante ese tiempo es exactamente 107. Dejemos que X represente la variable aleatoria de Poisson apropiada del número de coches que pasan por su posición en cada sesión del sábado.

a. ¿Cuál es la probabilidad de que le pasen más de 100 coches en un sábado?

#media= 107
#intevalo= 120

#| Distribución de Poisson
#q = 100
#lambda = 107

preg2a <- 1- ppois(100, 107)
preg2a
[1] 0.7319128

La probabilidad de que le pasen más de 100 coches en un sábado es 0.73

b. Determina la probabilidad de que no pase ningún coche.

preg2b <- dpois(0, 107)
preg2b
[1] 3.39227e-47

La probabilidad de que no pase ningún coche es 0

c. Traza la función de masa de Poisson correspondiente sobre los valores en 60 ≤ x ≤ 150.

x <- 60:150
pmf <- dpois(x, 107)
plot(x, pmf, type = "h", lwd = 3, col = "blue",
     xlab = "Número de coches que pasan en un sábado", 
     ylab = "Probabilidad",
     main = "Función de masa de probabilidad de Poisson")

El resultado es una gráfica con la función de masa de probabilidad de Poisson que muestra la probabilidad de que ocurran diferentes números de coches que pasan en un sábado, dado que la media del número de coches es 107. La gráfica muestra que la probabilidad máxima ocurre alrededor del valor medio de 107, y la probabilidad disminuye rápidamente para valores más grandes o más pequeños.

d. Simule 260 resultados a partir de esta distribución (unos cinco años de sesiones semanales de control los sábados). Trace los resultados simulados utilizando hist; utilice xlim para establecer los límites horizontales de 60 a 150. Compare su histograma con la forma de su función de masa de (c).

set.seed(4042)  
# Establecemos una semilla para poder reproducir los resultados
simulaciones <- rpois(260, lambda = 107)  # Simulamos 260 resultados

# Graficamos el histograma de los resultados simulados
hist(simulaciones, xlim = c(60, 150), breaks = 30,
     xlab = "Número de coches que pasan en un sábado",
     ylab = "Frecuencia",
     main = "Histograma de resultados simulados")

El resultado es un histograma que muestra la frecuencia de los resultados simulados. Podemos ver que la forma del histograma se asemeja a la forma de la función de masa de probabilidad de Poisson que graficamos en el apartado (c), con una mayor frecuencia alrededor del valor medio de 107 y una disminución en la frecuencia para valores más grandes o más pequeños. Esto es consistente con la distribución de Poisson, que se caracteriza por tener una forma similar a una campana sesgada hacia la derecha.

#a. ¿Cuál es la probabilidad de que le pasen más de 100 coches en un sábado?

set.seed(120)
prob <- dnorm(17,4.5)
prob20 <- (1- pnorm(20, mean=17,sd=4.5))
prob20
[1] 0.2524925

#ii. ¿Cuál es la probabilidad de que un estudiante tarde entre 5 y 10 minutos en terminar la pregunta?

test <- pnorm(4,99, 17, 4.5)
test2 <-  pnorm(10,17,4.5)
test3= test2-test
test3
[1] 0.0599069

#iii. Encuentre el tiempo que marca el 10 por ciento más lento de estudiantes

p33 <- qnorm(0.10, 17,4.5)
p33
[1] 11.23302

#iv. Trazar la distribución normal de interés entre ±4 s y sombra en el área de probabilidad de (iii), el 10 por ciento más lento de los estudiantes.

p33 <- qnorm(0.10, 17,4.5) p33

Ejercicio 3

Un tutor sabe que el tiempo que tardan los estudiantes de primer curso de estadística en completar una determinada pregunta de estadística, X, se distribuye normalmente con una media de 17 minutos y una desviación estándar de 4,5 minutos.

i. ¿Cuál es la probabilidad de que un estudiante universitario seleccionado al azar tarda más de 20 minutos en completar la pregunta?

#distribucion normal
#media = 17mins
#sd = 4.5mins

preg3i <- 1- pnorm(20,mean=17, sd=4.5)
preg3i
[1] 0.2524925

La probabilidad de que un estudiante universitario seleccionado al azar tarde más de 20 minutos es 0.25

ii. ¿Cuál es la probabilidad de que un estudiante tarde entre 5 y 10 minutos en terminar la pregunta?

preg3ii_4 <- pnorm(5, mean=17, sd=4.5)
preg3ii_10 <- pnorm(10, mean=17, sd=4.5)
preg3ii <- preg3ii_10 - preg3ii_4
preg3ii
[1] 0.05607653

La probabilidad de que un estudiante tarde entre 5 y 10 minutos es 0.06

#iii. Encuentre el tiempo que marca el 10 por ciento más lento de estudiantes

p33 <- qnorm(0.10, 17,4.5)
p33
[1] 11.23302

#iv. Trazar la distribución normal de interés entre ±4 s y sombra en el área de probabilidad de (iii), el 10 por ciento más lento de los estudiantes.