Pregunta: Utilizando la base de datos
penguins
del paquete palmerpenguins
, calcula
la media, mediana y desviación estándar de la longitud del pico
(bill_length_mm
) de los pinguinos. Escribe el código en R
necesario para calcular estas estadísticas y discute cuál es la medida
más representativa si existen valores atípicos.
library(palmerpenguins)
# Calcular las estadísticas descriptivas
media_bill <- mean(penguins$bill_length_mm, na.rm = TRUE)
mediana_bill <- median(penguins$bill_length_mm, na.rm = TRUE)
sd_bill <- sd(penguins$bill_length_mm, na.rm = TRUE)
media_bill
## [1] 43.92193
mediana_bill
## [1] 44.45
sd_bill
## [1] 5.459584
Pregunta: Genera un histograma de la variable
bill_length_mm
para visualizar la distribución de la
longitud del pico de los pinguinos. Describe la forma de la
distribución.
library(ggplot2)
# Crear histograma
ggplot(penguins, aes(x = bill_length_mm)) +
geom_histogram(binwidth = 2, fill = "blue", color = "black") +
labs(title = "Histograma de la Longitud del Pico de los Pinguinos",
x = "Longitud del Pico (mm)",
y = "Frecuencia") +
theme_minimal()
## Warning: Removed 2 rows containing non-finite outside the scale range
## (`stat_bin()`).
Pregunta: Simula el lanzamiento de una moneda justa 100 veces. ¿Cuál es la probabilidad de obtener exactamente 60 caras? Escribe el código en R para realizar esta simulación y calcular la probabilidad.
set.seed(123)
# Simular el lanzamiento de la moneda 100 veces
lanzamientos <- rbinom(100, 1, 0.5)
# Calcular la probabilidad de obtener exactamente 60 caras
probabilidad_60_caras <- sum(lanzamientos == 1) / length(lanzamientos)
probabilidad_60_caras
## [1] 0.47
Pregunta: Considera un experimento donde lanzas dos dados al aire. ¿Cuál es la probabilidad de que la suma de los números obtenidos sea 7 dado que al menos uno de los dados muestra un 5? Escribe el código en R para calcular esta probabilidad condicional.
# Definir todos los posibles resultados de los dados
resultados <- expand.grid(dado1 = 1:6, dado2 = 1:6)
# Filtrar los casos donde la suma es 7
suma_siete <- resultados[rowSums(resultados) == 7, ]
# Filtrar los casos donde al menos uno es 5
al_menos_uno_cinco <- resultados[resultados$dado1 == 5 | resultados$dado2 == 5, ]
# Calcular la probabilidad condicional
prob_condicional <- nrow(suma_siete[suma_siete$dado1 == 5 | suma_siete$dado2 == 5, ]) / nrow(al_menos_uno_cinco)
prob_condicional
## [1] 0.1818182
Pregunta: Si lanzas una moneda justa 10 veces, ¿cuál es la probabilidad de obtener exactamente 7 caras? Escribe el código en R para calcular esta probabilidad utilizando la función adecuada.
# Calcular la probabilidad de obtener exactamente 7 caras en 10 lanzamientos
probabilidad_7_caras <- dbinom(7, size = 10, prob = 0.5)
probabilidad_7_caras
## [1] 0.1171875
Pregunta: Simula 1000 lanzamientos de una moneda justa. Calcula la proporción de caras obtenidas en el experimento y compara este valor con la probabilidad teórica. Escribe el código en R para la simulación y el análisis.
set.seed(123)
# Simular 1000 lanzamientos de la moneda
lanzamientos <- rbinom(1000, 1, 0.5)
# Calcular la proporción de caras
proporcion_caras <- mean(lanzamientos)
proporcion_caras
## [1] 0.493
Pregunta: Considerando la longitud del pico de los
pinguinos (bill_length_mm
), toma muestras aleatorias de
tamaño 30 y calcula la media muestral de cada una. Repite este proceso
1000 veces. Grafica la distribución de las medias muestrales y comenta
sobre la forma de la distribución de estas medias. Escribe el código en
R para realizar este experimento.
set.seed(123)
# Tomar muestras aleatorias y calcular las medias
medias_muestrales <- replicate(1000, mean(sample(penguins$bill_length_mm, 30, replace = TRUE), na.rm = TRUE))
# Graficar la distribución de las medias muestrales
hist(medias_muestrales, breaks = 30, main = "Distribución de las Medias Muestrales",
xlab = "Media de la Longitud del Pico (mm)", col = "lightblue", border = "black")