Pregunta 1: Estadística Descriptiva (Pinguinos)

Pregunta: Utilizando la base de datos penguins del paquete palmerpenguins, calcula la media, mediana y desviación estándar de la longitud del pico (bill_length_mm) de los pinguinos. Escribe el código en R necesario para calcular estas estadísticas y discute cuál es la medida más representativa si existen valores atípicos.

library(palmerpenguins)

# Calcular las estadísticas descriptivas
media_bill <- mean(penguins$bill_length_mm, na.rm = TRUE)
mediana_bill <- median(penguins$bill_length_mm, na.rm = TRUE)
sd_bill <- sd(penguins$bill_length_mm, na.rm = TRUE)

media_bill
## [1] 43.92193
mediana_bill
## [1] 44.45
sd_bill
## [1] 5.459584

Pregunta 2: Visualización de Datos (Pinguinos)

Pregunta: Genera un histograma de la variable bill_length_mm para visualizar la distribución de la longitud del pico de los pinguinos. Describe la forma de la distribución.

library(ggplot2)

# Crear histograma
ggplot(penguins, aes(x = bill_length_mm)) +
  geom_histogram(binwidth = 2, fill = "blue", color = "black") +
  labs(title = "Histograma de la Longitud del Pico de los Pinguinos",
       x = "Longitud del Pico (mm)",
       y = "Frecuencia") +
  theme_minimal()
## Warning: Removed 2 rows containing non-finite outside the scale range
## (`stat_bin()`).

Pregunta 3: Probabilidad con Lanzamiento de Moneda

Pregunta: Simula el lanzamiento de una moneda justa 100 veces. ¿Cuál es la probabilidad de obtener exactamente 60 caras? Escribe el código en R para realizar esta simulación y calcular la probabilidad.

set.seed(123)

# Simular el lanzamiento de la moneda 100 veces
lanzamientos <- rbinom(100, 1, 0.5)

# Calcular la probabilidad de obtener exactamente 60 caras
probabilidad_60_caras <- sum(lanzamientos == 1) / length(lanzamientos)

probabilidad_60_caras
## [1] 0.47

Pregunta 4: Probabilidad Condicional (Lanzamiento de Dados)

Pregunta: Considera un experimento donde lanzas dos dados al aire. ¿Cuál es la probabilidad de que la suma de los números obtenidos sea 7 dado que al menos uno de los dados muestra un 5? Escribe el código en R para calcular esta probabilidad condicional.

# Definir todos los posibles resultados de los dados
resultados <- expand.grid(dado1 = 1:6, dado2 = 1:6)

# Filtrar los casos donde la suma es 7
suma_siete <- resultados[rowSums(resultados) == 7, ]

# Filtrar los casos donde al menos uno es 5
al_menos_uno_cinco <- resultados[resultados$dado1 == 5 | resultados$dado2 == 5, ]

# Calcular la probabilidad condicional
prob_condicional <- nrow(suma_siete[suma_siete$dado1 == 5 | suma_siete$dado2 == 5, ]) / nrow(al_menos_uno_cinco)

prob_condicional
## [1] 0.1818182

Pregunta 5: Distribución Binomial (Lanzamiento de Moneda)

Pregunta: Si lanzas una moneda justa 10 veces, ¿cuál es la probabilidad de obtener exactamente 7 caras? Escribe el código en R para calcular esta probabilidad utilizando la función adecuada.

# Calcular la probabilidad de obtener exactamente 7 caras en 10 lanzamientos
probabilidad_7_caras <- dbinom(7, size = 10, prob = 0.5)

probabilidad_7_caras
## [1] 0.1171875

Pregunta 6: Ley de los Grandes Números (Lanzamiento de Moneda)

Pregunta: Simula 1000 lanzamientos de una moneda justa. Calcula la proporción de caras obtenidas en el experimento y compara este valor con la probabilidad teórica. Escribe el código en R para la simulación y el análisis.

set.seed(123)

# Simular 1000 lanzamientos de la moneda
lanzamientos <- rbinom(1000, 1, 0.5)

# Calcular la proporción de caras
proporcion_caras <- mean(lanzamientos)

proporcion_caras
## [1] 0.493

Pregunta 7: Teorema del Límite Central (Pinguinos)

Pregunta: Considerando la longitud del pico de los pinguinos (bill_length_mm), toma muestras aleatorias de tamaño 30 y calcula la media muestral de cada una. Repite este proceso 1000 veces. Grafica la distribución de las medias muestrales y comenta sobre la forma de la distribución de estas medias. Escribe el código en R para realizar este experimento.

set.seed(123)

# Tomar muestras aleatorias y calcular las medias
medias_muestrales <- replicate(1000, mean(sample(penguins$bill_length_mm, 30, replace = TRUE), na.rm = TRUE))

# Graficar la distribución de las medias muestrales
hist(medias_muestrales, breaks = 30, main = "Distribución de las Medias Muestrales",
     xlab = "Media de la Longitud del Pico (mm)", col = "lightblue", border = "black")