Ejercicio 1
En la base de datos nycflights23::flights se registra el
número de minutos de retraso al despegar en la columna
dep_delay.
Considere la variable aleatoria \[ X = \text{“número de minutos de retraso al despegar de un vuelo”}. \]
dep_delay.# Cargar paquete (solo si va a usar %>%)
library(dplyr)
# 1) Renombrar y limpiar base de datos
BD <- NOMBRE_BASE %>%
filter(!is.na(NOMBRE_COLUMNA))
# 2) Calcular la suma total de la columna
suma_total <- sum(BD$NOMBRE_COLUMNA)
# 3) Mostrar el resultado
suma_total
Ejercicio 2
En la base de datos nycflights23::flights se registra el
número de minutos de retraso al aterrizar en la columna
arr_delay.
Considere la variable aleatoria
\[ X = \text{“número de minutos de retraso al aterrizar de un vuelo”}. \]
arr_delay.# 1) Renombrar y limpiar base de datos
BD <- NOMBRE_BASE %>%
filter(!is.na(NOMBRE_COLUMNA))
# 2) Calcular la suma total de la columna
suma_total <- sum(BD$NOMBRE_COLUMNA)
# 3) Mostrar el resultado
suma_total
Ejercicio 3
En la base de datos nycflights23::flights se registra,
para cada vuelo, el aeropuerto (columna origin), el número
de minutos de retraso al despegar (columna dep_delay) y el
número de minutos de retraso al aterrizar (columna
arr_delay).
Considere las variables aleatorias \[ X = \text{“número de minutos de retraso al despegar de un vuelo”} \] \[ Y = \text{“número de minutos de retraso al aterrizar de un vuelo”}. \]
# 1) Renombrar y limpiar base de datos
BD <- NOMBRE_BASE %>%
filter(!is.na(NOMBRE_COL_GRUPO), # por ejemplo, origin
!is.na(NOMBRE_COL_DEP), # por ejemplo, dep_delay
!is.na(NOMBRE_COL_ARR)) # por ejemplo, arr_delay
# 2) Calcular los promedios por grupo (por ejemplo, por aeropuerto)
resumen <- BD %>%
group_by(NOMBRE_COL_GRUPO) %>% # agrupar por aeropuerto
summarise(
prom_dep = mean(NOMBRE_COL_DEP), # promedio retraso al despegar
prom_arr = mean(NOMBRE_COL_ARR) # promedio retraso al aterrizar
) %>%
mutate(
diferencia = prom_arr - prom_dep # diferencia de promedios (aterrizar - despegar)
)
# 3) Mostrar la tabla resumen
resumen
Ejercicio 4
En la base de datos nycflights23::flights se registra,
para cada vuelo, el número de minutos de retraso al despegar (por
ejemplo, en la columna dep_delay) y el número de minutos de
retraso al aterrizar (por ejemplo, en la columna
arr_delay).
Considere las variables aleatorias
\[ X = \text{“nnúmero de minutos de retraso al despegar de un vuelo”} \]
\[ X = \text{“número de minutos de retraso al aterrizar de un vuelo”} \]
Definimos además la variable
\[ D = Y - X \] donde \(D\) representa la diferencia entre el número de minutos de retraso al aterrizar y al despegar de un vuelo.
# 1) Renombrar y limpiar base de datos
BD <- NOMBRE_BASE %>%
filter(!is.na(NOMBRE_COL_DEP), # por ejemplo, dep_delay
!is.na(NOMBRE_COL_ARR)) # por ejemplo, arr_delay
# 2) Crear nueva columna con la diferencia de retrasos (aterrizar - despegar)
BD <- BD %>%
mutate(
DIF_RETRASO = NOMBRE_COL_ARR - NOMBRE_COL_DEP
# Por ejemplo: DIF_RETRASO = arr_delay - dep_delay
)
# 3) Calcular la media de la diferencia de retrasos
media_dif <- mean(BD$DIF_RETRASO)
# 4) Mostrar el resultado
media_dif
Ejercicio 4
En la base de datos nycflights23::flights se registra,
para cada vuelo, el número de minutos de retraso al despegar (columna
dep_delay) y el número de minutos de retraso al aterrizar
(columna arr_delay).
Considere las variables aleatorias \[ X = \text{“número de minutos de retraso al despegar de un vuelo”\ \] \[ Y = \text{“número de minutos de retraso al aterrizar de un vuelo”}. \]
# Cargar paquete (solo si va a usar %>%)
library(dplyr)
# 1) Renombrar y limpiar base de datos
BD <- NOMBRE_BASE %>%
filter(!is.na(NOMBRE_COL_DEP),
!is.na(NOMBRE_COL_ARR))
# 2) Probabilidades empíricas para el retraso al despegar (X)
p_X_pos <- mean(BD$NOMBRE_COL_DEP > 0) # P(X > 0): prob. de despegar con retraso
p_X_neg <- mean(BD$NOMBRE_COL_DEP < 0) # P(X < 0): prob. de despegar adelantado
# 3) Probabilidades empíricas para el retraso al aterrizar (Y)
p_Y_pos <- mean(BD$NOMBRE_COL_ARR > 0) # P(Y > 0): prob. de aterrizar con retraso
p_Y_neg <- mean(BD$NOMBRE_COL_ARR < 0) # P(Y < 0): prob. de aterrizar adelantado
# 4) Histogramas de X e Y
hist(BD$NOMBRE_COL_DEP,
main = "Histograma del retraso al despegar",
xlab = "Minutos de retraso al despegar")
hist(BD$NOMBRE_COL_ARR,
main = "Histograma del retraso al aterrizar",
xlab = "Minutos de retraso al aterrizar")
# 5) Mostrar probabilidades estimadas
p_X_pos; p_X_neg
p_Y_pos; p_Y_neg