library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(titanic)
library(gapminder)
library(tidyverse)
## -- Attaching packages ------------------------------------------- tidyverse 1.2.1 --
## v tibble 1.4.2 v purrr 0.2.5
## v tidyr 0.8.1 v stringr 1.3.1
## v readr 1.1.1 v forcats 0.3.0
## -- Conflicts ---------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
df <- dplyr::bind_rows(titanic::titanic_train,
titanic::titanic_test)
glimpse(df)
## Observations: 1,309
## Variables: 12
## $ PassengerId <int> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,...
## $ Survived <int> 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0,...
## $ Pclass <int> 3, 1, 3, 1, 3, 3, 1, 3, 3, 2, 3, 1, 3, 3, 3, 2, 3,...
## $ Name <chr> "Braund, Mr. Owen Harris", "Cumings, Mrs. John Bra...
## $ Sex <chr> "male", "female", "female", "female", "male", "mal...
## $ Age <dbl> 22, 38, 26, 35, 35, NA, 54, 2, 27, 14, 4, 58, 20, ...
## $ SibSp <int> 1, 1, 0, 1, 0, 0, 0, 3, 0, 1, 1, 0, 0, 1, 0, 0, 4,...
## $ Parch <int> 0, 0, 0, 0, 0, 0, 0, 1, 2, 0, 1, 0, 0, 5, 0, 0, 1,...
## $ Ticket <chr> "A/5 21171", "PC 17599", "STON/O2. 3101282", "1138...
## $ Fare <dbl> 7.2500, 71.2833, 7.9250, 53.1000, 8.0500, 8.4583, ...
## $ Cabin <chr> "", "C85", "", "C123", "", "", "E46", "", "", "", ...
## $ Embarked <chr> "S", "C", "S", "S", "S", "Q", "S", "S", "S", "C", ...
unknown <- filter(df, is.na(Survived))
Por Nicolás Cortés, Claudia Rojas y Constanza Cabrera
El trasatlántico británico “RMS Titanic” naufragó al cuarto día de su viaje inaugural generando un impacto mundial debido a la magnitud de la tragedia. El barco inició su travesía con 1309 pasajeros a bordo que zarparon desde Southampton (Inglaterra) en dirección a la ciudad de Nueva York en Estados Unidos, sin embargo, el Titanic se hundió en las aguas del Atlántico Norte tras chocar con un iceberg.
Entre sus pasajeros figuraban personas extremadamente ricas, además de cientos de inmigrantes irlandeses, británicos, entre otros, que iban en busca de una mejor vida en el “nuevo continente”. Los pasajeros a bordo estaban clasificados de acuerdo con su respectiva clase social, separados por 3 niveles en orden descendente.
Tras el fatal accidente, 549 personas murieron, en su mayoría de tercera clase, solo 342 pasajeros sobrevivieron y aún hay 418 personas de las que se desconoce su paradero.
ggplot(unknown) +
geom_bar(aes(x = Pclass, fill = factor(Pclass)), colour = "black") +
labs(
title = "Total de pasajeros desaparecidos",
subtitle="El gráfico informa sobre la capacidad económica de los pasajeros desaparecidos
a bordo de la embarcación",
caption = "Titanic Passenger Survival Data Set",
x = NULL,
y = "Cantidad de Pasajeros") +
scale_fill_discrete(name = "Clase\npasajero", breaks = c(1, 2, 3), c("Primera", "Segunda", "Tercera")) +
facet_wrap(~ Sex) +
theme_bw()
Del total de los pasajeros desaparecidos, quienes lideran las cifras son hombres y mujeres que adquirieron su ticket en tercera clase, es decir, aquellos que poseen menores ingresos. Los hombres de la tercera clase lideran las cifras llegando casi a los 150, superando ampliamente a las mujeres.
ggplot(unknown) +
geom_boxplot(aes(x = Sex, y = Age, fill = factor(Pclass))) +
facet_wrap(~ Pclass)+ labs(
title = "Pasajeros a bordo del Titanic",
subtitle="El siguiente gráfico es una comparación de los pasajeros cuyo estado es desconocido
por edad, sexo y clase de ticket que adquirieron",
caption = "Titanic Passenger Survival Data Set",
x = "Pasajeros",
y = "Edad de las personas",
colour = "si su gráfico tiene un atributo color pueden cambiar la leyenda con esto") +
scale_fill_discrete(name = "Clase\npasajero", breaks = c(1, 2, 3), c("Primera", "Segunda", "Tercera")) +
theme_bw()
## Warning: Removed 86 rows containing non-finite values (stat_boxplot).
En cuanto a los pasajeros de la primera clase, las mujeres desaparecidas entre los 29 y 55 años obtuvieron las cifras más elevadas, con un promedio de 41 años. En cuanto a los hombres reportaron mayor desaparición entre las edades de 30 y 50 años, teniendo un promedio de 45 años.
Por otra parte, dentro de los pasajeros no identificados pertenecientes a la segunda clase, las mujeres tenían una edad que bordeaba los 19 y 30 años y un promedio de 25 años. En el caso de los hombres del mismo grupo, ellos se concentraron entre los 25 años hasta los 40 años, presentando un promedio de 28 años.
Finalmente en los pasajeros de la tercera clase, las mujeres tenían una edad entre 18 a 30 años, con un promedio de pasajeras que bordea los 23 años. En el caso de los hombres, la estadística arroja que la edad de los pasajeros es de 20 a los 30 años, con un promedio de 25 años.
ggplot(unknown) +
geom_histogram(mapping = aes(x = Fare), fill = "violet", colour = "black") + labs(
title = "Dinero desembolsado en el ticket de ingreso",
subtitle="El gráfico informa sobre la tarifa de los tickets a los que
tuvieron acceso las personas desaparecidas a bordo del Titanic",
caption = "Titanic Passanger Survival Data Set",
x = "Tarifa de los tickets",
y = "Pasajeros desaparecidos",
colour = "si su gráfico tiene un atributo color pueden cambiar la leyenda con esto" +
theme_bw()
)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 1 rows containing non-finite values (stat_bin).
En el tercer gráfico se aprecia que la mayoría de los pasajeros desaparecidos pagaron un ticket que fluctuó entre los 0 a las 100 libras esterlinas, quienes fueron alrededor de 400 de los 418 desaparecidos, lo que representa el 96% del total de los pasajeros.
Las autoridades lideradas por el agente especial John Winterbotton, del Departamento de Victimas Especiales del FBI, se encuentran pesquisando el paradero de los pasajeros desaparecidos, cuyos restos todavía son reclamados por los familiares más cercanos.