El RMS Titanic fue un transatlántico británico, el mayor barco de pasajeros del mundo en el momento de su terminación, que se hundió en la noche del 14 a la madrugada del 15 de abril de 1912 durante su viaje inaugural desde Southampton a Nueva York. En el hundimiento del Titanic murieron 1514 personas de las 2223 que iban a bordo, lo que convierte a esta tragedia en uno de los mayores naufragios de la historia ocurridos en tiempo de paz. Construido entre 1909 y 1912 en el astillero Harland and Wolff de Belfast, el Titanic era el segundo de los tres transatlánticos que formaban la clase Olympic, propiedad de la naviera White Star Line, junto al RMS Olympic y, posteriormente, el HMHS Britannic.
Id
Sobrevivió : 1=Si, 0=no
Clase de pasajeros : 1=Superior, 2=Mediana or 3=Baja
Nombre
Sexo : female= mujer, male=hombre
Años
Número de hermanos / cónyuges en el extranjero
Número de padres / niños a bordo
Número de Ticket
Tarifa de pasajeros
Cabina
Puerto o embarcación: C = Cherbourg, Q = Queenstown, S = Southampton
Cantidad de sobrevivientes (0= murió, 1= vivió)
train$Survived <- as.factor(train$Survived)
table(train$Survived)
##
## 0 1
## 549 342
Cantidad de pasajeros por clase (1=Superior, 2=Mediana or 3=Baja)
table(train$Pclass)
##
## 1 2 3
## 216 184 491
Cantaidad de pasajeros.
## [1] 891
Cantidad de hombre y mujeres
train$Sex <- as.factor(train$Sex)
table(train$Sex)
##
## female male
## 314 577
table(train$Sex, train$Survived)
##
## 0 1
## female 81 233
## male 468 109
Número de hermanos / cónyuges en el extranjero
train$SibSp <- as.factor(train$SibSp)
table(train$SibSp)
##
## 0 1 2 3 4 5 8
## 608 209 28 16 18 5 7
Parch “Parche Número de Padres / Niños a bordo”
train$Parch <- as.factor(train$Parch)
table(train$Parch)
##
## 0 1 2 3 4 5 6
## 678 118 80 5 4 5 1
Cantidad de tickets únicos.
length(unique(train$Ticket))
## [1] 681
Embarked (C = Cherbourg; Q = Queenstown; S = Southampton)
train$Embarked <- as.factor(train$Embarked)
table(train$Embarked)
##
## C Q S
## 2 168 77 644
Sobrevivientes
summary(train$Survived)
## 0 1
## 549 342
Clase (1=Superior, 2=Medio or 3=Baja)
summary(train$Pclass)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 3.000 2.309 3.000 3.000
Total de personas a bordo del Titanic
## Length Class Mode
## 891 character character
Sexo de los pasajeros (female=mujer, male=hombre)
summary(train$Sex)
## female male
## 314 577
Número de hermanos / cónyuges en el extranjero
summary(train$SibSp)
## 0 1 2 3 4 5 8
## 608 209 28 16 18 5 7
Parche Número de Padres / Niños a bordo
summary(train$Parch)
## 0 1 2 3 4 5 6
## 678 118 80 5 4 5 1
Ticket Entre los 891 boletos de embarque, había pasajeros compartiendo el mismo boleto, con los nombres de los 39 pasajeros mostrados abajo.
shareTix <- train[train$Ticket %in% names(table(train$Ticket))[table(train$Ticket) > 5],]
shareTix[order(shareTix$Ticket),]$Name
## [1] "Bing, Mr. Lee"
## [2] "Ling, Mr. Lee"
## [3] "Lang, Mr. Fang"
## [4] "Foo, Mr. Choong"
## [5] "Lam, Mr. Ali"
## [6] "Lam, Mr. Len"
## [7] "Chip, Mr. Chang"
## [8] "Panula, Master. Juha Niilo"
## [9] "Panula, Master. Eino Viljami"
## [10] "Panula, Mr. Ernesti Arvid"
## [11] "Panula, Mrs. Juha (Maria Emilia Ojala)"
## [12] "Panula, Mr. Jaako Arnold"
## [13] "Panula, Master. Urho Abraham"
## [14] "Andersson, Mr. Anders Johan"
## [15] "Andersson, Miss. Ellis Anna Maria"
## [16] "Andersson, Miss. Ingeborg Constanzia"
## [17] "Andersson, Miss. Sigrid Elisabeth"
## [18] "Andersson, Mrs. Anders Johan (Alfrida Konstantia Brogren)"
## [19] "Andersson, Miss. Ebba Iris Alfrida"
## [20] "Andersson, Master. Sigvard Harald Elias"
## [21] "Skoog, Master. Harald"
## [22] "Skoog, Mrs. William (Anna Bernhardina Karlsson)"
## [23] "Skoog, Mr. Wilhelm"
## [24] "Skoog, Miss. Mabel"
## [25] "Skoog, Miss. Margit Elizabeth"
## [26] "Skoog, Master. Karl Thorsten"
## [27] "Goodwin, Master. William Frederick"
## [28] "Goodwin, Miss. Lillian Amy"
## [29] "Goodwin, Master. Sidney Leonard"
## [30] "Goodwin, Master. Harold Victor"
## [31] "Goodwin, Mrs. Frederick (Augusta Tyler)"
## [32] "Goodwin, Mr. Charles Edward"
## [33] "Sage, Master. Thomas Henry"
## [34] "Sage, Miss. Constance Gladys"
## [35] "Sage, Mr. Frederick"
## [36] "Sage, Mr. George John Jr"
## [37] "Sage, Miss. Stella Anna"
## [38] "Sage, Mr. Douglas Bullen"
## [39] "Sage, Miss. Dorothy Edith \"Dolly\""
Edades de pasajeros (Años)
boxplot(train$Age, xlab="Edades de pasajeros (Años)")
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.42 20.12 28.00 29.70 38.00 80.00
## [1] 28
Histograma de la edad.
Al revisar este histograma, lo que nos indica es que mas del 60% de las personas tenían menos de 40 años, así como, la mayor cantidad de personas tenían entre 20 a 30 años de edad respecto a las otras columnas.
Cuartiles y rango intercuartil de la edad.
Se puede denotar aquí que el 50 % de las personas está entre los 20 años y los 38, es donde esta la mayor concentración de las personas que iban en el Titanic.Además, la persona con menos edad era un bebé de aproximadamente 5 meses, y la persona con más edad era una persona de 80 años
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.42 20.12 28.00 29.70 38.00 80.00
## [1] 17.875
Cuartiles y rango intercuartil de la tarifa.
Se puede denotar aquí que el 50 % de las personas pagaron una tarifa entre 7.91 y 31.00 en la moneda que se haya pagado. Además, existieron personas que no pagaron ni un solo centavo, se subieron gratis, y otra persona que pagó 512.30 que fue la que dió más.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 7.91 14.45 32.20 31.00 512.30
## [1] 23.0896
Correlación: Correspondencia o relación recíproca entre dos o más acciones o fenómenos.
Correlación entre la edad y la tarifa.
Al observar esta correlación entre estos dos datos, se puede observar que tienen una ligera correlación, por lo que al aumentar una, ligera, muy ligeramente aumentará la otra. Se omitieron los nulos en esta operación.
## [1] 0.09606669
La Gráfica de dispersión de la edad con respecto a la Tarifa.
Como se puede apreciar en la correlación que tienen estás dos variables, tienen una relación positiva muy baja, por lo que nos indica que si la edad aumenta, la tarifa aumenta relativamente poco.
Representación de la clase con respecto a los sobrevivientes/muertos de cada una.
En la gráfica se puede observar que la mayor cantidad de personas que se salvaron fueron los de la clase 1, que casi se salvaron alrededor de 3/5, por lo que si eras de la clase 1 tenías muchas más probabilidades de salvarte.
Por el lado contrario, los que más se murieron fueron los de la clase 3, muriendo casi el 80 %, lo que quiere decir que si eras de clase 3 tenías pocas probabilidades de sobrevivir.
La clase 2 en su defecto fue la más balaceada, casi sobrevivieron la misma cantidad que murieron.
Representación de el sexo con respecto a los sobrevivientes.
Lo que se puede observar en la gráfica, es que la mayoría de los hombres se sacrificaron para salvar a casi el 80 % de las mujeres, gracias a tener una postura machista, esto sucedió.
Representación de los sobrevivientes con respecto a la embarcación que subieron abordo del barco.
Al observar la gráfica la mayor parte de los que se subieron en la embarcación de Cherbourg sobrevivieron, por que se tenía más probabilidad de sobrevivir, aunque la mayoría de las personas se subieron en la embarcación de Southampton, fueron menos personas las que sobrevivieron con respecto al porcentaje original de las personas que se subieron en esa embarcación, por lo que si te subiste en esta embarcación, quizás tenías menos probabilidad de sobrevivir.