The Titanic (right), pictured on March 6, 1912

Contexto

El RMS Titanic fue un transatlántico británico, el mayor barco de pasajeros del mundo en el momento de su terminación, que se hundió en la noche del 14 a la madrugada del 15 de abril de 1912 durante su viaje inaugural desde Southampton a Nueva York. En el hundimiento del Titanic murieron 1514 personas de las 2223 que iban a bordo, lo que convierte a esta tragedia en uno de los mayores naufragios de la historia ocurridos en tiempo de paz. Construido entre 1909 y 1912 en el astillero Harland and Wolff de Belfast, el Titanic era el segundo de los tres transatlánticos que formaban la clase Olympic, propiedad de la naviera White Star Line, junto al RMS Olympic y, posteriormente, el HMHS Britannic.

Describir el domino de la información

Id

Sobrevivió : 1=Si, 0=no

Clase de pasajeros : 1=Superior, 2=Mediana or 3=Baja

Nombre

Sexo : female= mujer, male=hombre

Años

Número de hermanos / cónyuges en el extranjero

Número de padres / niños a bordo

Número de Ticket

Tarifa de pasajeros

Cabina

Puerto o embarcación: C = Cherbourg, Q = Queenstown, S = Southampton

Describir cada una de las variables.

Cantidad de sobrevivientes (0= murió, 1= vivió)

train$Survived <- as.factor(train$Survived)
table(train$Survived)
## 
##   0   1 
## 549 342

Cantidad de pasajeros por clase (1=Superior, 2=Mediana or 3=Baja)

table(train$Pclass)
## 
##   1   2   3 
## 216 184 491

Cantaidad de pasajeros.

## [1] 891

Cantidad de hombre y mujeres

train$Sex <- as.factor(train$Sex)
table(train$Sex)
## 
## female   male 
##    314    577
table(train$Sex, train$Survived)
##         
##            0   1
##   female  81 233
##   male   468 109

Número de hermanos / cónyuges en el extranjero

train$SibSp <- as.factor(train$SibSp)
table(train$SibSp)
## 
##   0   1   2   3   4   5   8 
## 608 209  28  16  18   5   7

Parch “Parche Número de Padres / Niños a bordo”

train$Parch <- as.factor(train$Parch)
table(train$Parch)
## 
##   0   1   2   3   4   5   6 
## 678 118  80   5   4   5   1

Cantidad de tickets únicos.

length(unique(train$Ticket))
## [1] 681
Embarked (C = Cherbourg; Q = Queenstown; S = Southampton)

Embarked (C = Cherbourg; Q = Queenstown; S = Southampton)

train$Embarked <- as.factor(train$Embarked)
table(train$Embarked)
## 
##       C   Q   S 
##   2 168  77 644

Estadisticas básicas de resumen.

Sobrevivientes

summary(train$Survived)
##   0   1 
## 549 342

Clase (1=Superior, 2=Medio or 3=Baja)

summary(train$Pclass)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.000   3.000   2.309   3.000   3.000

Total de personas a bordo del Titanic

##    Length     Class      Mode 
##       891 character character

Sexo de los pasajeros (female=mujer, male=hombre)

summary(train$Sex)
## female   male 
##    314    577

Número de hermanos / cónyuges en el extranjero

summary(train$SibSp)
##   0   1   2   3   4   5   8 
## 608 209  28  16  18   5   7

Parche Número de Padres / Niños a bordo

summary(train$Parch)
##   0   1   2   3   4   5   6 
## 678 118  80   5   4   5   1

Ticket Entre los 891 boletos de embarque, había pasajeros compartiendo el mismo boleto, con los nombres de los 39 pasajeros mostrados abajo.

shareTix <- train[train$Ticket %in% names(table(train$Ticket))[table(train$Ticket) > 5],]
shareTix[order(shareTix$Ticket),]$Name
##  [1] "Bing, Mr. Lee"                                            
##  [2] "Ling, Mr. Lee"                                            
##  [3] "Lang, Mr. Fang"                                           
##  [4] "Foo, Mr. Choong"                                          
##  [5] "Lam, Mr. Ali"                                             
##  [6] "Lam, Mr. Len"                                             
##  [7] "Chip, Mr. Chang"                                          
##  [8] "Panula, Master. Juha Niilo"                               
##  [9] "Panula, Master. Eino Viljami"                             
## [10] "Panula, Mr. Ernesti Arvid"                                
## [11] "Panula, Mrs. Juha (Maria Emilia Ojala)"                   
## [12] "Panula, Mr. Jaako Arnold"                                 
## [13] "Panula, Master. Urho Abraham"                             
## [14] "Andersson, Mr. Anders Johan"                              
## [15] "Andersson, Miss. Ellis Anna Maria"                        
## [16] "Andersson, Miss. Ingeborg Constanzia"                     
## [17] "Andersson, Miss. Sigrid Elisabeth"                        
## [18] "Andersson, Mrs. Anders Johan (Alfrida Konstantia Brogren)"
## [19] "Andersson, Miss. Ebba Iris Alfrida"                       
## [20] "Andersson, Master. Sigvard Harald Elias"                  
## [21] "Skoog, Master. Harald"                                    
## [22] "Skoog, Mrs. William (Anna Bernhardina Karlsson)"          
## [23] "Skoog, Mr. Wilhelm"                                       
## [24] "Skoog, Miss. Mabel"                                       
## [25] "Skoog, Miss. Margit Elizabeth"                            
## [26] "Skoog, Master. Karl Thorsten"                             
## [27] "Goodwin, Master. William Frederick"                       
## [28] "Goodwin, Miss. Lillian Amy"                               
## [29] "Goodwin, Master. Sidney Leonard"                          
## [30] "Goodwin, Master. Harold Victor"                           
## [31] "Goodwin, Mrs. Frederick (Augusta Tyler)"                  
## [32] "Goodwin, Mr. Charles Edward"                              
## [33] "Sage, Master. Thomas Henry"                               
## [34] "Sage, Miss. Constance Gladys"                             
## [35] "Sage, Mr. Frederick"                                      
## [36] "Sage, Mr. George John Jr"                                 
## [37] "Sage, Miss. Stella Anna"                                  
## [38] "Sage, Mr. Douglas Bullen"                                 
## [39] "Sage, Miss. Dorothy Edith \"Dolly\""

Boxplots. Interpretation.

Edades de pasajeros (Años)

boxplot(train$Age, xlab="Edades de pasajeros (Años)")

Inclinación de los datos. Interpretación.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.42   20.12   28.00   29.70   38.00   80.00
## [1] 28

Histogramas.

Histograma de la edad.

Al revisar este histograma, lo que nos indica es que mas del 60% de las personas tenían menos de 40 años, así como, la mayor cantidad de personas tenían entre 20 a 30 años de edad respecto a las otras columnas.

Cuartiles.

Cuartiles y rango intercuartil de la edad.

Se puede denotar aquí que el 50 % de las personas está entre los 20 años y los 38, es donde esta la mayor concentración de las personas que iban en el Titanic.Además, la persona con menos edad era un bebé de aproximadamente 5 meses, y la persona con más edad era una persona de 80 años

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.42   20.12   28.00   29.70   38.00   80.00
## [1] 17.875

Cuartiles y rango intercuartil de la tarifa.

Se puede denotar aquí que el 50 % de las personas pagaron una tarifa entre 7.91 y 31.00 en la moneda que se haya pagado. Además, existieron personas que no pagaron ni un solo centavo, se subieron gratis, y otra persona que pagó 512.30 que fue la que dió más.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    7.91   14.45   32.20   31.00  512.30
## [1] 23.0896

Correlación

Correlación: Correspondencia o relación recíproca entre dos o más acciones o fenómenos.

Correlación entre la edad y la tarifa.

Al observar esta correlación entre estos dos datos, se puede observar que tienen una ligera correlación, por lo que al aumentar una, ligera, muy ligeramente aumentará la otra. Se omitieron los nulos en esta operación.

## [1] 0.09606669

Gráficos de dispersión.

La Gráfica de dispersión de la edad con respecto a la Tarifa.

Como se puede apreciar en la correlación que tienen estás dos variables, tienen una relación positiva muy baja, por lo que nos indica que si la edad aumenta, la tarifa aumenta relativamente poco.

Gráficos Aparte.

Representación de la clase con respecto a los sobrevivientes/muertos de cada una.

En la gráfica se puede observar que la mayor cantidad de personas que se salvaron fueron los de la clase 1, que casi se salvaron alrededor de 3/5, por lo que si eras de la clase 1 tenías muchas más probabilidades de salvarte.

Por el lado contrario, los que más se murieron fueron los de la clase 3, muriendo casi el 80 %, lo que quiere decir que si eras de clase 3 tenías pocas probabilidades de sobrevivir.

La clase 2 en su defecto fue la más balaceada, casi sobrevivieron la misma cantidad que murieron.

Representación de el sexo con respecto a los sobrevivientes.

Lo que se puede observar en la gráfica, es que la mayoría de los hombres se sacrificaron para salvar a casi el 80 % de las mujeres, gracias a tener una postura machista, esto sucedió.

Representación de los sobrevivientes con respecto a la embarcación que subieron abordo del barco.

Al observar la gráfica la mayor parte de los que se subieron en la embarcación de Cherbourg sobrevivieron, por que se tenía más probabilidad de sobrevivir, aunque la mayoría de las personas se subieron en la embarcación de Southampton, fueron menos personas las que sobrevivieron con respecto al porcentaje original de las personas que se subieron en esa embarcación, por lo que si te subiste en esta embarcación, quizás tenías menos probabilidad de sobrevivir.