15 de abril de 1912

Importar base de datos

#file.choose

bd<- read.csv("/Users/mac/Downloads/titanic.csv")

Entender base de datos

summary(bd)
##      pclass         survived         name               sex           
##  Min.   :1.000   Min.   :0.000   Length:1309        Length:1309       
##  1st Qu.:2.000   1st Qu.:0.000   Class :character   Class :character  
##  Median :3.000   Median :0.000   Mode  :character   Mode  :character  
##  Mean   :2.295   Mean   :0.382                                        
##  3rd Qu.:3.000   3rd Qu.:1.000                                        
##  Max.   :3.000   Max.   :1.000                                        
##                                                                       
##       age              sibsp            parch          ticket         
##  Min.   : 0.1667   Min.   :0.0000   Min.   :0.000   Length:1309       
##  1st Qu.:21.0000   1st Qu.:0.0000   1st Qu.:0.000   Class :character  
##  Median :28.0000   Median :0.0000   Median :0.000   Mode  :character  
##  Mean   :29.8811   Mean   :0.4989   Mean   :0.385                     
##  3rd Qu.:39.0000   3rd Qu.:1.0000   3rd Qu.:0.000                     
##  Max.   :80.0000   Max.   :8.0000   Max.   :9.000                     
##  NA's   :263                                                          
##       fare            cabin             embarked             boat          
##  Min.   :  0.000   Length:1309        Length:1309        Length:1309       
##  1st Qu.:  7.896   Class :character   Class :character   Class :character  
##  Median : 14.454   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 33.295                                                           
##  3rd Qu.: 31.275                                                           
##  Max.   :512.329                                                           
##  NA's   :1                                                                 
##       body        home.dest        
##  Min.   :  1.0   Length:1309       
##  1st Qu.: 72.0   Class :character  
##  Median :155.0   Mode  :character  
##  Mean   :160.8                     
##  3rd Qu.:256.0                     
##  Max.   :328.0                     
##  NA's   :1188

Filtrar base de datos

 Titanic <- bd[,c("pclass", "age", "sex", "survived")]

 Titanic$survived <- as.factor(ifelse(Titanic$survived==0, "Murio", "Sobrevivió"))
 
 Titanic$pclass<- as.factor(Titanic$pclass)
 Titanic$sex<- as.factor(Titanic$sex)
 str(Titanic)
## 'data.frame':    1309 obs. of  4 variables:
##  $ pclass  : Factor w/ 3 levels "1","2","3": 1 1 1 1 1 1 1 1 1 1 ...
##  $ age     : num  29 0.917 2 30 25 ...
##  $ sex     : Factor w/ 2 levels "female","male": 1 2 1 2 1 2 1 2 1 2 ...
##  $ survived: Factor w/ 2 levels "Murio","Sobrevivió": 2 2 1 1 1 2 2 1 2 1 ...
 sum(is.na(Titanic)) 
## [1] 263
 Titanic <- na.omit(Titanic) 

Omitir NA

Titanic <- na.omit(Titanic)

Crear arbol de decisión

library(rpart)
arbol <-rpart(formula=survived~ ., data = Titanic)
arbol 
## n= 1046 
## 
## node), split, n, loss, yval, (yprob)
##       * denotes terminal node
## 
##  1) root 1046 427 Murio (0.59177820 0.40822180)  
##    2) sex=male 658 135 Murio (0.79483283 0.20516717)  
##      4) age>=9.5 615 110 Murio (0.82113821 0.17886179) *
##      5) age< 9.5 43  18 Sobrevivió (0.41860465 0.58139535)  
##       10) pclass=3 29  11 Murio (0.62068966 0.37931034) *
##       11) pclass=1,2 14   0 Sobrevivió (0.00000000 1.00000000) *
##    3) sex=female 388  96 Sobrevivió (0.24742268 0.75257732)  
##      6) pclass=3 152  72 Murio (0.52631579 0.47368421)  
##       12) age>=1.5 145  66 Murio (0.54482759 0.45517241) *
##       13) age< 1.5 7   1 Sobrevivió (0.14285714 0.85714286) *
##      7) pclass=1,2 236  16 Sobrevivió (0.06779661 0.93220339) *

Install.packages (rpart.plot)

#install.packages("rpart.plot")
library(rpart.plot)

rpart.plot(arbol)

prp(arbol,extra=7, prefix="fracción\n") 

Conclusion

Durante esta actividad se analizo la base de datos sobre los sobrevivientes del hundimiento del Titanic en 1912.

Podemos observar que las variables importantes son: pclass,age,sex y survived, de esta manera podemos analizar que 41% de los pasajeros del titanic sobrevivieron, siendo asi que por ser mujer tenias 75% de posibilidades de sobrevivir y si era de tercera clase aumentaba aun mas su probabilidad de sobrevivir, comentando otro dato interesante es que los niños tuvieron un alta probabilidad de sobrevivir si eran menores de 9.5 años.

Es un una actividad interesante la cual al usar un herramienta asi fue mas visual a la hora de interpretar y el entendimiento fue mas sencillo.

LS0tCnRpdGxlOiAiVGl0YW5pYyIKYXV0aG9yOiAiQ2FybG9zIENhcnJpbGxvIEEwMTc1MTE2OSIKZGF0ZTogImByIFN5cy5EYXRlKClgIgpvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KCjxiIHN0eWxlID0gJ2NvbG9yIDogcmVkOyBmb250LXNpemU6IDUwcHg7Jz4KIDE1IGRlIGFicmlsIGRlIDE5MTI8L2I+Cgo8aW1nIHNyYz0iL1VzZXJzL21hYy9Eb3dubG9hZHMvVGl0YW5pYyBJbWFnZW4uanBlZyI+CgojICoqSW1wb3J0YXIgYmFzZSBkZSBkYXRvcyoqCgpgYGB7cn0KI2ZpbGUuY2hvb3NlCgpiZDwtIHJlYWQuY3N2KCIvVXNlcnMvbWFjL0Rvd25sb2Fkcy90aXRhbmljLmNzdiIpCgpgYGAKCiMgKipFbnRlbmRlciBiYXNlIGRlIGRhdG9zKiogCmBgYHtyfQpzdW1tYXJ5KGJkKQpgYGAKCiMgKipGaWx0cmFyIGJhc2UgZGUgZGF0b3MqKiAKCmBgYHtyfQogVGl0YW5pYyA8LSBiZFssYygicGNsYXNzIiwgImFnZSIsICJzZXgiLCAic3Vydml2ZWQiKV0KCiBUaXRhbmljJHN1cnZpdmVkIDwtIGFzLmZhY3RvcihpZmVsc2UoVGl0YW5pYyRzdXJ2aXZlZD09MCwgIk11cmlvIiwgIlNvYnJldml2acOzIikpCiAKIFRpdGFuaWMkcGNsYXNzPC0gYXMuZmFjdG9yKFRpdGFuaWMkcGNsYXNzKQogVGl0YW5pYyRzZXg8LSBhcy5mYWN0b3IoVGl0YW5pYyRzZXgpCiBzdHIoVGl0YW5pYykKCiBzdW0oaXMubmEoVGl0YW5pYykpIAoKIFRpdGFuaWMgPC0gbmEub21pdChUaXRhbmljKSAKYGBgCgojICoqT21pdGlyIE5BKioKCmBgYHtyfQpUaXRhbmljIDwtIG5hLm9taXQoVGl0YW5pYykKYGBgCgojICAqKkNyZWFyIGFyYm9sIGRlIGRlY2lzacOzbioqIAoKYGBge3J9CmxpYnJhcnkocnBhcnQpCmFyYm9sIDwtcnBhcnQoZm9ybXVsYT1zdXJ2aXZlZH4gLiwgZGF0YSA9IFRpdGFuaWMpCmFyYm9sIApgYGAKCiMgICoqSW5zdGFsbC5wYWNrYWdlcyAocnBhcnQucGxvdCkqKgpgYGB7cn0KI2luc3RhbGwucGFja2FnZXMoInJwYXJ0LnBsb3QiKQpsaWJyYXJ5KHJwYXJ0LnBsb3QpCgpycGFydC5wbG90KGFyYm9sKQoKcHJwKGFyYm9sLGV4dHJhPTcsIHByZWZpeD0iZnJhY2Npw7NuXG4iKSAKYGBgCgogIAojICoqQ29uY2x1c2lvbioqCiAKIyMjICpEdXJhbnRlIGVzdGEgYWN0aXZpZGFkIHNlIGFuYWxpem8gbGEgYmFzZSBkZSBkYXRvcyBzb2JyZSBsb3Mgc29icmV2aXZpZW50ZXMgZGVsIGh1bmRpbWllbnRvIGRlbCBUaXRhbmljIGVuIDE5MTIuKgogCiMjIyAqUG9kZW1vcyBvYnNlcnZhciBxdWUgbGFzIHZhcmlhYmxlcyBpbXBvcnRhbnRlcyBzb246IHBjbGFzcyxhZ2Usc2V4IHkgc3Vydml2ZWQsIGRlIGVzdGEgbWFuZXJhIHBvZGVtb3MgYW5hbGl6YXIgcXVlIDQxJSBkZSBsb3MgcGFzYWplcm9zIGRlbCB0aXRhbmljIHNvYnJldml2aWVyb24sIHNpZW5kbyBhc2kgcXVlIHBvciBzZXIgbXVqZXIgdGVuaWFzIDc1JSBkZSBwb3NpYmlsaWRhZGVzIGRlIHNvYnJldml2aXIgeSBzaSBlcmEgZGUgdGVyY2VyYSBjbGFzZSBhdW1lbnRhYmEgYXVuIG1hcyBzdSBwcm9iYWJpbGlkYWQgZGUgc29icmV2aXZpciwgY29tZW50YW5kbyBvdHJvIGRhdG8gaW50ZXJlc2FudGUgZXMgcXVlIGxvcyBuacOxb3MgdHV2aWVyb24gdW4gYWx0YSBwcm9iYWJpbGlkYWQgZGUgc29icmV2aXZpciBzaSBlcmFuIG1lbm9yZXMgZGUgOS41IGHDsW9zLioKIAojIyMgKkVzIHVuIHVuYSBhY3RpdmlkYWQgaW50ZXJlc2FudGUgbGEgY3VhbCBhbCB1c2FyIHVuIGhlcnJhbWllbnRhIGFzaSBmdWUgbWFzIHZpc3VhbCBhIGxhIGhvcmEgZGUgaW50ZXJwcmV0YXIgeSBlbCBlbnRlbmRpbWllbnRvIGZ1ZSBtYXMgc2VuY2lsbG8uKgogCiAKIAogCiAKIAogCiAKIAogCiAKIAogCiAKIAoK