## Parsed with column specification:
## cols(
## PassengerId = col_integer(),
## Survived = col_integer(),
## Pclass = col_integer(),
## Name = col_character(),
## Sex = col_character(),
## Age = col_double(),
## SibSp = col_integer(),
## Parch = col_integer(),
## Ticket = col_character(),
## Fare = col_double(),
## Cabin = col_character(),
## Embarked = col_character()
## )
Os dados analisados, são de um conjunto de treinamento para analise dos dados do naufragio do titanic. Ele contem 891 obsevações e 12 variaveis.
Tem-se que mais de 60% dos passageiros não sobreviveram.
cla.t<-table(train$Survived,train$Pclass)
par(mfrow = c(1,1))
barplot(cla.t,beside = TRUE,col =cols2)
legend("topleft", xpd=TRUE, ncol=2, legend=c( "Morreu","Sobreviveu"),
fill=cols2, bty="n")
Apesar de um numero alto de passageiros na terceira classe, a maior parte dos sobreviventes são da primeira classe.
par(mfrow = c(1,2))
sexo <- c("feminino", "masculino")
barplot(table(train$Sex), names.arg =sexo,col=cols2)
title(main = "sexo")
barplot(prop.table(table(train$Sex))*100, names.arg =sexo,col = cols2)
title(main = "sexo", ylab = "%")
A população em sua maioria é do sexo masculino, sendo ela mais de 60%
sex.t<-table(train$Survived,train$Sex)
par(mfrow = c(1,1))
barplot(sex.t,beside = TRUE,col = cols2)
legend("topleft", xpd=TRUE, ncol=2, legend=c("Morreu","Sobreviveu"),
fill=cols2, bty="n")
hist(train$Age,col = "#DF65B0")
Maior parte dos passageiros tinham idades entre 20 e 40 anos.
hist(train$SibSp,col = "#DF65B0")
hist(train$Parch,col = "#DF65B0")