En el proyecto se trabajó con la libreria titanic, específicamente titanic_train
library(titanic)
## Warning: package 'titanic' was built under R version 4.0.2
data=titanic::titanic_train
Se empieza con el análisis estadístico univariante, para las variables cuantitativas
Histograma de la variable Age(Edad)
hist(data$Age)

Medidas estadísticas de la variable Age
summary(na.omit(data$Age))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.42 20.12 28.00 29.70 38.00 80.00
Desviación estándar de la variable Age
sd(na.omit(data$Age))
## [1] 14.5265
Diagrama de cajas de la variable Age
boxplot(data$Age,horizontal = TRUE)

Histograma de la variabe Fare (Tarifa)
hist(data$Fare)

Medidas estadísticas de la variable Fare
summary(na.omit(data$Fare))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 7.91 14.45 32.20 31.00 512.33
Desviación estándar de la variable Fare
sd(na.omit(data$Fare))
## [1] 49.69343
Diagrama de cajas de la variable Fare
boxplot(data$Fare,horizontal = TRUE)

Histograma de la variabe SibSp(Number of Siblings/Spouses Aboard)
hist(data$SibSp)

Medidas estadísticas de la variable SibSp
summary(na.omit(data$SibSp))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 0.000 0.523 1.000 8.000
Desviación estándar de la variable SibSp
sd(na.omit(data$SibSp))
## [1] 1.102743
Diagrama de cajas de la variable SibSp
boxplot(data$SibSp,horizontal = TRUE)

Histograma de la variabe Parch (Number of Parents/Children Aboard)
hist(data$Parch)

Medidas estadísticas de la variable Parch
summary(na.omit(data$Parch))
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 0.0000 0.3816 0.0000 6.0000
Desviación estándar de la variable Parch
sd(na.omit(data$Parch))
## [1] 0.8060572
Diagrama de cajas de la variable Parch
boxplot(data$Parch,horizontal = TRUE)

Ahora se continua con el análisis univariante de las variables cualitativas
Tabla de frecuencias para la variable Sex(Sexo)
table(data$Sex)
##
## female male
## 314 577
Gráfico de pastel para la variable Sex
pie(table(data$Sex),labels = c("F(35.24%)","M(64.75%)"))

Tabla de frecuencia de la variable Pclass (# de pasajeros en 1era., 2da.,3era. clase)
table(data$Pclass)
##
## 1 2 3
## 216 184 491
Gráfico de pastel para la variable Pclass
pie(table(data$Pclass),labels = c("Primera clase(24.2%)","Segunda clase(20.75%)","Tercera clase(55.1%)"))

Tabla de frecuencias para la variable Embarked[Ciudad en la que se embarcó (C = Cherbourg; Q = Queenstown; S = Southampton)]
table(data$Embarked)
##
## C Q S
## 2 168 77 644
Gráfico de pastel para la variable Embarked
pie(table(data$Embarked),labels = c("S(72.4%)","C(18.9%)","Q(8.7%)"))
