En el proyecto se trabajó con la libreria titanic, específicamente titanic_train

library(titanic)
## Warning: package 'titanic' was built under R version 4.0.2
data=titanic::titanic_train

Se empieza con el análisis estadístico univariante, para las variables cuantitativas

Histograma de la variable Age(Edad)

hist(data$Age)

Medidas estadísticas de la variable Age

summary(na.omit(data$Age))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.42   20.12   28.00   29.70   38.00   80.00

Desviación estándar de la variable Age

sd(na.omit(data$Age))
## [1] 14.5265

Diagrama de cajas de la variable Age

boxplot(data$Age,horizontal = TRUE)

Histograma de la variabe Fare (Tarifa)

hist(data$Fare)

Medidas estadísticas de la variable Fare

summary(na.omit(data$Fare))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    7.91   14.45   32.20   31.00  512.33

Desviación estándar de la variable Fare

sd(na.omit(data$Fare))
## [1] 49.69343

Diagrama de cajas de la variable Fare

boxplot(data$Fare,horizontal = TRUE)

Histograma de la variabe SibSp(Number of Siblings/Spouses Aboard)

hist(data$SibSp)

Medidas estadísticas de la variable SibSp

summary(na.omit(data$SibSp))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   0.000   0.523   1.000   8.000

Desviación estándar de la variable SibSp

sd(na.omit(data$SibSp))
## [1] 1.102743

Diagrama de cajas de la variable SibSp

boxplot(data$SibSp,horizontal = TRUE)

Histograma de la variabe Parch (Number of Parents/Children Aboard)

hist(data$Parch)

Medidas estadísticas de la variable Parch

summary(na.omit(data$Parch))
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.3816  0.0000  6.0000

Desviación estándar de la variable Parch

sd(na.omit(data$Parch))
## [1] 0.8060572

Diagrama de cajas de la variable Parch

boxplot(data$Parch,horizontal = TRUE)

Ahora se continua con el análisis univariante de las variables cualitativas

Tabla de frecuencias para la variable Sex(Sexo)

table(data$Sex)
## 
## female   male 
##    314    577

Gráfico de pastel para la variable Sex

pie(table(data$Sex),labels = c("F(35.24%)","M(64.75%)"))

Tabla de frecuencia de la variable Pclass (# de pasajeros en 1era., 2da.,3era. clase)

table(data$Pclass)
## 
##   1   2   3 
## 216 184 491

Gráfico de pastel para la variable Pclass

pie(table(data$Pclass),labels = c("Primera clase(24.2%)","Segunda clase(20.75%)","Tercera clase(55.1%)"))

Tabla de frecuencias para la variable Embarked[Ciudad en la que se embarcó (C = Cherbourg; Q = Queenstown; S = Southampton)]

table(data$Embarked)
## 
##       C   Q   S 
##   2 168  77 644

Gráfico de pastel para la variable Embarked

pie(table(data$Embarked),labels = c("S(72.4%)","C(18.9%)","Q(8.7%)"))