Objetivo: Generar una red neuronal para calcular cuantos sobrevivientes resultaron del Titanic, por medio de un ETL del dataset
library(readr)
DatosTitanicEsp <- read_csv("~/Curso Redes Neuronales/Dataset/DatosTitanicEsp.csv")
## Rows: 891 Columns: 12
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): Nombre, Sexo, Ticket, Cabina, Puerto
## dbl (7): Numero, Vivio, ClasePasajero, Edad, Familiares, FamiliaDirecta, Costo
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(DatosTitanicEsp)
#sumar los NA's por cada columna factor
sum(is.na(DatosTitanicEsp$Vivio))
## [1] 0
sum(is.na(DatosTitanicEsp$Sexo))
## [1] 0
sum(is.na(DatosTitanicEsp$Edad)) #177 con NA's
## [1] 177
sum(is.na(DatosTitanicEsp$ClasePasajero))
## [1] 0
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.