Teoría

La librería DataExplorer es la más conocida para el análisis exploratorio. Es muy simmple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.

La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son: * introduce() * plot_intro() * plot_boxplot() * plot_missing() * plot_histogram() * plot_bar() * plot_correlation()

Instalar paquetes y librerias

library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)

Contexto

El paquete nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK, LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos

flights<- flights
weather<- weather
planes<- planes
airports<- airports
airlines<- airlines
df<- merge(flights, airlines, by= "carrier")
df<- merge(df, planes, by= "tailnum")

Crear reporte y visualizar gráficos

introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by= "carrier")
## Warning: Removed 23255 rows containing non-finite values (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite values (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)

plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlcjogTllDIEZsaWdodHMgIgphdXRob3I6ICJKYXptaW4gQ29ydGV6IgpkYXRlOiAiMjAyNC0wMi0yNyIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKICAgIHRoZW1lOiBkYXJrCgotLS0KCiFbXSgvVXNlcnMvamF6bWluY29ydGV6L0Rlc2t0b3AvQ29uY2VudHJhY2lvzIFuIElBL00yIFRhcmVhcy9hdmlvbmNpdG8ud2VicCkKCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+VGVvcsOtYTwvc3Bhbj4KTGEgbGlicmVyw61hIERhdGFFeHBsb3JlciBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4gRXMgbXV5IHNpbW1wbGUgZGUgdXNhciB5IG11eSBwb2Rlcm9zYSwgcHVlcyBvZnJlY2UgY29tbyBzYWxpZGEgdW4gaW5mb3JtZSBjb24gbXVjaGEgaW5mb3JtYWNpw7NuLgoKTGEgZnVuY2nDs24gcGFyYSBjcmVhciBlbCBpbmZvcm1lIGVzICpjcmVhdGVfcmVwb3J0KiwgeSBwYXJhIHZlciBjYWRhIGdyw6FmaWNhIGRlIGZvcm1hIGluZGl2aWR1YWwsIGxhcyBmdW5jaW9uZXMgc29uOgoqICppbnRyb2R1Y2UoKSoKKiAqcGxvdF9pbnRybygpKgoqICpwbG90X2JveHBsb3QoKSoKKiAqcGxvdF9taXNzaW5nKCkqCiogKnBsb3RfaGlzdG9ncmFtKCkqCiogKnBsb3RfYmFyKCkqCiogKnBsb3RfY29ycmVsYXRpb24oKSoKCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxpYnJlcmlhczwvc3Bhbj4KCmBgYHtyfQpsaWJyYXJ5KERhdGFFeHBsb3JlcikKI2luc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpCmxpYnJhcnkobnljZmxpZ2h0czEzKQoKYGBgCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+Q29udGV4dG88L3NwYW4+CgpFbCBwYXF1ZXRlICpueWNmbGlnaHRzMTMqIGNvbnRpZW5lIGluZm9ybWFjacOzbiBzb2JyZSB0b2RvcyBsb3MgdnVlbG9zIHF1ZSBwYXJ0aWVyb24gZGVzZGUgTnVldmEgWW9yayAoRVdSLCBKRkssIExHQSkgYSBkZXN0aW5vcyBlbiBsb3MgRXN0YWRvcyBVbmlkb3MgZW4gMjAxMy4gRnVlcm9uIDMzNiw3NzYgdnVlbG9zIGVuIHRvdGFsLgoKTGFzIHRhYmxhcyBkZSBlc3RlIHBhcXVldGUgeSBzdXMgcmVsYWNpb25lcyBzb24gbGFzIHNpZ3VpZW50ZXM6CgohW10oL1VzZXJzL2phem1pbmNvcnRlei9EZXNrdG9wL0NvbmNlbnRyYWNpb8yBbiBJQS9NMiBUYXJlYXMvcmVsYXRpb25hbC1ueWNmbGlnaHRzLnBuZykKCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5DcmVhciBiYXNlIGRlIGRhdG9zPC9zcGFuPgoKYGBge3J9CmZsaWdodHM8LSBmbGlnaHRzCndlYXRoZXI8LSB3ZWF0aGVyCnBsYW5lczwtIHBsYW5lcwphaXJwb3J0czwtIGFpcnBvcnRzCmFpcmxpbmVzPC0gYWlybGluZXMKZGY8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnk9ICJjYXJyaWVyIikKZGY8LSBtZXJnZShkZiwgcGxhbmVzLCBieT0gInRhaWxudW0iKQpgYGAKCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5DcmVhciByZXBvcnRlIHkgdmlzdWFsaXphciBncsOhZmljb3M8L3NwYW4+CgoKCmBgYHtyfQppbnRyb2R1Y2UoZGYpCnBsb3RfaW50cm8oZGYpCnBsb3RfYm94cGxvdChkZiwgYnk9ICJjYXJyaWVyIikKcGxvdF9taXNzaW5nKGRmKQpwbG90X2hpc3RvZ3JhbShkZikKcGxvdF9iYXIoZGYpCnBsb3RfY29ycmVsYXRpb24oZGYpCmBgYAoK