Teoría

La librería DataExplorer es la más conocida para el análisis exploratorio. Es muy simmple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.

La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son: * introduce()
* plot_intro()
* plot_boxplot()
* plot_missing()
* plot_histogram()
* plot_bar()
* plot_correlation()

Instalar paquetes y librerias

library(DataExplorer)
## Warning: package 'DataExplorer' was built under R version 4.3.2
#install.packages("nycflights13")
library(nycflights13)
## Warning: package 'nycflights13' was built under R version 4.3.2

Contexto

El paquete nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK, LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos

flights<- flights
weather<- weather
planes<- planes
airports<- airports
airlines<- airlines
df<- merge(flights, airlines, by= "carrier")
df<- merge(df, planes, by= "tailnum")

Crear reporte y visualizar gráficos

introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by= "carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)

plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tDQp0aXRsZTogIk5ZQyBGbGlnaHRzICINCmF1dGhvcjogIkx1aXMgTWVuZG96YSINCmRhdGU6ICIyMDI0LTAyLTI3Ig0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlDQogICAgdGhlbWU6IGRhcmsNCg0KLS0tDQoNCiFbXShDOlxcVXNlcnNcXEx1aXMgUm9kcmlndWV6XFxEb3dubG9hZHNcXGF2aW9uLmdpZikNCg0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+VGVvcsOtYTwvc3Bhbj4NCkxhIGxpYnJlcsOtYSBEYXRhRXhwbG9yZXIgZXMgbGEgbcOhcyBjb25vY2lkYSBwYXJhIGVsIGFuw6FsaXNpcyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1tcGxlIGRlIHVzYXIgeSBtdXkgcG9kZXJvc2EsIHB1ZXMgb2ZyZWNlIGNvbW8gc2FsaWRhIHVuIGluZm9ybWUgY29uIG11Y2hhIGluZm9ybWFjacOzbi4NCg0KTGEgZnVuY2nDs24gcGFyYSBjcmVhciBlbCBpbmZvcm1lIGVzICpjcmVhdGVfcmVwb3J0KiwgeSBwYXJhIHZlciBjYWRhIGdyw6FmaWNhIGRlIGZvcm1hIGluZGl2aWR1YWwsIGxhcyBmdW5jaW9uZXMgc29uOg0KKiAqaW50cm9kdWNlKCkqICANCiogKnBsb3RfaW50cm8oKSogIA0KKiAqcGxvdF9ib3hwbG90KCkqICANCiogKnBsb3RfbWlzc2luZygpKiAgDQoqICpwbG90X2hpc3RvZ3JhbSgpKiAgDQoqICpwbG90X2JhcigpKiAgDQoqICpwbG90X2NvcnJlbGF0aW9uKCkqICANCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IHllbGxvdzsiPkluc3RhbGFyIHBhcXVldGVzIHkgbGlicmVyaWFzPC9zcGFuPg0KDQpgYGB7cn0NCmxpYnJhcnkoRGF0YUV4cGxvcmVyKQ0KI2luc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpDQpsaWJyYXJ5KG55Y2ZsaWdodHMxMykNCg0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5Db250ZXh0bzwvc3Bhbj4NCg0KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLLCBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zIGVuIDIwMTMuIEZ1ZXJvbiAzMzYsNzc2IHZ1ZWxvcyBlbiB0b3RhbC4NCg0KTGFzIHRhYmxhcyBkZSBlc3RlIHBhcXVldGUgeSBzdXMgcmVsYWNpb25lcyBzb24gbGFzIHNpZ3VpZW50ZXM6DQoNCiFbXShDOlxcVXNlcnNcXEx1aXMgUm9kcmlndWV6XFxEb3dubG9hZHNcXHJlbGF0aW9uYWwtbnljZmxpZ2h0cyAoMSkucG5nKQ0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+Q3JlYXIgYmFzZSBkZSBkYXRvczwvc3Bhbj4NCg0KYGBge3J9DQpmbGlnaHRzPC0gZmxpZ2h0cw0Kd2VhdGhlcjwtIHdlYXRoZXINCnBsYW5lczwtIHBsYW5lcw0KYWlycG9ydHM8LSBhaXJwb3J0cw0KYWlybGluZXM8LSBhaXJsaW5lcw0KZGY8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnk9ICJjYXJyaWVyIikNCmRmPC0gbWVyZ2UoZGYsIHBsYW5lcywgYnk9ICJ0YWlsbnVtIikNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+Q3JlYXIgcmVwb3J0ZSB5IHZpc3VhbGl6YXIgZ3LDoWZpY29zPC9zcGFuPg0KDQoNCg0KYGBge3J9DQppbnRyb2R1Y2UoZGYpDQpwbG90X2ludHJvKGRmKQ0KcGxvdF9ib3hwbG90KGRmLCBieT0gImNhcnJpZXIiKQ0KcGxvdF9taXNzaW5nKGRmKQ0KcGxvdF9oaXN0b2dyYW0oZGYpDQpwbG90X2JhcihkZikNCnBsb3RfY29ycmVsYXRpb24oZGYpDQpgYGANCg0K