Data Explorer

Teoría

La librería Data Explorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.

La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son:

introduce() plot_intro() plot_boxplot() plot_histogram() plot_bar() plot_correlation()

Librerías

library(nycflights13)
#install.packages("DataExplorer")
library(DataExplorer)

Contexto

El paquete nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva Tork (EWR, JFK, LGA) a destinos en los Estados Unidos en 2013. Fueron 336.776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos

flights=flights
weather=weather
planes=planes
airports=airports
airlines=airlines
df=merge(flights,airlines,by="carrier")
df=merge(df,planes,by="tailnum")

Creación de reporte

#create_report(df)

introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by= "carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_histogram(df)

plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlciIKYXV0aG9yOiAiR2FicmllbCBNZWRpbmEgLSBBMDEyNzU3NjMiCmRhdGU6ICIyMDI0LTAyLTIwIgpvdXRwdXQ6CiAgaHRtbF9kb2N1bWVudDoKICAgIGNvZGVfZm9sZGluZzogaGlkZQogICAgdG9jOiB5ZXMKICAgIHRvY19mbG9hdDogeWVzCiAgICBjb2RlX2Rvd25sb2FkOiB5ZXMKICAgIHRoZW1lOiByZWFkYWJsZQogICAgaGlnaGxpZ2h0OiB0YW5nbwogIHBkZl9kb2N1bWVudDoKICAgIHRvYzogeWVzCi0tLQoKRGF0YSBFeHBsb3JlcgoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBCcm93bjsiPlRlb3LDrWE8L3NwYW4+CgohW10oL1VzZXJzL2dhYnJpZWxtZWRpbmEvRG93bmxvYWRzL00yL2F2aW9uLmdpZikKCgpMYSBsaWJyZXLDrWEgRGF0YSBFeHBsb3JlciBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4gRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBwdWVzIG9mcmVjZSBjb21vIHNhbGlkYSB1biBpbmZvcm1lIGNvbiBtdWNoYSBpbmZvcm1hY2nDs24uCgoKTGEgZnVuY2nDs24gcGFyYSBjcmVhciBlbCBpbmZvcm1lIGVzIGNyZWF0ZV9yZXBvcnQsIHkgcGFyYSB2ZXIgY2FkYSBncsOhZmljYSBkZSBmb3JtYSBpbmRpdmlkdWFsLCBsYXMgZnVuY2lvbmVzIHNvbjoKCmludHJvZHVjZSgpCnBsb3RfaW50cm8oKQpwbG90X2JveHBsb3QoKQpwbG90X2hpc3RvZ3JhbSgpCnBsb3RfYmFyKCkKcGxvdF9jb3JyZWxhdGlvbigpCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6IEJyb3duOyI+TGlicmVyw61hczwvc3Bhbj4KCmBgYHtyIHdhcm5pbmc9RkFMU0V9CmxpYnJhcnkobnljZmxpZ2h0czEzKQojaW5zdGFsbC5wYWNrYWdlcygiRGF0YUV4cGxvcmVyIikKbGlicmFyeShEYXRhRXhwbG9yZXIpCmBgYAojIyA8c3BhbiBzdHlsZT0iY29sb3I6IEJyb3duOyI+Q29udGV4dG88L3NwYW4+CgpFbCBwYXF1ZXRlIG55Y2ZsaWdodHMxMyBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFRvcmsgKEVXUiwgSkZLLCBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zIGVuIDIwMTMuIEZ1ZXJvbiAzMzYuNzc2IHZ1ZWxvcyBlbiB0b3RhbC4KCkxhcyB0YWJsYXMgZGUgZXN0ZSBwYXF1ZXRlIHkgc3VzIHJlbGFjaW9uZXMgc29uIGxhcyBzaWd1aWVudGVzOgoKIVtdKC9Vc2Vycy9nYWJyaWVsbWVkaW5hL0Rvd25sb2Fkcy9NMi9yZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiBCcm93bjsiPkNyZWFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+CmBgYHtyfQoKCmZsaWdodHM9ZmxpZ2h0cwp3ZWF0aGVyPXdlYXRoZXIKcGxhbmVzPXBsYW5lcwphaXJwb3J0cz1haXJwb3J0cwphaXJsaW5lcz1haXJsaW5lcwpkZj1tZXJnZShmbGlnaHRzLGFpcmxpbmVzLGJ5PSJjYXJyaWVyIikKZGY9bWVyZ2UoZGYscGxhbmVzLGJ5PSJ0YWlsbnVtIikKCgpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogQnJvd247Ij5DcmVhY2nDs24gZGUgcmVwb3J0ZTwvc3Bhbj4KCmBgYHtyfQojY3JlYXRlX3JlcG9ydChkZikKCmludHJvZHVjZShkZikKcGxvdF9pbnRybyhkZikKcGxvdF9ib3hwbG90KGRmLCBieT0gImNhcnJpZXIiKQpwbG90X2hpc3RvZ3JhbShkZikKcGxvdF9iYXIoZGYpCnBsb3RfY29ycmVsYXRpb24oZGYpCmBgYAoKCgo=