
Introducción
La librería Data Explorer es la más conocida para el
análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece
como salida un informe con mucha información.
La función para crear el informe es create_report(), y para
ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plot_boxplot()
- plot_missing()
- plot_histogram()
- plot_correlation()
#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)
El paqute nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK, y LGA) a destinos en
los Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes:
.
Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by="carrier")
df <- merge(df, planes, by="tailnum")
#create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by="carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)


plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

Conclusión
La librería Data Explorer es un excelente punto de partida para el
análisis exploratorio de datos, ya que de manera práctica proporciona un
resumen de múltiples medidas descriptivas de los datos.
LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlciIKYXV0aG9yOiAiTGlzc2V0IEhlcm7DoW5kZXogQTAxMjg0NjExIgpkYXRlOiAiMjAyNC0wMi0yNyIKb3V0cHV0OiAKIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KIVtdKC9Vc2Vycy9saXNoZHovRG93bmxvYWRzL3BsYW5lLmdpZikKICAKIyBJbnRyb2R1Y2Npw7NuICAKCkxhIGxpYnJlcsOtYSAqRGF0YSBFeHBsb3JlciogZXMgbGEgbcOhcyBjb25vY2lkYSBwYXJhIGVsIGFuw6FsaXNpcyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1wbGUgZGUgdXNhciB5IG11eSBwb2Rlcm9zYSwgcHVlcyBvZnJlY2UgY29tbyBzYWxpZGEgdW4gaW5mb3JtZSBjb24gbXVjaGEgaW5mb3JtYWNpw7NuLiAgCgpMYSBmdW5jacOzbiBwYXJhIGNyZWFyIGVsIGluZm9ybWUgZXMgKmNyZWF0ZV9yZXBvcnQoKSosIHkgcGFyYSB2ZXIgY2FkYSBncsOhZmljYSBkZSBmb3JtYSBpbmRpdmlkdWFsLCBsYXMgZnVuY2lvbmVzIHNvbjogIAoKKiAqaW50cm9kdWNlKCkqIAoqICpwbG90X2ludHJvKCkqIAoqICpwbG90X2JveHBsb3QoKSogCiogKnBsb3RfbWlzc2luZygpKiAgICAKKiAqcGxvdF9oaXN0b2dyYW0oKSogICAgCiogKnBsb3RfY29ycmVsYXRpb24oKSogIAoKYGBge3J9CiNpbnN0YWxsLnBhY2thZ2VzKCJEYXRhRXhwbG9yZXIiKQpsaWJyYXJ5KERhdGFFeHBsb3JlcikKCiNpbnN0YWxsLnBhY2thZ2VzKCJueWNmbGlnaHRzMTMiKQpsaWJyYXJ5KG55Y2ZsaWdodHMxMykKYGBgCgpFbCBwYXF1dGUgKm55Y2ZsaWdodHMxMyogY29udGllbmUgaW5mb3JtYWNpw7NuIHNvYnJlIHRvZG9zIGxvcyB2dWVsb3MgcXVlIHBhcnRpZXJvbiBkZXNkZSBOdWV2YSBZb3JrIChFV1IsIEpGSywgeSBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zIGVuIDIwMTMuIEZ1ZXJvbiAzMzYsNzc2IHZ1ZWxvcyBlbiB0b3RhbC4gCgpMYXMgdGFibGFzIGRlIGVzdGUgcGFxdWV0ZSB5IHN1cyByZWxhY2lvbmVzIHNvbiBsYXMgc2lndWllbnRlczogIAohW10oL1VzZXJzL2xpc2hkei9Eb3dubG9hZHMvVW50aXRsZWQucG5nKS4gCgojIENyZWFyIGJhc2UgZGUgZGF0b3MKCmBgYHtyfQpmbGlnaHRzIDwtIGZsaWdodHMKd2VhdGhlciA8LSB3ZWF0aGVyCnBsYW5lcyA8LSBwbGFuZXMKYWlycG9ydHMgPC0gYWlycG9ydHMKYWlybGluZXMgPC0gYWlybGluZXMKZGYgPC0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5PSJjYXJyaWVyIikKZGYgPC0gbWVyZ2UoZGYsIHBsYW5lcywgYnk9InRhaWxudW0iKQpgYGAKCmBgYHtyfQojY3JlYXRlX3JlcG9ydChkZikKaW50cm9kdWNlKGRmKQpwbG90X2ludHJvKGRmKQpwbG90X2JveHBsb3QoZGYsIGJ5PSJjYXJyaWVyIikKcGxvdF9taXNzaW5nKGRmKQpwbG90X2hpc3RvZ3JhbShkZikKcGxvdF9jb3JyZWxhdGlvbihkZikKYGBgCiAgCiAgCiMgQ29uY2x1c2nDs24gCkxhIGxpYnJlcsOtYSBEYXRhIEV4cGxvcmVyIGVzIHVuIGV4Y2VsZW50ZSBwdW50byBkZSBwYXJ0aWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3JpbyBkZSBkYXRvcywgeWEgcXVlIGRlIG1hbmVyYSBwcsOhY3RpY2EgcHJvcG9yY2lvbmEgdW4gcmVzdW1lbiBkZSBtw7psdGlwbGVzIG1lZGlkYXMgZGVzY3JpcHRpdmFzIGRlIGxvcyBkYXRvcy4K