
TeorÃa
La librerÃa DataExplorer es la más conocida para el análisis
exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como
salida un informe con mucha información.
La función para crear el informe es create_report, y para
ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plot_boxplot()
- plot_missing()
- plot_histogram()
- plot_bar()
- plot_correlation()
Instalar paquetes y llamar
librerÃas
# install.packages("DataExplorer")
library(DataExplorer)
# install.packages("nycflights13")
library(nycflights13)
Contexto
El paquete nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos en los
Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by = "tailnum")
Crear reporte y visualizar
gráficas
# create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by="carrier")
## Warning: Removed 23255 rows containing non-finite values (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite values (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)


plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJSYXVsIENhbnR1IC0gQTAxMDg3NjgzIg0KZGF0ZTogIjIwMjQtMDItMjciDQpvdXRwdXQ6IA0KICBodG1sX2RvY3VtZW50Og0KICAgIHRvYzogVFJVRQ0KICAgIHRvY19mbG9hdDogVFJVRQ0KICAgIGNvZGVfZG93bmxvYWQ6IFRSVUUNCiAgICB0aGVtZTogZGFyaw0KLS0tDQoNCiFbXShDOlxcVXNlcnNcXHJhdWxjXFxPbmVEcml2ZVxcRXNjcml0b3Jpb1xcSW50ZWxpZ2VuY2lhXFxBVklPTi5naWYpDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5UZW9yw61hPC9zcGFuPg0KTGEgbGlicmVyw61hICpEYXRhRXhwbG9yZXIqIGVzIGxhIG3DoXMgY29ub2NpZGEgcGFyYSBlbCBhbsOhbGlzaXMgZXhwbG9yYXRvcmlvLiBFcyBtdXkgc2ltcGxlIGRlIHVzYXIgeSBtdXkgcG9kZXJvc2EsIHB1ZXMgb2ZyZWNlIGNvbW8gc2FsaWRhIHVuIGluZm9ybWUgY29uIG11Y2hhIGluZm9ybWFjacOzbi4gIA0KDQpMYSBmdW5jacOzbiBwYXJhIGNyZWFyIGVsIGluZm9ybWUgZXMgKmNyZWF0ZV9yZXBvcnQqLCB5IHBhcmEgdmVyIGNhZGEgZ3LDoWZpY2EgZGUgZm9ybWEgaW5kaXZpZHVhbCwgbGFzIGZ1bmNpb25lcyBzb246ICANCg0KKiAqaW50cm9kdWNlKCkqDQoqICpwbG90X2ludHJvKCkqDQoqICpwbG90X2JveHBsb3QoKSoNCiogKnBsb3RfbWlzc2luZygpKg0KKiAqcGxvdF9oaXN0b2dyYW0oKSoNCiogKnBsb3RfYmFyKCkqDQoqICpwbG90X2NvcnJlbGF0aW9uKCkqDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzPC9zcGFuPg0KYGBge3J9DQojIGluc3RhbGwucGFja2FnZXMoIkRhdGFFeHBsb3JlciIpDQpsaWJyYXJ5KERhdGFFeHBsb3JlcikNCiMgaW5zdGFsbC5wYWNrYWdlcygibnljZmxpZ2h0czEzIikNCmxpYnJhcnkobnljZmxpZ2h0czEzKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5Db250ZXh0bzwvc3Bhbj4NCkVsIHBhcXVldGUgKm55Y2ZsaWdodHMxMyogY29udGllbmUgaW5mb3JtYWNpw7NuIHNvYnJlIHRvZG9zIGxvcyB2dWVsb3MgcXVlIHBhcnRpZXJvbiBkZXNkZSBOdWV2YSBZb3JrIChFV1IsIEpGSyB5IExHQSkgYSBkZXN0aW5vcyBlbiBsb3MgRXN0YWRvcyBVbmlkb3MgZW4gMjAxMy4gRnVlcm9uIDMzNiw3NzYgdnVlbG9zIGVuIHRvdGFsLiAgDQoNCkxhcyB0YWJsYXMgZGUgZXN0ZSBwYXF1ZXRlIHkgc3VzIHJlbGFjaW9uZXMgc29uIGxhcyBzaWd1aWVudGVzOg0KDQohW10oQzpcXFVzZXJzXFxyYXVsY1xcT25lRHJpdmVcXEVzY3JpdG9yaW9cXEludGVsaWdlbmNpYVxccmVsYXRpb25hbC1ueWNmbGlnaHRzLnBuZykNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6IHllbGxvdzsiPkNyZWFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+DQpgYGB7cn0NCmZsaWdodHMgPC0gZmxpZ2h0cw0Kd2VhdGhlciA8LSB3ZWF0aGVyDQpwbGFuZXMgPC0gcGxhbmVzDQphaXJwb3J0cyA8LSBhaXJwb3J0cw0KYWlybGluZXMgPC0gYWlybGluZXMNCmRmIDwtIG1lcmdlKGZsaWdodHMsIGFpcmxpbmVzLCBieSA9ICJjYXJyaWVyIikNCmRmIDwtIG1lcmdlKGRmLCBwbGFuZXMsIGJ5ID0gInRhaWxudW0iKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5DcmVhciByZXBvcnRlIHkgdmlzdWFsaXphciBncsOhZmljYXM8L3NwYW4+DQpgYGB7cn0NCiMgY3JlYXRlX3JlcG9ydChkZikNCmludHJvZHVjZShkZikNCnBsb3RfaW50cm8oZGYpDQpwbG90X2JveHBsb3QoZGYsIGJ5PSJjYXJyaWVyIikNCnBsb3RfbWlzc2luZyhkZikNCnBsb3RfaGlzdG9ncmFtKGRmKQ0KcGxvdF9iYXIoZGYpDQpwbG90X2NvcnJlbGF0aW9uKGRmKQ0KYGBgDQoNCg0K