
TeorÃa
La librerÃa DataExplorer es la más conocida para el análisis
exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como
salida un informe con mucha información.
La función para crear el informe es create_report, y para
ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plot_boxplot()
- plot_missing()
- plot_histogram()
- plot_bar()
- plot_correlacion()
Instalar paquetes y llamar
librerÃas
#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)
Contexto
El paquete nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos en los
Estados Unidos en 2013. Fueron 336, 776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by = "tailnum")
Crear reporte y visualizar
gráficas
#create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by = "carrier")
## Warning: Removed 23255 rows containing non-finite values (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite values (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)


plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJMZXNseSBEYXJpYW4gUm9tZXJvIFZhenF1ZXogLSBBMDE3NzExMjciDQpkYXRlOiAiMjAyNC0wMi0yNyINCm91dHB1dDogDQogaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlIA0KICAgIHRoZW1lOiBkYXJrDQotLS0NCg0KIVtdKEM6XFxVc2Vyc1xcbGVzZGFcXE9uZURyaXZlXFxEb2N1bWVudG9zXFxDb25jZW50cmFjaW9uIElBXFxSIE1vZHVsbyAzXFxhdmlvbi5naWYpDQoNCiMgPHNwYW4gc3R5bGU9ICJjb2xvcjogeWVsbG93OyI+VGVvcsOtYTwvc3Bhbj4NCkxhIGxpYnJlcsOtYSAqRGF0YUV4cGxvcmVyKiBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4gRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBwdWVzIG9mcmVjZSBjb21vIHNhbGlkYSB1biBpbmZvcm1lIGNvbiBtdWNoYSBpbmZvcm1hY2nDs24uDQoNCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgZWwgaW5mb3JtZSBlcyAqY3JlYXRlX3JlcG9ydCosIHkgcGFyYSB2ZXIgY2FkYSBncsOhZmljYSBkZSBmb3JtYSBpbmRpdmlkdWFsLCBsYXMgZnVuY2lvbmVzIHNvbjoNCg0KICogKmludHJvZHVjZSgpKg0KICogKnBsb3RfaW50cm8oKSoNCiAqICpwbG90X2JveHBsb3QoKSoNCiAqICpwbG90X21pc3NpbmcoKSoNCiAqICpwbG90X2hpc3RvZ3JhbSgpKg0KICogKnBsb3RfYmFyKCkqDQogKiAqcGxvdF9jb3JyZWxhY2lvbigpKg0KIA0KIA0KIyA8c3BhbiBzdHlsZT0gImNvbG9yOiB5ZWxsb3c7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzPC9zcGFuPg0KYGBge3J9DQojaW5zdGFsbC5wYWNrYWdlcygiRGF0YUV4cGxvcmVyIikNCmxpYnJhcnkoRGF0YUV4cGxvcmVyKQ0KI2luc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpDQpsaWJyYXJ5KG55Y2ZsaWdodHMxMykNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSAiY29sb3I6IHllbGxvdzsiPkNvbnRleHRvPC9zcGFuPg0KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIHkgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLiBGdWVyb24gMzM2LCA3NzYgdnVlbG9zIGVuIHRvdGFsLg0KDQpMYXMgdGFibGFzIGRlIGVzdGUgcGFxdWV0ZSB5IHN1cyByZWxhY2lvbmVzIHNvbiBsYXMgc2lndWllbnRlczoNCg0KIVtdKEM6XFxVc2Vyc1xcbGVzZGFcXE9uZURyaXZlXFxEb2N1bWVudG9zXFxDb25jZW50cmFjaW9uIElBXFxSIE1vZHVsbyAzXFxyZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQ0KDQojIDxzcGFuIHN0eWxlPSAiY29sb3I6IHllbGxvdzsiPkNyZWFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+DQpgYGB7cn0NCmZsaWdodHMgPC0gZmxpZ2h0cw0Kd2VhdGhlciA8LSB3ZWF0aGVyDQpwbGFuZXMgPC0gcGxhbmVzDQphaXJwb3J0cyA8LSBhaXJwb3J0cw0KYWlybGluZXMgPC0gYWlybGluZXMNCmRmIDwtIG1lcmdlKGZsaWdodHMsIGFpcmxpbmVzLCBieSA9ICJjYXJyaWVyIikNCmRmIDwtIG1lcmdlKGRmLCBwbGFuZXMsIGJ5ID0gInRhaWxudW0iKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ICJjb2xvcjogeWVsbG93OyI+Q3JlYXIgcmVwb3J0ZSB5IHZpc3VhbGl6YXIgZ3LDoWZpY2FzPC9zcGFuPg0KYGBge3J9DQoNCiNjcmVhdGVfcmVwb3J0KGRmKQ0KaW50cm9kdWNlKGRmKQ0KcGxvdF9pbnRybyhkZikNCnBsb3RfYm94cGxvdChkZiwgYnkgPSAiY2FycmllciIpDQpwbG90X21pc3NpbmcoZGYpDQpwbG90X2hpc3RvZ3JhbShkZikNCnBsb3RfYmFyKGRmKQ0KcGxvdF9jb3JyZWxhdGlvbihkZikNCmBgYA0KDQogDQogDQogDQogDQog