Teoría

La librería Data Explorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.

La función para crear el informe es create_report, y para ver cada grafica de forma individual, las funciones son:

  • introduce()
  • plot_intro()
  • plotboxplot()
  • plot_missing()
  • plot_histogram()
  • plot_bar()
  • plot_correlation()

Instalar paquetes y llamar librerías

#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)

Contexto

El paquete nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK, LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos

flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by ="tailnum")
#create_report(df)
introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by = "carrier")

plot_missing(df)

plot_histogram(df)

plot_bar(df)

plot_correlation(df)

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJDZWNpbGlhIFJpdmFzIEdvbnrDoWxleiAtIEEwMTI4NDg3NCINCmRhdGU6ICIyMDI0LTAyLTI3Ig0Kb3V0cHV0OiANCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IFRSVUUNCiAgICB0b2NfZmxvYXQ6IFRSVUUNCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFDQogICAgdGhlbWU6IGRhcmsNCi0tLQ0KDQohW10oQzpcXFVzZXJzXFxEZWxsXFxPbmVEcml2ZSAtIEluc3RpdHV0byBUZWNub2xvZ2ljbyB5IGRlIEVzdHVkaW9zIFN1cGVyaW9yZXMgZGUgTW9udGVycmV5XFxEZXNrdG9wXFxNT0RVTE8gMiBJQVxcZGF0YSBleHBsb3Jlci5qcGcpDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5UZW9yw61hPC9zcGFuPg0KTGEgbGlicmVyw61hICpEYXRhIEV4cGxvcmVyKiBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4gRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBwdWVzIG9mcmVjZSBjb21vIHNhbGlkYSB1biBpbmZvcm1lIGNvbiBtdWNoYSBpbmZvcm1hY2nDs24uDQoNCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgZWwgaW5mb3JtZSBlcyAqY3JlYXRlX3JlcG9ydCosIHkgcGFyYSB2ZXIgY2FkYSBncmFmaWNhIGRlIGZvcm1hIGluZGl2aWR1YWwsIGxhcyBmdW5jaW9uZXMgc29uOiAgDQoNCiogKmludHJvZHVjZSgpKg0KKiAqcGxvdF9pbnRybygpKg0KKiAqcGxvdGJveHBsb3QoKSoNCiogKnBsb3RfbWlzc2luZygpKg0KKiAqcGxvdF9oaXN0b2dyYW0oKSoNCiogKnBsb3RfYmFyKCkqDQoqICpwbG90X2NvcnJlbGF0aW9uKCkqDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzPC9zcGFuPg0KDQpgYGB7ciBtZXNzYWdlID0gRkFMU0UsIHdhcm5pbmcgPSBGQUxTRX0NCiNpbnN0YWxsLnBhY2thZ2VzKCJEYXRhRXhwbG9yZXIiKQ0KbGlicmFyeShEYXRhRXhwbG9yZXIpDQojaW5zdGFsbC5wYWNrYWdlcygibnljZmxpZ2h0czEzIikNCmxpYnJhcnkobnljZmxpZ2h0czEzKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiB5ZWxsb3c7Ij5Db250ZXh0bzwvc3Bhbj4NCg0KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLLCBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zIGVuIDIwMTMuIEZ1ZXJvbiAzMzYsNzc2IHZ1ZWxvcyBlbiB0b3RhbC4NCg0KTGFzIHRhYmxhcyBkZSBlc3RlIHBhcXVldGUgeSBzdXMgcmVsYWNpb25lcyBzb24gbGFzIHNpZ3VpZW50ZXM6DQoNCiFbXShDOlxcVXNlcnNcXERlbGxcXE9uZURyaXZlIC0gSW5zdGl0dXRvIFRlY25vbG9naWNvIHkgZGUgRXN0dWRpb3MgU3VwZXJpb3JlcyBkZSBNb250ZXJyZXlcXERlc2t0b3BcXE1PRFVMTyAyIElBXFxyZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQ0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+Q3JlYXIgYmFzZSBkZSBkYXRvczwvc3Bhbj4NCg0KYGBge3IgbWVzc2FnZSA9IEZBTFNFLCB3YXJuaW5nID0gRkFMU0V9DQpmbGlnaHRzIDwtIGZsaWdodHMNCndlYXRoZXIgPC0gd2VhdGhlcg0KcGxhbmVzIDwtIHBsYW5lcw0KYWlycG9ydHMgPC0gYWlycG9ydHMNCmFpcmxpbmVzIDwtIGFpcmxpbmVzDQpkZiA8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnkgPSAiY2FycmllciIpDQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieSA9InRhaWxudW0iKQ0KYGBgDQoNCmBgYHtyIG1lc3NhZ2UgPSBGQUxTRSwgd2FybmluZyA9IEZBTFNFfQ0KI2NyZWF0ZV9yZXBvcnQoZGYpDQppbnRyb2R1Y2UoZGYpDQpwbG90X2ludHJvKGRmKQ0KcGxvdF9ib3hwbG90KGRmLCBieSA9ICJjYXJyaWVyIikNCnBsb3RfbWlzc2luZyhkZikNCnBsb3RfaGlzdG9ncmFtKGRmKQ0KcGxvdF9iYXIoZGYpDQpwbG90X2NvcnJlbGF0aW9uKGRmKQ0KYGBgDQoNCg==