
La librerÃa Data Explorer es la más conocida para el
análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece
como una salida un informe con mucha información.
La funcion para crear el informe es create_report, y para
ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plot_boxplot()
- plot_missing()
- plot_histogram()
- plot_bar()
- plot_correlation()
Instalar paquetes y llamar
#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)
Contexto
El paquete nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK, LGA) a destinos en los
Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes:

Crear Base de Datos
flights = flights
weather = weather
planes = planes
airports = airports
airlines = airlines
df = merge(flights, airlines, by = "carrier")
df = merge(df, planes, by = "tailnum")
Crear reporte y Visualizar
Gráfica
# create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by ="carrier")


plot_missing(df)

plot_histogram(df)


plot_bar(df)

plot_correlation(df)

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJFZHVhcmRvIENhbWFjaG8gLSBBMDEwMjY0MzciDQpkYXRlOiAiMjAyNC0wMi0xOSINCm91dHB1dDogDQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiBUUlVFDQogICAgdG9jX2Zsb2F0OiBUUlVFDQogICAgY29kZV9kb3dubG9hZDogVFJVRQ0KICAgIHRoZW1lOiBkYXJrDQoNCi0tLQ0KDQohW10oQzpcXFVzZXJzXFxFZHVhcmRvXFxEb3dubG9hZHNcXGNpdGF0aW9uLXVsdHJhLWludHJlcmlvci0xLndlYnApDQoNCkxhIGxpYnJlcsOtYSAqRGF0YSBFeHBsb3JlciogZXMgbGEgbcOhcyBjb25vY2lkYSBwYXJhIGVsIGFuw6FsaXNpcyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1wbGUgZGUgdXNhciB5IG11eSBwb2Rlcm9zYSwgcHVlcyBvZnJlY2UgY29tbyB1bmEgc2FsaWRhIHVuIGluZm9ybWUgY29uIG11Y2hhIGluZm9ybWFjacOzbi4NCg0KTGEgZnVuY2lvbiBwYXJhIGNyZWFyIGVsIGluZm9ybWUgZXMgKmNyZWF0ZV9yZXBvcnQqLCB5IHBhcmEgdmVyIGNhZGEgZ3LDoWZpY2EgZGUgZm9ybWEgaW5kaXZpZHVhbCwgbGFzIGZ1bmNpb25lcyBzb246DQoNCiogKmludHJvZHVjZSgpKg0KKiAqcGxvdF9pbnRybygpKg0KKiAqcGxvdF9ib3hwbG90KCkqDQoqICpwbG90X21pc3NpbmcoKSoNCiogKnBsb3RfaGlzdG9ncmFtKCkqDQoqICpwbG90X2JhcigpKg0KKiAqcGxvdF9jb3JyZWxhdGlvbigpKg0KDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyPC9zcGFuPg0KDQpgYGB7ciB3YXJuaW5nPUZBTFNFfQ0KI2luc3RhbGwucGFja2FnZXMoIkRhdGFFeHBsb3JlciIpDQpsaWJyYXJ5KERhdGFFeHBsb3JlcikNCiNpbnN0YWxsLnBhY2thZ2VzKCJueWNmbGlnaHRzMTMiKQ0KbGlicmFyeShueWNmbGlnaHRzMTMpDQpgYGANCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6eWVsbG93OyI+Q29udGV4dG88L3NwYW4+DQoNCkVsIHBhcXVldGUgKm55Y2ZsaWdodHMxMyogY29udGllbmUgaW5mb3JtYWNpw7NuIHNvYnJlIHRvZG9zIGxvcyB2dWVsb3MgcXVlIHBhcnRpZXJvbiBkZXNkZSBOdWV2YSBZb3JrIChFV1IsIEpGSywgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLiBGdWVyb24gMzM2LDc3NiB2dWVsb3MgZW4gdG90YWwuDQoNCkxhcyB0YWJsYXMgZGUgZXN0ZSBwYXF1ZXRlIHkgc3VzIHJlbGFjaW9uZXMgc29uIGxhcyBzaWd1aWVudGVzOg0KDQohW10oQzpcXFVzZXJzXFxFZHVhcmRvXFxEb3dubG9hZHNcXHJlbGF0aW9uYWwtbnljZmxpZ2h0cy5wbmcpDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPkNyZWFyIEJhc2UgZGUgRGF0b3M8L3NwYW4+DQoNCmBgYHtyfQ0KZmxpZ2h0cyA9IGZsaWdodHMNCndlYXRoZXIgPSB3ZWF0aGVyDQpwbGFuZXMgPSBwbGFuZXMNCmFpcnBvcnRzID0gYWlycG9ydHMNCmFpcmxpbmVzID0gYWlybGluZXMNCmRmID0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5ID0gImNhcnJpZXIiKQ0KZGYgPSBtZXJnZShkZiwgcGxhbmVzLCBieSA9ICJ0YWlsbnVtIikNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjp5ZWxsb3c7Ij5DcmVhciByZXBvcnRlIHkgVmlzdWFsaXphciBHcsOhZmljYTwvc3Bhbj4NCg0KYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0NCiMgY3JlYXRlX3JlcG9ydChkZikNCmludHJvZHVjZShkZikNCnBsb3RfaW50cm8oZGYpDQpwbG90X2JveHBsb3QoZGYsIGJ5ID0iY2FycmllciIpDQpwbG90X21pc3NpbmcoZGYpDQpwbG90X2hpc3RvZ3JhbShkZikNCnBsb3RfYmFyKGRmKQ0KcGxvdF9jb3JyZWxhdGlvbihkZikNCmBgYA0KDQoNCg==