Teoría

La líbreria DataExplorer es la mas conocida en el mundo análitico exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.
La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son:

  • introduce()
  • plot_intro()
  • plot_boxplot()
  • plot_missing()
  • plot_histogram()
  • plot_bar()
  • plat_correlation()

Instalar paquetes y llamar librerias

library(DataExplorer)
library(nycflights13)

Contexto

El paquete nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos en los Estados Unidos en 2013. FUeron 336,776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:

Crear bases de datos

flights <- flights
planes <- planes
weather <- weather
airlines <- airlines
airports <- airports
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by = "tailnum")

Crear reporte y visualizar las gráficas

#create_report(df)
introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by = "carrier")

plot_missing(df)

plot_histogram(df)

plot_bar(df)

plot_correlation(df)

LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlciIKYXV0aG9yOiAiTWFyY2VsbyBUYW0gQXJpY2EgLSBBMDE3MjIxNDAiCmRhdGU6ICJgciBTeXMuRGF0ZSgpYCIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OiAKICAgIHRvYzogVFJVRQogICAgdG9jX2Zsb2F0OiBUUlVFCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFCiAgICB0aGVtZTogZGFyawotLS0KCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPlRlb3LDrWE8L3NwYW4+IApMYSBsw61icmVyaWEgKipEYXRhRXhwbG9yZXIqKiBlcyBsYSBtYXMgY29ub2NpZGEgZW4gZWwgbXVuZG8gYW7DoWxpdGljbyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1wbGUgZGUgdXNhciB5IG11eSBwb2Rlcm9zYSwgcHVlcyBvZnJlY2UgY29tbyBzYWxpZGEgdW4gaW5mb3JtZSBjb24gbXVjaGEgaW5mb3JtYWNpw7NuLiAgCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgZWwgaW5mb3JtZSBlcyAqKmNyZWF0ZV9yZXBvcnQqKiwgeSBwYXJhIHZlciBjYWRhIGdyw6FmaWNhIGRlIGZvcm1hIGluZGl2aWR1YWwsIGxhcyBmdW5jaW9uZXMgc29uOgoKKiAqaW50cm9kdWNlKCkqCiogKnBsb3RfaW50cm8oKSoKKiAqcGxvdF9ib3hwbG90KCkqCiogKnBsb3RfbWlzc2luZygpKgoqICpwbG90X2hpc3RvZ3JhbSgpKgoqICpwbG90X2JhcigpKgoqICpwbGF0X2NvcnJlbGF0aW9uKCkqCgojIDxzcGFuIHN0eWxlPSJjb2xvcjp5ZWxsb3c7Ij5JbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXJpYXM8L3NwYW4+IApgYGB7cn0KbGlicmFyeShEYXRhRXhwbG9yZXIpCmxpYnJhcnkobnljZmxpZ2h0czEzKQpgYGAKCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPkNvbnRleHRvPC9zcGFuPiAKCkVsIHBhcXVldGUgKipueWNmbGlnaHRzMTMqKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIHkgTEdBKSBhIGRlc3Rpbm9zIGVuIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLiBGVWVyb24gMzM2LDc3NiB2dWVsb3MgZW4gdG90YWwuCgpMYXMgdGFibGFzIGRlIGVzdGUgcGFxdWV0ZSB5IHN1cyByZWxhY2lvbmVzIHNvbiBsYXMgc2lndWllbnRlczoKIVtdKC9Vc2Vycy9tYXJjZWxvdGFtL0Rlc2t0b3AvY29uY2VudHJhY2lvbiBBSS9NMi9yZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQoKIyA8c3BhbiBzdHlsZT0iY29sb3I6eWVsbG93OyI+Q3JlYXIgYmFzZXMgZGUgZGF0b3M8L3NwYW4+IApgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQpmbGlnaHRzIDwtIGZsaWdodHMKcGxhbmVzIDwtIHBsYW5lcwp3ZWF0aGVyIDwtIHdlYXRoZXIKYWlybGluZXMgPC0gYWlybGluZXMKYWlycG9ydHMgPC0gYWlycG9ydHMKZGYgPC0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5ID0gImNhcnJpZXIiKQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieSA9ICJ0YWlsbnVtIikKYGBgCgojIDxzcGFuIHN0eWxlPSJjb2xvcjp5ZWxsb3c7Ij5DcmVhciByZXBvcnRlIHkgdmlzdWFsaXphciBsYXMgZ3LDoWZpY2FzPC9zcGFuPiAKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KI2NyZWF0ZV9yZXBvcnQoZGYpCmludHJvZHVjZShkZikKcGxvdF9pbnRybyhkZikKcGxvdF9ib3hwbG90KGRmLCBieSA9ICJjYXJyaWVyIikKcGxvdF9taXNzaW5nKGRmKQpwbG90X2hpc3RvZ3JhbShkZikKcGxvdF9iYXIoZGYpCnBsb3RfY29ycmVsYXRpb24oZGYpCmBgYAoK