
Teoría
La librería Data Explorer es la más conocida para el
análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece
como salida un informe con mucha información.
La función para crear el informe es create_report, y para
ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plot_boxplot()
- plot_missing()
- plot_histogram()
- plot_bar()
- plot_correlation()
Instalar paquetes y llamar
librerías
#install.packages("DataExplorer")
library(DataExplorer)
## Warning: package 'DataExplorer' was built under R version 4.3.2
#install.packages("nycflights13")
library(nycflights13)
## Warning: package 'nycflights13' was built under R version 4.3.2
Contexto
El paquete nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos de los
Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes:

Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
#como tienen una columna en común, se usa merge para juntarlas
df <- merge(df, planes, by = "tailnum")
Crear reporte y visualizar
gráficas
# create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by = "carrier")


plot_missing(df)

plot_histogram(df)


plot_bar(df)

plot_correlation(df)

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJOYXllbGkgUGXDsWEgTWFydMOtbmV6IC0gQTAxMzY4NTE2Ig0KZGF0ZTogIjIwMjQtMDItMjciDQpvdXRwdXQ6DQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiB0cnVlDQogICAgdG9jX2Zsb2F0OiB0cnVlDQogICAgY29kZV9kb3dubG9hZDogdHJ1ZSANCiAgICB0aGVtZTogZGFyaw0KLS0tDQoNCiFbXShDOlxcVXNlcnNcXG5heWVsXFxEb3dubG9hZHNcXGF2aW9uLmdpZikNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6eWVsbG93OyI+VGVvcsOtYTwvc3Bhbj4NCkxhIGxpYnJlcsOtYSAqRGF0YSBFeHBsb3JlciogZXMgbGEgbcOhcyBjb25vY2lkYSBwYXJhIGVsIGFuw6FsaXNpcyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1wbGUgZGUgdXNhciB5IG11eSBwb2Rlcm9zYSwgcHVlcyBvZnJlY2UgY29tbyBzYWxpZGEgdW4gaW5mb3JtZSBjb24gbXVjaGEgaW5mb3JtYWNpw7NuLg0KDQpMYSBmdW5jacOzbiBwYXJhIGNyZWFyIGVsIGluZm9ybWUgZXMgKmNyZWF0ZV9yZXBvcnQqLCB5IHBhcmEgdmVyIGNhZGEgZ3LDoWZpY2EgZGUgZm9ybWEgaW5kaXZpZHVhbCwgbGFzIGZ1bmNpb25lcyBzb246ICANCg0KKiAqaW50cm9kdWNlKCkqDQoqICpwbG90X2ludHJvKCkqDQoqICpwbG90X2JveHBsb3QoKSoNCiogKnBsb3RfbWlzc2luZygpKg0KKiAqcGxvdF9oaXN0b2dyYW0oKSoNCiogKnBsb3RfYmFyKCkqDQoqICpwbG90X2NvcnJlbGF0aW9uKCkqDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcsOtYXM8L3NwYW4+DQpgYGB7cn0NCiNpbnN0YWxsLnBhY2thZ2VzKCJEYXRhRXhwbG9yZXIiKQ0KbGlicmFyeShEYXRhRXhwbG9yZXIpDQojaW5zdGFsbC5wYWNrYWdlcygibnljZmxpZ2h0czEzIikNCmxpYnJhcnkobnljZmxpZ2h0czEzKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnllbGxvdzsiPkNvbnRleHRvPC9zcGFuPg0KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLIHkgTEdBKSBhIGRlc3Rpbm9zIGRlIGxvcyBFc3RhZG9zIFVuaWRvcyBlbiAyMDEzLiBGdWVyb24gMzM2LDc3NiB2dWVsb3MgZW4gdG90YWwuICANCg0KTGFzIHRhYmxhcyBkZSBlc3RlIHBhcXVldGUgeSBzdXMgcmVsYWNpb25lcyBzb24gbGFzIHNpZ3VpZW50ZXM6ICANCg0KIVtdKEM6XFxVc2Vyc1xcbmF5ZWxcXERvd25sb2Fkc1xccmVsYXRpb25hbC1ueWNmbGlnaHRzLnBuZykNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6eWVsbG93OyI+Q3JlYXIgYmFzZSBkZSBkYXRvczwvc3Bhbj4NCmBgYHtyfQ0KZmxpZ2h0cyA8LSBmbGlnaHRzDQp3ZWF0aGVyIDwtIHdlYXRoZXINCnBsYW5lcyA8LSBwbGFuZXMNCmFpcnBvcnRzIDwtIGFpcnBvcnRzDQphaXJsaW5lcyA8LSBhaXJsaW5lcw0KZGYgPC0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5ID0gImNhcnJpZXIiKQ0KI2NvbW8gdGllbmVuIHVuYSBjb2x1bW5hIGVuIGNvbcO6biwgc2UgdXNhIG1lcmdlIHBhcmEganVudGFybGFzDQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieSA9ICJ0YWlsbnVtIikNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjp5ZWxsb3c7Ij5DcmVhciByZXBvcnRlIHkgdmlzdWFsaXphciBncsOhZmljYXM8L3NwYW4+DQpgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0KIyBjcmVhdGVfcmVwb3J0KGRmKQ0KaW50cm9kdWNlKGRmKQ0KcGxvdF9pbnRybyhkZikNCnBsb3RfYm94cGxvdChkZiwgYnkgPSAiY2FycmllciIpDQpwbG90X21pc3NpbmcoZGYpDQpwbG90X2hpc3RvZ3JhbShkZikNCnBsb3RfYmFyKGRmKQ0KcGxvdF9jb3JyZWxhdGlvbihkZikNCmBgYA==