La librería Data Explorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.

La función para crear el informe es create_report(), y para ver cada gráfica de forma individual, las funciones son:

  • introduce()
  • plot_intro()
  • plot_boxplot()
  • plot_missing()
  • plot_histogram()
  • plot_correlation()
#install.packages("DataExplorer")
library(DataExplorer)

#install.packages("nycflights13")
library(nycflights13)

El paqute nycflights13 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK, y LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.

Las tablas de este paquete y sus relaciones son las siguientes:
.

Crear base de datos

flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by="carrier")
df <- merge(df, planes, by="tailnum")
#create_report(df)
introduce(df)
##     rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170      28               10                 18                   0
##   total_missing_values complete_rows total_observations memory_usage
## 1               311768           920            7956760     50225296
plot_intro(df)

plot_boxplot(df, by="carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

# Conclusión La librería Data Explorer es un excelente punto de partida para el análisis exploratorio de datos, ya que de manera práctica proporciona un resumen de múltiples medidas descriptivas de los datos.

LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlciIKYXV0aG9yOiAiTGlzc2V0IEhlcm7DoW5kZXogQTAxMjg0NjExIgpkYXRlOiAiMjAyNC0wMi0yNyIKb3V0cHV0OiAKIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KIVtdKC9Vc2Vycy9saXNoZHovRG93bmxvYWRzL3BsYW5lLmdpZikKICAKTGEgbGlicmVyw61hICpEYXRhIEV4cGxvcmVyKiBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4gRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBwdWVzIG9mcmVjZSBjb21vIHNhbGlkYSB1biBpbmZvcm1lIGNvbiBtdWNoYSBpbmZvcm1hY2nDs24uICAKCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgZWwgaW5mb3JtZSBlcyAqY3JlYXRlX3JlcG9ydCgpKiwgeSBwYXJhIHZlciBjYWRhIGdyw6FmaWNhIGRlIGZvcm1hIGluZGl2aWR1YWwsIGxhcyBmdW5jaW9uZXMgc29uOiAgCgoqICppbnRyb2R1Y2UoKSogCiogKnBsb3RfaW50cm8oKSogCiogKnBsb3RfYm94cGxvdCgpKiAKKiAqcGxvdF9taXNzaW5nKCkqICAgIAoqICpwbG90X2hpc3RvZ3JhbSgpKiAgICAKKiAqcGxvdF9jb3JyZWxhdGlvbigpKiAgCgpgYGB7cn0KI2luc3RhbGwucGFja2FnZXMoIkRhdGFFeHBsb3JlciIpCmxpYnJhcnkoRGF0YUV4cGxvcmVyKQoKI2luc3RhbGwucGFja2FnZXMoIm55Y2ZsaWdodHMxMyIpCmxpYnJhcnkobnljZmxpZ2h0czEzKQpgYGAKCkVsIHBhcXV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUgcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLLCB5IExHQSkgYSBkZXN0aW5vcyBlbiBsb3MgRXN0YWRvcyBVbmlkb3MgZW4gMjAxMy4gRnVlcm9uIDMzNiw3NzYgdnVlbG9zIGVuIHRvdGFsLiAKCkxhcyB0YWJsYXMgZGUgZXN0ZSBwYXF1ZXRlIHkgc3VzIHJlbGFjaW9uZXMgc29uIGxhcyBzaWd1aWVudGVzOiAgCiFbXSgvVXNlcnMvbGlzaGR6L0Rvd25sb2Fkcy9VbnRpdGxlZC5wbmcpLiAKCiMgQ3JlYXIgYmFzZSBkZSBkYXRvcwoKYGBge3J9CmZsaWdodHMgPC0gZmxpZ2h0cwp3ZWF0aGVyIDwtIHdlYXRoZXIKcGxhbmVzIDwtIHBsYW5lcwphaXJwb3J0cyA8LSBhaXJwb3J0cwphaXJsaW5lcyA8LSBhaXJsaW5lcwpkZiA8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnk9ImNhcnJpZXIiKQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieT0idGFpbG51bSIpCmBgYAoKYGBge3J9CiNjcmVhdGVfcmVwb3J0KGRmKQppbnRyb2R1Y2UoZGYpCnBsb3RfaW50cm8oZGYpCnBsb3RfYm94cGxvdChkZiwgYnk9ImNhcnJpZXIiKQpwbG90X21pc3NpbmcoZGYpCnBsb3RfaGlzdG9ncmFtKGRmKQpwbG90X2NvcnJlbGF0aW9uKGRmKQpgYGAKIyBDb25jbHVzacOzbiAKTGEgbGlicmVyw61hIERhdGEgRXhwbG9yZXIgZXMgdW4gZXhjZWxlbnRlIHB1bnRvIGRlIHBhcnRpZGEgcGFyYSBlbCBhbsOhbGlzaXMgZXhwbG9yYXRvcmlvIGRlIGRhdG9zLCB5YSBxdWUgZGUgbWFuZXJhIHByw6FjdGljYSBwcm9wb3JjaW9uYSB1biByZXN1bWVuIGRlIG3Dumx0aXBsZXMgbWVkaWRhcyBkZXNjcmlwdGl2YXMgZGUgbG9zIGRhdG9zLgo=