
Teoría
La librería *DataExplorer** es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información.
La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plotboxpot
- plot_missingg()
- plot_hisogram()
- plot_bar()
- plot_correlation()
Instalar paquetes y llamar librerias
#install.packages("caret") #Algoritmos de aprendizaje
library(caret)
## Loading required package: ggplot2
## Loading required package: lattice
#install.packages("datasets") #Usar la base de datos "Iris"
library(datasets)
#install.packages("ggplot2") #Gráficas con mejor diseño
library(ggplot2)
#install.packages("lattice") #Crear gráficos
library(lattice)
#install.packages("DataExplorer") #Crear gráficos
library(DataExplorer)
library(DataExplorer)
library(nycflights13)
library(ggplot2)
library(naniar)
#file.choose()
Instalar paquetes y llamar librerias
El paquete nycflights12 contiene información sobre todos los vuelos que partieron desde Nueva York (EWR, JFK, LGA) a destinos en los Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquete y sus relaciones son las siguientes: 
Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by = "tailnum")
#create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296

plot_boxplot(df, by = "carrier")
## Warning: Removed 23255 rows containing non-finite values (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite values (`stat_boxplot()`).

#plot_missingg(df)
#plot_hisogram(df)
plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tCnRpdGxlOiAiRGF0YSBFeHBsb3JlciAtIE7DoWplcmEiCmF1dGhvcjogIkRhbmllbCBOYWplcmEgLSBBMDE3MDk3OCIKZGF0ZTogIjIwMjQtMDItMTkiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDoKICAgIHRvYzogVFJVRQogICAgdG9jX2Zsb2F0OiBUUlVFCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFCiAgICB0aGVtZTogZGFyawogICAgaGlnaGxpZ2h0OiAia2F0ZSIKLS0tCgohW10oL1VzZXJzL2RhbmllbG5hamVyYS9Eb3dubG9hZHMvdnVlbG9zX255LmpmaWYpCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogeWVsbG93OyI+VGVvcsOtYTwvc3Bhbj4KTGEgbGlicmVyw61hICpEYXRhRXhwbG9yZXIqKiBlcyBsYSBtw6FzIGNvbm9jaWRhIHBhcmEgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpby4KRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBwdWVzIG9mcmVjZSBjb21vIHNhbGlkYSB1biBpbmZvcm1lIGNvbgptdWNoYSBpbmZvcm1hY2nDs24uCgpMYSBmdW5jacOzbiBwYXJhIGNyZWFyIGVsIGluZm9ybWUgZXMgKmNyZWF0ZV9yZXBvcnQqLCB5IHBhcmEgdmVyIGNhZGEgZ3LDoWZpY2EKZGUgZm9ybWEgaW5kaXZpZHVhbCwgbGFzIGZ1bmNpb25lcyBzb246CgoqICppbnRyb2R1Y2UoKSoKKiAqcGxvdF9pbnRybygpKgoqICpwbG90Ym94cG90KgoqICpwbG90X21pc3NpbmdnKCkqCiogKnBsb3RfaGlzb2dyYW0oKSoKKiAqcGxvdF9iYXIoKSoKKiAqcGxvdF9jb3JyZWxhdGlvbigpKgoKIyA8c3BhbiBzdHlsZT0iY29sb3I6IHllbGxvdzsiPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcmlhczwvc3Bhbj4KYGBge3J9CiNpbnN0YWxsLnBhY2thZ2VzKCJjYXJldCIpICNBbGdvcml0bW9zIGRlIGFwcmVuZGl6YWplCmxpYnJhcnkoY2FyZXQpCiNpbnN0YWxsLnBhY2thZ2VzKCJkYXRhc2V0cyIpICNVc2FyIGxhIGJhc2UgZGUgZGF0b3MgIklyaXMiCmxpYnJhcnkoZGF0YXNldHMpCiNpbnN0YWxsLnBhY2thZ2VzKCJnZ3Bsb3QyIikgI0dyw6FmaWNhcyBjb24gbWVqb3IgZGlzZcOxbwpsaWJyYXJ5KGdncGxvdDIpCiNpbnN0YWxsLnBhY2thZ2VzKCJsYXR0aWNlIikgI0NyZWFyIGdyw6FmaWNvcwpsaWJyYXJ5KGxhdHRpY2UpCiNpbnN0YWxsLnBhY2thZ2VzKCJEYXRhRXhwbG9yZXIiKSAjQ3JlYXIgZ3LDoWZpY29zCmxpYnJhcnkoRGF0YUV4cGxvcmVyKQpsaWJyYXJ5KERhdGFFeHBsb3JlcikKbGlicmFyeShueWNmbGlnaHRzMTMpCmxpYnJhcnkoZ2dwbG90MikKbGlicmFyeShuYW5pYXIpCiNmaWxlLmNob29zZSgpCmBgYAoKIyA8c3BhbiBzdHlsZT0iY29sb3I6IHllbGxvdzsiPkluc3RhbGFyIHBhcXVldGVzIHkgbGxhbWFyIGxpYnJlcmlhczwvc3Bhbj4KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEyKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG9zIHZ1ZWxvcyBxdWUKcGFydGllcm9uIGRlc2RlIE51ZXZhIFlvcmsgKEVXUiwgSkZLLCBMR0EpIGEgZGVzdGlub3MgZW4gbG9zIEVzdGFkb3MgVW5pZG9zCmVuIDIwMTMuIEZ1ZXJvbiAzMzYsNzc2IHZ1ZWxvcyBlbiB0b3RhbC4KCkxhcyB0YWJsYXMgZGUgZXN0ZSBwYXF1ZXRlIHkgc3VzIHJlbGFjaW9uZXMgc29uIGxhcyBzaWd1aWVudGVzOgohW10oL1VzZXJzL2RhbmllbG5hamVyYS9Eb3dubG9hZHMvbnlmbGlnaHRzcy5qcGVnKQoKIyA8c3BhbiBzdHlsZT0iY29sb3I6IHllbGxvdzsiPkNyZWFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+CmBgYHtyfQpmbGlnaHRzIDwtIGZsaWdodHMKd2VhdGhlciA8LSB3ZWF0aGVyCnBsYW5lcyA8LSBwbGFuZXMKYWlycG9ydHMgPC0gYWlycG9ydHMKYWlybGluZXMgPC0gYWlybGluZXMKZGYgPC0gbWVyZ2UoZmxpZ2h0cywgYWlybGluZXMsIGJ5ID0gImNhcnJpZXIiKQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieSA9ICJ0YWlsbnVtIikKYGBgCgoKYGBge3J9CiNjcmVhdGVfcmVwb3J0KGRmKQppbnRyb2R1Y2UoZGYpCnBsb3RfaW50cm8oZGYpCnBsb3RfYm94cGxvdChkZiwgYnkgPSAiY2FycmllciIpCiNwbG90X21pc3NpbmdnKGRmKQojcGxvdF9oaXNvZ3JhbShkZikKcGxvdF9iYXIoZGYpCnBsb3RfY29ycmVsYXRpb24oZGYpCmBgYAoK