#
TeorÃa La librerÃa Data
Explorer es la más cocnocida para el ánalisis exploratorio. Es muy
simple de usar y muy poderos, pues ofrece como salida un informe con
mucha información.
La función para crear informes es create_report , y para ver
cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plotboxplot()
- plot_missing()
- plot_histogram()
- plot_bar()
- plot_correlation()
Instalar paquetes y llamar
librerÃas
#install.packages("DataExplorer")
library(DataExplorer)
#install.packages("nycflights13")
library(nycflights13)
Contexto
El paquete nycflights13 contiene información sobre todos los
vuelos que partieron desde Nueva York (EWR, JFK y LGA) a destinos en los
Estados Unidos en 2013. Fueron 336,776 vuelos en total.
Las tablas de este paquette y sus relaciones son las siguientes:
# Crear base de datos
flights <- flights
weather <- weather
planes <- planes
airports <- airports
airlines <- airlines
df <- merge(flights, airlines, by = "carrier")
df <- merge(df, planes, by = "tailnum")
Crear reporte y visualizar
graficas
#create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by="carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)


plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJHZXJhcmRvIENlZGlsbG8gQ29yb25hIg0KZGF0ZTogIjIwMjQtMDItMjYiDQpvdXRwdXQ6IA0KICBodG1sX2RvY3VtZW50OiANCiAgICB0b2M6IFRSVUUNCiAgICB0b2NfZmxvYXQ6IFRSVUUNCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFDQogICAgdGhlbWU6IGRhcmsNCi0tLQ0KDQohW10oQzpcXFVzZXJzXFxyb2RyaVxcRGVza3RvcFxcbW9kdWxvIDJcXERhdGEgZXhwbG9yZXJcXDk4LndlYnApIA0KIyA8c3BhbiBzdHlsZT0iY29sb3I6cGluazsiPlRlb3LDrWE8L3NwYW4+IA0KTGEgbGlicmVyw61hICpEYXRhIEV4cGxvcmVyKiBlcyBsYSBtw6FzIGNvY25vY2lkYSBwYXJhIGVsIMOhbmFsaXNpcyBleHBsb3JhdG9yaW8uIA0KRXMgbXV5IHNpbXBsZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3MsIHB1ZXMgb2ZyZWNlIGNvbW8gc2FsaWRhIHVuIGluZm9ybWUgY29uIG11Y2hhIGluZm9ybWFjacOzbi4gDQoNCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgaW5mb3JtZXMgZXMgKmNyZWF0ZV9yZXBvcnQqICwgeSBwYXJhIHZlciBjYWRhIGdyw6FmaWNhIGRlIA0KZm9ybWEgaW5kaXZpZHVhbCwgbGFzIGZ1bmNpb25lcyBzb246IA0KDQoqICppbnRyb2R1Y2UoKSoNCiogKnBsb3RfaW50cm8oKSoNCiogKnBsb3Rib3hwbG90KCkqDQoqICpwbG90X21pc3NpbmcoKSoNCiogKnBsb3RfaGlzdG9ncmFtKCkqDQoqICpwbG90X2JhcigpKg0KKiAqcGxvdF9jb3JyZWxhdGlvbigpKg0KDQojIDxzcGFuIHN0eWxlPSJjb2xvcjpwaW5rOyI+SW5zdGFsYXIgcGFxdWV0ZXMgeSBsbGFtYXIgbGlicmVyw61hczwvc3Bhbj4gDQpgYGB7cn0NCiNpbnN0YWxsLnBhY2thZ2VzKCJEYXRhRXhwbG9yZXIiKQ0KbGlicmFyeShEYXRhRXhwbG9yZXIpDQojaW5zdGFsbC5wYWNrYWdlcygibnljZmxpZ2h0czEzIikNCmxpYnJhcnkobnljZmxpZ2h0czEzKQ0KYGBgDQoNCg0KIyA8c3BhbiBzdHlsZT0iY29sb3I6cGluazsiPkNvbnRleHRvPC9zcGFuPiANCkVsIHBhcXVldGUgKm55Y2ZsaWdodHMxMyogY29udGllbmUgaW5mb3JtYWNpw7NuIHNvYnJlIHRvZG9zIGxvcyB2dWVsb3MgcXVlIHBhcnRpZXJvbiBkZXNkZSBOdWV2YSBZb3JrIChFV1IsIEpGSyB5IExHQSkgYSBkZXN0aW5vcyBlbiBsb3MgRXN0YWRvcyBVbmlkb3MgZW4gMjAxMy4gRnVlcm9uIDMzNiw3NzYgdnVlbG9zIGVuIHRvdGFsLg0KDQpMYXMgdGFibGFzIGRlIGVzdGUgcGFxdWV0dGUgeSBzdXMgcmVsYWNpb25lcyBzb24gbGFzIHNpZ3VpZW50ZXM6IA0KIVtdKEM6XFxVc2Vyc1xccm9kcmlcXERlc2t0b3BcXG1vZHVsbyAyXFxEYXRhIGV4cGxvcmVyXFxyZWxhdGlvbmFsLW55Y2ZsaWdodHMucG5nKQ0KIyA8c3BhbiBzdHlsZT0iY29sb3I6cGluazsiPkNyZWFyIGJhc2UgZGUgZGF0b3M8L3NwYW4+IA0KYGBge3J9DQpmbGlnaHRzIDwtIGZsaWdodHMNCndlYXRoZXIgPC0gd2VhdGhlcg0KcGxhbmVzIDwtIHBsYW5lcw0KYWlycG9ydHMgPC0gYWlycG9ydHMNCmFpcmxpbmVzIDwtIGFpcmxpbmVzDQpkZiA8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnkgPSAiY2FycmllciIpDQpkZiA8LSBtZXJnZShkZiwgcGxhbmVzLCBieSA9ICJ0YWlsbnVtIikNCmBgYA0KDQoNCiMgPHNwYW4gc3R5bGU9ImNvbG9yOnBpbms7Ij5DcmVhciByZXBvcnRlIHkgdmlzdWFsaXphciBncmFmaWNhczwvc3Bhbj4gDQpgYGB7cn0NCiNjcmVhdGVfcmVwb3J0KGRmKQ0KaW50cm9kdWNlKGRmKQ0KcGxvdF9pbnRybyhkZikNCnBsb3RfYm94cGxvdChkZiwgYnk9ImNhcnJpZXIiKQ0KcGxvdF9taXNzaW5nKGRmKQ0KcGxvdF9oaXN0b2dyYW0oZGYpDQpwbG90X2JhcihkZikNCnBsb3RfY29ycmVsYXRpb24oZGYpDQpgYGANCg0KDQoNCg==