
#file.choose()
TeorÃa
La librerua DataExplorer es la más conocida para el análisis
exploratorio. Es muy simpe de usar y muy poderosa, ofrece como salida un
informe con mucha información
La función para crear el informe es create_report, y para ver
cada gráfica de forma individual, las funciones son:
- introduce()
- plot_intro()
- plotboxplot()
- plot_missing()
- plot histogram
- plot_bar()
- plot_correlation()
Instalar paquetes y librerÃas
#install.packages("DataExplorer")
library(DataExplorer)
## Warning: package 'DataExplorer' was built under R version 4.3.2
#install.packages("nycflights13")
library(nycflights13)
## Warning: package 'nycflights13' was built under R version 4.3.2
Contexto
El paquete nycflights13 contiene información sobre todos lo
vuelos que patieron desde Nueva York (EWR, JFK y LGA) a destinos en los
Estados Unidos de América en el 2013. Fueron 336,776 vuelos en
total.
Las tablas de este paquete y sus relaciones son las siguientes:
Crear la base de datos
flights<- flights
weather<- weather
planes<- planes
airports<- airports
airlines<- airlines
df<- merge(flights, airlines, by= "carrier")
df<- merge(df, planes, by= "tailnum")
Crear el reporte y visualizar
gráficas
#create_report(df)
introduce(df)
## rows columns discrete_columns continuous_columns all_missing_columns
## 1 284170 28 10 18 0
## total_missing_values complete_rows total_observations memory_usage
## 1 311768 920 7956760 50225296
plot_intro(df)

plot_boxplot(df, by = "carrier")
## Warning: Removed 23255 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## Warning: Removed 288513 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

plot_missing(df)

plot_histogram(df)


plot_bar(df)
## 4 columns ignored with more than 50 categories.
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## model: 127 categories

plot_correlation(df)
## 5 features with more than 20 categories ignored!
## tailnum: 3322 categories
## dest: 104 categories
## time_hour: 6934 categories
## manufacturer: 35 categories
## model: 127 categories
## Warning in cor(x = structure(list(year.x = c(2013L, 2013L, 2013L, 2013L, : the
## standard deviation is zero

LS0tDQp0aXRsZTogIkRhdGEgRXhwbG9yZXIiDQphdXRob3I6ICJEaWVnbyBQZXJleiBBMDEyNzU1NjEiDQpkYXRlOiAiMi8yNy8yMDI0Ig0Kb3V0cHV0Og0KICBodG1sX2RvY3VtZW50Og0KICAgIHRvYzogeWVzDQogICAgdG9jX2Zsb2F0OiB5ZXMNCiAgICBjb2RlX2Rvd25sb2FkOiB5ZXMNCiAgICB0aGVtZTogeWV0aQ0KLS0tDQoNCiAgIVtdKEM6XFxVc2Vyc1xcRGllZ28gUMOpcmV6XFxEb3dubG9hZHNcXGRlc2NhcmdhICgyKS5qcGVnKQ0KYGBge3J9DQojZmlsZS5jaG9vc2UoKQ0KYGBgDQoNCiMgPHNwYW4gc3R5bGU9ICJjb2xvcjogYmx1ZTsiPlRlb3LDrWE8L3NwYW4+IA0KTGEgbGlicmVydWEgKkRhdGFFeHBsb3JlciogZXMgbGEgbcOhcyBjb25vY2lkYSBwYXJhIGVsIGFuw6FsaXNpcyBleHBsb3JhdG9yaW8uIEVzIG11eSBzaW1wZSBkZSB1c2FyIHkgbXV5IHBvZGVyb3NhLCBvZnJlY2UgY29tbyBzYWxpZGEgdW4gaW5mb3JtZSBjb24gbXVjaGEgaW5mb3JtYWNpw7NuICANCkxhIGZ1bmNpw7NuIHBhcmEgY3JlYXIgZWwgaW5mb3JtZSBlcyAqY3JlYXRlX3JlcG9ydCosIHkgcGFyYSB2ZXIgY2FkYSBncsOhZmljYSBkZSBmb3JtYSBpbmRpdmlkdWFsLCBsYXMgZnVuY2lvbmVzIHNvbjogIA0KDQoqICppbnRyb2R1Y2UoKSoNCiogKnBsb3RfaW50cm8oKSoNCiogKnBsb3Rib3hwbG90KCkqDQoqICpwbG90X21pc3NpbmcoKSoNCiogKnBsb3QgaGlzdG9ncmFtKg0KKiAqcGxvdF9iYXIoKSoNCiogKnBsb3RfY29ycmVsYXRpb24oKSoNCg0KIyA8c3BhbiBzdHlsZT0gImNvbG9yOiBibHVlOyI+SW5zdGFsYXIgcGFxdWV0ZXMgeSBsaWJyZXLDrWFzPC9zcGFuPiANCmBgYHtyfQ0KI2luc3RhbGwucGFja2FnZXMoIkRhdGFFeHBsb3JlciIpDQpsaWJyYXJ5KERhdGFFeHBsb3JlcikNCiNpbnN0YWxsLnBhY2thZ2VzKCJueWNmbGlnaHRzMTMiKQ0KbGlicmFyeShueWNmbGlnaHRzMTMpDQpgYGANCg0KIyA8c3BhbiBzdHlsZT0gImNvbG9yOiBibHVlOyI+Q29udGV4dG88L3NwYW4+IA0KRWwgcGFxdWV0ZSAqbnljZmxpZ2h0czEzKiBjb250aWVuZSBpbmZvcm1hY2nDs24gc29icmUgdG9kb3MgbG8gdnVlbG9zIHF1ZSBwYXRpZXJvbiBkZXNkZSBOdWV2YSBZb3JrIChFV1IsIEpGSyB5IExHQSkgYSBkZXN0aW5vcyBlbiBsb3MgRXN0YWRvcyBVbmlkb3MgZGUgQW3DqXJpY2EgZW4gZWwgMjAxMy4gRnVlcm9uIDMzNiw3NzYgdnVlbG9zIGVuIHRvdGFsLg0KDQpMYXMgdGFibGFzIGRlIGVzdGUgcGFxdWV0ZSB5IHN1cyByZWxhY2lvbmVzIHNvbiBsYXMgc2lndWllbnRlczogDQoNCiMgPHNwYW4gc3R5bGU9ICJjb2xvcjogYmx1ZTsiPkNyZWFyIGxhIGJhc2UgZGUgZGF0b3M8L3NwYW4+IA0KYGBge3J9DQpmbGlnaHRzPC0gZmxpZ2h0cw0Kd2VhdGhlcjwtIHdlYXRoZXINCnBsYW5lczwtIHBsYW5lcw0KYWlycG9ydHM8LSBhaXJwb3J0cw0KYWlybGluZXM8LSBhaXJsaW5lcw0KZGY8LSBtZXJnZShmbGlnaHRzLCBhaXJsaW5lcywgYnk9ICJjYXJyaWVyIikNCmRmPC0gbWVyZ2UoZGYsIHBsYW5lcywgYnk9ICJ0YWlsbnVtIikNCmBgYA0KDQojIDxzcGFuIHN0eWxlPSAiY29sb3I6IGJsdWU7Ij5DcmVhciBlbCByZXBvcnRlIHkgdmlzdWFsaXphciBncsOhZmljYXM8L3NwYW4+IA0KYGBge3J9DQojY3JlYXRlX3JlcG9ydChkZikNCmludHJvZHVjZShkZikNCmBgYA0KDQpgYGB7cn0NCnBsb3RfaW50cm8oZGYpDQpgYGANCg0KYGBge3J9DQpwbG90X2JveHBsb3QoZGYsIGJ5ID0gImNhcnJpZXIiKQ0KYGBgDQoNCmBgYHtyfQ0KcGxvdF9taXNzaW5nKGRmKQ0KYGBgDQoNCmBgYHtyfQ0KcGxvdF9oaXN0b2dyYW0oZGYpDQpgYGANCg0KYGBge3J9DQpwbG90X2JhcihkZikNCmBgYA0KDQpgYGB7cn0NCnBsb3RfY29ycmVsYXRpb24oZGYpDQpgYGANCg0K