Vamos a identificar cuales variables de unicentro están dando problemas. Si en las graficos aparece una variable de color amarillo significa que con la variable de ese archivo hay datos faltantes o incompletos. Esa es data a mejorar.
## Loading required package: colorspace
## Loading required package: grid
## VIM is ready to use.
## Since version 4.0.0 the GUI is in its own package VIMGUI.
##
## Please use the package to use the new (and old) GUI.
## Suggestions and bug-reports can be submitted at: https://github.com/alexkowa/VIM/issues
##
## Attaching package: 'VIM'
## The following object is masked from 'package:datasets':
##
## sleep
##
## Variables sorted by number of missings:
## Variable Count
## tienda 0.0608365
## id_tienda 0.0000000
## id_categoria 0.0000000
## file_nm 0.0000000
## Warning in plot.aggr(res, ...): not enough horizontal space to display
## frequencies
##
## Variables sorted by number of missings:
## Variable Count
## nofactura 0.0323760499
## tienda 0.0004063939
## nit 0.0004063939
## idfactura 0.0000000000
## fechafact 0.0000000000
## horafact 0.0000000000
## idtienda 0.0000000000
## valor 0.0000000000
## idestadofactura 0.0000000000
## estado 0.0000000000
## fecha_carga 0.0000000000
## hora_carga 0.0000000000
## idusuario 0.0000000000
## file_nm 0.0000000000
##
## Variables sorted by number of missings:
## Variable Count
## id_beneficio 0
## beneficio 0
## id_categoria_beneficio 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_categoria 0
## categoria 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## id_pelicula 0
## pelicula 0
## clasificacion 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## tipo_documento 0.010869565
## documento 0.010869565
## email 0.001086957
## iduser 0.000000000
## nombre 0.000000000
## apellido 0.000000000
## Adidas - 1-256 0.000000000
## Adidas Originals - 1-084 0.000000000
## Adrimodas - 2-147 0.000000000
## Afternoon Tea - 1003 0.000000000
## Agatha de la Prada - 1-274 0.000000000
## Agatha Ruiz De La Prada - 1-274 0.000000000
## Agencia de Pantuflas - 1-121 0.000000000
## Ambiente Gourmet - 1-245 0.000000000
## Ambos - Â 2-123 0.000000000
## Americana de Colchones - 1-116 0.000000000
## Americanino - Â 2-127 0.000000000
## Aquiles - 2-100 0.000000000
## Armi, Prono, Bkul, Koaj - 2-062 0.000000000
## ArtesanÃas El Zipa - 2-110 0.000000000
## Arturo Calle - 1-049 0.000000000
## Avianca - Deprisa - 1-002 0.000000000
## Ópticas ABC - 2-209 0.000000000
## Ópticas GMO - 1-176 0.000000000
## Época - 1-170 0.000000000
## Bauer - 2-253 0.000000000
## Bella Piel - 2-169 0.000000000
## Beso De Coco - 2-272 0.000000000
## Boots'n Bags - Â 2-183 0.000000000
## Bosi - 1-159 0.000000000
## Bosi Bambino - 2-047 0.000000000
## Bottero - 2-257 0.000000000
## Boucherel - 2-098 0.000000000
## Brissa - 2-001 0.000000000
## Café Illy - 1-012 0.000000000
## California Inn - 2-114 0.000000000
## Calvin Klein - 1-174 0.000000000
## Calzado Janine - 2-124 0.000000000
## Camiseria Inglesa - 2-141 0.000000000
## Candys Factory - 2-104 0.000000000
## Caprino - 2-115 0.000000000
## Caretas - 1-249 0.000000000
## Carlos Nieto - 2-004 0.000000000
## Cascabel - 2-207 0.000000000
## Castañer - 2-214 0.000000000
## Chantal - 2-165 0.000000000
## Cher France - Mujer Latina - 2-118 0.000000000
## Cherie - 2-109 0.000000000
## Chevignon - 2-206 0.000000000
## Cine Colombia - 1-200 0.000000000
## Cinnabon - 1-227 0.000000000
## Clarks - 2-130 0.000000000
## Claro - 2-002 0.000000000
## Clonhadas - 1-123 0.000000000
## Colchones El Dorado - 1-126 0.000000000
## Colchones Spring - 2-035 0.000000000
## Colchones Tempur - 1-179 0.000000000
## Colombia Gamers - 2-108 0.000000000
## Color Siete - 1-066 0.000000000
## Converse - 2-090 0.000000000
## Copa Airlines Colombia - 1-001 0.000000000
## Crepes & Waffles - 1-089 0.000000000
## Crocs - 1-052 0.000000000
## Deli - 1-251 0.000000000
## Derek - 1-054 0.000000000
## Diesel - 2-139 0.000000000
## Diner - 2-142 0.000000000
## Do It! - 1-009 0.000000000
## Domenico - 2-102 0.000000000
## Drogueria Cafam - 2-068 0.000000000
## Drogueria Colsubsidio - 2-263 0.000000000
## Drogueria Rosas - 2-167 0.000000000
## Du Pareil Au Meme - 2-195 0.000000000
## Dunkin Donuts - 2-158 0.000000000
## El Carnal - 2-076 0.000000000
## El Corral - 2-078 0.000000000
## ELA - 2-045 0.000000000
## Elements - 2-177 0.000000000
## EPK - 1-101 0.000000000
## Esprit - Â 2-186 0.000000000
## Exito - 1-233 0.000000000
## F.nebuloni - 1-247 0.000000000
## Fajas Maria E - 2-261 0.000000000
## Falabella - 1-013 0.000000000
## Fájate - 1-004 0.000000000
## Fedco - 1-072 0.000000000
## Florina Joyas y Accesorios - 2-195 0.000000000
## Florsheim - 2-075 0.000000000
## Foto Japon - 2-074 0.000000000
## Freeport Store - 1-088 0.000000000
## Fuera De Serie - 1-022 0.000000000
## FXA Shop - 1-029 0.000000000
## Garvi - 1-158 0.000000000
## Glam & Co - 1-170 0.000000000
## Glauser - 2-199 0.000000000
## Health Company - 2-122 0.000000000
## Hush Puppies - 2-040 0.000000000
## Imusa - 1-244 0.000000000
## Inkanta - 2-018 0.000000000
## Insolenzia - 1-119 0.000000000
## iShop - Â 1-080 0.000000000
## Isla Bonita - 2-163 0.000000000
## Jenos Pizza - 1-203 0.000000000
## JoyerÃa Arneva - 2-106 0.000000000
## JoyerÃa Intercontinental - Â 2-144 0.000000000
## Juan Valdez - 1-260 0.000000000
## Julio - 2-184 0.000000000
## Juvenia - 2-107 0.000000000
## Kelinda - 1-133 0.000000000
## Kevins - 1-042 0.000000000
## Kiehl's - Â 2-083 0.000000000
## Kokoriko - Mimos - Â 2-042 0.000000000
## Kosta Azul - 1-010 0.000000000
## Krispy Kreme - 2-269 0.000000000
## L'occitane - 2-036 0.000000000
## La Bolera - 1-030 0.000000000
## La Riviera - 1-040 0.000000000
## La Riviera - 1-252 0.000000000
## Lafam - 1-092 0.000000000
## Lafam - 2-029 0.000000000
## Lec Lee - 1-183 0.000000000
## Leonisa - 2-089 0.000000000
## Levi's - 2-270 0.000000000
## Libreria Nacional - Â 1-146 0.000000000
## Lili Pink - 2-153 0.000000000
## Los Vestidos - 1-199 0.000000000
## Loto Del Sur - 1-007 0.000000000
## Louis Barton - 2-016 0.000000000
## Luber - 1-115 0.000000000
## Lucania - 2-069 0.000000000
## Lucero Hofmann Diseños - 2-095 0.000000000
## Ma Maternity By Neuf - 2-103 0.000000000
## Mama's - 2-099 0.000000000
## Marco Aldany - Â 2-155 0.000000000
## Maria Helena - Â 1-231 0.000000000
## Maria Paula - 1-137 0.000000000
## Mario Hernandez - Â 1-069 0.000000000
## Marruecos - 2-179 0.000000000
## Massimo Dutti - 1-163 0.000000000
## Mateo Dalla - 1-108 0.000000000
## Mc Donalds - 1-065 0.000000000
## Mercedes Campuzano - Â 1-247 0.000000000
## Merrell - Â 2-208 0.000000000
## MIC - 2-119 0.000000000
## MNG - 1-081 0.000000000
## Mont Blanc - 1-014 0.000000000
## Movistar - 1-151 0.000000000
## Mundo Unico - Â 1-005 0.000000000
## Mussi - 2-113 0.000000000
## My Brand - 2-138 0.000000000
## Naf Naf - 2-211 0.000000000
## Naydu - 2-227 0.000000000
## Nespresso - 1-045 0.000000000
## Nike - Â 2-150 0.000000000
## Nueva Moda - 2-132 0.000000000
## Oma Restaurante - 2-046 0.000000000
## Opposite - 2-219 0.000000000
## Opticalia - Fundación Oftalmológica Nacional - 1-223 0.000000000
## Opticentro - 2-259 0.000000000
## Panamericana - Â 2-172 0.000000000
## Pandora - 1-184 0.000000000
## Pat Primo - 1-188 0.000000000
## Payless ShoeSource - 2-273 0.000000000
## People Plays - 2-081 0.000000000
## Pepe Ganga - Â 1-196 0.000000000
## Pharmaskin - 2-112 0.000000000
## Planeta Sport - 2-271 0.000000000
## Preppy - 2-087 0.000000000
## Pressto - L-2 0.000000000
## Primavera Shoes - 1-025 0.000000000
## Pylones - 2-129 0.000000000
## Rathzel - Â 1-041 0.000000000
## Sally Beauty - 2-185 0.000000000
## Samalens - 1-094 0.000000000
## Samsonite - 1-037 0.000000000
## Santana - 1-135 0.000000000
## Santorini - 2-249 0.000000000
## Servientrega - 1-105 0.000000000
## Sie Sua - 1-225 0.000000000
## Smartfone - 1-112 0.000000000
## Solo Relojes - 2-156 0.000000000
## Sopas de Mamá y Postres de la Abuela - 1-060 0.000000000
## Speedo - 1-102 0.000000000
## Sport Life - 2-077 0.000000000
## Spring Step - 1-085 0.000000000
## Sterling Joyeros - Â 2-210 0.000000000
## Stradivarius - 1-093 0.000000000
## Studio F - Â 2-225 0.000000000
## Swarovski - 2-039 0.000000000
## Swatch - 2-053 0.000000000
## Tania - Â 2-146 0.000000000
## Tennis - 1-077 0.000000000
## THAX Diseñadores - 2-097 0.000000000
## The North Face - 2-193 0.000000000
## Thermos - Â 2-216 0.000000000
## Tigo - 1-122 0.000000000
## Time Square - 1-113 0.000000000
## Tommy Hilfiger - 1-016 0.000000000
## TopMark - 1-187 0.000000000
## Totto - 1-026 0.000000000
## Totto Tú - 1-162 0.000000000
## Tous - 2-182 0.000000000
## Toys Landia - 1-106 0.000000000
## Travesuras - 1-050 0.000000000
## Tv Novedades Tv - 2-096 0.000000000
## Unicentro - 0-001 0.000000000
## Uniplaza De Comidas - 4-001 0.000000000
## Vans - Â 2-140 0.000000000
## Velez - 1-073 0.000000000
## Veraneo - 1-034 0.000000000
## Viajes El Corte Inglés - 2-101 0.000000000
## Victoria's Secret - 2-217 0.000000000
## Villa Romana - 1-036 0.000000000
## Whopper King - 1-140 0.000000000
## Women Secret - 2-034 0.000000000
## Xuss - 1-152 0.000000000
## Zara - 1-103 0.000000000
## Zephir - 2-159 0.000000000
## Zut - 1-021 0.000000000
## file_nm 0.000000000
##
## Variables sorted by number of missings:
## Variable Count
## id_beneficio 0
## beneficio 0
## tipo_b 0
## iduser 0
## nombre 0
## apellido 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## tipo_documento 0.010869565
## documento 0.010869565
## email 0.001086957
## iduser 0.000000000
## nombre 0.000000000
## apellido 0.000000000
## Accesorios 0.000000000
## Almacenes por Departamentos 0.000000000
## Bancos 0.000000000
## Calzado 0.000000000
## Comidas 0.000000000
## Deportes 0.000000000
## Entretenimiento 0.000000000
## Hogar y Decoración 0.000000000
## Joyas y Relojes 0.000000000
## Libros 0.000000000
## Marroquineria 0.000000000
## Moda Vestuarios 0.000000000
## Niños y jugueterÃa 0.000000000
## Opticas 0.000000000
## Salud y Belleza 0.000000000
## TecnologÃa 0.000000000
## Telefonia 0.000000000
## Viajes 0.000000000
## file_nm 0.000000000
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## id_beneficio 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_producto 0
## producto 0
## id_categoria 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## sector 0.727173913
## ciudad 0.710869565
## nivel_educativo 0.710869565
## estado_civil 0.710869565
## genero 0.589130435
## tipo_documento 0.010869565
## documento 0.010869565
## email 0.001086957
## id_usuario 0.000000000
## nombre 0.000000000
## apellido 0.000000000
## idtipodoc 0.000000000
## nacimiento 0.000000000
## idciudad 0.000000000
## idsector 0.000000000
## idniveledu 0.000000000
## idestcivil 0.000000000
## hijos 0.000000000
## puntosganados 0.000000000
## puntosgastados 0.000000000
## fecha_registro 0.000000000
## hora_registro 0.000000000
## file_nm 0.000000000
##
## Variables sorted by number of missings:
## Variable Count
## id_beneficio 0
## beneficio 0
## id_categoria_beneficio 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## id_producto 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## fecha 0
## hora 0
## file_nm 0
##
## Variables sorted by number of missings:
## Variable Count
## 17 1.00000000
## 16 0.98461538
## 14 0.96923077
## 8 0.96153846
## 9 0.96153846
## 10 0.96153846
## 11 0.96153846
## 12 0.96153846
## 13 0.96153846
## 7 0.95384615
## 6 0.94615385
## 5 0.93076923
## 4 0.92307692
## 3 0.89230769
## 2 0.81538462
## 1 0.03076923
## id_usuario 0.00000000
## file_nm 0.00000000
##
## Variables sorted by number of missings:
## Variable Count
## id_usuario 0
## fecha 0
## hora 0
## file_nm 0