Felipe Jiménez
julio 18, 2015
Essentially, all models are wrong, but some are useful George E. P. Box .


-Las organizaciones líderes e innovadoras en el mundo son data driven.
-El presente y futuro de una organización data-driven es el Big Data y la información almacenada en internet.
-Entre el 80%-90% de la data potencialmente importante se encuentra en forma no estructurada.






-Para hacer uso adecuado de la información no estructurada e interpretar la data de acuerdo a su contexto,se debe utilizar el Procesamiento de Lenguaje Natural.
Dado el nombre de una o varias entidades, crear un motor que busque las coincidencias de esa(s) entidad(es) en noticias y documentos en internet(Hits).

Dichos documentos son comparados y puestos en contexto con textos LAFT ya clasificados para cuantificar su similaridad.

Luego por medio de modelos predictivos se asigne una probabilidad de ser un texto LAFT a los documentos con los que la entidad tuvo coincidencia(Matchs).





















Se recopilaron un total de 14944 documentos (9412 de temas LAFT y 5870 de otros temas ) desde los meses 4 - 6 del año 2015(luego de aplicar los filtros de limpieza).




-Generación de alertas: Correr procesos automatizados para generar alertas de la cartera, gestores u ordenantes de operaciones con el grupo.
-Consultas especiales de individuos: Investigaciones especiales realizadas en algunas ocasiones a individuos.
-Monitoreo automatizado de noticias: Monitorear de manera automatizada las noticias por país, midiendo la frecuencia, tendencia y tipos de riesgos por país, además de generar las alertas por cada país para que sean analizadas por el departamento de cumplimiento.