IMPORTANCIA DE LA VISUALIZACIÓN DE DATOS
- Visualización de datos es el estudio de cómo representar datos mediante un enfoque visual o artístico en lugar del método tradicional de generación de informes.
- Es un campo en crecimiento con una escasez crítica de verdaderos expertos.
- Visualizaciones de datos que contienen datos inteligentes (datos procesados) y que proporcionan algún valor a una empresa al permitir que una persona o grupo de personas tomen decisiones más rápidas basadas en esos datos.
- La atención no se centra en lo que es bonito o atractivo frente a lo feo; su enfoque está en la experiencia y utilidad del usuario final.
LA VISUALIZACIÓN EN EL FLUJO DE ANÁLISIS DE LOS DATOS
BALANCES Y CONTRA BALANCES
- La visualización de datos es un tema fundamental en el proceso de creación de conocimiento en base a datos crudos
- La visualización de datos no es solamente un tema técnico,
- Dado que su objetivo es transmitir información que luego se transforma en conocimiento, el formato de esta transmisión debe ser tal que, personal no técnico este en capacidad de asimilar dicho conocimiento
INTERACTIVIDAD
Cuando se esta en una etapa exploratoria se desea que el analista pueda manipular la visualización viendo distintos aspectos como factores y medidas , entonces hablamos de que la presentación es interactiva , por lo tanto se excluye la posibilidad de hacer eso con Infografías .
Un gráfico interactivo cuenta una historia diferente cada vez que se presenta Una visualización de estado muestra una historia de datos que desea explicar
LIBRERÍAS Y APLICACIONES
Existen una gran cantidad de librerías y aplicaciones para generar visualilzaciones
Podríamos clasificarlar de acuerdo al nivel de interactividad que permiten
No interactivas
Una vez creado el gráfico el usuario final no puede alterar su contenido ni su forma. Un ejemplo de este tipo es ggplot
## Loading required package: ggplot2

Parcialemente Interactivas
Estas aplicaciones permiten algún nivel de interactividad con el usuario, de tal manera que se pueda por ejemplo seleccionar
- Un distinto tipo de gráfico
- Seleccionar una o más trazas visibles
- Subsets de datos a examinar
- Enfocar el gráfico en una área en particular
Pero estas aplicaciones se basan en las capacidades de la librerías que usan y no todas permiten el mismo nivel de interactividad. Y ,por supuesto, están atadas a dicha librería Ejemplos de este tipo son aquellos logrados con Javascript, Plotly
## Loading required package: rCharts
## Loading required package: base64enc
- Pero si la librería no soporta no soporta algún tipo de interactividad,
Completamente Interactivas
- Son completamente interactivas y se basan generalmente en frameworks específicos.
- Requieren más esfuerzo de programación para anticiparse a todas las opciones opciones que el usuario pueda imaginar
- Y requieren que el ambiente de progamación este disponible para su ejecución, lo cual hace que el cliente cuente con el ambiente en su propia PC. Sin embargo los servicios de publicación en la nube hacen esto más fácil, pero hay restricciones.
Un ejemplo es esta presentación lograda en R makdown y Shiny
R GGPLOT
- ggplot2 es un paquete de visualización de datos para el lenguaje R.
- Es un esquema general para la visualización de datos que divide los gráficos en componentes semánticos en una modalidad de capas.
- Forma parte del paquete Tidyverse, un sistema para la manipulación, exploración y visualización de datos que comparten una filosofía de diseño común. Los paquetes de Tidyverse están destinados a ser usados por estadísticos y científicos de datos. Básicamente, tidyverse trata sobre las conexiones entre las herramientas que hacen posible el flujo de trabajo.
Capas de ggplot
- Data: Especifica los dataset que se usarán, solo tiene un argumento: data=xxxx, solo utiliza data frames, otras capas podrían definir data adicional.
- Aesthetics: aes() especifica el mapeo de estética a los datos
- Geometrics: geom_xxx() especifica un objeto geométrico (tipo de gráfico) y combina: datos, mapeo estético, funciones estadísticas (stat) y ajuste de posición. Ej: puntos, líneas, barras
- Facets: facet_xxx(). Es una capa que permite desagregar relaciones complejas en pequeños múltiples
- Statistics: stat_xx() . Cada geom está asociado a una función estadística, pero puede ser cambiado mediante esta capa para especificar exactamente lo que se desea ver
- Coodinates: coord_xxx(). El sistema de coordenadas determina cómo se combinan la estética x y para colocar elementos en el gráfico. Ej: coord_polar ().
- Themes: theme_xxx(). Los temas controlan la visualización de todos los elementos del gráfico que no son datos, como colores, líneas, tamaño letra etc.
JAVA SCRIPT
- Se ha creado una gran variedad de librerías javascript para este propósito.
- Las diferencias entre las librerías se pueden catalogar en : – Interactividad con el mouse (pasar encima, clik , multitouch etc) – Tipos de gráficos que soportan – Licenciamiento (hay algunos que tiene costo) – Habilidad de zoom in/out – Capacidad de Anotaciones – Rotaciones – Browser soportados – Otras funcionalidades
R MARKDOWN y SHINY
Los documentos de R Markdown son completamente reproducibles. Utiliza una interfaz de cuaderno productiva para unir texto narrativo y código para producir resultados con un formato elegante. Utilice varios lenguajes, incluidos R, Python y SQL.
Admite docenas de formatos de salida estáticos y dinámicos, incluidos HTML, PDF, MS Word, Beamer, diapositivas HTML5, folletos de estilo Tufte, libros, paneles de control, aplicaciones brillantes, artículos científicos, sitios web y más.
Shiny es un paquete de R que permite construir aplicaciones web interactivas a partir de los scripts de R. La interactividad de estas aplicaciones permite manipular la visualización sin tener que manipular el código.