Este ramo consiste en la comprensión y manipulación de datos, tanto en la utilización de visualización como en herramientas de análisis, para poder rescatar la mayor cantidad de información de valor.
Este libro -uno de los libros guías del curso- es fácil, rápido y entretenido de leer. Explica con anécdotas divertidas lo que es la ciencia de datos. Les sirve para entender el fondo más allá de la programación que vemos en clases. De esta forma, se vuelve más fácil aplicarlo, y sobretodo, lograr un buen análisis en su trabajo final. Está disponible en la biblioteca online de la UAI. Si les cuesta encontrarlo, pregunten por el chat de la página de la biblioteca
Este libro online es una guía para aprender R. A diferencia de
nuestro curso, utiliza como base la sintaxis del paquete
dplyr, y nosotros aprendimos a usar el paquete
data.table. No importa cual sintaxis usen, a veces es bueno
probar más de una para decidir que es lo que más les acomoda. Los
capítulos de visualizaciones de este libro también son muy buenos y
siempre se los recomiendo. La gracia que tiene al ser un R book es que
todos los códigos están listos para copiar y pegar en R, además de que
usan bases de datos internas de R para los ejemplos. Por esto, es muy
fácil de replicar para practicar. Está disponible aquí
ggplot2 de Tidyverseleaflet de CRANStackoverflow es un foro donde puedes hacer preguntas específicas y otros podrían responderte, o donde puedes buscar dudas y revisar pregutas que otro ya hizo. El mejor consejo es buscar siempre con palabras claves y en inglés.
Martín Sielfeld, creó un archivo publicado en su Rpubs donde podrán encontrar multiples fuentes de datos de nuestro país y el mundo que les servirán tanto para el proyecto del curso como para futuros proyectos. Pueden encontrarlo aquí.