Campo interdisiplinario que se encarga de extraer conocimiento de datos y generar análisis sobre estos
Matemáticas
Estadística
Ciencias de computación
12 de agosto de 2020
Campo interdisiplinario que se encarga de extraer conocimiento de datos y generar análisis sobre estos
Matemáticas
Estadística
Ciencias de computación
“The ability to take data - to be able to understand it, to process it, to extract value from, to visualize it, to communicate it - that’s going to be a hugely important skill in the next decades”
Hal Varian, Economista Jefe de Google y Académico de UC Berkeley (2009)
Datos que contienen una mayor Variedad y que se presentan en Volúmenes crecientes y a una Velocidad superior (Gartnet,2001):
Volumen: Muchos!
Variedad: Datos estructurados - no estructurados
Velocidad: Tiempo real
Valor
Veracidad
“Creer que la información está por el mero hecho de que los datos existen es un serio error de principiante. Un punto crucial en la revolución de big data es que la falta de sistematización es la regla más que la explicación”
Walter Sosa, Economista Profesor en la UNLP y la UdeSA (2019)
Cumulus media (2017): En un minuto de internet…
3.5 millones de búsquedas en google
900.000 personas se conectan a Facebook
Se reproducen 4.1 millones de horas de videos en Youtube
Se envían 450.000 tweets
Se reproducen 70.000 horas de contenido en Netflix
Se suben 46.200 fotos en instagram
Los datos pueden ser un tuit, una posición en el GPS, el rut…
Los datos pueden estar en:
Repasaremos los tópicos principales de los que se ocupa DS desde un enfoque “Práctico”
Utilizaremos el software de estadístico R como una herramienta para desarrollar nuestros fines. El software nunca es el fin en si mismo!!
Las clases se enfocarán en la resolución de problemas para el análisis económico y aplicaciones para los negocios
Desarrollar la capacidad de conceptualización abstracta de estructura de datos y cómo estas se enlazan con metodologías para responder preguntas básicas que sirvan de apoyo a la toma de decisiones
Entender y aplicar la generación de información desde datos ‘crudos’
Aprender a trabajar datos de manera ordenada y sistemática con el fin de lograr generar proyectos que sean reproductibles
Brindar a estudiantes una introducción al lenguaje estadístico R
Introducción a la programación en R y Manejo de Datos
Visualización de Datos
El dilema actual de un buen Científico de Datos
Se entregan las primeras indicaciones y el contexto de este “mar de datos” que nos proponemos nadar
Se entregarán las herramientas básicas de programación en R para abordar los objetivos del curso:
Veremos como a través de los datos podemos:
Realizar análisis en términos exploratorios de forma visual para generar contexto, detectar problemas y posteriormente realizar alguna hipótesis de interés
Generar visualizaciones potentes que nos permitan captar la atención y mostrar dinámicas interesantes
Técnicas y herramientas de DS y su utilidad en la economía y en los negocios
Teoría:
Evaluación | Ponderación |
---|---|
Control 1 | 15% |
Control 2 | 10% |
Control 3 | 15% |
Entrega de Productos | 20% |
Proyecto Final – Primera Entrega | 10% |
Proyecto Final – Informe y Presentación | 30% |