Taller Final - Analytics II

Author

Julieth Zorro Melo

📊 Taller Final: Análisis exploratorio de datos para el proyecto de trabajo de grado

🎯Objetivo

Fortalecer las habilidades de análisis de datos aplicando principios del proceso estadístico colombiano, desarrollando recolección de datos propia, y elaborando análisis exploratorios y descriptivos con bases de datos secundarias.

Fecha de entrega: 19 de mayo
Modalidad de entrega: Presentación del trabajo (PPT) y del Dashboard en clase

🛠️ Instrucciones para el Taller

En este taller deberá presentar dos entregables.

  1. Presentación del análisis de una base de datos secundarios o externa
  2. Dashboard en PowerBI que permita análizar los resultados de la encuesta que diseño y recolecto por medio de Google Forms.

📊 Base de datos externa

Seleccione una base de datos relacionada con el tema del trabajo final.
Utilice R para realizar su análisis de datos.
En una presentación de máximo 6 páginas debe presentar lo siguiente.

1. Definición del fenómeno y objetivos del análisis

  • ¿Cuál es el fenómeno de estudio

  • ¿Qué variables o relaciones quieren analizar específicamente?

2. Fuentes de Información

  • ¿Qué fuentes de información encontró para el fenómeno?

  • ¿Cómo realizo la búsqueda?

  • ¿Descarto alguna? ¿Por qué?

  • ¿Considera que le hace falta alguna información para su análisis? ¿Por qué?

3. Caracterización de la(s) base(s) de datos

  • ¿La información está publicada en informes, papers académicos, noticias, documentos técnicos, tableros interactivos u otras plataformas? Especifiquen cuál.

  • Presente el link de donde descargo la información

  • Si realizo algún tipo de transformación de los datos, o algún proceso de consolidación describalo.

  • ¿Cuál es el tipo de investigación? (Censo, encuesta por muestreo, registro administrativo?

  • ¿Cuál es el universo de estudio, la población objetivo y las unidades estadísticas de las bases de datos utilizadas?

  • ¿Cuál es el tipo de formulario con el que se recolecto la información, y que tipo de preguntas contenia? (Si aplica)

  • La operación estadistica cuenta con manual de recolección y conceptos

  • La información recolectada tiene algún tipo de validación y consistencia.

  • ¿Las bases de datos tienen diseño muestral? Describan brevemente el tipo de muestreo, citando la fuente si está disponible.

Nota: Justifiquen su respuesta apoyandose en los lineamientos del Proceso Estadístico del SEN-Colombia (DANE, 2021) vistos en clase.

4. Calidad y documentación de los datos

  • ¿Las bases de datos utilizadas tienen diccionario de datos disponible?

  • ¿Cómo se difunden estas bases de datos? (medios y canales de difusión)

  • Importante: Relacionen sus respuestas con los subprocesos del Proceso Estadístico del SEN-Colombia.

5. Análisis descriptivo de datos secundarios (bases de datos externas)

  • Realicen un análisis exploratorio de las bases de datos originales:

    • Estadísticas descriptivas (media, mediana, desviación estándar, percentiles).

    • Visualización de datos gráfica.

    • Análisis de covarianza y correlación. Si es posible use gráficos de dispersión

  • Presente sus conclusiones. ¿Cómo las integrará en su trabajo de grado?

🎤 Formulario de recolección de datos (Google Forms)

1. Formulario de Recolección de Datos (Google Forms)

  • Elaboren un formulario en Google Forms relacionado con su fenómeno de estudio.

    El formulario debe cumplir con los conceptos vistos en clase y contener:

    • Mínimo 10 preguntas (de distintos tipos: abiertas, cerradas, de opción múltiple, escalas, etc.).

    • Variables relevantes para el análisis posterior.

    Entregables adicionales para esta sección:

    • Presentación del concepto, variables e indicadores a medir.

    • Descripción del diseño del formulario (qué preguntas se incluyen y su justificación).

    • Ficha metodológica, siguiendo el formato estándar basado en el DANE:

      • Nombre del formulario

      • Objetivo del instrumento.

      • Cobertura geográfica.

      • Unidad de observación.

      • Diseño muestral (si aplica).

      • Tipo de preguntas.

      • Fecha de recolección.

      • Canales de recolección (enlace, correo, redes sociales, etc.).

2. Recolección y análisis de datos propios

  1. Realicen un análisis descriptivo de la información recolectada y presentelo por medio de PowerBI. Su Dashboard debe cumplir los siguientes requisitos:

    Página de Presentación (portada):

    Debe contener, como mínimo:

    • Nombre del Dashboard

    • Objetivo del Dashboard

    • Información de su ficha metodológica

    Mínimo dos páginas o vistas interactivas:

    1. Cada página debe contener:

      1. Visualizaciones estadísticas descriptivas relevantes (no solo conteos, por ejemplo, tasas, promedios, medianas, frecuencias relativas)

      2. Uso de diferentes tipos de gráficas (barras, líneas, mapas, etc.).

      3. Visualización de tendencias y comparaciones entre indicadores

      4. Incorporación de filtros o segmentaciones (por entidad territorial, año, dimensión, indicador, etc.).

      5. Títulos claros en cada gráfica ejes correctamente etiquetados.

      6. Diseño visual ordenado, que facilite la interpretación de la información.

      7. Representación de distribuciones de probabilidad de al menos una variable numérica (por ejemplo, histograma o gráfico de densidad).

      Por último, presente sus conclusiones. ¿Cómo las integrará en su trabajo de grado? ¿Se relacionan con las conclusiones del análisis de bases de datos externas?

📋 Rúbrica de Evaluación

Criterio Excelente Bueno Aceptable Deficiente Ponderación
Definición del fenómeno y objetivos Fenómeno y objetivos muy claros, relevantes y coherentes con el tema de grado. Fenómeno y objetivos claros, aunque podrían ser más específicos. Fenómeno u objetivos algo vagos o poco relevantes. Fenómeno u objetivos poco claros o irrelevantes. 5%
Fuentes de información y caracterización de bases de datos Fuentes muy pertinentes, búsqueda detallada, justificación rigurosa; caracterización completa, siguiendo el SEN. Fuentes pertinentes, buena justificación; caracterización adecuada pero mejorable. Fuentes poco pertinentes o caracterización incompleta. Fuentes irrelevantes o caracterización deficiente. 5%
Calidad y documentación de los datos Análisis exhaustivo de calidad y documentación, integración clara con el SEN. Buen análisis de calidad y documentación; conexión razonable con el SEN. Análisis superficial o falta conexión explícita con el SEN. No analiza calidad o documentación; no se relaciona con el SEN. 5%
Análisis descriptivo de bases secundarias (R) Estadísticos y gráficos correctos y bien interpretados; análisis de correlaciones pertinente; conclusiones sólidas. Análisis correcto pero con algunas fallas menores en interpretación o profundidad. Estadísticos o gráficos básicos; conclusiones poco desarrolladas. Análisis incorrecto o incompleto; conclusiones irrelevantes. 10%
Formulario de recolección de datos (Google Forms) Formulario completo y bien diseñado; variables e indicadores claros; ficha metodológica completa. Formulario funcional; ficha metodológica adecuada aunque con faltantes menores. Formulario con errores o poco alineado al fenómeno; ficha metodológica incompleta. Formulario deficiente o ficha metodológica ausente. 5%
Dashboard en PowerBI Dashboard ordenado, visualmente atractivo, cumple todos los requisitos de interactividad y análisis. Dashboard funcional, aunque con algunas oportunidades de mejora en visualización o análisis. Dashboard básico, con errores o visualizaciones limitadas. Dashboard incompleto o mal estructurado. 10%
Conclusiones finales Integración clara y reflexiva entre análisis de datos secundarios y propios; aportes relevantes al trabajo de grado. Integración adecuada pero con limitaciones menores. Integración superficial o limitada. No hay integración o las conclusiones no aportan valor. 5%
Retroalimentación de compañeros 5%