La siguiente es la Guía 2: Producción de Acero – Comparando Grupos con ANOVA en GitHub Codespaces con Copilot, siguiendo la misma lógica de trabajo que en la Guía 1, pero aplicada al dataset acero.csv y al documento de apoyo.


📘 Guía 2: Producción de Acero

Comparando Grupos con ANOVA en GitHub Codespaces con Copilot

Objetivo

Que los estudiantes aprendan a:

  1. Crear un repositorio en GitHub y trabajarlo en Codespaces.
  2. Usar Copilot Chat para generar automáticamente archivos clave del proyecto.
  3. Implementar análisis de ANOVA (comparación de medias entre grupos) usando el dataset acero.csv.
  4. Presentar resultados en una interfaz con Streamlit (tablas, gráficos, resumen del modelo).
  5. Desplegar la aplicación en Streamlit Community Cloud.

🛠️ Flujo de trabajo recomendado

  1. Crear repositorio en GitHub

    • Nombre sugerido: produccion_acero_anova.
    • Incluir un README inicial y un .gitignore para Python.
  2. Abrir en Codespaces

    • Desde el repositorio → Code → Codespaces → Create codespace on main.
  3. Configurar entorno con Copilot

    • Verificar que Copilot y Copilot Chat estén activos.
    • Confirmar que la extensión de Python está instalada.
  4. Prompts sugeridos en Copilot Chat

    • README.md

      Crea un archivo README.md para este proyecto explicando que analizamos el dataset acero.csv mediante ANOVA, comparando el consumo energético en distintas líneas de producción de una empresa de acero. Incluye objetivos, metodología y referencias al archivo de datos.
    • requirements.txt

      Genera un archivo requirements.txt con pandas, numpy, matplotlib, seaborn, statsmodels y streamlit.
    • script principal

      Crea un archivo llamado app.py que lea el dataset acero.csv, muestre estadísticas descriptivas, visualizaciones de la variable consumo por línea de producción y realice un análisis ANOVA de un factor para comparar el consumo energético entre líneas de producción. Muestra los resultados en una interfaz con Streamlit.
    • gráficos complementarios

      Agrega al script app.py un boxplot que compare el consumo energético entre las tres líneas de producción (A, B y C), usando seaborn.
    • resumen ANOVA

      Incluye en el app.py la tabla de resultados del modelo ANOVA y una interpretación automática del valor p en lenguaje sencillo para los estudiantes.
  5. Probar en Codespaces

    • Instalar dependencias:

      pip install -r requirements.txt
    • Ejecutar:

      streamlit run app.py
  6. Control de versiones

    • Usar el ícono de rama en Codespaces:

      • Stage Changes → Commit → Sync Changes.
  7. Despliegue en Streamlit Community Cloud


✅ Checklist para estudiantes