Guía completa paso a paso para que elaborar desde
cero, en Google Colab, el notebook que genera el
archivo
pydataset_modelos_lineales_completo.xlsx,
utilizando prompts dirigidos a Gemini para que el
modelo asista en cada fase del desarrollo.
pydataset
para ANOVA, Regresión y ANCOVAAprender a construir un notebook ejecutable y documentado, que:
pydataset.| Sección | Descripción | Prompt sugerido para Gemini |
|---|---|---|
| 1️⃣ Encabezado | Título, autor, objetivo y fecha | Prompt: “Escribe una celda Markdown introductoria para un notebook en Google Colab titulado Clasificación de datasets de pydataset para ANOVA, Regresión y ANCOVA. Incluye mi nombre, el objetivo y la fecha actual.” |
| 2️⃣ Objetivos y requisitos | Lista de aprendizajes esperados y librerías necesarias | Prompt: “Redacta en Markdown los objetivos de aprendizaje y los requisitos del entorno para este notebook.” |
| 3️⃣ Instalación de dependencias | Celda de código para instalar los paquetes | Prompt: “Escribe el bloque de código en Colab para instalar pydataset, pandas y openpyxl de forma silenciosa.” |
| 4️⃣ Importaciones y función de clasificación | Importar librerías y crear función que identifique variables categóricas y numéricas | Prompt: “Genera código en Python para importar
pandas y pydataset y definir una función
clasificar_dataset(name) que cuente las variables
categóricas y numéricas y determine si se puede aplicar ANOVA, Regresión
o ANCOVA.” |
| 5️⃣ Listado de datasets | Mostrar el catálogo de pydataset en una tabla | Prompt: “Escribe código Python para listar todos los datasets de pydataset con sus títulos y mostrar las primeras 10 filas.” |
| 6️⃣ Clasificación automática | Aplicar la función a todos los datasets | Prompt: “Escribe el bloque de código para aplicar
clasificar_dataset a cada dataset de pydataset y concatenar
los resultados en un DataFrame tabla.” |
| 7️⃣ Exportación a Excel | Guardar resultados | Prompt: “Escribe código Python para guardar el
DataFrame en un archivo
pydataset_modelos_lineales_completo.xlsx y mostrar un
mensaje de confirmación.” |
| 8️⃣ Uso pedagógico | Explicación textual de cómo emplear el archivo | Prompt: “Redacta en Markdown una guía breve sobre cómo usar el archivo generado para seleccionar datasets apropiados para ANOVA, Regresión y ANCOVA.” |
| 9️⃣ Ejemplos rápidos | Mostrar ejemplos de fórmulas | Prompt: “Crea una celda Markdown con tres ejemplos:
ChickWeight para ANOVA, mtcars para Regresión
y CO2 para ANCOVA.” |
Gemini como asistente incremental
Uso de comentarios descriptivos En cada bloque de código, solicitar a Gemini:
“Agrega comentarios en español explicando cada línea de código.”
Verificación del resultado Después de ejecutar cada celda, revisar:
Documentación del proceso Los estudiantes deben guardar su notebook con el nombre:
Apellido_Nombre_pydataset_ANOVA_Regresion_ANCOVA.ipynbEntrega final
Los estudiantes pueden copiar estos prompts directamente en Gemini:
1️⃣ Escribe una introducción en Markdown para un notebook en Colab sobre clasificación de datasets de pydataset.
2️⃣ Lista los objetivos de aprendizaje y requisitos.
3️⃣ Genera la celda de instalación de dependencias.
4️⃣ Importa las librerías y define una función clasificar_dataset.
5️⃣ Muestra el listado de datasets disponibles.
6️⃣ Clasifica automáticamente y crea la tabla final.
7️⃣ Exporta el resultado a Excel.
8️⃣ Explica cómo usar el archivo generado en análisis estadísticos.
9️⃣ Agrega ejemplos de ANOVA, Regresión y ANCOVA.
Al finalizar, el notebook debe contener:
pydataset_modelos_lineales_completo.xlsx
con las columnas: dataset_id, title,
n_categoricas, n_numericas,
ANOVA, Regresión, ANCOVA.