A continuación se presenta el PLAN DE ASIGNATURA completo y formal, adaptado para los programas de Ingeniería Agrícola, Agroindustrial y Civil, incorporando el Módulo Cero de Ética e IA:
tsibble/fable/forecast en
R)La asignatura integra conceptos fundamentales de estadística aplicada con herramientas modernas de análisis en R y Python, con un enfoque orientado a la ingeniería. La metodología se apoya en análisis de datos reales, uso ético de herramientas de Inteligencia Artificial (ChatGPT, Gemini, Copilot) y el desarrollo de productos reproducibles (RMarkdown, Notebooks, Streamlit/Quarto opcional).
El curso prioriza cuatro ejes:
La asignatura NO profundiza en ANOVA porque este contenido se aborda en Diseño Experimental.
Propósito: establecer el marco ético, normativo y técnico del uso de IA en estadística.
Temas:
Ética e integridad científica.
CONPES 4144/2025 sobre IA en Colombia.
Riesgos: plagio, “humanización de texto”, deepfakes, fabricación de datos.
IA como herramienta para análisis: límites, citación, trazabilidad, bitácora de prompts.
Introducción al entorno:
Actividad evaluable: Documento APA + video grupal explicando el rol ético de la IA en análisis estadístico de ingeniería.
Práctica: cargar datasets del curso (Soils, Boston Housing, Acero, FAOSTAT).
ggplot2, seaborn,
plotnine.Práctica: comparación visual entre R y Python del mismo dataset.
Actividad: EDA del dataset Soils (carData).
chart.Correlation() en R y sns.pairplot()
en Python.Proyecto corto: informe APA comparativo de correlaciones.
Práctica: simulaciones con Python y R.
Actividad: elección de dataset con conteos y ajuste con métodos de máxima verosimilitud.
Actividad: comparación entre datasets de ingeniería (tiempos, fallos, calibres, humedad).
Proyecto: notebook + documento APA con un ajuste de distribución completo.
lm() en R; statsmodels y
scikit-learn en Python.Práctica: dataset Soils o Boston Housing (versión simplificada).
stepAIC() en R.Proyecto: modelo final + informe APA + interpretación detallada.
mgcv.Práctica: comparación GAM vs. LOESS para un problema de ingeniería.
Práctica: series climáticas (temperatura, precipitación).
Actividad: predicción de una serie agroclimática real.
tsibble y fable.Producto: informe APA + repositorio GitHub.
Proyecto grupal que combine:
Debe incluir:
| Componente | Porcentaje |
|---|---|
| Módulo Cero Ética e IA | 10% |
| Tareas prácticas (Python y R) | 30% |
| Proyectos parciales (EDA, Distribuciones, Regresiones, Series de Tiempo) | 30% |
| Proyecto Final Integrador | 30% |
A continuación se presenta la RÚBRICA DE EVALUACIÓN para la asignatura Estadística Aplicada con Python y R, alineada con:
La calificación es de 1 a 5 por criterio, donde:
| Criterio | 5 - Excelente | 4 - Alto | 3 - Básico | 2 - Bajo | 1 - Deficiente |
|---|---|---|---|---|---|
| 1. EDA (Exploratory Data Analysis) | Realiza EDA completo, estructurado y crítico; interpreta correctamente patrones, outliers y relaciones; usa visualizaciones adecuadas y comparativas en R y Python. | EDA adecuado con buena interpretación; pequeñas omisiones técnicas. | EDA parcial; análisis descriptivo limitado o poco profundo. | EDA incompleto; errores en interpretación o uso inadecuado de gráficos. | No realiza EDA o presenta análisis incorrecto. |
| 2. Ajuste a modelos teóricos de probabilidad | Selecciona adecuadamente la distribución; estima parámetros correctamente; aplica pruebas de bondad de ajuste e interpreta resultados con rigor. | Ajuste correcto pero con interpretación limitada o análisis comparativo incompleto. | Ajuste básico con errores menores o análisis superficial. | Ajuste incorrecto o sin pruebas de validación adecuadas. | No realiza ajuste o presenta errores conceptuales graves. |
| 3. Regresión y modelado | Modelo correctamente especificado; verifica supuestos; interpreta coeficientes y métricas (R², AIC, RMSE) con criterio ingenieril. | Modelo adecuado con interpretación general correcta. | Modelo funcional pero con debilidades en diagnóstico o interpretación. | Modelo mal especificado o con errores conceptuales. | No logra construir modelo válido. |
| 4. Series de tiempo (AutoTS u otros) | Analiza tendencia y estacionalidad; compara modelos; justifica selección según métricas; interpreta predicciones con sentido práctico. | Modelo adecuado con interpretación general correcta. | Aplica modelo automático sin análisis profundo. | Uso mecánico sin comprensión del proceso. | No logra aplicar modelo de series de tiempo. |
| 5. Reproducibilidad y documentación (Notebook/RMarkdown) | Código organizado, documentado, reproducible; estructura clara; publicación correcta en RPubs o repositorio. | Código funcional con buena organización. | Código funcional pero desordenado o poco documentado. | Código con errores frecuentes o sin claridad. | Código incompleto o no reproducible. |
| 6. Comunicación escrita (formato APA) | Informe claro, coherente, técnico; interpretación crítica; correcta citación y redacción científica. | Informe bien estructurado con pequeñas fallas de redacción. | Informe básico con deficiencias formales. | Redacción confusa; errores conceptuales frecuentes. | Documento incompleto o sin estructura científica. |
| 7. Video de sustentación | Explica con claridad metodología, resultados e interpretación; dominio conceptual; participación equilibrada del grupo. | Buena explicación con leves vacíos conceptuales. | Explicación básica; lectura parcial del documento. | Dificultad para explicar procedimientos y resultados. | No demuestra comprensión del trabajo realizado. |
| 8. Uso ético y transparente de IA | Presenta bitácora de prompts; declara uso de IA; demuestra comprensión del código generado; no hay evidencia de plagio. | Declara uso de IA pero con documentación parcial. | Uso evidente de IA sin suficiente explicación del proceso. | Uso poco transparente o dependencia excesiva sin comprensión. | Evidencia de plagio o fabricación de resultados. |
[ \(\text{Nota Final} = \frac{\text{Puntaje Obtenido}}{40} \times 5\)]
}