Entramos ahora en un punto clave del curso.
La SEMANA 3 — EDA Estructurado (I) ya no es solo conceptos aislados, sino integración sistemática.
Mantenemos el modelo:
Asignatura: Estadística Aplicada con Python y R Universidad de Sucre – Facultad de Ingeniería
Comprender el EDA (Exploratory Data Analysis) como proceso estructurado y no como revisión superficial de datos.
El estudiante debe:
Este tema dura una semana.
📌 Se diligencia UNA sola hoja al finalizar la segunda sesión.
Actúa como tutor experto en análisis exploratorio de datos aplicado a ingeniería.
Tema: EDA estructurado (I).
Explica qué es EDA y cuál es su propósito en estadística aplicada.
Describe un proceso estructurado paso a paso para realizar EDA.
Explica cómo identificar:
- Tipo de variables
- Valores faltantes
- Outliers
Explica las medidas de tendencia central y dispersión y cuándo cada una es más informativa.
Explica qué es sesgo (asimetría) y curtosis.
Incluye ejemplos aplicados a ingeniería.
Hazme 3 preguntas para verificar comprensión y corrige mis respuestas.
Se organiza el EDA como secuencia lógica:
Se enfatiza:
Antes de modelar, se debe comprender la naturaleza de los datos.
⚠️ No se diligencia la hoja aún.
Actúa como tutor experto en EDA con Python y R.
- Muéstrame cómo realizar inspección estructural de un dataset.
- Cómo detectar valores faltantes.
- Cómo calcular media, mediana, desviación estándar y varianza.
- Cómo estimar asimetría y curtosis.
- Cómo interpretar estos resultados en contexto de ingeniería.
No solo muestres código: explica qué significa cada resultado.
Se utiliza un dataset (por ejemplo Soils u otro del curso).
En Python:
df.info()df.isna().sum()df.describe()En R:
str()colSums(is.na())summary()moments::skewness()moments::kurtosis()Pero el énfasis es:
Al finalizar la sesión 2:
Genera un resumen estructurado para escribir a mano en UNA sola hoja.
Formato obligatorio: A) Idea central (1–2 líneas). B) 6–10 viñetas organizadas lógicamente. C) 3 relaciones clave (por qué/cómo). D) 1 ejemplo aplicado a ingeniería. E) 3 preguntas de autoevaluación con respuesta. F) Cierre: “Hoy aprendí que …”
Este resumen es solo guía.
Tema de la hoja:
“EDA Estructurado (I): Comprensión Univariada de los Datos”
Debe incluir:
□ Idea central del EDA □ Pasos estructurados del proceso □ Medidas de tendencia y dispersión □ Sesgo y curtosis □ Detección de valores atípicos □ Ejemplo aplicado a ingeniería □ 3 preguntas + respuestas □ Reflexión final
Evaluación sugerida sobre 5 puntos:
No se evalúa:
Se evalúa comprensión del proceso.
Al finalizar el tema, el estudiante: