Entramos ahora en un punto clave del curso.

La SEMANA 3 — EDA Estructurado (I) ya no es solo conceptos aislados, sino integración sistemática.

Mantenemos el modelo:

  • ✅ Un solo tema.
  • ✅ Dos sesiones.
  • ✅ Una única hoja evaluable al finalizar la segunda sesión.
  • ✅ IA como tutor.
  • ✅ Interpretación antes que técnica.
  • ✅ Escritura manual como consolidación cognitiva.

GUÍA MAESTRA

SEMANA 3 — EDA Estructurado (I)

Asignatura: Estadística Aplicada con Python y R Universidad de Sucre – Facultad de Ingeniería


1️⃣ PROPÓSITO DEL TEMA

Comprender el EDA (Exploratory Data Analysis) como proceso estructurado y no como revisión superficial de datos.

El estudiante debe:

  • Inspeccionar estructura del dataset.
  • Identificar tipos de variables.
  • Detectar valores faltantes.
  • Calcular e interpretar medidas de tendencia y dispersión.
  • Analizar forma de la distribución (sesgo y curtosis).
  • Detectar valores atípicos.

Este tema dura una semana.

📌 Se diligencia UNA sola hoja al finalizar la segunda sesión.


2️⃣ ESTRUCTURA DE LA SEMANA

  • Sesión 1 (2 horas): Fundamentos del EDA estructurado.
  • Sesión 2 (2 horas): Aplicación práctica en dataset real.
  • Producto evaluable: 1 hoja física (anverso + reverso).

SESIÓN 1

Fundamentos del EDA Estructurado


🔹 Fase 1 — Actividad “Estudia y Aprende”

PROMPT 1 — INICIO

Actúa como tutor experto en análisis exploratorio de datos aplicado a ingeniería.

Tema: EDA estructurado (I).

  1. Explica qué es EDA y cuál es su propósito en estadística aplicada.

  2. Describe un proceso estructurado paso a paso para realizar EDA.

  3. Explica cómo identificar:

    • Tipo de variables
    • Valores faltantes
    • Outliers
  4. Explica las medidas de tendencia central y dispersión y cuándo cada una es más informativa.

  5. Explica qué es sesgo (asimetría) y curtosis.

  6. Incluye ejemplos aplicados a ingeniería.

Hazme 3 preguntas para verificar comprensión y corrige mis respuestas.


🔹 Fase 2 — Orientación Docente

Se organiza el EDA como secuencia lógica:

Paso 1: Inspección estructural

  • Número de filas y columnas.
  • Tipo de variables.
  • Variables categóricas vs numéricas.

Paso 2: Valores faltantes

  • ¿Cuántos?
  • ¿En qué variables?
  • ¿Es crítico o marginal?

Paso 3: Análisis univariado

  • Media vs mediana.
  • Desviación estándar.
  • Rango.
  • Distribución visual.

Paso 4: Forma de distribución

  • Asimetría.
  • Curtosis.
  • Interpretación ingenieril.

Se enfatiza:

Antes de modelar, se debe comprender la naturaleza de los datos.

⚠️ No se diligencia la hoja aún.


SESIÓN 2

Aplicación del EDA en Dataset Real


🔹 Fase 1 — Actividad “Estudia y Aprende” (Aplicación)

PROMPT 2 — APLICACIÓN

Actúa como tutor experto en EDA con Python y R.

  1. Muéstrame cómo realizar inspección estructural de un dataset.
  2. Cómo detectar valores faltantes.
  3. Cómo calcular media, mediana, desviación estándar y varianza.
  4. Cómo estimar asimetría y curtosis.
  5. Cómo interpretar estos resultados en contexto de ingeniería.

No solo muestres código: explica qué significa cada resultado.


🔹 Fase 2 — Demostración Docente

Se utiliza un dataset (por ejemplo Soils u otro del curso).

En Python:

  • df.info()
  • df.isna().sum()
  • df.describe()
  • Cálculo de skew y kurtosis

En R:

  • str()
  • colSums(is.na())
  • summary()
  • moments::skewness()
  • moments::kurtosis()

Pero el énfasis es:

  • ¿Qué indica una alta dispersión?
  • ¿Qué implica una distribución sesgada?
  • ¿Es apropiada la media?
  • ¿Podría afectar futuros modelos?

3️⃣ CIERRE DEL TEMA — GENERACIÓN DEL RESUMEN GUÍA

Al finalizar la sesión 2:

PROMPT DE CIERRE GLOBAL

Genera un resumen estructurado para escribir a mano en UNA sola hoja.

Formato obligatorio: A) Idea central (1–2 líneas). B) 6–10 viñetas organizadas lógicamente. C) 3 relaciones clave (por qué/cómo). D) 1 ejemplo aplicado a ingeniería. E) 3 preguntas de autoevaluación con respuesta. F) Cierre: “Hoy aprendí que …”

Este resumen es solo guía.


4️⃣ REVERSO — ESCRITURA MANUAL (EVIDENCIA EVALUABLE)

Tema de la hoja:

“EDA Estructurado (I): Comprensión Univariada de los Datos”

Debe incluir:

□ Idea central del EDA □ Pasos estructurados del proceso □ Medidas de tendencia y dispersión □ Sesgo y curtosis □ Detección de valores atípicos □ Ejemplo aplicado a ingeniería □ 3 preguntas + respuestas □ Reflexión final


5️⃣ CRITERIOS DE EVALUACIÓN

Evaluación sugerida sobre 5 puntos:

  1. Comprensión del proceso estructurado.
  2. Diferenciación correcta entre medidas.
  3. Interpretación de sesgo y curtosis.
  4. Aplicación contextualizada.
  5. Profundidad en la reflexión final.

No se evalúa:

  • Código escrito en la hoja.
  • Cálculos extensos.
  • Copia textual del chatbot.

Se evalúa comprensión del proceso.


6️⃣ RESULTADO FORMATIVO DE LA SEMANA 3

Al finalizar el tema, el estudiante:

  • Realiza EDA como procedimiento ordenado.
  • Interpreta medidas más allá de la fórmula.
  • Detecta problemas en datos antes de modelar.
  • Comprende que el EDA es diagnóstico previo obligatorio.