Análisis de Caso — Semana 7

Predicción de inversión

Equipo 8

2026-02-17

Agenda

  1. 📋 Descripción del Caso
  2. 📊 Normalidad & Tablas de Frecuencia
  3. 📉 Medidas de Sumarización y Datos Atípicos
  4. 🔵 Diagrama de Venn — Eventos S, C, E
  5. 🧮 Tabla de Contingencia & Probabilidades
  6. 🔔 Distribución Normal: Gruma y Cemex
  7. 📐 Prueba de Igualdad de Varianzas (F-test)
  8. 🎯 Perfil del Inversionista Objetivo
  9. 🌎 Estrategia para Atraer Inversión a México
  10. ✅ Conclusiones

Descripción del Caso

El gobierno ha decidido seguir contratando nuestros servicios de consultoría para identificar las características de los clientes potenciales de inversión y garantizar la sostenibilidad económica del país.

Objetivo

Definir el perfil del inversionista ideal a partir de datos reales de rendimientos bursátiles y clientes potenciales (N = 3,000).

Datos disponibles

  • Hoja 1: Rendimientos diarios de 6 acciones (250 obs.)
  • Hoja 2: Perfil socioeconómico de 3,000 clientes potenciales (Sexo, Casa, Estudios, Monto, Ingresos…)

Normalidad & Tablas de Frecuencia

Accion p(Shapiro) Asimetría Curtosis ex. Normal (5%)
Gruma 0.70545 0.100 0.140 ✅ Sí|
Bimbo 0.01291 0.202 0.659 ❌ No|
Netflix 0.00000 0.215 2.243 ❌ No|
Cemex 0.16125 0.190 0.585 ✅ Sí|
Nike 0.00000 -0.244 16.135 ❌ No|
Tesla 0.00000 0.602 4.105 ❌ No|

Filas en verde = no se rechaza H₀ de normalidad (p > 0.05): Gruma (p = 0.705) y Cemex (p = 0.105). El resto presenta colas pesadas o exceso de curtosis.

Medidas de sumarización (Rendimientos)

Accion Media (%) Mediana SD (%) Var Min Max
Gruma -0.0356 -0.1330 1.3868 1.9233 -4.099 4.039
Bimbo -0.0205 -0.0445 1.4721 2.1671 -3.696 4.738
Netflix 0.2981 0.0595 2.2305 4.9751 -6.692 9.512
Cemex -0.0977 -0.1760 1.6461 2.7095 -5.025 5.089
Nike 0.1914 0.0000 2.2794 5.1957 -15.699 13.505
Tesla -0.0648 -0.1125 2.8624 8.1931 -9.352 15.004

Histogramas de Rendimientos

Datos Atípicos por Acción

Nike (24 atíp.) y Netflix (12 atíp.) muestran la mayor volatilidad extrema. El outlier más extremo de Nike fue −15.70% (un solo día).

Supuestos para eventos S, C y E

Para el análisis de probabilidades se definieron tres eventos binarios sobre N = 3,000 clientes potenciales:

🧑 Evento S

Sexo = Hombre

Identifica si el cliente es de género masculino.

🏠 Evento C

Casa = Propia

Indica si el cliente posee vivienda propia como activo patrimonial.

🎓 Evento E

Estudios = Maestría

Mide el nivel de escolaridad como proxy de sofisticación financiera.

Diagrama de Venn — S ∩ C ∩ E

S∩C∩E = 95 clientes · S∩C = 353 · S∩E = 393 · C∩E = 194 · Ninguno = 815

Tabla de contingencia (Sexo, Casa, Estudios)

E = No E = Sí
Mujer, No propia 815 285
Mujer, Propia 298 99
Hombre, No propia 852 298
Hombre, Propia 258 95

Probabilidades solicitadas

TablaExpresión Valor
P(S) 0.501000
P(C) 0.250000
P(E) 0.259000
P(S/C) 0.470667
P(S/E) 0.505792
P(C∩E) 0.064667
P(E∩S) 0.131000
P(C∩S) 0.117667
P(C∪E) 0.444333
P(S∪E) 0.629000
P(C∪S) 0.633333
P(C∪E∪S) 0.728333
P(C∩E∩S) 0.031667
P(C∩(E∪S')) 0.164000
P(C∩(S∪E)) 0.150667
P(S∩(C'∪E)) 0.415000
P(S∪E'∪C) 0.905000
P(C') 0.750000

Distribución Normal — Gruma y Cemex

Se usa X ~ Normal(μ, σ²) con μ y σ² de rendimientos.

Accion μ σ P(X≤0.01%)
Gruma -0.035628 1.386831 0.5131
Cemex -0.097672 1.646059 0.5261

Nota: En una variable continua, P(X = 0.01%) = 0. Se puede reportar la densidad f(0.01%) si lo piden.

Prueba F — Igualdad de Varianzas

\[H_0: \sigma^2_{\text{Gruma}} = \sigma^2_{\text{Cemex}} \qquad H_1: \sigma^2_{\text{Gruma}} \neq \sigma^2_{\text{Cemex}} \quad (\alpha = 0.05)\]

Conclusión: F = 1.4088 > F_crit = 1.2827, p = 0.00704 < 0.05 → Se rechaza H₀. Las varianzas no son iguales (riesgo diferente entre ambas acciones).

Variables que explican el perfil del inversionista

El inversionista objetivo típico tiene ingresos altos, activos propios y posgrado — percentil ≥ 75 en monto disponible.

Estrategia para Atraer Inversión a México

📦 Portafolio por Perfil de Riesgo

Perfil Instrumento Rendimiento Riesgo
Conservador CETES / Bonos Gov. 5 – 8 % 🟢 Bajo |
Moderado FIBRAs / Fondos deuda 9 – 13 % 🟡 Medio |
Agresivo Acciones / ETFs 14 %+ 🔴 Alto |

🌐 Pilares de la Propuesta

  1. CETES/Bonos para perfil conservador
  2. FIBRAs y fondos para rendimiento moderado
  3. Incentivos fiscales para nuevos inversionistas
  4. Plataforma digital — alta/baja sin fricción
  5. Transparencia — reportes periódicos automáticos
  6. Fidelización — bonus por permanencia 12–24 meses

Bajo riesgo percibido + rendimiento atractivo = clave para retener al inversionista objetivo.

Conclusiones

  • 📊 Normalidad: Con los datos reales, Gruma (p = 0.705) y Cemex (p = 0.105) son las únicas acciones que no rechazan normalidad. Nike y Tesla presentan curtosis extrema.

  • 📉 Atípicos: Nike acumula 24 outliers con un mínimo de −15.70% en un solo día; Tesla tiene el rango más extremo (−9.35% a +15.00%), reflejando alta volatilidad.

  • 🔵 Perfil: Solo el 3.2% (95/3,000) de los clientes es Hombre + Casa Propia + Maestría, pero concentra la mayor capacidad de inversión sostenida.

Conclusiones

  • 📐 Varianzas: Prueba F rechaza igualdad (F = 1.4286, p ≈ 0.005): Cemex es ~43% más volátil que Gruma. Tratamiento estadístico diferenciado es necesario.

  • 🌎 Estrategia: Portafolio diversificado + incentivos fiscales + digitalización son los tres pilares para sostener y ampliar la inversión en México.

Referencias

  • Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality. Biometrika, 52(3–4), 591–611.
  • D’Agostino, R. B., Belanger, A., & D’Agostino Jr., R. B. (1990). A suggestion for using powerful and informative tests of normality. The American Statistician, 44(4), 316–321.
  • Bolsa Mexicana de Valores / Bloomberg. (2018). Datos históricos de rendimientos diarios — Gruma, Bimbo, Netflix, Cemex, Nike, Tesla.
  • Montgomery, D. C., & Runger, G. C. (2018). Applied Statistics and Probability for Engineers (7th ed.). Wiley.
  • R Core Team (2024). R: A language and environment for statistical computing. Vienna: R Foundation. r-project.org

¡Gracias!

Equipo 8

Fundamentos de Estadística — Semana 7

Análisis reproducible con Quarto · Visualizaciones con ggplot2