Next‑Word Predictor: sugerencias de la próxima palabra en tiempo real usando n‑gramas (1–4) con Stupid Backoff (lambda = 0.4) y pruning por historia (Top‑K + umbral de frecuencia).
- Pipeline: limpieza → tokenización → n‑gramas + conteos → pruning → ranking por backoff.
- Ventajas: latencia baja, modelo compacto, explicable y portable a Shiny/móvil.
| Tabla | Filas | MB |
|---|---|---|
| Unigramas | 30 | 0.00 |
| Bigramas | 37 | 0.01 |
| Trigramas | 38 | 0.01 |
| 4-gramas | 38 | 0.01 |