18 marzo, 2021

Proyecto de procesamiento de lenguaje natural

En este proyecto se realizará un predictor de texto con el software R y se visualizará la predicción a través de una Shiny-App.

Shiny es un paquete de R que permite construir aplicaciones web interactivas a partir de código R.

Etapas del proyecto

  • Obtención de los datos
  • Previsualización
  • Limpieza
  • Análisis exploratorio
  • Algoritmo de predicción
  • Shiny App

Obtención de los datos

Los datos para trabajar este proyecto son los datos otorgados por la plataforma Coursera para el trabajo final de la especialización en ciencia de datos ofertada por la universidad Jhons Hopkins.

Para obtener los datos, se debe usar el siguiente enlace: Datos del proyecto

Características de los datos

Los datos consisten de 3 grandes archivos de texto en inglés que involucran una amplia cantidad de noticias, blogs y contenido de Twitter.