Scraping Twitter

Extraccion de Tweets

La cantidad de Twits que circulan en la red, son una fuente de informacion muy valiosa, es por ello, que se han desarrollado tecnicas para lograr extraer dicha informacion.

Haciendo uso de la libreria rtweet, no haremos con informacion referente a Tarjetas de Credito.

## 
## -- Column specification --------------------------------------------------------
## cols(
##   screen_name = col_character(),
##   created_at = col_datetime(format = ""),
##   status_id = col_double(),
##   text = col_character()
## )

A continuacion se muestra la informacion obtenida.

Tokenizacion y Limpieza de Texto

El proceso de limpieza de texto, dentro del Ômbito de text mining, consiste en eliminar del texto todo aquello que no aporte información sobre su temÔtica, estructura o contenido. Tokenizar un texto consiste en dividir el texto en las unidades que lo conforman, entendiendo por unidad el elemento mÔs sencillo con significado propio para el anÔlisis en cuestión, en este caso, las palabras.

Representacion Visual

Una forma visual de representar las palabras mÔs frecuentes es mediante nubes de palabras (word clouds). En esta representación, las palabras mÔs importantes tienen mayor tamaño.