Paquetes
library(pacman)
p_load("dplyr", "stringr", "ggplot2", "wordcloud","rmdformats","vembedr", "xfun")
Análisis de conteo de palabras para conocer su frecuencia
- Este es un ejercicio de la materia de probabilidad y estadÃstica de la clase de las 9:00 a.m. (LMV) del departamento de matemáticas de ITSON.
Procesamiento del lenguaje natural.
Entendiendo el lenguaje
Principales ecuaciones utilizadas.
Si lo que se busca es incluir ecuaciones en texto, serÃa asÃ: \(E=mc^2\)
Para explicar una ecuación se incluye de la siguiente forma:
\[ (1) E=mc^2 \] En la ecuación (1) tenemos que:
- E = EnergÃa.
- m = Masa.
- C = Velocidad de la luz.
Concepto de PLN
- Análisis moffológico o léxico.
- Análisis sintáctico.
- Análisis semántico.
- Análisis pragmático.
En el siguiente enlace enlace pueden ver un artÃculo explicando más acerca de esto.
Función.
FreqCategory <- function(value) {
strCategory <- ifelse(value <=5, " 5",
ifelse(value <=10, " 10",
ifelse(value <=20, " 20",
ifelse(value <=50, " 50",
ifelse(value <=100, " 100",
ifelse(value <=500, " 500",
ifelse(value <=1000, " 1,000",
">1,000")))))))
strCategory
}
Datos de texto.
setwd("~/EA9am")
politica <- readLines("politica.txt")
head(politica)
## [1] "también se está comenzando transmisiones"
## [2] ""
## [3] "en facebook live y todos ustedes"
## [4] ""
## [5] "bienvenidos"
## [6] ""
Conteo de lineas (renglones).
#Longitud del vector.
intLineCount <- length(politica)
intLineCount
## [1] 3182
Video de youtube de la charla:
embed_url("https://youtu.be/5PLw3Macsxs")