• Pacotes que utilizei para apresentação
library(knitr) # colocar figuras/imagens na apresentação
library(readxl) # leitura dos dados em excel
library(flextable) # Construir Tabelas
library(officer) # Pacote para utilizar algumas opções extras do pacote flextable
library(DT) # pacote para construir tabelas dinâmicas

1 Introdução

Neste presente trabalho será apresentado a definição de alguns classificadores bayesianos e a sua aplicação na classificação de texto, implementação dos classificadores em alguns exemplos no Rstudio/Rmarkdown.

2 Definição do Classificador Naive Bayes

O algoritmo “Naive Bayes” é um classificador probabilístico baseado no “Teorema de Bayes”, o qual foi criado por Thomas Bayes (1701 - 1761) para tentar provar a existência de Deus.

Hoje é utilizado na área de Aprendizado de Máquina (Machine Learning) para categorizar textos com base na frequência das palavras usadas.

Exemplos de Utilização do Classificador:

  • Classificação de textos;

  • Pode ser usado para identificar se determinado e-mail é um SPAM ou sobre qual assunto se refere determinado texto;

  • Análise de sentimento em redes sociais.

knitr::include_graphics("Thomas_Bayes.jpg")

Figura 1: Thomas Bayes (1701-1761).

3 Outros Classificadores

Naive-Bayes

Redes neurais

SOM

Árvores de decisão

Regras de decisão