Exercício 11 - R Markdown

Q1

# Carregar o arquivo de texto com o discurso "Eu tenho um sonho"
discurso <- read_file('discurso_martin_luther_king.txt')

# Converter para um "corpus" que é basicamente uma coleção de documentos
corpus <- Corpus(VectorSource(discurso))

# Limpar os dados, em sequência:
#   - Colocar todos os caracteres em caixa baixa;
#   - Remover sinais de pontuação;
#   - Remover números;
#   - Remover excesso de caracteres em branco, unir vários whitespaces em sequência a um só
#   - Remover palavras que geram ruídos (preposições, advérbios) no idioma "português"
corpus <- tm_map(corpus, tolower)
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, stripWhitespace)
corpus <- tm_map(corpus, removeWords, stopwords('portuguese'))

# Gerar a nuvem de palavras
wordcloud(
  corpus,
  min.freq = 3,
  max.words = 60,
  random.order = FALSE,
  rot.per = 0.2,
  colors = brewer.pal(5, "Accent")
)

# Preparar os dados para gerar o gráfico com as palavras mais frequentes
matrix_freq <- as.matrix(TermDocumentMatrix(corpus))
freq_palavras <- sort(rowSums(matrix_freq), decreasing = T)

barplot(subset(freq_palavras, freq_palavras > 2), las = 2, col = rainbow(8))

Q2

# Carregar dataset com tweets referentes ao desmatamento na Amazônia
amazonia <- read.csv('tweetsAmazonia.csv')
# Colocar a coluna inteira de tweets numa variável
tweets <- amazonia$tweet

# Converter para um "corpus" que é basicamente uma coleção de documentos
corpus <- Corpus(VectorSource(tweets))

# Limpar os dados, em sequência:
#   - Colocar todos os caracteres em caixa baixa;
#   - Remover sinais de pontuação;
#   - Remover números;
#   - Remover excesso de caracteres em branco, unir vários whitespaces em sequência a um só
#   - Remover palavras que geram ruídos (preposições, advérbios) no idioma "português"
corpus <- tm_map(corpus, tolower)
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, stripWhitespace)
corpus <- tm_map(corpus, removeWords, stopwords('portuguese'))

# Gerar a nuvem de palavras
wordcloud(
  corpus,
  min.freq = 3,
  max.words = 60,
  random.order = FALSE,
  rot.per = 0.2,
  colors = brewer.pal(9, "Accent")
)

Q3

Transformada de Fourier: \[ \mathcal{F}[x(t)] = X(\omega) = \int_{-\infty}^{\infty}x(t) e^{-j\omega t} dt \]

Lei de Amdahl: \[ S(n) = \frac{T(1)}{T(n)} = \frac{T(1)}{T(1)(B + \frac{1}{n}(1 - B))} = \frac{1}{B + \frac{1}{n}(1 - B)} \]

Teorema Fundamental do Cálculo: \[ \int_{a}^{b}f(x)dx = F(b) - F(a) \]

Fórmula da Variância: \[ \sigma^2 = \frac{\Sigma|x - \mu|^2}{N} \]

Teoria do Caos: \[ X_{t+1} = kx_t(1 - x_t) \]

Q4

Figura 1 - Data Science Figura 2 - Data Science

datatable(head(airquality))
datatable(head(USArrests))

Q5

Riordan (2008)

Dante (2017)

Gaiman (2020)

Melo Neto (2007)

Stoker (1997)

Dante, Alighieri. 2017. The Divine Comedy. Aegitas.
Gaiman, Neil. 2020. Norse Mythology. Bloomsbury Publishing.
Melo Neto, João Cabral de. 2007. Morte e Vida Severina. Alfaguara.
Riordan, Rick. 2008. Percy Jackson and the Sea of Monsters (Book 2). Penguin UK.
Stoker, Bram. 1997. Dracula. Broadview Press.