Tabs

Primeira

Nuvem de palavra do discurso “Eu tenho um sonho” de Martin Luther King Jr. Também plote as palavras mais frequentes.

Preparação dos dados para o primeiro ponto

text <- read_file("i_have_a_dream.txt")

regexp <- "[[:alpha:]]+"
words <- str_extract_all(text, regexp)

corpus <- Corpus(VectorSource(words))

#Coloca tudo em minúsculo
corpus <- tm_map(corpus,tolower)
#Remove pontuação
corpus <- tm_map(corpus,removePunctuation)
#Remove números
corpus <- tm_map(corpus,removeNumbers)
#Remove espaços extras em branco
corpus <- tm_map(corpus, stripWhitespace)
#Remove palavras ruído
corpus <- tm_map(corpus, removeWords, stopwords("portuguese"))

Nuvem de palavras

wordcloud(corpus, min.freq= 1, max.words=60, random.order=FALSE, rot.per=0.35, colors=brewer.pal(8, "Dark2"))

Gráfico das palavras mais frequentes

tdm <- as.matrix(TermDocumentMatrix(corpus))

fre <- sort(rowSums(tdm), decreasing = T)

top_10 <- fre[0:10]

barplot(top_10, las=2, col = rainbow(10))

Segunda

Nuvem de palavras a partir dos tweets sobre o Desmatamento no Brasil. Também faça uma análise de sentimentos com relação a esses tweets.

Carregar base de dados

tweets <- read.csv("tweetsAmazonia.csv")

Preparar dados para nuvem de palavras

regexp <- "[[:alpha:]]+"

concatenated_tweets <- paste(tweets$tweet, collapse= " ")
words <- str_extract_all(concatenated_tweets, regexp)

vector <- VectorSource(words)
tweet_corpus <- Corpus(vector)

#Coloca tudo em minúsculo
tweet_corpus <- tm_map(tweet_corpus,tolower)
#Remove pontuação
tweet_corpus <- tm_map(tweet_corpus,removePunctuation)
#Remove números
tweet_corpus <- tm_map(tweet_corpus,removeNumbers)
#Remove espaços extras em branco
tweet_corpus <- tm_map(tweet_corpus, stripWhitespace)
#Remove palavras ruído
tweet_corpus <- tm_map(tweet_corpus, removeWords, stopwords("portuguese"))

Nuvem de palavras

wordcloud(tweet_corpus, min.freq= 1, max.words=60, random.order=FALSE, rot.per=0.35, colors=brewer.pal(8, "Dark2"))

Análise de sentimentos

# Seleciona colunas de sentimentos
sentiments <- tweets %>% select(Raiva:Neutro)
# Converte os valores para numérico (estavam como char)
numeric_sentiments <- sentiments %>% mutate_all(as.numeric)
# Transforma numa matriz para ser lido pelo barplot
sentiments_matrix <- as.matrix(numeric_sentiments)
# Soma os valores para cada sentimento ignorando os NA
sentiments_sum <- colSums(sentiments_matrix, na.rm = TRUE)

# Plota o gráfico
barplot(sentiments_sum,las=2,col=rainbow(10),ylab= "Quantidade",main= "Pontuação de Sentimentos para os Tweets Sobre A Amazônia")

Terceira

5 equações complexas usando Latex

Sequência de Fibonacci

$f_n = f_{n-1} + f_{n-2}$

Equação de Bhaskara

$x = \dfrac{-b \pm \sqrt{b^2 - 4ac}}{2a}$

Equação da derivada de $e^x$

$\dfrac{d}{dx} e^x = e^x$*

Equação da integral de $e^x$

$\int e^x dx = e^x + C$

Equação da série de Taylor para $e^x$

$e^x = \sum_{n=0}^{\infty} \dfrac{x^n}{n!}$

Quarta

2 Figuras relacionadas a ciência de dados e 2 tabelas.

$Imagem mostrando dados num estilo futurístico. Disponível em “https://www.lse.ac.uk/study-at-lse/Graduate/Assets/Images/video-images/MSc-Data-Science.jpg”$

Imagem mostrando dados num estilo futurístico. Disponível em “https://www.lse.ac.uk/study-at-lse/Graduate/Assets/Images/video-images/MSc-Data-Science.jpg”

Imagem gerada por inteligência artificial usando Stabble Diffusion 2.1 com o prompt: “person analysing data in a computer with some charts”

Duas tabelas

Dataset Iris

datatable(iris)

Dataset USArrests

datatable(USArrests)

Quinta

5 referências usando o BibTex.

R Core Team (2022)

Wickham (2016)

Chang (2013)

Gasser and Brännström (2013)

Wickham et al. (2019)

Chang, Winston. 2013. “Shiny: Web Application Framework for r.” Journal of Statistical Software 56 (1): 1–32. https://doi.org/10.18637/jss.v056.i01.

Gasser, Thomas, and Per Brännström. 2013. Introduction to Statistical Learning with Applications in r. Springer.

R Core Team. 2022. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.

Wickham, Hadley. 2016. R for Data Science. O’Reilly Media.

Wickham, Hadley, Mara Averick, Jennifer Bryan, and Karthik Ram et al. 2019. “Welcome to the Tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.

Lista de exercícios 11 - Computação para análise de dados

Bruno Vasconcelos

2023-07-25

Tabs

Primeira

Nuvem de palavra do discurso “Eu tenho um sonho” de Martin Luther King Jr. Também plote as palavras mais frequentes.

Preparação dos dados para o primeiro ponto

Nuvem de palavras

Gráfico das palavras mais frequentes

Segunda

Nuvem de palavras a partir dos tweets sobre o Desmatamento no Brasil. Também faça uma análise de sentimentos com relação a esses tweets.

Carregar base de dados

Preparar dados para nuvem de palavras

Nuvem de palavras

Análise de sentimentos

Terceira

5 equações complexas usando Latex

Quarta

2 Figuras relacionadas a ciência de dados e 2 tabelas.

Duas tabelas

Dataset Iris

Dataset USArrests

Quinta

5 referências usando o BibTex.