discurso = read.delim("discurso_mlk.txt", header=FALSE)
VS <- VectorSource(discurso)
corpus <- Corpus(VS)
#removendo minúsculos
corpus <- tm_map(corpus, content_transformer(tolower))
#removendo pontuação
corpus <- tm_map(corpus, removePunctuation)
#removendo espaços extras em branco
corpus <- tm_map(corpus, stripWhitespace)
#remover numeros
corpus <- tm_map(corpus, removeNumbers)
#remover stopwords
corpus <- tm_map(corpus, removeWords, stopwords('portuguese'))
#converter para o formato de matrix
tdm <- as.matrix(TermDocumentMatrix(corpus))
#Fornecer as frequencias ordenadas de cada palavra
fre <- sort(rowSums(tdm), decreasing = TRUE)
#escolhedo um subconjunto dos dados
aux<- subset(fre, fre>2)
#plotar gráfico de barras
barplot(aux, las=2, col = rainbow(10))
wordcloud(corpus, min.freq = 1, max.words = Inf,
random.order = FALSE, rot.per = 0.35,
colors=brewer.pal(5,"Dark2"))
#tweets <- search_tweets("Brasil", n=500, lang="pt") a pesquisa foi colocada em brasilTweets.csv
#tweetsDF <- load("datTweetsBrasil.Rda")
tweetsDF <- readRDS(file="datTweetsBrasil.Rda")
tweets_texto <-paste(tweetsDF$text, collapse = " ")
wordcloud(width=800, height=800,
tweets_texto, min.freq = 1, max.words = 100,
random.order = FALSE, rot.per = 0.35,
colors=brewer.pal(50,"Dark2")) #não entendi os parametros de tamanho, nao achei na internet muito sobre
#pontuando os tweets
tweetsDF <- tweetsDF$text
s<-get_nrc_sentiment(tweetsDF)
#plotando grafico com sentimentos
barplot(colSums(s), las=2, col=rainbow(10),
ylab = "Contagem", main = "Sentimentos em relação a Brasil")
\[E\alpha = \frac{1}{1+10\frac{R\beta - R\alpha}{400}}\]
\[f'(x) = \frac{df}{dx}=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}\]
\[f(x) =\sum_{n=0}^{\infty}\frac{f^{(n)}(a)(x-a)^n}{n!}\]
\[CPI = \sum_{n}^{i=1}(CPIi x Li)\]
\[\oint E\cdot ds = -\frac{d\Phi B}{dt}\] ## 4 - 2 Figuras relacionadas a ciência de dados e 2 tabelas (dica: use datatable() do pacote DT).
Figura 1
Figura 2
datatable(iris)
datatable(mtcars)
Araújo et al. (2013) Allaire (2012) Dhar (2013) Verzani (2011) Redmalm (2014)