Este relatório utiliza o dataset tweetsAmazonia.csv
, que
contém tweets relacionados à Amazônia. O objetivo é realizar
manipulações de dados, criar tabelas interativas, apresentar equações
complexas e incluir figuras e referências em um formato organizado.
O dataset fornecido será carregado diretamente, e as primeiras linhas serão exibidas para entender sua estrutura.
# Carregar o dataset obtendo as primeiras 1000 linhas
dados <- head(read.csv("tweetsAmazonia.csv", stringsAsFactors = FALSE), 1000)
# Exibir as primeiras linhas do novo dataframe
head(dados)
## id conversation_id created_at
## 1 1,08459959983744E+018 1,08459858565469E+018 2019-01-13 20:54:30 -03
## 2 1,08455408683651E+018 1,08455408683651E+018 2019-01-13 17:53:38 -03
## 3 1,08454386634108E+018 1,08454386634108E+018 2019-01-13 17:13:02 -03
## 4 1,08454269619741E+018 1,08454269619741E+018 2019-01-13 17:08:23 -03
## 5 1,08452233434461E+018 1,08452233434461E+018 2019-01-13 15:47:28 -03
## 6 1,08452190038929E+018 1,08452190038929E+018 2019-01-13 15:45:45 -03
## date time timezone user_id username
## 1 2019-01-13 20:54:30 -300 2663964890 nelsonrabat
## 2 2019-01-13 17:53:38 -300 9,21801127322153E+017 _____insight
## 3 2019-01-13 17:13:02 -300 4497684585 maiconob45
## 4 2019-01-13 17:08:23 -300 7,73569207183213E+017 marinacomh
## 5 2019-01-13 15:47:28 -300 541156738 mariluparreiras
## 6 2019-01-13 15:45:45 -300 541156738 mariluparreiras
## name place
## 1 nelson rabat lemos
## 2 G.
## 3 Maicon Mauricio
## 4 marih 🇧🇷
## 5 #LulaRousseff #ComLulaEm2022
## 6 #LulaRousseff #ComLulaEm2022
## tweet
## 1 @FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia.....
## 2 Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, mas também dos que votaram nele.
## 3 Recomeçou já o desmatamento descontrolado da Amazônia https://t.co/QvAXdwHBbP
## 4 tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até falar mal sobre stalin e no exato momento sorri falso e coloquei meus fones
## 5 @ONU_es @ONUHumanRights Dezenas de grileiros invadiram a Terra Indígena Uru-eu-wau-wau nos últimos dias, em área próxima ao município Jorge Teixeira (RO), a 322 km de Porto Velho. O DESMATAMENTO DA AMAZÔNIA É O GRANDE OBJETIVO … https://t.co/C4b1lZkCXX
## 6 @ONU_es @ONUHumanRights PROFESSOR INDÍGENA FOI ESPANCADO ATÉ À MORTE … E O DESMATAMENTO DA AMAZÔNIA É O GRANDE INTERESSE … https://t.co/GaNV5alHhI
## language
## 1 pt
## 2 pt
## 3 pt
## 4 pt
## 5 pt
## 6 pt
## mentions
## 1 []
## 2 []
## 3 []
## 4 []
## 5 [{'screen_name': 'onuhumanrights', 'name': 'onu derechos humanos colombia', 'id': '95326483'}]
## 6 [{'screen_name': 'onuhumanrights', 'name': 'onu derechos humanos colombia', 'id': '95326483'}]
## urls
## 1 []
## 2 []
## 3 ['https://www.facebook.com/100003882912440/posts/1375089452630472/']
## 4 []
## 5 ['https://www1.folha.uol.com.br/amp/poder/2019/01/terra-indigena-e-invadida-por-grileiros-em-rondonia.shtml']
## 6 ['http://agenciabrasil.ebc.com.br/geral/noticia/2018-01/professor-indigena-e-morto-pauladas-em-santa-catarina?amp']
## photos replies_count retweets_count likes_count hashtags cashtags
## 1 [] 1 0 4 [] []
## 2 [] 0 1 1 [] []
## 3 [] 0 0 0 [] []
## 4 [] 0 0 2 [] []
## 5 [] 0 0 0 [] []
## 6 [] 0 0 0 [] []
## link retweet
## 1 https://twitter.com/nelsonrabat/status/1084599599837442050 False
## 2 https://twitter.com/_____insight/status/1084554086836514818 False
## 3 https://twitter.com/MaiconOb45/status/1084543866341081088 False
## 4 https://twitter.com/marinacomh/status/1084542696197406722 False
## 5 https://twitter.com/MariluParreiras/status/1084522334344613888 False
## 6 https://twitter.com/MariluParreiras/status/1084521900389294080 False
## quote_url video thumbnail near geo source user_rt_id user_rt retweet_id
## 1 0
## 2 0
## 3 0
## 4 0
## 5 0
## 6 0
## reply_to
## 1 [{'screen_name': 'FotosDeFatos', 'name': 'Fotos de Fatos', 'id': '2959459379'}]
## 2 []
## 3 []
## 4 []
## 5 []
## 6 []
## retweet_date translate trans_src trans_dest Raiva Antecipação Nojo Medo
## 1 0 0 0 0
## 2 2 1 2 3
## 3 0 0 0 0
## 4 3 0 3 1
## 5 0 1 0 0
## 6 1 1 1 1
## Alegria Tristeza Surpesa Confiança Negativo Positivo Neutro Sentiment X X.1
## 1 0 0 0 0 0 0 1 0 NA
## 2 0 3 0 1 1 0 0 -1 NA
## 3 0 0 0 0 1 0 0 -1 NA
## 4 0 3 0 3 1 0 0 -1 NA
## 5 0 0 0 2 0 1 0 1 NA
## 6 0 1 1 2 0 1 0 1 NA
## X.2 X.3 X.4 X.5 X.6 X.7 X.8 X.9 X.10 X.11 X.12 X.13 X.14 X.15 X.16 X.17 X.18
## 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## X.19
## 1 NA
## 2 NA
## 3 NA
## 4 NA
## 5 NA
## 6 NA
# Estrutura dos dados
str(dados)
## 'data.frame': 1000 obs. of 68 variables:
## $ id : chr "1,08459959983744E+018" "1,08455408683651E+018" "1,08454386634108E+018" "1,08454269619741E+018" ...
## $ conversation_id: chr "1,08459858565469E+018" "1,08455408683651E+018" "1,08454386634108E+018" "1,08454269619741E+018" ...
## $ created_at : chr "2019-01-13 20:54:30 -03" "2019-01-13 17:53:38 -03" "2019-01-13 17:13:02 -03" "2019-01-13 17:08:23 -03" ...
## $ date : chr "2019-01-13" "2019-01-13" "2019-01-13" "2019-01-13" ...
## $ time : chr "20:54:30" "17:53:38" "17:13:02" "17:08:23" ...
## $ timezone : int -300 -300 -300 -300 -300 -300 -300 -300 -300 -300 ...
## $ user_id : chr "2663964890" "9,21801127322153E+017" "4497684585" "7,73569207183213E+017" ...
## $ username : chr "nelsonrabat" "_____insight" "maiconob45" "marinacomh" ...
## $ name : chr "nelson rabat lemos" "G." "Maicon Mauricio" "marih 🇧🇷" ...
## $ place : chr "" "" "" "" ...
## $ tweet : chr "@FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia....." "Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, m"| __truncated__ "Recomeçou já o desmatamento descontrolado da Amazônia https://t.co/QvAXdwHBbP" "tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até fa"| __truncated__ ...
## $ language : chr "pt" "pt" "pt" "pt" ...
## $ mentions : chr "[]" "[]" "[]" "[]" ...
## $ urls : chr "[]" "[]" "['https://www.facebook.com/100003882912440/posts/1375089452630472/']" "[]" ...
## $ photos : chr "[]" "[]" "[]" "[]" ...
## $ replies_count : chr "1" "0" "0" "0" ...
## $ retweets_count : chr "0" "1" "0" "0" ...
## $ likes_count : chr "4" "1" "0" "2" ...
## $ hashtags : chr "[]" "[]" "[]" "[]" ...
## $ cashtags : chr "[]" "[]" "[]" "[]" ...
## $ link : chr "https://twitter.com/nelsonrabat/status/1084599599837442050" "https://twitter.com/_____insight/status/1084554086836514818" "https://twitter.com/MaiconOb45/status/1084543866341081088" "https://twitter.com/marinacomh/status/1084542696197406722" ...
## $ retweet : chr "False" "False" "False" "False" ...
## $ quote_url : chr "" "" "" "" ...
## $ video : chr "0" "0" "0" "0" ...
## $ thumbnail : chr "" "" "" "" ...
## $ near : chr "" "" "" "" ...
## $ geo : chr "" "" "" "" ...
## $ source : chr "" "" "" "" ...
## $ user_rt_id : chr "" "" "" "" ...
## $ user_rt : chr "" "" "" "" ...
## $ retweet_id : chr "" "" "" "" ...
## $ reply_to : chr "[{'screen_name': 'FotosDeFatos', 'name': 'Fotos de Fatos', 'id': '2959459379'}]" "[]" "[]" "[]" ...
## $ retweet_date : chr "" "" "" "" ...
## $ translate : chr "" "" "" "" ...
## $ trans_src : chr "" "" "" "" ...
## $ trans_dest : chr "" "" "" "" ...
## $ Raiva : chr "0" "2" "0" "3" ...
## $ Antecipação : chr "0" "1" "0" "0" ...
## $ Nojo : chr "0" "2" "0" "3" ...
## $ Medo : chr "0" "3" "0" "1" ...
## $ Alegria : chr "0" "0" "0" "0" ...
## $ Tristeza : chr "0" "3" "0" "3" ...
## $ Surpesa : chr "0" "0" "0" "0" ...
## $ Confiança : chr "0" "1" "0" "3" ...
## $ Negativo : chr "0" "1" "1" "1" ...
## $ Positivo : chr "0" "0" "0" "0" ...
## $ Neutro : int 1 0 0 0 0 0 0 0 0 0 ...
## $ Sentiment : chr "0" "-1" "-1" "-1" ...
## $ X : chr "" "" "" "" ...
## $ X.1 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.2 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.3 : chr "" "" "" "" ...
## $ X.4 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.5 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.6 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.7 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.8 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.9 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.10 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.11 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.12 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.13 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.14 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.15 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.16 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.17 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.18 : int NA NA NA NA NA NA NA NA NA NA ...
## $ X.19 : int NA NA NA NA NA NA NA NA NA NA ...
# Resumo estatístico
summary(dados)
## id conversation_id created_at date
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## time timezone user_id username
## Length:1000 Min. :-300 Length:1000 Length:1000
## Class :character 1st Qu.:-300 Class :character Class :character
## Mode :character Median :-300 Mode :character Mode :character
## Mean :-300
## 3rd Qu.:-300
## Max. :-300
##
## name place tweet language
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## mentions urls photos replies_count
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## retweets_count likes_count hashtags cashtags
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## link retweet quote_url video
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## thumbnail near geo source
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## user_rt_id user_rt retweet_id reply_to
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## retweet_date translate trans_src trans_dest
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Raiva Antecipação Nojo Medo
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Alegria Tristeza Surpesa Confiança
## Length:1000 Length:1000 Length:1000 Length:1000
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Negativo Positivo Neutro Sentiment
## Length:1000 Length:1000 Min. :0.000 Length:1000
## Class :character Class :character 1st Qu.:0.000 Class :character
## Mode :character Mode :character Median :1.000 Mode :character
## Mean :0.502
## 3rd Qu.:1.000
## Max. :1.000
##
## X X.1 X.2 X.3
## Length:1000 Min. :1 Min. :0 Length:1000
## Class :character 1st Qu.:1 1st Qu.:0 Class :character
## Mode :character Median :1 Median :0 Mode :character
## Mean :1 Mean :0
## 3rd Qu.:1 3rd Qu.:0
## Max. :1 Max. :0
## NA's :998 NA's :998
## X.4 X.5 X.6 X.7 X.8
## Min. : NA Min. : NA Min. : NA Min. : NA Min. : NA
## 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA
## Median : NA Median : NA Median : NA Median : NA Median : NA
## Mean :NaN Mean :NaN Mean :NaN Mean :NaN Mean :NaN
## 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA
## Max. : NA Max. : NA Max. : NA Max. : NA Max. : NA
## NA's :1000 NA's :1000 NA's :1000 NA's :1000 NA's :1000
## X.9 X.10 X.11 X.12 X.13
## Min. : NA Min. : NA Min. : NA Min. : NA Min. : NA
## 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA
## Median : NA Median : NA Median : NA Median : NA Median : NA
## Mean :NaN Mean :NaN Mean :NaN Mean :NaN Mean :NaN
## 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA
## Max. : NA Max. : NA Max. : NA Max. : NA Max. : NA
## NA's :1000 NA's :1000 NA's :1000 NA's :1000 NA's :1000
## X.14 X.15 X.16 X.17 X.18
## Min. : NA Min. : NA Min. : NA Min. : NA Min. : NA
## 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA 1st Qu.: NA
## Median : NA Median : NA Median : NA Median : NA Median : NA
## Mean :NaN Mean :NaN Mean :NaN Mean :NaN Mean :NaN
## 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA 3rd Qu.: NA
## Max. : NA Max. : NA Max. : NA Max. : NA Max. : NA
## NA's :1000 NA's :1000 NA's :1000 NA's :1000 NA's :1000
## X.19
## Min. : NA
## 1st Qu.: NA
## Median : NA
## Mean :NaN
## 3rd Qu.: NA
## Max. : NA
## NA's :1000
Vamos filtrar os tweets que mencionam “Amazônia” e adicionar uma variável categórica de sentimento com base no texto.
# Filtrar tweets que mencionam "Amazônia"
dados_filtrados <- subset(dados, grepl("Amazônia", tweet, ignore.case = TRUE))
# Criar variável categórica (exemplo fictício)
dados_filtrados$sentimento <- ifelse(grepl("salvar|proteger", dados_filtrados$tweet, ignore.case = TRUE),
"Positivo",
ifelse(grepl("destruir|queimada", dados_filtrados$tweet, ignore.case = TRUE),
"Negativo", "Neutro"))
# Selecionar as colunas username, name, tweet, link, sentimento
dados_filtrados <- dados_filtrados[, c("username", "name", "tweet", "link", "sentimento")]
# Exibir o resultado
head(dados_filtrados)
## username name
## 1 nelsonrabat nelson rabat lemos
## 2 _____insight G.
## 3 maiconob45 Maicon Mauricio
## 4 marinacomh marih 🇧🇷
## 5 mariluparreiras #LulaRousseff #ComLulaEm2022
## 6 mariluparreiras #LulaRousseff #ComLulaEm2022
## tweet
## 1 @FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia.....
## 2 Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, mas também dos que votaram nele.
## 3 Recomeçou já o desmatamento descontrolado da Amazônia https://t.co/QvAXdwHBbP
## 4 tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até falar mal sobre stalin e no exato momento sorri falso e coloquei meus fones
## 5 @ONU_es @ONUHumanRights Dezenas de grileiros invadiram a Terra Indígena Uru-eu-wau-wau nos últimos dias, em área próxima ao município Jorge Teixeira (RO), a 322 km de Porto Velho. O DESMATAMENTO DA AMAZÔNIA É O GRANDE OBJETIVO … https://t.co/C4b1lZkCXX
## 6 @ONU_es @ONUHumanRights PROFESSOR INDÍGENA FOI ESPANCADO ATÉ À MORTE … E O DESMATAMENTO DA AMAZÔNIA É O GRANDE INTERESSE … https://t.co/GaNV5alHhI
## link sentimento
## 1 https://twitter.com/nelsonrabat/status/1084599599837442050 Neutro
## 2 https://twitter.com/_____insight/status/1084554086836514818 Neutro
## 3 https://twitter.com/MaiconOb45/status/1084543866341081088 Neutro
## 4 https://twitter.com/marinacomh/status/1084542696197406722 Neutro
## 5 https://twitter.com/MariluParreiras/status/1084522334344613888 Neutro
## 6 https://twitter.com/MariluParreiras/status/1084521900389294080 Neutro
Utilizamos o pacote DT para criar uma tabela interativa com opções de busca, ordenação e paginação.
library(DT)
datatable(
dados_filtrados,
options = list(pageLength = 5, autoWidth = TRUE),
caption = 'Tabela interativa de tweets sobre a Amazônia.'
)
Abaixo estão cinco equações complexas escritas em LaTeX, com explicações detalhadas sobre seu significado.
A fórmula da regressão linear representa a relação entre uma variável dependente (\(Y\)) e uma ou mais variáveis independentes (\(X\)).
\[ Y = \beta_0 + \beta_1 X + \epsilon \]
A variância mede a dispersão dos valores de uma variável em relação à sua média.
\[ \sigma^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \]
A probabilidade condicional de um evento \(A\) dado \(B\), amplamente utilizada em classificadores de texto.
\[ P(A|B) = \frac{P(B|A)P(A)}{P(B)} \]
Essa fórmula calcula a relevância de uma palavra em um documento dentro de um conjunto de documentos, sendo amplamente usada em análise de texto.
\[ tfidf(t, d, D) = tf(t, d) \cdot idf(t, D) \]
Essa fórmula mede a distância entre dois pontos \(p\) e \(q\) em um espaço \(n\)-dimensional.
\[ d(p, q) = \sqrt{\sum_{i=1}^n (q_i - p_i)^2} \]
Essas equações representam conceitos fundamentais utilizados em estatística, aprendizado de máquina e ciência de dados.
Wickham and Wickham (2016)
Wickham, Çetinkaya-Rundel, and Grolemund (2023)
Van Der Aalst and Aalst (2016)
Dhar (2013)
Baumer and Udwin (2015)