Introdução

Este relatório utiliza o dataset tweetsAmazonia.csv, que contém tweets relacionados à Amazônia. O objetivo é realizar manipulações de dados, criar tabelas interativas, apresentar equações complexas e incluir figuras e referências em um formato organizado.

1. Manipulação de Dados

Carregando os Dados

O dataset fornecido será carregado diretamente, e as primeiras linhas serão exibidas para entender sua estrutura.

# Carregar o dataset obtendo as primeiras 1000 linhas
dados <- head(read.csv("tweetsAmazonia.csv", stringsAsFactors = FALSE), 1000)

# Exibir as primeiras linhas do novo dataframe
head(dados)
##                      id       conversation_id              created_at
## 1 1,08459959983744E+018 1,08459858565469E+018 2019-01-13 20:54:30 -03
## 2 1,08455408683651E+018 1,08455408683651E+018 2019-01-13 17:53:38 -03
## 3 1,08454386634108E+018 1,08454386634108E+018 2019-01-13 17:13:02 -03
## 4 1,08454269619741E+018 1,08454269619741E+018 2019-01-13 17:08:23 -03
## 5 1,08452233434461E+018 1,08452233434461E+018 2019-01-13 15:47:28 -03
## 6 1,08452190038929E+018 1,08452190038929E+018 2019-01-13 15:45:45 -03
##         date     time timezone               user_id        username
## 1 2019-01-13 20:54:30     -300            2663964890     nelsonrabat
## 2 2019-01-13 17:53:38     -300 9,21801127322153E+017    _____insight
## 3 2019-01-13 17:13:02     -300            4497684585      maiconob45
## 4 2019-01-13 17:08:23     -300 7,73569207183213E+017      marinacomh
## 5 2019-01-13 15:47:28     -300             541156738 mariluparreiras
## 6 2019-01-13 15:45:45     -300             541156738 mariluparreiras
##                           name place
## 1           nelson rabat lemos      
## 2                           G.      
## 3              Maicon Mauricio      
## 4                     marih 🇧🇷      
## 5 #LulaRousseff #ComLulaEm2022      
## 6 #LulaRousseff #ComLulaEm2022      
##                                                                                                                                                                                                                                                            tweet
## 1                                                                                                                                           @FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia.....
## 2                                                                                                                 Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, mas também dos que votaram nele.
## 3                                                                                                                                                                                 Recomeçou já o desmatamento descontrolado da Amazônia  https://t.co/QvAXdwHBbP
## 4                                                                       tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até falar mal sobre stalin e no exato momento sorri falso e coloquei meus fones
## 5 @ONU_es @ONUHumanRights Dezenas de grileiros invadiram a Terra Indígena Uru-eu-wau-wau nos últimos dias, em área próxima ao município Jorge Teixeira (RO), a 322 km de Porto Velho. O DESMATAMENTO DA AMAZÔNIA É O GRANDE OBJETIVO …   https://t.co/C4b1lZkCXX
## 6                                                                                                            @ONU_es @ONUHumanRights PROFESSOR INDÍGENA FOI ESPANCADO ATÉ À MORTE … E O DESMATAMENTO DA AMAZÔNIA É O GRANDE INTERESSE …  https://t.co/GaNV5alHhI
##   language
## 1       pt
## 2       pt
## 3       pt
## 4       pt
## 5       pt
## 6       pt
##                                                                                         mentions
## 1                                                                                             []
## 2                                                                                             []
## 3                                                                                             []
## 4                                                                                             []
## 5 [{'screen_name': 'onuhumanrights', 'name': 'onu derechos humanos colombia', 'id': '95326483'}]
## 6 [{'screen_name': 'onuhumanrights', 'name': 'onu derechos humanos colombia', 'id': '95326483'}]
##                                                                                                                  urls
## 1                                                                                                                  []
## 2                                                                                                                  []
## 3                                                ['https://www.facebook.com/100003882912440/posts/1375089452630472/']
## 4                                                                                                                  []
## 5       ['https://www1.folha.uol.com.br/amp/poder/2019/01/terra-indigena-e-invadida-por-grileiros-em-rondonia.shtml']
## 6 ['http://agenciabrasil.ebc.com.br/geral/noticia/2018-01/professor-indigena-e-morto-pauladas-em-santa-catarina?amp']
##   photos replies_count retweets_count likes_count hashtags cashtags
## 1     []             1              0           4       []       []
## 2     []             0              1           1       []       []
## 3     []             0              0           0       []       []
## 4     []             0              0           2       []       []
## 5     []             0              0           0       []       []
## 6     []             0              0           0       []       []
##                                                             link retweet
## 1     https://twitter.com/nelsonrabat/status/1084599599837442050   False
## 2    https://twitter.com/_____insight/status/1084554086836514818   False
## 3      https://twitter.com/MaiconOb45/status/1084543866341081088   False
## 4      https://twitter.com/marinacomh/status/1084542696197406722   False
## 5 https://twitter.com/MariluParreiras/status/1084522334344613888   False
## 6 https://twitter.com/MariluParreiras/status/1084521900389294080   False
##   quote_url video thumbnail near geo source user_rt_id user_rt retweet_id
## 1               0                                                        
## 2               0                                                        
## 3               0                                                        
## 4               0                                                        
## 5               0                                                        
## 6               0                                                        
##                                                                          reply_to
## 1 [{'screen_name': 'FotosDeFatos', 'name': 'Fotos de Fatos', 'id': '2959459379'}]
## 2                                                                              []
## 3                                                                              []
## 4                                                                              []
## 5                                                                              []
## 6                                                                              []
##   retweet_date translate trans_src trans_dest Raiva Antecipação Nojo Medo
## 1                                                 0           0    0    0
## 2                                                 2           1    2    3
## 3                                                 0           0    0    0
## 4                                                 3           0    3    1
## 5                                                 0           1    0    0
## 6                                                 1           1    1    1
##   Alegria Tristeza Surpesa Confiança Negativo Positivo Neutro Sentiment X X.1
## 1       0        0       0         0        0        0      1         0    NA
## 2       0        3       0         1        1        0      0        -1    NA
## 3       0        0       0         0        1        0      0        -1    NA
## 4       0        3       0         3        1        0      0        -1    NA
## 5       0        0       0         2        0        1      0         1    NA
## 6       0        1       1         2        0        1      0         1    NA
##   X.2 X.3 X.4 X.5 X.6 X.7 X.8 X.9 X.10 X.11 X.12 X.13 X.14 X.15 X.16 X.17 X.18
## 1  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 2  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 3  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 4  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 5  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
## 6  NA      NA  NA  NA  NA  NA  NA   NA   NA   NA   NA   NA   NA   NA   NA   NA
##   X.19
## 1   NA
## 2   NA
## 3   NA
## 4   NA
## 5   NA
## 6   NA
# Estrutura dos dados
str(dados)
## 'data.frame':    1000 obs. of  68 variables:
##  $ id             : chr  "1,08459959983744E+018" "1,08455408683651E+018" "1,08454386634108E+018" "1,08454269619741E+018" ...
##  $ conversation_id: chr  "1,08459858565469E+018" "1,08455408683651E+018" "1,08454386634108E+018" "1,08454269619741E+018" ...
##  $ created_at     : chr  "2019-01-13 20:54:30 -03" "2019-01-13 17:53:38 -03" "2019-01-13 17:13:02 -03" "2019-01-13 17:08:23 -03" ...
##  $ date           : chr  "2019-01-13" "2019-01-13" "2019-01-13" "2019-01-13" ...
##  $ time           : chr  "20:54:30" "17:53:38" "17:13:02" "17:08:23" ...
##  $ timezone       : int  -300 -300 -300 -300 -300 -300 -300 -300 -300 -300 ...
##  $ user_id        : chr  "2663964890" "9,21801127322153E+017" "4497684585" "7,73569207183213E+017" ...
##  $ username       : chr  "nelsonrabat" "_____insight" "maiconob45" "marinacomh" ...
##  $ name           : chr  "nelson rabat lemos" "G." "Maicon Mauricio" "marih 🇧🇷" ...
##  $ place          : chr  "" "" "" "" ...
##  $ tweet          : chr  "@FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia....." "Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, m"| __truncated__ "Recomeçou já o desmatamento descontrolado da Amazônia  https://t.co/QvAXdwHBbP" "tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até fa"| __truncated__ ...
##  $ language       : chr  "pt" "pt" "pt" "pt" ...
##  $ mentions       : chr  "[]" "[]" "[]" "[]" ...
##  $ urls           : chr  "[]" "[]" "['https://www.facebook.com/100003882912440/posts/1375089452630472/']" "[]" ...
##  $ photos         : chr  "[]" "[]" "[]" "[]" ...
##  $ replies_count  : chr  "1" "0" "0" "0" ...
##  $ retweets_count : chr  "0" "1" "0" "0" ...
##  $ likes_count    : chr  "4" "1" "0" "2" ...
##  $ hashtags       : chr  "[]" "[]" "[]" "[]" ...
##  $ cashtags       : chr  "[]" "[]" "[]" "[]" ...
##  $ link           : chr  "https://twitter.com/nelsonrabat/status/1084599599837442050" "https://twitter.com/_____insight/status/1084554086836514818" "https://twitter.com/MaiconOb45/status/1084543866341081088" "https://twitter.com/marinacomh/status/1084542696197406722" ...
##  $ retweet        : chr  "False" "False" "False" "False" ...
##  $ quote_url      : chr  "" "" "" "" ...
##  $ video          : chr  "0" "0" "0" "0" ...
##  $ thumbnail      : chr  "" "" "" "" ...
##  $ near           : chr  "" "" "" "" ...
##  $ geo            : chr  "" "" "" "" ...
##  $ source         : chr  "" "" "" "" ...
##  $ user_rt_id     : chr  "" "" "" "" ...
##  $ user_rt        : chr  "" "" "" "" ...
##  $ retweet_id     : chr  "" "" "" "" ...
##  $ reply_to       : chr  "[{'screen_name': 'FotosDeFatos', 'name': 'Fotos de Fatos', 'id': '2959459379'}]" "[]" "[]" "[]" ...
##  $ retweet_date   : chr  "" "" "" "" ...
##  $ translate      : chr  "" "" "" "" ...
##  $ trans_src      : chr  "" "" "" "" ...
##  $ trans_dest     : chr  "" "" "" "" ...
##  $ Raiva          : chr  "0" "2" "0" "3" ...
##  $ Antecipação    : chr  "0" "1" "0" "0" ...
##  $ Nojo           : chr  "0" "2" "0" "3" ...
##  $ Medo           : chr  "0" "3" "0" "1" ...
##  $ Alegria        : chr  "0" "0" "0" "0" ...
##  $ Tristeza       : chr  "0" "3" "0" "3" ...
##  $ Surpesa        : chr  "0" "0" "0" "0" ...
##  $ Confiança      : chr  "0" "1" "0" "3" ...
##  $ Negativo       : chr  "0" "1" "1" "1" ...
##  $ Positivo       : chr  "0" "0" "0" "0" ...
##  $ Neutro         : int  1 0 0 0 0 0 0 0 0 0 ...
##  $ Sentiment      : chr  "0" "-1" "-1" "-1" ...
##  $ X              : chr  "" "" "" "" ...
##  $ X.1            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.2            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.3            : chr  "" "" "" "" ...
##  $ X.4            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.5            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.6            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.7            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.8            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.9            : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.10           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.11           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.12           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.13           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.14           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.15           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.16           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.17           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.18           : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ X.19           : int  NA NA NA NA NA NA NA NA NA NA ...
# Resumo estatístico
summary(dados)
##       id            conversation_id     created_at            date          
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      time              timezone      user_id            username        
##  Length:1000        Min.   :-300   Length:1000        Length:1000       
##  Class :character   1st Qu.:-300   Class :character   Class :character  
##  Mode  :character   Median :-300   Mode  :character   Mode  :character  
##                     Mean   :-300                                        
##                     3rd Qu.:-300                                        
##                     Max.   :-300                                        
##                                                                         
##      name              place              tweet             language        
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    mentions             urls              photos          replies_count     
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  retweets_count     likes_count          hashtags           cashtags        
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      link             retweet           quote_url            video          
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   thumbnail             near               geo               source         
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   user_rt_id          user_rt           retweet_id          reply_to        
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  retweet_date        translate          trans_src          trans_dest       
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##     Raiva           Antecipação            Nojo               Medo          
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    Alegria            Tristeza           Surpesa           Confiança        
##  Length:1000        Length:1000        Length:1000        Length:1000       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    Negativo           Positivo             Neutro       Sentiment        
##  Length:1000        Length:1000        Min.   :0.000   Length:1000       
##  Class :character   Class :character   1st Qu.:0.000   Class :character  
##  Mode  :character   Mode  :character   Median :1.000   Mode  :character  
##                                        Mean   :0.502                     
##                                        3rd Qu.:1.000                     
##                                        Max.   :1.000                     
##                                                                          
##       X                  X.1           X.2          X.3           
##  Length:1000        Min.   :1     Min.   :0     Length:1000       
##  Class :character   1st Qu.:1     1st Qu.:0     Class :character  
##  Mode  :character   Median :1     Median :0     Mode  :character  
##                     Mean   :1     Mean   :0                       
##                     3rd Qu.:1     3rd Qu.:0                       
##                     Max.   :1     Max.   :0                       
##                     NA's   :998   NA's   :998                     
##       X.4            X.5            X.6            X.7            X.8      
##  Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA   
##  1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA   
##  Median : NA    Median : NA    Median : NA    Median : NA    Median : NA   
##  Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN   
##  3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA   
##  Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA   
##  NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000  
##       X.9            X.10           X.11           X.12           X.13     
##  Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA   
##  1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA   
##  Median : NA    Median : NA    Median : NA    Median : NA    Median : NA   
##  Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN   
##  3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA   
##  Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA   
##  NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000  
##       X.14           X.15           X.16           X.17           X.18     
##  Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA    Min.   : NA   
##  1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA    1st Qu.: NA   
##  Median : NA    Median : NA    Median : NA    Median : NA    Median : NA   
##  Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN    Mean   :NaN   
##  3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA    3rd Qu.: NA   
##  Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA    Max.   : NA   
##  NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000   NA's   :1000  
##       X.19     
##  Min.   : NA   
##  1st Qu.: NA   
##  Median : NA   
##  Mean   :NaN   
##  3rd Qu.: NA   
##  Max.   : NA   
##  NA's   :1000

Manipulações Simples

Vamos filtrar os tweets que mencionam “Amazônia” e adicionar uma variável categórica de sentimento com base no texto.

# Filtrar tweets que mencionam "Amazônia"
dados_filtrados <- subset(dados, grepl("Amazônia", tweet, ignore.case = TRUE))

# Criar variável categórica (exemplo fictício)
dados_filtrados$sentimento <- ifelse(grepl("salvar|proteger", dados_filtrados$tweet, ignore.case = TRUE), 
                                     "Positivo", 
                                     ifelse(grepl("destruir|queimada", dados_filtrados$tweet, ignore.case = TRUE), 
                                            "Negativo", "Neutro"))

# Selecionar as colunas username, name, tweet, link, sentimento
dados_filtrados <- dados_filtrados[, c("username", "name", "tweet", "link", "sentimento")]

# Exibir o resultado
head(dados_filtrados)
##          username                         name
## 1     nelsonrabat           nelson rabat lemos
## 2    _____insight                           G.
## 3      maiconob45              Maicon Mauricio
## 4      marinacomh                     marih 🇧🇷
## 5 mariluparreiras #LulaRousseff #ComLulaEm2022
## 6 mariluparreiras #LulaRousseff #ComLulaEm2022
##                                                                                                                                                                                                                                                            tweet
## 1                                                                                                                                           @FotosDeFatos daqui há alguns anos vai ser só um fiapo de rio, devido ao desmatamento que vão fazer na amazônia.....
## 2                                                                                                                 Depois que São Paulo virar um deserto por conta do desmatamento da Amazônia, lembrem-se da família bolsonaro, mas também dos que votaram nele.
## 3                                                                                                                                                                                 Recomeçou já o desmatamento descontrolado da Amazônia  https://t.co/QvAXdwHBbP
## 4                                                                       tava conversando com o cara sentado do meu lado sobre o desmatamento da amazônia e ele pareceu ser legal até falar mal sobre stalin e no exato momento sorri falso e coloquei meus fones
## 5 @ONU_es @ONUHumanRights Dezenas de grileiros invadiram a Terra Indígena Uru-eu-wau-wau nos últimos dias, em área próxima ao município Jorge Teixeira (RO), a 322 km de Porto Velho. O DESMATAMENTO DA AMAZÔNIA É O GRANDE OBJETIVO …   https://t.co/C4b1lZkCXX
## 6                                                                                                            @ONU_es @ONUHumanRights PROFESSOR INDÍGENA FOI ESPANCADO ATÉ À MORTE … E O DESMATAMENTO DA AMAZÔNIA É O GRANDE INTERESSE …  https://t.co/GaNV5alHhI
##                                                             link sentimento
## 1     https://twitter.com/nelsonrabat/status/1084599599837442050     Neutro
## 2    https://twitter.com/_____insight/status/1084554086836514818     Neutro
## 3      https://twitter.com/MaiconOb45/status/1084543866341081088     Neutro
## 4      https://twitter.com/marinacomh/status/1084542696197406722     Neutro
## 5 https://twitter.com/MariluParreiras/status/1084522334344613888     Neutro
## 6 https://twitter.com/MariluParreiras/status/1084521900389294080     Neutro

2. Tabela Interativa

Utilizamos o pacote DT para criar uma tabela interativa com opções de busca, ordenação e paginação.

library(DT)

datatable(
  dados_filtrados,
  options = list(pageLength = 5, autoWidth = TRUE),
  caption = 'Tabela interativa de tweets sobre a Amazônia.'
)

3. Equações Complexas

Abaixo estão cinco equações complexas escritas em LaTeX, com explicações detalhadas sobre seu significado.

1. Fórmula da Regressão Linear

A fórmula da regressão linear representa a relação entre uma variável dependente (\(Y\)) e uma ou mais variáveis independentes (\(X\)).

\[ Y = \beta_0 + \beta_1 X + \epsilon \]

  • \(Y\): variável dependente (resultado esperado).
  • \(\beta_0\): intercepto da reta (valor de \(Y\) quando \(X = 0\)).
  • \(\beta_1\): coeficiente angular (inclinação da reta).
  • \(X\): variável independente.
  • \(\epsilon\): termo de erro.

2. Fórmula da Variância

A variância mede a dispersão dos valores de uma variável em relação à sua média.

\[ \sigma^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2 \]

  • \(\sigma^2\): variância da amostra.
  • \(n\): número de observações.
  • \(X_i\): valor individual da variável.
  • \(\bar{X}\): média dos valores.

3. Fórmula da Probabilidade Bayesiana

A probabilidade condicional de um evento \(A\) dado \(B\), amplamente utilizada em classificadores de texto.

\[ P(A|B) = \frac{P(B|A)P(A)}{P(B)} \]

  • \(P(A|B)\): probabilidade de \(A\) ocorrer dado \(B\).
  • \(P(B|A)\): probabilidade de \(B\) ocorrer dado \(A\).
  • \(P(A)\): probabilidade de \(A\).
  • \(P(B)\): probabilidade de \(B\).

4. Fórmula do TF-IDF

Essa fórmula calcula a relevância de uma palavra em um documento dentro de um conjunto de documentos, sendo amplamente usada em análise de texto.

\[ tfidf(t, d, D) = tf(t, d) \cdot idf(t, D) \]

  • \(tf(t, d)\): frequência da palavra \(t\) no documento \(d\).
  • \(idf(t, D)\): logaritmo inverso da frequência da palavra \(t\) em todos os documentos \(D\).

5. Fórmula da Distância Euclidiana

Essa fórmula mede a distância entre dois pontos \(p\) e \(q\) em um espaço \(n\)-dimensional.

\[ d(p, q) = \sqrt{\sum_{i=1}^n (q_i - p_i)^2} \]

  • \(d(p, q)\): distância entre os pontos \(p\) e \(q\).
  • \(p_i\), \(q_i\): coordenadas dos pontos nos \(n\) eixos.

Essas equações representam conceitos fundamentais utilizados em estatística, aprendizado de máquina e ciência de dados.

4. Figuras

Data Science Lifecycle.
Data Science Lifecycle.
Advanced Data Science Concepts for Business Professionals.
Advanced Data Science Concepts for Business Professionals.

5. Referências

Wickham and Wickham (2016)

Wickham, Çetinkaya-Rundel, and Grolemund (2023)

Van Der Aalst and Aalst (2016)

Dhar (2013)

Baumer and Udwin (2015)


Baumer, Benjamin, and Dana Udwin. 2015. “R Markdown.” Wiley Interdisciplinary Reviews: Computational Statistics 7 (3): 167–77.
Dhar, Vasant. 2013. “Data Science and Prediction.” Communications of the ACM 56 (12): 64–73.
Van Der Aalst, Wil, and Wil van der Aalst. 2016. Data Science in Action. Springer.
Wickham, Hadley, Mine Çetinkaya-Rundel, and Garrett Grolemund. 2023. R for Data Science. " O’Reilly Media, Inc.".
Wickham, Hadley, and Hadley Wickham. 2016. Data Analysis. Springer.