knitr::opts_chunk$set(
echo = TRUE,
message = FALSE,
warning = FALSE)
setwd("~/ANOVA")
# Pacotes e Funções
library(tidyverse) # Manipulacao eficiente de dados## -- Attaching packages ------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.0 v purrr 0.3.4
## v tibble 3.0.1 v dplyr 0.8.5
## v tidyr 1.0.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.5.0
## Warning: package 'ggplot2' was built under R version 3.6.3
## Warning: package 'tibble' was built under R version 3.6.3
## Warning: package 'tidyr' was built under R version 3.6.3
## Warning: package 'purrr' was built under R version 3.6.3
## Warning: package 'dplyr' was built under R version 3.6.3
## Warning: package 'forcats' was built under R version 3.6.3
## -- Conflicts --------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
## Warning: package 'pdftools' was built under R version 3.6.3
## Warning: package 'RRPP' was built under R version 3.6.3
## Warning: package 'plotrix' was built under R version 3.6.3
Neste estudo foram realizados diversos testes para verificar a hipótese de que há diferença estatisticamente significante no enquadramento de candidatos á presidência no Brasil. Não foi possível aplicar ANOVA, devido a grande quantidade de valores zerados, ou seja, os dados não possuem curva normal, sendo que a aplicação desses testes não seria válida. Foi então escolhido então teste t de Student para a distribuição por PLANOS e na distribuição por DIA foi escolhido um teste para dados não paramétricos, o teste Wilcoxon.
A diferença é calculada com a fórmula abaixo:
\(Diferença = Positivo + Neutro - Negativo\)
Sendo os dados distribuídos por PLANO, os quais podem ter diversos valores por dia
A média do universo é descrita abaixo
## [1] 12.19118
Testando a hipótese que Haddad tem a diferença de Positivo + Neutro - Negativo menor que a média do universo.
##
## One Sample t-test
##
## data: Haddad$Diferenca
## t = -1.3878, df = 247, p-value = 0.1664
## alternative hypothesis: true mean is not equal to 12.19118
## 95 percent confidence interval:
## 8.275435 12.869727
## sample estimates:
## mean of x
## 10.57258
A média de Haddad é estatisticamente igual a média do universo, segundo o teste t de Student.
boxplot(Haddad$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Haddad", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Haddad e a média do universo")Testando a hipótese que Bolsonaro mais os enquadramentos da facada somados, tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
Bolsonaro <- Tidy_Calculado_1T %>%
filter(Candidato == "BOLSONAROfacada")
t.test(Bolsonaro$Diferenca, mu=m)##
## One Sample t-test
##
## data: Bolsonaro$Diferenca
## t = 3.887, df = 464, p-value = 0.0001163
## alternative hypothesis: true mean is not equal to 12.19118
## 95 percent confidence interval:
## 15.22389 21.42557
## sample estimates:
## mean of x
## 18.32473
A média de Bolsonaro é maior que a média do universo, e essa diferença é estatisticamente significante, segundo o teste t de Student.
boxplot(Bolsonaro$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Bolsonaro", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Bolsonaro e a média do universo")Testando a hipótese que Ciro tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
##
## One Sample t-test
##
## data: Ciro$Diferenca
## t = -1.3648, df = 422, p-value = 0.173
## alternative hypothesis: true mean is not equal to 12.19118
## 95 percent confidence interval:
## 9.209421 12.729113
## sample estimates:
## mean of x
## 10.96927
A média de Ciro é estatisticamente igual a média do universo, segundo o teste t de Student.
boxplot(Ciro$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Ciro", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Ciro e a média do universo")Testando a hipótese que Marina tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
##
## One Sample t-test
##
## data: Marina$Diferenca
## t = -2.9349, df = 416, p-value = 0.003522
## alternative hypothesis: true mean is not equal to 12.19118
## 95 percent confidence interval:
## 8.176028 11.397113
## sample estimates:
## mean of x
## 9.786571
A média de Marina é estatisticamente menor que a média do universo, segundo o teste t de Student.
boxplot(Marina$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Marina", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Marina e a média do universo")Testando a hipótese que Alkimin tem a diferença de Positivo + Neutro - Negativo menor que a média do universo.
##
## One Sample t-test
##
## data: Alckmin$Diferenca
## t = -2.7652, df = 465, p-value = 0.005915
## alternative hypothesis: true mean is not equal to 12.19118
## 95 percent confidence interval:
## 8.773231 11.613035
## sample estimates:
## mean of x
## 10.19313
A média de Alckmin é estatisticamente menor que a média do universo, segundo o teste t de Student.
boxplot(Alckmin$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Alckmin", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Alckmin e a média do universo")Somando os enquadramentos positivos e neutros e diminuindo os enquadramentos negativos com a distribuição dos dados por PLANO, o candidato mais beneficiado no primeiro turno foi Bolsonaro. Bolsonaro foi o único candidato que teve a média da diferença (Posito + Neutro - Negativo por PLANO) estatisticamente maior que a média do universo, utilizando o teste i de Student.
O teste Wilcoxon foi usado na distribuição por DIA devido a quantidade baixa e não normalização dos dados
A diferença é calculada com a fórmula abaixo:
\(Diferença = Positivo + Neutro - Negativo\)
Sendo que os dados foram agregados por DIA.
A média do universo é descrita abaixo
## [1] 97.35238
Testando a hipótese que Haddad tem a diferença de Positivo + Neutro - Negativo menor que a média do universo.
##
## Wilcoxon signed rank test with continuity correction
##
## data: Haddad$Diferenca
## V = 195, p-value = 0.001251
## alternative hypothesis: true location is not equal to 97.35238
A média de Haddad é menor que a média do universo, e essa diferença é estatisticamente significante, segundo o teste Wilcoxon.
boxplot(Haddad$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Haddad", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Haddad e a média do universo")Testando a hipótese que Bolsonaro mais os enquadramentos da facada somados, tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
Bolsonaro <- Tidy_Calculado_1T %>%
filter(Candidato == "BOLSONAROFacada")
wilcox.test(Bolsonaro$Diferenca, mu=m)##
## Wilcoxon signed rank test with continuity correction
##
## data: Bolsonaro$Diferenca
## V = 369, p-value = 0.3051
## alternative hypothesis: true location is not equal to 97.35238
A média de Bolsonaro é maior que a média do universo, mas essa diferença NÃO é estatisticamente significante, segundo o teste Wilcoxon.
boxplot(Bolsonaro$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Bolsonaro", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Bolsonaro e a média do universo")Testando a hipótese que Ciro tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
##
## Wilcoxon signed rank test with continuity correction
##
## data: Ciro$Diferenca
## V = 597, p-value = 0.06982
## alternative hypothesis: true location is not equal to 97.35238
A média de Ciro é maior que a média do universo, mas a diferença NÃO é estatisticamente significante, segundo o teste Wilcoxon.
boxplot(Ciro$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Ciro", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Ciro e a média do universo")Testando a hipótese que Marina tem a diferença de Positivo + Neutro - Negativo maior que a média do universo.
##
## Wilcoxon signed rank test with continuity correction
##
## data: Marina$Diferenca
## V = 491, p-value = 0.6258
## alternative hypothesis: true location is not equal to 97.35238
A média de Marina é estatisticamente igual a média do universo, segundo o teste Wilcoxon.
boxplot(Marina$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Marina", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Marina e a média do universo")Testando a hipótese que Alkimin tem a diferença de Positivo + Neutro - Negativo menor que a média do universo.
Alckmin <- Tidy_Calculado_1T %>%
filter(Candidato == "ALCKMIN")
wilcox.test(Alckmin$Diferenca, mu=m)##
## Wilcoxon signed rank test with continuity correction
##
## data: Alckmin$Diferenca
## V = 686, p-value = 0.003434
## alternative hypothesis: true location is not equal to 97.35238
A média de Alckmin é maior que a média do universo e essa diferença É estatisticamente significante, segundo o teste Wilcoxon.
boxplot(Alckmin$Diferenca, Tidy_Calculado_1T$Diferenca,
outline = FALSE,
names = c("Alckmin", "Média do Grupo"),
col = c("blue", "yellow"),
main = "Diferença entre Alckmin e a média do universo")Somando os enquadramentos positivos e neutros e diminuindo os enquadramentos negativos agregados por DIA, o candidato mais beneficiado no primeiro turno foi Alckmin, que foi o único candidato que teve a média da diferença (Positivo + Neutro - Negativo dispostos por dia) estatisticamente maior que a média do universo, utilizando o teste Wilcoxon (para amostras com dados não normalizados).