Para esta tarefa, utilize o objeto dados criado a partir dp banco de dados ppc400.csv. Utilize o codebook disponível neste link para explorar as variáveis.
Exercício 1
As variáveis de jornalistaaté advogados apresentam as notas dadas para indicar o grau de confiança em cada um dos profissionais. Para cada uma das variáveis calcule:
Qual profissional tem a maior média de confiança?
dados <-read.csv2("ppc400.csv")View(dados)jorna.adv <- dplyr::select(dados,jornalistas:advogados)jorna.adv <-na.omit(jorna.adv)colMeans(jorna.adv)
$jornalistas
Shapiro-Wilk normality test
data: x
W = 0.9591, p-value = 5.024e-08
$medicos
Shapiro-Wilk normality test
data: x
W = 0.9053, p-value = 1.371e-13
$cient_emp_priv
Shapiro-Wilk normality test
data: x
W = 0.94182, p-value = 3.704e-10
$religiosos
Shapiro-Wilk normality test
data: x
W = 0.93484, p-value = 6.621e-11
$cient_uni_pub
Shapiro-Wilk normality test
data: x
W = 0.84832, p-value < 2.2e-16
$rep_ong_ma
Shapiro-Wilk normality test
data: x
W = 0.89597, p-value = 2.572e-14
$politicos
Shapiro-Wilk normality test
data: x
W = 0.74941, p-value < 2.2e-16
$professores
Shapiro-Wilk normality test
data: x
W = 0.8438, p-value < 2.2e-16
$cient_uni_priv
Shapiro-Wilk normality test
data: x
W = 0.91658, p-value = 1.215e-12
$militares
Shapiro-Wilk normality test
data: x
W = 0.95068, p-value = 4.029e-09
$escritores
Shapiro-Wilk normality test
data: x
W = 0.93468, p-value = 6.364e-11
$cient_emp_pub
Shapiro-Wilk normality test
data: x
W = 0.89473, p-value = 2.078e-14
$artistas
Shapiro-Wilk normality test
data: x
W = 0.96217, p-value = 1.36e-07
$juizes
Shapiro-Wilk normality test
data: x
W = 0.9472, p-value = 1.532e-09
$esportistas
Shapiro-Wilk normality test
data: x
W = 0.95316, p-value = 8.213e-09
$advogados
Shapiro-Wilk normality test
data: x
W = 0.95586, p-value = 1.84e-08
# foi feito o teste shapiro-wilk e nenhuma das variaveis contem distruicao normal.
Faça um histograma com a distribuição de notas do profissional com a maior média.
hist(jorna.adv$professores,main ="histrograma media dos professores", xlab ="notas dos professores", ylab ="quantidade de notas")
Faça um gráfico de densidade com o profissional com a menor média.
library(tidyverse)
Warning: pacote 'tidyverse' foi compilado no R versão 4.4.1
Warning: pacote 'ggplot2' foi compilado no R versão 4.4.1
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.5
✔ forcats 1.0.0 ✔ stringr 1.5.1
✔ ggplot2 3.5.1 ✔ tibble 3.2.1
✔ lubridate 1.9.3 ✔ tidyr 1.3.1
✔ purrr 1.0.2
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
As variáveis de int_alimentacao até int_celebridades representam as notas, de 1 a 10, para o grau de interesse dos respondentes do questionário em relação à alguns temas: quanto maior a nota, maior o interesse. Já as variáveis de inf_alimentacao até c indicam o quanto cada respondente se informa sobre cada um dos temas: quanto maior a nota, mais o respodente busca se informar sobre o tema. Diante disso, responda as seguintes questões:
Qual tema tem a maior média de interesse e qual tem a maior média de busca por informação? Quais as medianas e desvios padrão desses temas?
inte <- dplyr::select(dados,int_alimentacao:int_celebridades)inte <-na.omit(inte)media.inte <-colMeans(inte)inform <- dplyr::select(dados,inf_alimentacao:inf_celebridades)inform <-na.omit(inform)media.inform <-colMeans(inform)# Maior media de inte e maior de informwhich.max(media.inte)
int_alimentacao
1
which.max(media.inform)
inf_med_saude
3
# Mediana e desvio padrao de inte e informmedian(inte$int_alimentacao)
[1] 9
median(inform$inf_med_saude)
[1] 8
sd(inte$int_alimentacao)
[1] 2.028729
sd(inform$inf_med_saude)
[1] 2.212146
Faça um histograma que mostre a distribuição das notas do tema de maior interesse e outro para o tema de maior busca.
hist(inte$int_alimentacao)
hist(inform$inf_med_saude)
Faça dois gráficos de barras, um para as médias de interesse e outro para as médias de informação para cada tema.