Tarefa 2

Author

kalaine

Instruções

Para esta tarefa, utilize o objeto dados criado a partir dp banco de dados ppc400.csv. Utilize o codebook disponível neste link para explorar as variáveis.

Exercício 1

As variáveis de jornalistaaté advogados apresentam as notas dadas para indicar o grau de confiança em cada um dos profissionais. Para cada uma das variáveis calcule:

  1. Qual profissional tem a maior média de confiança?
dados <- read.csv2("ppc400.csv")
View(dados)
jorna.adv <- dplyr::select(dados,jornalistas:advogados)
jorna.adv <- na.omit(jorna.adv)
colMeans(jorna.adv)
   jornalistas        medicos cient_emp_priv     religiosos  cient_uni_pub 
      5.996997       7.441441       6.570571       5.054054       7.957958 
    rep_ong_ma      politicos    professores cient_uni_priv      militares 
      7.195195       2.291291       8.432432       7.171171       5.657658 
    escritores  cient_emp_pub       artistas         juizes    esportistas 
      7.117117       7.468468       5.486486       5.855856       5.225225 
     advogados 
      5.102102 
which.max(colMeans(jorna.adv))
professores 
          8 
  1. Qual profissional tem a menir média de confiança
which.min(colMeans(jorna.adv))
politicos 
        7 
  1. Para qual profisisonal a mediana de confiança é maior?
medianas <- apply(jorna.adv, 2,median)
which.max(medianas)
professores 
          8 
  1. Qual profissisonal têm o maior desvio padrão em relação à confiança?
desviopa <- apply(jorna.adv, 2,sd)
which.max(desviopa)
religiosos 
         4 
  1. Quais profissionais têm notas com distribuição normal?
dn <- data.frame(lapply(jorna.adv, function(x){as.numeric(x)}))
typeof(dn$jornalistas)
[1] "double"
lapply(jorna.adv, function(x){shapiro.test(x)})
$jornalistas

    Shapiro-Wilk normality test

data:  x
W = 0.9591, p-value = 5.024e-08


$medicos

    Shapiro-Wilk normality test

data:  x
W = 0.9053, p-value = 1.371e-13


$cient_emp_priv

    Shapiro-Wilk normality test

data:  x
W = 0.94182, p-value = 3.704e-10


$religiosos

    Shapiro-Wilk normality test

data:  x
W = 0.93484, p-value = 6.621e-11


$cient_uni_pub

    Shapiro-Wilk normality test

data:  x
W = 0.84832, p-value < 2.2e-16


$rep_ong_ma

    Shapiro-Wilk normality test

data:  x
W = 0.89597, p-value = 2.572e-14


$politicos

    Shapiro-Wilk normality test

data:  x
W = 0.74941, p-value < 2.2e-16


$professores

    Shapiro-Wilk normality test

data:  x
W = 0.8438, p-value < 2.2e-16


$cient_uni_priv

    Shapiro-Wilk normality test

data:  x
W = 0.91658, p-value = 1.215e-12


$militares

    Shapiro-Wilk normality test

data:  x
W = 0.95068, p-value = 4.029e-09


$escritores

    Shapiro-Wilk normality test

data:  x
W = 0.93468, p-value = 6.364e-11


$cient_emp_pub

    Shapiro-Wilk normality test

data:  x
W = 0.89473, p-value = 2.078e-14


$artistas

    Shapiro-Wilk normality test

data:  x
W = 0.96217, p-value = 1.36e-07


$juizes

    Shapiro-Wilk normality test

data:  x
W = 0.9472, p-value = 1.532e-09


$esportistas

    Shapiro-Wilk normality test

data:  x
W = 0.95316, p-value = 8.213e-09


$advogados

    Shapiro-Wilk normality test

data:  x
W = 0.95586, p-value = 1.84e-08
# foi feito o teste shapiro-wilk e nenhuma das variaveis contem distruicao normal.
  1. Faça um histograma com a distribuição de notas do profissional com a maior média.
hist(jorna.adv$professores,main = "histrograma media dos professores", xlab = "notas dos professores", ylab = "quantidade de notas")

  1. Faça um gráfico de densidade com o profissional com a menor média.
library(tidyverse)
Warning: pacote 'tidyverse' foi compilado no R versão 4.4.1
Warning: pacote 'ggplot2' foi compilado no R versão 4.4.1
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ggplot(jorna.adv,aes(x=politicos)) + geom_density()

  1. Faça um boxplot comparando os profissionais com menor e com maior média.
boxplot(jorna.adv$politicos,jorna.adv$professores)

Exercício 2

As variáveis de int_alimentacao até int_celebridades representam as notas, de 1 a 10, para o grau de interesse dos respondentes do questionário em relação à alguns temas: quanto maior a nota, maior o interesse. Já as variáveis de inf_alimentacao até c indicam o quanto cada respondente se informa sobre cada um dos temas: quanto maior a nota, mais o respodente busca se informar sobre o tema. Diante disso, responda as seguintes questões:

  1. Qual tema tem a maior média de interesse e qual tem a maior média de busca por informação? Quais as medianas e desvios padrão desses temas?
inte <- dplyr::select(dados,int_alimentacao:int_celebridades)
inte <- na.omit(inte)
media.inte <- colMeans(inte)


inform <- dplyr::select(dados,inf_alimentacao:inf_celebridades)
inform <- na.omit(inform)
media.inform <- colMeans(inform)

# Maior media de inte e maior de inform
which.max(media.inte)
int_alimentacao 
              1 
which.max(media.inform)
inf_med_saude 
            3 
# Mediana e desvio padrao de inte e inform
median(inte$int_alimentacao)
[1] 9
median(inform$inf_med_saude)
[1] 8
sd(inte$int_alimentacao)
[1] 2.028729
sd(inform$inf_med_saude)
[1] 2.212146
  1. Faça um histograma que mostre a distribuição das notas do tema de maior interesse e outro para o tema de maior busca.
hist(inte$int_alimentacao)

hist(inform$inf_med_saude)

  1. Faça dois gráficos de barras, um para as médias de interesse e outro para as médias de informação para cada tema.
barplot(media.inte)

barplot(media.inform)