Tarefa 2

Author

RAFAEL FRANÇA

Instruções

Para esta tarefa, utilize o objeto dados criado a partir dp banco de dados ppc400.csv. Utilize o codebook disponível neste link para explorar as variáveis.

Exercício 1

As variáveis de jornalistaaté advogados apresentam as notas dadas para indicar o grau de confiança em cada um dos profissionais. Para cada uma das variáveis calcule:

  1. Qual profissional tem a maior média de confiança?
dados <- read.csv2("ppc400.csv")
View(dados)
jornal.advog <- dplyr::select(dados,jornalistas:advogados)
jornal.advog <- na.omit(jornal.advog)
colMeans(jornal.advog)
   jornalistas        medicos cient_emp_priv     religiosos  cient_uni_pub 
      5.996997       7.441441       6.570571       5.054054       7.957958 
    rep_ong_ma      politicos    professores cient_uni_priv      militares 
      7.195195       2.291291       8.432432       7.171171       5.657658 
    escritores  cient_emp_pub       artistas         juizes    esportistas 
      7.117117       7.468468       5.486486       5.855856       5.225225 
     advogados 
      5.102102 
which.max(colMeans(jornal.advog))
professores 
          8 
  1. Qual profissional tem a menir média de confiança
which.min(colMeans(jornal.advog))
politicos 
        7 
  1. Para qual profisisonal a mediana de confiança é maior?
medianas <- apply(jornal.advog, 2, median)
which.max(medianas)
professores 
          8 
  1. Qual profissisonal têm o maior desvio padrão em relação à confiança?
desvio.p <- apply(jornal.advog, 2, sd)
which.max(desvio.p)
religiosos 
         4 
  1. Quais profissionais têm notas com distribuição normal?
distribui.normal <- data.frame(lapply(jornal.advog, function(x){as.numeric(x)}))
typeof(distribui.normal$jornalitas)
[1] "NULL"
lapply(jornal.advog, function(x){shapiro.test(x)})
$jornalistas

    Shapiro-Wilk normality test

data:  x
W = 0.9591, p-value = 5.024e-08


$medicos

    Shapiro-Wilk normality test

data:  x
W = 0.9053, p-value = 1.371e-13


$cient_emp_priv

    Shapiro-Wilk normality test

data:  x
W = 0.94182, p-value = 3.704e-10


$religiosos

    Shapiro-Wilk normality test

data:  x
W = 0.93484, p-value = 6.621e-11


$cient_uni_pub

    Shapiro-Wilk normality test

data:  x
W = 0.84832, p-value < 2.2e-16


$rep_ong_ma

    Shapiro-Wilk normality test

data:  x
W = 0.89597, p-value = 2.572e-14


$politicos

    Shapiro-Wilk normality test

data:  x
W = 0.74941, p-value < 2.2e-16


$professores

    Shapiro-Wilk normality test

data:  x
W = 0.8438, p-value < 2.2e-16


$cient_uni_priv

    Shapiro-Wilk normality test

data:  x
W = 0.91658, p-value = 1.215e-12


$militares

    Shapiro-Wilk normality test

data:  x
W = 0.95068, p-value = 4.029e-09


$escritores

    Shapiro-Wilk normality test

data:  x
W = 0.93468, p-value = 6.364e-11


$cient_emp_pub

    Shapiro-Wilk normality test

data:  x
W = 0.89473, p-value = 2.078e-14


$artistas

    Shapiro-Wilk normality test

data:  x
W = 0.96217, p-value = 1.36e-07


$juizes

    Shapiro-Wilk normality test

data:  x
W = 0.9472, p-value = 1.532e-09


$esportistas

    Shapiro-Wilk normality test

data:  x
W = 0.95316, p-value = 8.213e-09


$advogados

    Shapiro-Wilk normality test

data:  x
W = 0.95586, p-value = 1.84e-08
#após ser feita o teste de normalidade shapiro-wilk foi visto que nenhum profissional tem distribuição normal#
  1. Faça um histograma com a distribuição de notas do profissional com a maior média.
hist(jornal.advog$professores,main =  "HISTOGRAMAS DE PROFESSORES", xlab = "notas dos professores", ylab = "Nº de notas")

  1. Faça um gráfico de densidade com o profissional com a menor média.
library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ggplot(jornal.advog, aes(x=politicos))+geom_density()

  1. Faça um boxplot comparando os profissionais com menor e com maior média.
boxplot(jornal.advog$politicos, jornal.advog$professores)

Exercício 2

As variáveis de int_alimentacao até int_celebridades representam as notas, de 1 a 10, para o grau de interesse dos respondentes do questionário em relação à alguns temas: quanto maior a nota, maior o interesse. Já as variáveis de inf_alimentacao até inf_celebridades indicam o quanto cada respondente se informa sobre cada um dos temas: quanto maior a nota, mais o respodente busca se informar sobre o tema. Diante disso, responda as seguintes questões:

  1. Qual tema tem a maior média de interesse e qual tem a maior média de busca por informação? Quais as medianas e desvios padrão desses temas?
interresses <- dplyr::select(dados, int_alimentacao : int_celebridades)
interresses <- na.omit(interresses)
media.interresse <- colMeans(interresses)


informação <- dplyr::select(dados, inf_alimentacao : inf_celebridades)
informação <- na.omit(informação)
media.informação <- colMeans(informação)

##  Maior média entre o interrese e a maior média de informações ##

which.max(media.interresse)
int_alimentacao 
              1 
which.max(media.informação)
inf_med_saude 
            3 
## Mesiana e Desvio padrão entre informações e interresses ##

median(interresses$int_alimentacao)
[1] 9
median(informação$inf_med_saude)
[1] 8
sd(interresses$int_alimentacao)
[1] 2.028729
sd(informação$inf_med_saude)
[1] 2.212146
  1. Faça um histograma que mostre a distribuição das notas do tema de maior interesse e outro para o tema de maior busca.
hist(interresses$int_alimentacao)

hist(informação$inf_med_saude)

  1. Faça dois gráficos de barras, um para as médias de interesse e outro para as médias de informação para cada tema.
barplot(media.interresse)

barplot(media.informação)