Quiz 2
Calcolare tabella delle frequenze assolute, percentuali e percentuali cumulate per la variabile polintr, assicurandosi di filtrare gli NA nel calcolo. Creare un nuovo dataframe con queste informazioni. Qual è la classe modale? e La classe mediana?
library(haven)
library(labelled)
library(ggplot2)
library("tidyverse")
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.0 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.2 ✔ tibble 3.2.0
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
ess <- read_sav("ess_2008.sav")
ess <- unlabelled(ess)
ess2 = ess %>%
group_by(polintr) %>%
summarize(n=n()) %>%
filter(!is.na(polintr)) %>%
mutate(perc = n/sum(n) *100) %>%
mutate(cum_perc = cumsum(perc))
print("La mediana è data da due classi mediane, di cui una è il limite inferiore cioè abbastanza interessato e una è il limite superiore cioè poco interessato")
## [1] "La mediana è data da due classi mediane, di cui una è il limite inferiore cioè abbastanza interessato e una è il limite superiore cioè poco interessato"
print("La classe modale è poco interessato poichè è il valore che si ripete più volte quindi il valore più alto")
## [1] "La classe modale è poco interessato poichè è il valore che si ripete più volte quindi il valore più alto"
- Rappresentare graficamente la variabile polintr
p <- ess %>%
ggplot(aes(x=polintr)) + geom_bar()
p
- Modificare il grafico in modo da ordinare le modalità sulla base della loro frequenza in senso decrescente (suggerimento: provare ad aggiungere al grafico + coord_flip() per ruotare il grafico e rendere la visualizzazione più efficace)
p <- ess %>%
ggplot(aes(x=fct_infreq(polintr))) + geom_bar() + coord_flip()
p