Tabela 4. Criar um dataset só com table eggs e todos os processos (all).
observed_month
prod_type
prod_process
n_hens
n_eggs
source
2016-07-31
table eggs
all
299669000
7350500000
ChicEggs-09-23-2016.pdf
2016-08-31
table eggs
all
300917000
7409000000
ChicEggs-10-21-2016.pdf
2016-09-30
table eggs
all
303270000
7204200000
ChicEggs-11-22-2016.pdf
2016-10-31
table eggs
all
305852000
7534700000
ChicEggs-12-23-2016.pdf
2016-11-30
table eggs
all
310728000
7468500000
ChicEggs-01-24-2017.pdf
2016-12-31
table eggs
all
318820000
7950400000
ChicEggs-02-28-2017.pdf
Exercício 5 - mudando nome das variáveis.
Code
nomes_br <-rename(egg, `Mês observado`= observed_month, `Tipo de produção`= prod_type, `Processo de produção`= prod_process, `Número de galinhas`= n_hens, `Número de ovos`= n_eggs, Fonte = source)kable6 <-kable(head(nomes_br))kable_styling(kable6, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")
Tabela 5. Mudar os nomes das variáveis para português.
Mês observado
Tipo de produção
Processo de produção
Número de galinhas
Número de ovos
Fonte
2016-07-31
hatching eggs
all
57975000
1147000000
ChicEggs-09-23-2016.pdf
2016-08-31
hatching eggs
all
57595000
1142700000
ChicEggs-10-21-2016.pdf
2016-09-30
hatching eggs
all
57161000
1093300000
ChicEggs-11-22-2016.pdf
2016-10-31
hatching eggs
all
56857000
1126700000
ChicEggs-12-23-2016.pdf
2016-11-30
hatching eggs
all
57116000
1096600000
ChicEggs-01-24-2017.pdf
2016-12-31
hatching eggs
all
57750000
1132900000
ChicEggs-02-28-2017.pdf
Exercício 6 - mudando nomes de fatores dentro de variáveis específicas.
Code
new_factors <-mutate(nomes_br, `Tipo de produção`=recode(`Tipo de produção`, `hatching eggs`="ovos de incubação", `table eggs`="ovos de consumo"), `Processo de produção`=recode(`Processo de produção`, all ="todos os processos", `cage-free (non-organic)`="livre de gaiolas: não orgânico", `cage-free (organic)`="livre de gaiolas: orgânico"))kable7 <-kable(head(new_factors))kable_styling(kable7, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")
Tabela 6. Mudar os nomes dos fatores para português.
Mês observado
Tipo de produção
Processo de produção
Número de galinhas
Número de ovos
Fonte
2016-07-31
ovos de incubação
todos os processos
57975000
1147000000
ChicEggs-09-23-2016.pdf
2016-08-31
ovos de incubação
todos os processos
57595000
1142700000
ChicEggs-10-21-2016.pdf
2016-09-30
ovos de incubação
todos os processos
57161000
1093300000
ChicEggs-11-22-2016.pdf
2016-10-31
ovos de incubação
todos os processos
56857000
1126700000
ChicEggs-12-23-2016.pdf
2016-11-30
ovos de incubação
todos os processos
57116000
1096600000
ChicEggs-01-24-2017.pdf
2016-12-31
ovos de incubação
todos os processos
57750000
1132900000
ChicEggs-02-28-2017.pdf
Exercício 7 - criando nova variável a partir da combinação de variáveis pré-existentes.
Code
new.variable <-mutate(new_factors, Produtividade = (`Número de ovos`/`Número de galinhas`)) #feito com a tabela traduzida.kable8 <-kable(head(new.variable))kable_styling(kable8, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")
Tabela 7. Criar uma nova variável chamada ‘produtividade’ com a razão entre número de ovos (n_eggs) e número de galinhas (n_hens).
Mês observado
Tipo de produção
Processo de produção
Número de galinhas
Número de ovos
Fonte
Produtividade
2016-07-31
ovos de incubação
todos os processos
57975000
1147000000
ChicEggs-09-23-2016.pdf
19.78439
2016-08-31
ovos de incubação
todos os processos
57595000
1142700000
ChicEggs-10-21-2016.pdf
19.84026
2016-09-30
ovos de incubação
todos os processos
57161000
1093300000
ChicEggs-11-22-2016.pdf
19.12668
2016-10-31
ovos de incubação
todos os processos
56857000
1126700000
ChicEggs-12-23-2016.pdf
19.81638
2016-11-30
ovos de incubação
todos os processos
57116000
1096600000
ChicEggs-01-24-2017.pdf
19.19952
2016-12-31
ovos de incubação
todos os processos
57750000
1132900000
ChicEggs-02-28-2017.pdf
19.61732
Exercício 8 - criando subconjunto de dados a partir de uma seleção específica das variáveis.
Tabela 10. Faça um sumário dos dados com as médias de n_hens e n_eggs por ano, por produto e por processo.
#END
Source Code
---title: "Atividade 2 - Tidyverse"author: "Amanda Beatriz Loureiro"date: "12 Oct 2024"cap-location: bottomtitle-block-banner: trueformat: htmlcode-link: truecode-tools: truetheme: custom.scsstoc: truetoc-title: "Lista de Atividades"editor: visualeditor_options: chunk_output_type: console---> `Leitura de dados e carregamento de pacotes````{r}#| warning: False#| code-fold: truelibrary(tidyverse) library(knitr)library(kableExtra)library(tidyverse)library(tinytex)egg <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2023/2023-04-11/egg-production.csv') ```# Exercício 1 - removendo colunas de um conjunto de dados```{r}#| tbl-cap: "Tabela 1. Remover a última coluna do dataset (a coluna chamada source)."#| warning: False#| code-fold: trueegg1 <-select(egg, - source) kable1 <-kable(head(egg1))kable_styling(kable1, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 2 - selecionando variáveis numéricas de um conjunto de dados.```{r}#| tbl-cap: "Tabela 2. Selecionar apenas as variáveis numéricas."#| warning: False#| code-fold: truenumber <-select_if(egg, is.numeric) kable2 <-kable(head(number))kable_styling(kable2, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 3 - criando subconjuntos a partir de um conjunto de dados.```{r}#| tbl-cap: "Tabela 3. Criar um dataset só com hatching e outro dataset apenas com table eggs."#| warning: False#| code-fold: truehatching_tab <-filter(egg, prod_type =="hatching eggs") #apenas hatching tab_eggs <-filter(egg, prod_type =="table eggs") #apenas table eggskable3 <-kable(head(hatching_tab), caption ="Tabela 3.1. Hatching Eggs")kable4 <-kable(head(tab_eggs), caption ="Tabela 3.2. Table Eggs")kable_styling(kable3, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")kable_styling(kable4, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 4 - criando subconjuntos a partir de fatores específicos dentro do conjunto de dados.```{r}#| tbl-cap: "Tabela 4. Criar um dataset só com table eggs e todos os processos (all)."#| warning: False#| code-fold: trueselection <-filter(egg, prod_type =="table eggs"& prod_process =="all")kable5 <-kable(head(selection))kable_styling(kable5, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 5 - mudando nome das variáveis. ```{r}#| tbl-cap: "Tabela 5. Mudar os nomes das variáveis para português."#| warning: False#| code-fold: truenomes_br <-rename(egg, `Mês observado`= observed_month, `Tipo de produção`= prod_type, `Processo de produção`= prod_process, `Número de galinhas`= n_hens, `Número de ovos`= n_eggs, Fonte = source)kable6 <-kable(head(nomes_br))kable_styling(kable6, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 6 - mudando nomes de fatores dentro de variáveis específicas.```{r}#| tbl-cap: "Tabela 6. Mudar os nomes dos fatores para português."#| warning: False#| code-fold: truenew_factors <-mutate(nomes_br, `Tipo de produção`=recode(`Tipo de produção`, `hatching eggs`="ovos de incubação", `table eggs`="ovos de consumo"), `Processo de produção`=recode(`Processo de produção`, all ="todos os processos", `cage-free (non-organic)`="livre de gaiolas: não orgânico", `cage-free (organic)`="livre de gaiolas: orgânico"))kable7 <-kable(head(new_factors))kable_styling(kable7, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 7 - criando nova variável a partir da combinação de variáveis pré-existentes.```{r}#| tbl-cap: "Tabela 7. Criar uma nova variável chamada ‘produtividade’ com a razão entre número de ovos (n_eggs) e número de galinhas (n_hens)."#| warning: False#| code-fold: truenew.variable <-mutate(new_factors, Produtividade = (`Número de ovos`/`Número de galinhas`)) #feito com a tabela traduzida.kable8 <-kable(head(new.variable))kable_styling(kable8, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 8 - criando subconjunto de dados a partir de uma seleção específica das variáveis.```{r}#| tbl-cap: "Tabela 8. Criar um dataset só de produtos cage free e criar novas variáveis separando n_eggs e n_hens por orgânicos e não orgânicos."#| warning: False#| code-fold: truesep <- egg1 %>%filter(prod_process !="all") %>%separate(prod_process, into =c("process", "type"), sep=" ") %>%pivot_wider(names_from = type, values_from =c(n_hens, n_eggs)) #inglêskable9 <-kable(head(sep), caption ="Tabela 8.1. Cage-free/ Eggs and hens / Organic and non-organic")kable_styling(kable9, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")sep2 <- new_factors %>%select(- Fonte) %>%filter(`Processo de produção`%in%c("livre de gaiolas: não orgânico", "livre de gaiolas: orgânico")) %>%separate(`Processo de produção`, into =c("processo", "tipo"), sep=": ") %>%pivot_wider(names_from = tipo, values_from =c(`Número de galinhas`, `Número de ovos`)) #portuguêskable10 <-kable(head(sep2), caption ="Tabela 8.2. Livre de gaiolas/ Ovos e galinhas/ Orgânico e não-orgânico")kable_styling(kable10, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 9 - combinando duas variáveis numéricas em uma única coluna.```{r}#| tbl-cap: "Tabela 9. Criar uma variável categórica com os fatores n_eggs e n_hens, combinando seus valores em uma única coluna."#| warning: False#| code-fold: truecateg <- egg %>%pivot_longer(4:5, names_to ="Eggs and hens", values_to ="egg/hens")kable11 <-kable(head(categ))kable_styling(kable11, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")```# Exercício 10 - sumarizando dados (média, desvio, etc) de acordo com fatores específicos de cada variável.```{r}#| tbl-cap: "Tabela 10. Faça um sumário dos dados com as médias de n_hens e n_eggs por ano, por produto e por processo."#| warning: False#| code-fold: truesum <- egg %>%separate(observed_month, into =c("year", "month", "day"), sep ="-") %>%select(-month, -day, -source) %>%group_by(year, prod_type,prod_process) %>%summarise_all(mean)kable12 <-kable(head(sum), caption ="Tabela 10.1. Sumário")kable_styling(kable12, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")sum2 <- egg %>%separate(observed_month, into =c("year", "month", "day"), sep ="-") %>%group_by(year, prod_type, prod_process) %>%summarise(Média_ovos =mean(n_eggs), Média_galinha =mean(n_hens)) #anotherwaykable13 <-kable(head(sum2), caption ="Tabela 10.2. Sumário")kable_styling(kable13, full_width = F, bootstrap_options =c("striped","hover","condensed")) %>%row_spec(1:6, background ="#FFE4E1")````#END`