1 + 1
[1] 2
Quarto enables you to weave together content and executable code into a finished document. To learn more about Quarto see https://quarto.org.
When you click the Render button a document will be generated that includes both content and the output of embedded code. You can embed code like this:
1 + 1
[1] 2
You can add options to executable code like this
2 * 2
[1] 4
Redija a prova em quarto, suíte de apresentação do Rstudio ou em Vs code. Publique a prova no Rpubs e envie o endereço para mim.
O que é tidyverse? Explique as seguintes funções: pipe, select, filter, mutate. Qual a diferença entre um data.frame e um tibble?
Tidyverse é uma ferramenta ou uma coleção da Ciência de dados que permite visualizar, manusear e carregar os dados de uma maneira mais prática e coerente.
Função select: Permite selecionar colunas que estão em um conjunto de dados para criar um subconjunto de colunas. Por exemplo: Se a tabela possui 5 colunas e eu desejo trabalhar apenas com 3 colunas, devo digitar a função ‘’select(x,y,z)’‘. No caso,’‘x,y e z’’ seriam as colunas selecionadas que eu desejaria trabalhar.
Função filter: Permite a filtragem das linhas contendo ou não algumas condições.
Função mutate: Permite a criação de uma nova coluna ou modificar uma mesma coluna. Por exemplo, se eu desejar criar outra coluna contendo os valores do VTI - Ci, devo digitar: mutate(x=vti-ci) onde ‘’x’’ seria o novo nome da coluna que eu quero criar e ‘’vti - ci’’ seria o cálculo para criar os novos dados.
Data.frame é o padrão utilizado para visualização e rodagem da linguagem, ele possui dados bidimensionais (colunas e linhas), é heterogêneo por coluna (pode ter várias colunas de diferentes formas, uma coluna de números - pib -, uma coulna de texto - países -, uma coluna de data - dia, mês e ano -, etc), é homogêneo dentro das colunas (precisa ter a mesma variável em uma mesma coluna), toda coluna precisa ser nomeada e possui uma estrutura retangular (todas as colunas precisam ter a mesma quantidade de linhas, formando um retângulo perfeito).
Já o tibble é uma espécie de atualização do data frame. Ele foi criado para evitar inconsistências do data frame e é uma reconfiguração que dificilmente irá apresentar bugs, ele não permite a mudança automática para renomear colunas, o que permite uma maior confiabilidade dos dados.
O que garante que um conjunto de pactoes seja de código aberto é a transparência, a confiabilidade e a cooperatividade da ferramenta. O tidyverse possui funções ou códigos disponibilizados abertamente para qualquer pessoa utilizar, manusear, modificar, etc; o que permite uma transparência e confiabilidade. Além disso, qualquer pessoa pode manusear a ferramenta e compartilhar com quem quiser, o que garante uma cooperatividade e a ferramenta se mantém por si só, sem precisar de atualização de software.
Um software é considerado livre quando a ferramenta disponibiliza liberdade para ser manuseada. O tidyverse oferece justamente isso, liberdade para qualquer pessoa utilizar da ferramenta que quiser de forma gratuita, liberdade para comrpartilhar as funções utilizadas, liberdade para modificar códigos e liberdade para estudar os códigos e as funções para atualizar possíveis bugs.
Irei salvar a tabela do Sidra e limpar no excel, carregar a ferramenta do tidyverse para utilizar as funções, digitar a função para ler os dados (‘’ipca_csv’’ seria o nome da tabela e skip, o número de linhas para pular e desconsiderar; no caso, a tabela já estaria limpa então nao precisaria pular nenhuma linha, por isso o ‘’skip=0’’), digitar a função para verificar, olhar os dados, utilizaria a função mutate para modificar a coluna de datas e por fim a função para gerar a nova tabela.
liberary(tidyverse)
dados<-read_csv2(‘’ipca_csv’’,skip=0
print(dados)
mutate(as.Date(paste0(ano-‘’01-01’’)))
print(tabela final)
Observação: Ao limpar a tabela no excel e salvar, não estava sendo salva da forma que deveria, limpa (mesmo importando em uma nova planilha, ela estava vindo suja), não consegui finalizar o processo com a tabela para abrir no Rstudio. Respondi no chunk e fiz os comentários da forma que eu faria caso conseguisse finalizar e abrir a tabela aqui. Ao renderizar, deu erro pois não encontrou nenhum dado, por isso, escrevi o código (que deveria ser escrito no chunk) na parte em branco.