Quarta atividade para a disciplina R4DS abordando conceitos da linguagem R.
Comandos usados para importação de dados no R:
- ‘readxl’: função ‘read_xlsx()’
A função acima é utilizada para importar dados de um arquivo em planilha no formato ‘.xlsx’.
EX.:voos_de_marco <- read_xlsx(path = ‘voos_trimestre.xlsx’, sheet = ‘voos_de_marco’)
- ‘readr’: função ‘read_delim()’
A função acima é utilizada para importar dados de um arquivo em planilha no formato ‘.csv’.
Ex.: voos_de_janeiro <- read_delim(file = ‘voos_de_janeiro.csv’, delim = ‘;’)
- ‘googlesheets4’: função ‘read_sheet()’
A função acima é utilizada para importar dados de um arquivo em planilha no formato do googlesheets.
Ex.:respostas <- read_sheet(ss = “https://docs.google.com/spreadsheets/d/1K6Kh37Y90jhfNk049ln9Lng1W-ONhjQaG5KFcVGxXrs/edit?usp=sharing”)
Explicação dos argumentos, path, file, delim, ss
- ‘path’ e ‘file’: Determinam o caminho dos arquivos que serão usados para manipulação para os tipos de arquivo ‘.xlsx’ e ‘.csv’, respectivamente.
- ‘delim’: Representa o delimitador decima que o arquivo usa para que a importação seja feita corretamente.
- ‘ss’: Representa o identificador da planilha que será manipulada.
- ‘rbind()’ É uma função usada para empilhar as linhas de diferente tabelas.
Ex.: voos_trimestre <- rbind(voos_de_janeiro, voos_de_fevereiro, voos_de_marco)
-‘cbind()’ É uma função usada para concatenar as colunas de diferentes tabelas.
EX.: voos_trimestre <- cbind(voos_de_janeiro, voos_de_fevereiro, voos_de_marco)
-‘ncol()’ - Retorna o número de colunas que a tabela possui
EX.:‘ncol(voos_trimestre)’
-‘nrow()’ - Retorna o número de linhas que a tabela possui
EX.:‘nrow(voos_trimestre)’
-‘dim()’ - Retorna a dimensão da tabela
EX.:‘dim(voos_trimestre)’
-‘head()’ - Retorna as primeiras informações da tabela
EX.:‘head(voos_trimestre)’
-‘tail()’ - Retorna as últimas informações da tabela
EX.:‘tail(voos_trimestre)’
-‘str()’ - Retorna o resumo geral da tabela, cabeçalho, dados, tipo de variável.
EX.:‘str(voos_trimestre)’
Existe a possibilidade de selecionar as informações específicas dentro das tabelas que estamos trabalhando. A primeira é conhcendo qual o número da coluna e linhas que vamos modificar. Para isso usamos as chaves.
EX.: ‘voos_trimestre[c(1,2,3),5]’. Aqui selecionando os 3 primeiros valores da quinta coluna
‘voos_trimestre[1:20, 5]’ Aqui selecionando os 20 primeiros valores da quinta coluna
‘voos_trimestre[, 5]’ Aqui selecionando todos os valores da quinta coluna
Outra maneira de manipular os dados é conhecendo o nome das colunas assim.
EX.:‘voos_trimestre$distancia’ manipulo os dados do arquivo ‘voos_trimestre’ em que sua coluna chama ‘distancia’.
-‘min()’ - Retorna o valor mínimo dos valores da coluna específica
EX.:‘min(voos_trimestre$distancia)’
-‘max()’ - Retorna o valor máximo dos valores da coluna específica
EX.:‘max(voos_trimestre$distancia)’
-‘mean()’ - Retorna a média dos valores da coluna específica
EX.:‘mean(voos_trimestre$distancia)’
-‘sd()’ - Retorna o desvio padrão dos valores da coluna específica
EX.:‘sd(voos_trimestre$distancia)’
-‘median()’ - Retorna a mediana dos valores da coluna específica
EX.:‘median(voos_trimestre$distancia)’
-‘round()’ - Arredonda os valores da coluna com o número de casas decimais determinado.
EX.:‘round(mean(voos_trimestre$distancia), digits = 2)’
-‘class()’ - Retorna qual a classe da variável. Ex: data, boleana, número, caractere, etc.
EX.: ‘class(10)’ ‘class(TRUE)’
-‘Sys.date()’ - Retorna a data de hoje utilizada pelo sistema (computador).
OPERADORES
-‘>’ - Compara se um valor é maior que outro
EX.:‘x > 10’ - Comparando o valor de x com o valor 10 (é maior?)
-‘==’ - Compara se um valor é igual a outro
EX.:‘x == 10’ - comparando o valor de x com o valor 10 (é igual?)
-‘<’ - Compara se um valor é menor que outro
EX.:‘x < 10’ - comparando o valor de x com o valor 10 (é menor?)
-‘<=’ - Compara se um valor é menor ou igual a outro
EX.:‘x <= 10’ - comparando o valor de x com o valor 10 (é menor ou igual?)
-‘>=’ - Compara se um valor é maior ou igual a outro
EX.:‘x <= 10’ - comparando o valor de x com o valor 10 (é maior ou igual?)
-‘!=’ - Compara se um valor é diferente de outro
EX.:‘x != 10’ - comparando o valor de x com o valor 10 (é diferente?)
-‘%in%’ - Compara se um valor está contindo no intervalor
EX.:‘x %in% c(9,10,11)’ - comparando o valor de x com o valor 10 (está contido?)
Regra do ‘E’ (&) É utilizado quando queremos comprar duas condições e ambas necessitam ser verdadeiras.
EX.: ‘voos_trimestre[voos_trimestre$distancia >= 1006.869 & <= 2006]’
Regra do ‘OU’ (|) É utilizado quando queremos comprar duas condições e pelo menos uma necessita ser verdadeira.
EX.: ‘voos_trimestre[voos_trimestre$distancia >= 1006.869 | <= 2006]’