Capítulo 1 - Introdução

Quarta atividade para a disciplina R4DS abordando conceitos da linguagem R.

Capítulo 2 - Desenvolvimento

A) Importação de dados

Comandos usados para importação de dados no R:

- ‘readxl’: função ‘read_xlsx()’

A função acima é utilizada para importar dados de um arquivo em planilha no formato ‘.xlsx’.

EX.:voos_de_marco <- read_xlsx(path = ‘voos_trimestre.xlsx’, sheet = ‘voos_de_marco’)

- ‘readr’: função ‘read_delim()’

A função acima é utilizada para importar dados de um arquivo em planilha no formato ‘.csv’.

Ex.: voos_de_janeiro <- read_delim(file = ‘voos_de_janeiro.csv’, delim = ‘;’)

- ‘googlesheets4’: função ‘read_sheet()’

A função acima é utilizada para importar dados de um arquivo em planilha no formato do googlesheets.

Ex.:respostas <- read_sheet(ss = “https://docs.google.com/spreadsheets/d/1K6Kh37Y90jhfNk049ln9Lng1W-ONhjQaG5KFcVGxXrs/edit?usp=sharing”)

Explicação dos argumentos, path, file, delim, ss

- ‘path’ e ‘file’: Determinam o caminho dos arquivos que serão usados para manipulação para os tipos de arquivo ‘.xlsx’ e ‘.csv’, respectivamente.

- ‘delim’: Representa o delimitador decima que o arquivo usa para que a importação seja feita corretamente.

- ‘ss’: Representa o identificador da planilha que será manipulada.

B) Combinação de tabelas

- ‘rbind()’ É uma função usada para empilhar as linhas de diferente tabelas.

Ex.: voos_trimestre <- rbind(voos_de_janeiro, voos_de_fevereiro, voos_de_marco)

-‘cbind()’ É uma função usada para concatenar as colunas de diferentes tabelas.

EX.: voos_trimestre <- cbind(voos_de_janeiro, voos_de_fevereiro, voos_de_marco)

C) Estrutura e dimensões dos dados

-‘ncol()’ - Retorna o número de colunas que a tabela possui

EX.:‘ncol(voos_trimestre)’

-‘nrow()’ - Retorna o número de linhas que a tabela possui

EX.:‘nrow(voos_trimestre)’

-‘dim()’ - Retorna a dimensão da tabela

EX.:‘dim(voos_trimestre)’

-‘head()’ - Retorna as primeiras informações da tabela

EX.:‘head(voos_trimestre)’

-‘tail()’ - Retorna as últimas informações da tabela

EX.:‘tail(voos_trimestre)’

-‘str()’ - Retorna o resumo geral da tabela, cabeçalho, dados, tipo de variável.

EX.:‘str(voos_trimestre)’

D) Seleção e subconjuntos

Existe a possibilidade de selecionar as informações específicas dentro das tabelas que estamos trabalhando. A primeira é conhcendo qual o número da coluna e linhas que vamos modificar. Para isso usamos as chaves.

EX.: ‘voos_trimestre[c(1,2,3),5]’. Aqui selecionando os 3 primeiros valores da quinta coluna

‘voos_trimestre[1:20, 5]’ Aqui selecionando os 20 primeiros valores da quinta coluna

‘voos_trimestre[, 5]’ Aqui selecionando todos os valores da quinta coluna

Outra maneira de manipular os dados é conhecendo o nome das colunas assim.

EX.:‘voos_trimestre$distancia’ manipulo os dados do arquivo ‘voos_trimestre’ em que sua coluna chama ‘distancia’.

E) Funções estatísticas básicas

-‘min()’ - Retorna o valor mínimo dos valores da coluna específica

EX.:‘min(voos_trimestre$distancia)’

-‘max()’ - Retorna o valor máximo dos valores da coluna específica

EX.:‘max(voos_trimestre$distancia)’

-‘mean()’ - Retorna a média dos valores da coluna específica

EX.:‘mean(voos_trimestre$distancia)’

-‘sd()’ - Retorna o desvio padrão dos valores da coluna específica

EX.:‘sd(voos_trimestre$distancia)’

-‘median()’ - Retorna a mediana dos valores da coluna específica

EX.:‘median(voos_trimestre$distancia)’

-‘round()’ - Arredonda os valores da coluna com o número de casas decimais determinado.

EX.:‘round(mean(voos_trimestre$distancia), digits = 2)’

F) Comparações lógicas.

-‘class()’ - Retorna qual a classe da variável. Ex: data, boleana, número, caractere, etc.

EX.: ‘class(10)’ ‘class(TRUE)’

-‘Sys.date()’ - Retorna a data de hoje utilizada pelo sistema (computador).

OPERADORES

-‘>’ - Compara se um valor é maior que outro

EX.:‘x > 10’ - Comparando o valor de x com o valor 10 (é maior?)

-‘==’ - Compara se um valor é igual a outro

EX.:‘x == 10’ - comparando o valor de x com o valor 10 (é igual?)

-‘<’ - Compara se um valor é menor que outro

EX.:‘x < 10’ - comparando o valor de x com o valor 10 (é menor?)

-‘<=’ - Compara se um valor é menor ou igual a outro

EX.:‘x <= 10’ - comparando o valor de x com o valor 10 (é menor ou igual?)

-‘>=’ - Compara se um valor é maior ou igual a outro

EX.:‘x <= 10’ - comparando o valor de x com o valor 10 (é maior ou igual?)

-‘!=’ - Compara se um valor é diferente de outro

EX.:‘x != 10’ - comparando o valor de x com o valor 10 (é diferente?)

-‘%in%’ - Compara se um valor está contindo no intervalor

EX.:‘x %in% c(9,10,11)’ - comparando o valor de x com o valor 10 (está contido?)

G) Operadores Compostos

Regra do ‘E’ (&) É utilizado quando queremos comprar duas condições e ambas necessitam ser verdadeiras.

EX.: ‘voos_trimestre[voos_trimestre$distancia >= 1006.869 & <= 2006]’

Regra do ‘OU’ (|) É utilizado quando queremos comprar duas condições e pelo menos uma necessita ser verdadeira.

EX.: ‘voos_trimestre[voos_trimestre$distancia >= 1006.869 | <= 2006]’