Operações básicas

  1. crie o vetor:

\(v=[17,19,20,25,50,49,45,50,18,20]\)

  1. Agora crie uma função que classifique os elementos do vetor se é múltiplo de 5 ou não:

Escola Inovadora

Uma escola apresenta um tema inovador para a aprovação de um aluno: O aluno só é aprovado caso alcance a média igual ou superior a 7, caso não atinja essa nota o aluno continua fazendo prova. Isso mesmo!!

Quantas provas foram necessárias fazer?

Agora use o comando set.seed(100) e refaça o processo

Base train.csv

Leia o arquivo train.csv,na pasta datasets, com os dados de alguns passageiros do acidente do Titanic como informado no Capítulo 2. e responda as questões:



  1. Quantas variáveis possui o arquivo? Quantas observações o arquivo tem?

  2. Quais são as classes das variáveis?

  3. Qual é a média das dos preços dos tickets?

  4. Faça um filtro na tabela e crie dois outros data frames. Um para o genero masculino e o outro para o genero feminino.

  5. Crie duas listas uma para informações do data frame do genero feminino e outro para o genero masculino. Cada lista deve ser composta:

Com base nas listas criadas, responda:

  1. Qual genero teve o maior número de pessoas embarcadas?

  2. Qual genero sobreviveu mais?

  3. Qual genero teve a maior média do número de parentes?

Base Human development index (HDI).csv

Leia a base Human development index (HDI).csv com os dados da evolução do IDH (Índice de Desenvolvimento Humano) dos países e responda os questionamentos.



  1. Crie uma função que classifique os países (em uma coluna extra na tabela) em 2014 de acordo com a tabela acima.

  2. Qual pais cresceu mais em relação à 2013?

  3. Qual pais caiu mais em relação à 2013?

  4. Quantos enstão com classificação baixa?

  5. Qual é a posição do Brasil?



Base dados_anp2.csv



Crie uma variavel chamada anp que receba a leitura de dados dados_anp2.csv.

  1. Faça o summary para entender a sua base.

  2. Quantos preços foram coletados?

  3. Crie uma tabela com a frequência de postos por combústivel, atribua essa tabela à variável “quantidade_postos”

  4. Qual combustível teve menos preços coletados? Isso faz sentido?

  5. Qual é o posto com menor preço de venda? É confiável essa fonte (dica: olhe para o fornecedor e a bandeira.)

  6. Crie a tabela dados_etanol, que é um filtro do data frame anp. Sumarize dados_etanol por UF e média dos preços de venda do etanol.

  7. Qual é o estado com a menor média de preços de venda do etanol. Isso faz sentido?

  8. Exporte para o mesmo arquivo em excel os data frames:



Base ChickenWeight



Essa base contem dados de galinhas divididas em quatro dietas distintas ao longo do tempo.

Diante dessa base faça:

  1. Qual dieta apresentou maior média de peso?

  2. Qual dieta apresentou maior homogeneidade dos pesos?

  3. Qual dieta seria escolhida para aumento de peso?

  4. Qual galinha apresentou meor evolução do peso. Atente-se para uma base válida.

  5. Qual galinha apresentou maior evolução do peso? Isso faz sentido?