Introdução:

Questão 1) Reproduza os gráficos abaixo utilizando o ggplot2 e o banco de dados mtcars:

a)

b) Dica: “facet_wrap”

c) Dica “grid.arrange”

Questão 2) A P & C tem supervisionado e controlado seu sistema biológico de tratamento (sistema de lagoas aeradas) através da demanda bioquímica de oxigênio (DBO), demanda química de oxigênio (DQO), pH, sólidos em suspensão (SS), nitrogênio nitrato (NN), nitrogênio amoniacal (NAm), fósforo (P), cor (Col), temperatura (T), condutividade (Cond) e vazão do efluente (FR) na entrada (in) e saída (out) do sistema de lagoas aeradas. Eles também dispõem de dados diários de precipitação (RF), produção de papel (Pap) e produção de celulose (Pulp). A partir da planilha fornecida no Moodle, se utilize da técnica de regressão linear a fim de prever o valor da DBO de entrada. Discuta os resultados obtidos e a validade deste modelo. Utilize o material dado em sala de aula sobre regressão como apoio. (OBS: A estimativa simples da DBO tem sido realizada através de um modelo linear DBO-DQO). É sugerido que siga a seguinte itemização:

  • Verificação de outlier;

  • Verificação da existência de agrupamento dos dados;

  • Verificação dos resíduos da regressão;

  • Exibição da equação e do erro da regressão;

  • Realização do particionamento em treino e teste dos dados;

  • Debate do erro do teste.