## Parsed with column specification:
## cols(
##   `Carimbo de data/hora` = col_character(),
##   Idade = col_double(),
##   `Você é` = col_character(),
##   `Curso no PPGCC / UFCG` = col_character(),
##   `Área de pesquisa` = col_character(),
##   `Nível de interesse na pós-gradução` = col_double(),
##   `Programa em R` = col_character(),
##   `Instituição de origem (abreviado)` = col_character(),
##   `Estado de nascimento (abreviado)` = col_character(),
##   `Número de irmãos (irmãs)` = col_character(),
##   `Altura (em centímetros)` = col_double()
## )

1. Calcule média e desvio padrão da idade e nível de interesse. As métricas contendos as métricas calculadas para idade e nível de interesse devem ser apresentadas de forma ordenada. Além de apresentar no relatório, os resultados devem ser salvos em um arquivo csv.

variavel media desvio_padrao
Idade 25.793103 4.9524836
Nível de interesse na pós-gradução 2.827586 0.3844259

2. Qual o curso com maior valor médio de idade? Discutir os resultados com base nos dados disponíveis em termos de representatividade.

Curso no PPGCC / UFCG media_idade desvio_padrao mediana
Aluno especial 36.33333 2.886751 38
Doutorado 30.25000 3.201562 29
Mestrado 23.54545 2.344746 23

Como visto na tabela, o curso com maior média de idade é o Doutorado, com 30.25 de média, embora exista a categoria Aluno especial, esta não se trata de um curso. Em termos de representatividade, essa média parece ser uma boa métrica, tendo em vista que se aproxima da mediana em ambos os cursos, além disso, o desvio padrão para nestas cursos também não parece tão alto. Ainda assim, devemos considerar a existência de outliers. Discutimos um pouco sobre na questão logo abaixo.

4. Crie um gráfico que mostra o percentual de alunos para cada estado de origem. Apresente o gráfico e discuta os resultados no relatório. O gráfico também deve ser salvo em uma imagem no formato png.

O que notamos é a massiva presença de alunos oriundos da Paraíba, com cerca de 66% da turma.

5. Compare a média de idade geral com a média dos top-5 e dos bottom-5. Além de apresentar e discutir os resultados no relatório, salvar em uma tabela (dataframe) com as médias em questão.

grupo media
top-5 35.2000
bottom-5 21.8000
geral 25.7931

A média geral da turma esta mais próxima da média dos 5 mais jovens. Além disso, existe uma diferença de quase 14 anos na média entre os 5 mais velhos para os 5 mais novos.

6. Você acredita que existe uma relação entre idade e nível de interesse? Discuta.

Para investigar isso, plotamos um gráfico de dispersão que nos ajuda a responder essa pergunta:

Pelo que observamos, não parece existir uma relação clara entre as duas variáveis.