Introdução

Neste relatório serão respondidas algumas perguntas sobre os alunos matriculos na disciplina de Fundamentos de Pesquisa em Ciência da Computação, do PPGCC-UFCG. Os dados utilizados foram colhidos através de formulário e são referentes às respostas desses alunos.


Questões

Calcule média e desvio padrão da idade e nível de interesse. As métricas contendo os valores calculados para idade e nível de interesse devem ser apresentadas de forma ordenada. Além de apresentar no relatório, os resultados devem ser salvos em um arquivo csv.

Métrica Varíável Valor
desvio padrão interesse 0.3844259
média interesse 2.8275862
desvio padrão idade 4.9524836
média idade 25.7931034

A média de idade geral é de 25.79 com desvio padrão de 4.95. Já para o nível de interesse, o valor da média é 2.83 com desvio padrão de 0.38. Esses resultados mostram que, no geral, a turma possui alunos com uma média de idade de aproximadamente 26 anos com alto nível de interesse no curso.


Qual o curso com maior valor médio de idade? Discutir os resultados com base nos dados disponíveis em termos de representatividade.

Curso Idade (média)
Aluno especial 36.33333
Doutorado 30.25000
Mestrado 23.54545

A maior média de idade é a dos alunos especiais, com valor 36.33. Contudo, há uma diferença entre a quantidade de alunos por curso. Vejamos a distribuição de suas idades.

No gráfico acima, cada ponto representa um aluno, e a linha vermelha tracejada a média de idade para aquele curso. A partir dele, observamos que a média para os alunos especiais foi calculada com base nas 3 observações existentes. Como a diferença entre esses valores não é tão grande, a média representa bem a idade desses alunos especiais.


Crie um gráfico que mostra a idade média para cada curso. Apresente o gráfico e discuta os resultados no relatório. O gráfico também deve ser salvo em uma imagem no formato png.

A maior média de idade pertence aos alunos especiais, e a menor aos alunos do mestrado. A diferença de idade entre os alunos desses cursos, de forma geral, é de aproximadamente 13 anos.


Crie um gráfico que mostra o percentual de alunos para cada estado de origem. Apresente o gráfico e discuta os resultados no relatório. O gráfico também deve ser salvo em uma imagem no formato png.

O estado com maior percentual de alunos é a Paraíba, seguido pelos estados de São Paulo e Bahia. Além da Paraíba, existem alunos de outros cinco estados no Nordeste.


Compare a média de idade geral com a média dos top-5 e dos bottom-5. Além de apresentar e discutir os resultados no relatório, salvar em uma tabela (dataframe) com as médias em questão.

Média Valor
Geral 25.7931
Top-5 35.2000
Bottom-5 21.8000

A média das 5 maiores idades é 35.2 e a das 5 menores é 21.8. A média das maiores idades difere em pouco mais de 10 anos da média de idade geral (25.79), e esta difere em pouco menos de 4 anos da média das menores idades.


Você acredita que existe uma relação entre idade e nível de interesse? Discuta.

Uma forma de verificar se existe alguma relação entre idade e nível de interesse é observar a distribuição das observações quando uma das variáveis está em função da outra.

Pelo gráfico, podemos observar que, embora existam alunos com menos de 30 anos com interesse nível 3, não existem alunos que possuem mais que 30 anos com interesse nível 2. Portanto, com base nessas informações, pode-se dizer que sim, existe uma relação entre idade e nível de interesse.