Desenvolvendo conceitos de distribuição de dados numéricos e sua relação com a média.
Esta atividade é adaptada do Capítulo 8 do livro aberto https://www.umlivroaberto.org/BookCloud/Volume_1/master/view/index
Para melhor aproveitamento deste material é fundamental realizar a aula de construção de histogramas com R http://rpubs.com/LucianeA/EM_Aula_Histograma
Ao final de um trimestre, um professor de Artes registrou as seguintes notas de seus 35 alunos, listadas a seguir, em ordem crescente.
x=c(0.8,2,2,2.5,2.5,3.5,4.5,5,5.4,5.5,5.5,5.5,6,6,6,6,6.3,6.5,6.8,6.8,7,7,7,7,7.3,7.3,7.5,7.5,7.5,7.5,7.8,8,8,8,8)
Este professor verificou que a média da turma foi aproximadamente 5,93 (soma das notas S=207,5).
Vamos verificar isso no R!
#Média
mean(x)
## [1] 5.928571
#Arredondando para duas casas decimais
round(mean(x),2)
## [1] 5.93
#Soma de todas as notas
sum(x)
## [1] 207.5
Como a participação da turma foi muito boa ao longo do trimestre, o professor resolveu dar uma bonificação na nota de cada aluno desta turma, pensando em duas possibilidades:
x1=x+1
x1
## [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3
## [18] 7.5 7.8 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0
## [35] 9.0
#Aumentar 20% é o mesmo que multiplicar por 1.2
x2=x*1.2
x2
## [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20
## [15] 7.20 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00
## [29] 9.00 9.00 9.36 9.60 9.60 9.60 9.60
A tabela abaixo contém os intervalos de classe considerados na construção do histograma das notas sem bonificação.
Distribuição de frequências das notas antes de bonificação intervalo frequência absoluta
| intervalo | frequencia absoluta |
|---|---|
| [0,2[ | 1 |
| [2,4[ | 5 |
| [4,6[ | 6 |
| [6,8[ | 23 |
hist(x, main="Histograma das notas antes da bonificação", xlab="Notas", ylab = "Freq. Absoluta", nclass = 5, ylim = c(0,25), xlim = c(0,10), right = FALSE, col="blue" )
Observe que nem sempre usando nclass obteremos o histograma com os intervalos de classes pré-definidos por nós. Para garantir isso, use:
hist(x, main="Histograma das notas antes da bonificação", xlab="Notas", ylab = "Freq. Absoluta", breaks = c(0,2,4,6,8), ylim = c(0,25), xlim = c(0,10), right = FALSE, col="blue" )
Os dois histogramas a seguir correspondem às notas, após usar cada uma das possibilidades consideradas pelo professor, mantendo quatro intervalos de classe.
hist(x1, main="Histograma das notas com bonificação de 1 ponto", xlab="Notas", ylab = "Freq. Absoluta", breaks = c(1,3,5,7,9), ylim = c(0,25), xlim = c(0,10), right = FALSE, col="blue" )
hist(x1, main="Histograma das notas com bonificação de 20%", xlab="Notas", ylab = "Freq. Absoluta", breaks = c(0,2.4,4.8,7.2,9.6), ylim = c(0,25), xlim = c(0,10), right = FALSE, col="blue" )
Compare os histogramas das notas com bonificação com o histograma original. O que mudou em cada um deles em relação ao original?
Dada a informação inicial de que a média da turma foi 5,93, de quanto será a média se o professor acrescentar um ponto a cada aluno? E se ele aumentar em 20% a nota de cada aluno?
Se você fosse um aluno desta turma, que possibilidade de bonificação você escolheria? Para que notas é melhor cada uma das estratégias?
Analisando o primeiro histograma apresentado com o original, percebe-se que o primeiro apresenta uma pequena alteração com intervalos de classe mais largos, ou seja de comprimento 2,4 (os comprimentos originais dos intervalos são iguais a 2). Já, o segundo, mantém intervalos de classe com mesmo comprimento aos do original, apresentando um deslocamento dos intervalos em uma unidade para à direita.
Observe que se todos os alunos tiverem o acréscimo de 1 ponto, a soma total das notas será acrescida de 35 pontos (pois são 35 alunos). Ao dividir o total por 35, perceba que a nova média será alterada exatamente pelo acréscimo de 1 ponto, passando a ser 6,93. Ou seja, a nova média é dada por
mean(x1)
## [1] 6.928571
#É o mesmo que
mean(x) + 1
## [1] 6.928571
Já no caso do aumento de 20% sobre a nota de cada aluno, teremos que a nova soma total de notas será dada pela soma original acrescida de 20% tal que a média será dada por
mean(x2)
## [1] 7.114286
#É o mesmo que
1.2 * mean(x)
## [1] 7.114286
compare
## notas bonus1 bonus2 diferenca
## 1 1 1 0.2 -0.8
## 2 2 1 0.4 -0.6
## 3 3 1 0.6 -0.4
## 4 4 1 0.8 -0.2
## 5 5 1 1.0 0.0
## 6 6 1 1.2 0.2
## 7 7 1 1.4 0.4
## 8 8 1 1.6 0.6
## 9 9 1 1.8 0.8
## 10 10 1 2.0 1.0
Esta atividade foi desenvolvida em Nova Friburgo-RJ por ocasião da visita da Profa. Luciane Alcoforado ao Colégio Estadual Doutor João Bazet à convite da Profa. Vanessa Manhães.
Profa. Luciane Alcoforado é licenciada em Matemática e vem desenvolvendo o projeto Estatística é com R! desde 2010 na Universidade Federal Fluminense. É autora dos livros de Introdução ao R utilizando a Estatística Básica (2014) e Visualização de Dados com o software R (2017). Seu objetivo é levar o R para todos os níveis de ensino e áreas de aplicação da estatística.
Profa. Vanessa Manhães é licenciada em Matemática e atua na rede de ensino do Estado do Rio de Janeiro desde 2015. Iniciou um curso de Extensão Estatística e Probabilidade no Ensino Médio em 2019 no projeto Livro Aberto, participou do I Educa-SER UFF/UNIRIO, a partir do qual percebeu a aplicabilidade da linguagem R para o Ensino Médio. Integrou-se ao projeto de Extensão Estatística é com R! da UFF e seu objetivo passou a ser o desenvolvimento de atividades utilizando a linguagem R para estudantes do ensino médio.