Introdução: Assuntos abordados

Neste trabalho, vamos usar a Matemática e a Estatística para entender melhor duas situações diferentes do nosso dia a dia: as notas da turma na disciplina de Física e os salários de profissionais da área de tecnologia. Através de gráficos e cálculos simples, mostramos como a análise de dados pode ser útil não só na escola, mas também em decisões importantes da vida, como planejar uma profissão ou organizar as finanças pessoais.

Na parte das notas de Física, usamos gráficos de barras e histogramas para observar como os alunos estão indo nas provas. Também fizemos simulações com dois tipos de bonificação: somando 1 ponto em todas as notas e aumentando as notas em 20%. Essas simulações ajudam a perceber como pequenas mudanças podem influenciar a média da turma e a distribuição das notas.

Já na parte dos salários, analisamos os 100 maiores salários líquidos de desenvolvedores de software no Brasil, todos convertidos para mil reais. Com o histograma e o boxplot, conseguimos ver em quais faixas de salário a maioria desses profissionais se encontra, além de identificar a média e os valores que separam os salários em partes (quartis). Essa parte do trabalho ajuda a gente a entender melhor como o mercado funciona e por que é importante pensar bem na profissão que queremos seguir.

Através dessas duas análises, conseguimos ver como a Matemática pode ajudar a interpretar dados, tomar decisões mais conscientes e entender melhor o mundo à nossa volta que são aprendizados importantes para nossa vida financeira e profissional.

Gráficos para variávies quantitativas contínua: Histograma

Uma variável quantitativa contínua é aquela que pode assumir qualquer valor dentro de um intervalo, incluindo valores decimais. Por exemplo, a altura de uma pessoa (1,72 m), a nota de uma prova (6,5), ou o salário (R$ 15.988,00). Esses valores não são fixos ou contados individualmente, mas medidos.

Para representar esse tipo de variável, o gráfico mais adequado é o histograma.

O que é um Histograma?

O histograma é um tipo de gráfico de colunas (barras verticais) usado para representar a distribuição de frequências de uma variável contínua. Ele agrupa os dados em intervalos de valores (chamados de classes) e mostra quantas observações caem em cada intervalo. Ou seja, ele indica quantas vezes os dados aparecem em cada faixa de valores.

Diferença entre histograma e gráfico de barras:

O gráfico de barras é usado para variáveis categóricas ou discretas, com espaço entre as barras.

O histograma é usado para variáveis contínuas, com barras coladas, porque os dados formam uma sequência contínua.

Atividade 1: Notas de física

Objetivo:

Analisar a distribuição das notas dos alunos em uma disciplina de Física, utilizando gráfico de barras, histograma e simulando duas bonificações. Essa atividade ajuda a entender como os dados se comportam e como alterações (como bonificações) impactam na distribuição.

Esse vetor contém as notas dos alunos da turma de física, com valores entre 0,8 e 8,0. É uma variável quantitativa contínua, pois as notas podem ter valores decimais.

#Notas de Física 

notas = c(0.8, 2, 2,2.5, 2.5, 3.5, 4.5, 5.0, 5.4, 5.5, 5.5, 5.5, 6 , 6 , 6, 6, 6.3, 6.5, 6,8, 6.8, 7 , 7 , 7, 7.3, 7.3, 7.5, 7.5, 7.5, 7.5, 7.8, 8, 8, 8, 8)
notas
##  [1] 0.8 2.0 2.0 2.5 2.5 3.5 4.5 5.0 5.4 5.5 5.5 5.5 6.0 6.0 6.0 6.0 6.3 6.5 6.0
## [20] 8.0 6.8 7.0 7.0 7.0 7.3 7.3 7.5 7.5 7.5 7.5 7.8 8.0 8.0 8.0 8.0

O gráfico de barras mostra quantas vezes cada nota específica foi registrada. É útil, mas limitado nesse caso porque as notas têm valores repetidos e decimais, o que torna a visualização pouco agrupada.

#Gráfico de barras com as notas de Física 
tabnotas = table(notas)

barplot (tabnotas)

O histograma permite ver em quais faixas as notas estão mais concentradas. Isso facilita a análise da turma como um todo.

#Histograma das notas de Física 
hist(notas,
     nclass= 5,
     right = FALSE,
     ylim = c(0,30),
     col = c("#44dfeb" ,"#9744eb" ,"#eb44cc" ,"#eb445a"),
     main = "Histograma das Notas de Física",
     xlab = "Notas da turma", 
     ylab = " Freq. Absoluta")

O histograma mostra o efeito da adição de 1 ponto. A forma é parecida com o histograma original, mas os valores estão todos 1 ponto acima.

#Histograma das Notas de Física com Bonificação

#Bonificação 2: aumentar as notas em 20%
#nvo conjunto das notas aumentadas em 20%
notas2 = notas*1.2
notas2 
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 7.20 9.60 8.16 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60
#Bonificação 1: aumentar 1 ponto nas notas
#novo conjunto das notas somando 1 ponto 
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.0
## [20] 9.0 7.8 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Histograma da Bonificação 1
hist(notas1,
     breaks = c(1,3,5,7,9),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#9a7dd4",
     main = "Notas de Física somando 1 ponto",
     xlab = "Notas da turma",
     ylab = " Freq. Absoluta")

#Histograma da Bonificação 2 
hist(notas2,
     breaks = c(0, 2.4, 4.8, 7.2, 9.6),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#d47daf",
     main = "Notas de Física aumentadas em 20%",
     xlab = "Notas da turma",
     ylab = " Freq. Absoluta")

Atividade 2: 100 maiores salários de desenvolvedores de softwares

Na Atividade 2, foi realizada uma análise estatística dos 100 maiores salários líquidos mensais de desenvolvedores de software no Brasil. Para facilitar a compreensão, os valores foram convertidos para mil reais. O objetivo principal foi observar como esses salários estão distribuídos, identificar faixas de maior concentração e analisar medidas importantes como média e quartis.

Durante a análise, foi possível perceber que a maioria dos salários se concentra entre aproximadamente R$ 15.000 e R$ 17.500. A média e a mediana dos salários estão próximas, o que indica que a distribuição dos dados é relativamente equilibrada, sem grande assimetria. Além disso, foram observados alguns valores mais altos que se destacam, indicando a presença de possíveis salários acima do padrão da maioria.

Também foram calculados os quartis, que dividem os salários em quatro partes iguais. Isso ajudou a entender melhor como os valores estão distribuídos: 25% dos salários estão abaixo do primeiro quartil, 50% estão abaixo da mediana e 75% estão abaixo do terceiro quartil. Esse tipo de análise é útil para visualizar como os salários se espalham e para identificar eventuais desigualdades.

Em resumo, a atividade mostrou que, embora os salários analisados estejam entre os mais altos da área, ainda existe uma variação considerável entre eles. A análise estatística permitiu compreender melhor essa distribuição e trouxe informações importantes sobre a realidade salarial dos desenvolvedores de software no topo do mercado.

# Vetor com os 100 maiores salários líquidos mensais (em reais)More actions
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)
#Convertor salários para mil reais

salarios_mil = salarios/1000

salarios_mil
##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515
#histograma dos 100 maiores salários de desenvolvedores 
hist(salarios_mil,
    breaks = seq(14.6, 18.6, by = 0.4),
    col = "#375fa3" , 
    main = " Histograma dos 100 maiores salários de
    desenvolvedores de software no Brasil",
    xlab = "Salários (mil R$)",
    ylab = "Freq. Absoluta",
    xlim = c(14, 19),
    ylim = c(0, 22)
    )

##Boxplot

O boxplot, ou diagrama de caixa, é um gráfico que ajuda a entender como os dados estão distribuídos. Ele mostra onde estão concentrados os valores, qual é a mediana (o valor do meio), e se existem valores muito diferentes dos demais (os chamados outliers).

No nosso trabalho, usamos o boxplot para analisar os 100 maiores salários de desenvolvedores de software no Brasil. Com ele, conseguimos ver de forma clara:

Em que faixa a maioria dos salários está concentrada;

Qual é o salário mediano;

Se há salários muito altos que fogem do padrão da maioria.

Esse tipo de gráfico é muito útil porque permite uma análise rápida e visual dos dados, facilitando a identificação de desigualdades ou padrões importantes.

#Boxplot
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#f50727" )

Juntando as informações

#criar uma base para receber dois gráficos
par(mfrow = c(2,1), mar = c(4, 4, 2, 1) )

#histograma dos 100 maiores salários de desenvolvedores 
hist(salarios_mil,
    breaks = seq(14.6, 18.6, by = 0.4),
    col = "#375fa3" , 
    main = " Histograma dos 100 maiores salários de
    desenvolvedores de software no Brasil",
    xlab = "Salários (mil R$)",
    ylab = "Freq. Absoluta",
    xlim = c(14, 19),
    ylim = c(0, 22)
    )
      

#Criar marcações
#média

media = sum(salarios_mil)/100
media
## [1] 16.55744
#Função que calcula média
mean(salarios_mil)
## [1] 16.55744
#quartis

q1 = salarios_mil[25]
q2 = salarios_mil[50]
q3 = salarios_mil[75]

#adicionar linhas no histograma
abline(v = media, col = "red", lwd = 2, lty = 2)
abline(v = q1, col = "#05fa26", lwd = 2, lty = 3)
abline(v = q2, col = "#05fa26", lwd = 2, lty = 3)
abline(v = q3, col = "#05fa26", lwd = 2, lty = 3)


#Boxplot
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#f50727" )