Introdução

Nesta aula, estudamos como organizar e interpretar dados numéricos usando ferramentas da Estatística. O foco será em entender como os dados se distribuem e como podemos representá-los visualmente para tirar conclusões de forma mais clara e rápida.

Gráfico para variáveis quantitativas contínuas

Um gráfico para variáveis quantitativas contínuas é usado para representar dados numéricos que podem assumir qualquer valor dentro de um intervalo, como altura, peso, salário ou temperatura. Esse tipo de gráfico mostra como os valores estão distribuídos.

Histograma

Um histograma é um gráfico usado para representar a distribuição de dados numéricos. Ele mostra com que frequência os valores aparecem dentro de certos intervalos. O eixo horizontal representa os intervalos de valores (também chamados de classes), enquanto o eixo vertical mostra a frequência com que os dados aparecem nesses intervalos. As barras do histograma são coladas umas nas outras, indicando que os dados são contínuos. A altura de cada barra mostra quantos valores estão dentro daquele intervalo. Esse tipo de gráfico é útil para observar padrões, como concentração de valores, simetria, dispersão e presença de valores extremos.

Atividade1: Notas de Física

Nesta aula, analisamos as notas da turma na matéria de Física usando gráficos e tabelas. O objetivo foi entender melhor como as notas estão distribuídas e ver o qu e acontece quando damos uma bonificação, como somar 1 ponto ou aumentar as notas em 20%. Com isso, aprendemos a usar ferramentas da Estatística para interpretar os dados de forma mais clara e ver como mudanças nas notas podem influenciar no desempenho da turma. Essa atividade ajudou a ligar a matemática com a realidade da sala de aula.

# Notas de Física

notas = c(0.8, 2, 2, 2.5, 2.5, 3.5, 4.5, 5, 5.4, 5.5, 5.5, 5.5, 6, 6, 6, 6, 6.3, 6.5, 6.8, 6.8, 7, 7, 7, 7, 7.3, 7.3, 7.5, 7.5, 7.5, 7.5, 7.8, 8, 8, 8, 8)
notas
##  [1] 0.8 2.0 2.0 2.5 2.5 3.5 4.5 5.0 5.4 5.5 5.5 5.5 6.0 6.0 6.0 6.0 6.3 6.5 6.8
## [20] 6.8 7.0 7.0 7.0 7.0 7.3 7.3 7.5 7.5 7.5 7.5 7.8 8.0 8.0 8.0 8.0
# Gráfico de barras com as notas de Física
tabnotas = table(notas)

barplot (tabnotas)

# Histograma das notas de Física
hist(notas,
     nclass = 5,
     right = FALSE,
     ylim = c(0,30),
     col = "#ff00bf",
     main = "Histograma das Notas de Física",
     xlab = "Notas da Turma",
     ylab = "Freq. Absoluta")

# Histograma das Notas de Física com Bonificação

# Bonificação 1: aumentar 1 ponto
# novo conjunto de notas somado 1 ponto
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
# Bonificação 2: aumentar as notas em 20%      
# novo conjunto de notas aumentado em 20%
notas2 = notas*1.2              
notas2
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60
# Histograma de Bonificação 1
hist(notas1,
     breaks = c(1, 3, 5, 7, 9),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#ff00bf",
     main = "Notas de Física somado 1 ponto",
     xlab = "Notas da Turma",
     ylab = "Freq. Absoluta")

# Histograma da Bonificação 2
hist(notas2,
     breaks = c(0,2.4,4.8,7.2,9.6),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#ff00bf",
     main = "Notas de Física aumentado em 20%",
     xlab = "Notas da Turma",
     ylab = "Freq. Absoluta")

Atividade2: 100 melhores salários de desenvolvedores de software

Nesta atividade, usamos a linguagem R para analisar os 100 maiores salários líquidos mensais de desenvolvedores de software no Brasil. Primeiro, transformamos os salários para mil reais, facilitando a visualização dos valores nos gráficos. Depois, criamos um histograma, que mostra a quantidade de pessoas em cada faixa salarial, e um boxplot, que resume os dados mostrando onde estão os salários mais baixos, médios e altos. Calculamos a média dos salários, que mostra quanto, em média, um desenvolvedor entre os 100 mais bem pagos recebe. Também identificamos os quartis: o Q1 indica o valor abaixo do qual estão os 25% menores salários do grupo; o Q2, que é a mediana, mostra o valor do meio; e o Q3 representa o ponto onde 75% dos salários estão abaixo. Essas informações foram marcadas com linhas no gráfico, facilitando a interpretação. Com isso, conseguimos entender melhor como esses salários estão distribuídos, se estão concentrados em uma faixa específica ou se há bastante variação entre eles. A atividade mostra como a estatística pode ajudar a visualizar e interpretar dados do mercado de trabalho.

# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)
# Converter salários para mil reais

salarios_mil = salarios/1000

salarios_mil
##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515
# Criar uma base para receber dois gráficos
par(mfrow = c(2,1), mar = c(4, 4, 2, 1))
# Histograma dos 100 maiores salários de desenvolvedores no br
hist(salarios_mil,
     breaks = seq(14.6, 18.6, by = 0.4),
     col = "#f73ec0",
     main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
     xlab = "Salários (mil R$)",
     ylab = "Freq. Absoluta",
     xlim = c(14, 19),
     ylim = c(0, 22))

#Criar as marcações
#Média

media = sum(salarios_mil)/100
media
## [1] 16.55744
# Função de calcular média
mean(salarios_mil)
## [1] 16.55744
# Quartis

q1 = salarios_mil[25]
q2 = salarios_mil[50]
q3 = salarios_mil[75]
#Boxplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#67d1f5")


abline(v = media, col ="#cc46db", lwd = 2, lty = 2)

Boxplot

O boxplot é um gráfico estatístico utilizado para representar a distribuição de um conjunto de dados numéricos de forma visual e resumida. Ele mostra informações sobre a tendência central, dispersão e simetria dos dados, permitindo identificar possíveis valores discrepantes. É uma ferramenta útil na análise exploratória, facilitando comparações entre diferentes conjuntos de dados.

#Boxplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#67d1f5")


abline(v = media, col ="#cc46db", lwd = 2, lty = 2)

###Atividade3:Criação dos vetores - Cotação das empresas A e B