introdução:assuntos abordados

O que é histograma?

Um histograma é um gráfico de barras que representa a distribuição de frequência de dados numéricos. Ele mostra como os dados estão distribuídos em diferentes intervalos (ou “bins”), onde a altura de cada barra indica a frequência ou número de observações dentro desse intervalo.

O que são medidas de posição?

Medidas de posição ou tendência central, são estatísticas que representam a posição central de um conjunto de dados, resumindo-o num único valor. As principais são a média, que é a soma de todos os valores dividida pelo seu número; a mediana, o valor que divide a série de dados em duas partes iguais após os dados estarem ordenados; e a moda, que é o valor que aparece com maior frequência no conjunto.

O que são medidas de dispersão?

Medidas de dispersão, também conhecidas como medidas de variabilidade, são indicadores estatísticos que mostram o grau de afastamento ou concentração dos valores de um conjunto de dados em relação à sua média. Elas revelam o quão homogêneo ou heterogêneo é um conjunto de dados, indicando se os valores estão próximos ou distantes uns dos outros e da média.

Graficos para variavéis quantitativas

histograma

O que são histogramas? Uma representação grafica de distribuição de dados e frequências de uma variavéis de quantitatuvas e intervalos usando retângulos , usamos nas aulas notas de física para fazermos o histograma.

Atividade1: notas de física

Nessa atividade usamos dados dos alunos para crias histograma e com as informações .

histograma das notas de física

#Notas de físicas

notas= c(0.8, 2, 2, 2.5, 2.5, 3.5, 4.5, 5, 5.4, 5.5, 5.5, 5.5, 6, 6, 6, 6, 6.3, 6.5, 6.8, 6.8, 7, 7, 7, 7, 7.3, 7.3, 7.5, 7.5, 7.5, 7.5, 7.8, 8, 8, 8, 8)

grafico de barras com as notas de física

tabnotas = table(notas)

barplot (tabnotas)

histograma das notas de física

hist(notas,
     nclass = 5,
     right = FALSE,
     ylim = c(0,30),
     col = c("aquamarine","violet","#8492d1","#84c0d1"),
     main = "Histograma das Notas de Física",
     xlab = "NOTAS da turma",
     ylab = "Freq. Absoluta")

bonificações

# Bonificação 1: aumentar 1 ponto nas notas 
#novo conjunto de notas somado 1 ponto
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Bonificação 2: aumentar as notas em 20%
#novo conjunto de notas aumentadas em 20%
notas2 = notas*1.2
notas2
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60

histograma de bnificaçao 1

hist(notas1,
     breaks = c(1,3,5,7,9),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#84b3d1",
     main = "Notas de Física somado 1 ponto",
     xlab = "Notas de turma",
     ylab = "Freq. Absolut")

##Bonificação 2
#Bonificação 2: aumentar as notas em 20%
#novo conjunto de notas aumentadas em 20%
notas2 = notas*1.2
notas2
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60
#Histograma da Bonificação 2
hist(notas2,
     breaks = c(0, 2.4, 4.8, 7.2, 9.6),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#9184d1",
     main = "Notas de Física aumentadas em 20%",
     xlab = "Notas de turma",
     ylab = "Freq. Absoluta")

## histograma de bonificação 1

hist(notas1,
     breaks = c(1,3,5,7,9),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#84b3d1")

boxplot

O que boxplot? Um Boxplot, ou diagrama de caixa, é um gráfico estatístico que ilustra a distribuição de um conjunto de dados, apresentando cinco valores chave: o mínimo, o primeiro quartil (Q1), a mediana, o terceiro quartil (Q3) e o máximo.

# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)

#Conveter salário para mil reais 

salarios_mil = salarios/1000

salarios_mil
##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515

boxplot

par(mar = c(4,4,0,1))
boxplot (salarios_mil,
         horinzontal = TRUE,
         col = "purple")

Logo após nós fizemos as marcações, calculamos a média, colocamos os quartis e as linhas no histograma

# Histograma dos 100 maiores salários de desenvolvedores no BR
hist (salarios_mil ,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
      xlab = "Salários (mil R$)",
      ylab = "Frequência Absoluta" ,
      ylim = c(0, 30)
      )


#Criar as marcações
#Média

media = sum (salarios_mil)/100
media
## [1] 16.55744
#Função que calcula média
mean (salarios_mil)
## [1] 16.55744
#Quartis

ql = salarios_mil [25]
q2 = salarios_mil [50]
q3 = salarios_mil [75]

#Adicionar linhas no histograma
abline(v = media, col = "#0fd1be", lwd = 2, lty = 2)
abline(v = ql, col = "pink", lwd = 2, lty = 3)
abline(v = q2, col = "pink", lwd = 2, lty = 3)
abline(v = q3, col = "pink", lwd = 2, lty = 3)


text (15.77, 25, labels = "Ql", cex = 0.6)
text (16.7, 25, labels = "Q2", cex = 0.6)
text (17.3, 25, labels = "Q3", cex = 0.6)
text (16.5, 28, labels= "Média" , cex = 0.6, col= "red")

Boxplot

O que é um boxplot? Um boxplot, também conhecido como diagrama de caixa, é um gráfico estatístico que representa visualmente a distribuição de dados numéricos. Ele mostra a dispersão dos dados, a mediana, os quartis (Q1, Q3), e os valores máximos e mínimos, permitindo identificar outliers.

Boxplot dos 100 salários

E por fim, Nós fizemos o Boxplot com os salários

par(mar = c (4, 4, 0,1))
boxplot (salarios_mil,
         horizontal = TRUE,
         col = "purple")

Juntando os dois gráficos

# Criar uma base para receber dois gráficos
par(mfrow = c(2,1) , mar = c (0, 4, 2, 1))

# Histograma dos 100 maiores salários de desenvolvedores no BR
hist (salarios_mil ,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
      xlab = "Salários (mil R$)",
      ylab = "Frequência Absoluta" ,
      ylim = c(0, 30)
      )



#Criar as marcações
#Média

media = sum (salarios_mil)/100
media
## [1] 16.55744
#Função que calcula média
mean (salarios_mil)
## [1] 16.55744
#Quartis

ql = salarios_mil [25]
q2 = salarios_mil [50]
q3 = salarios_mil [75]

#Adicionar linhas no histograma
abline(v = media, col = "#0fd1be", lwd = 2, lty = 2)
abline(v = ql, col = "pink", lwd = 2, lty = 3)
abline(v = q2, col = "pink", lwd = 2, lty = 3)
abline(v = q3, col = "pink", lwd = 2, lty = 3)


text (15.77, 25, labels = "Ql", cex = 0.6)
text (16.7, 25, labels = "Q2", cex = 0.6)
text (17.3, 25, labels = "Q3", cex = 0.6)
text (16.5, 28, labels= "Média" , cex = 0.6, col= "red")

#Boxplot
par(mar = c (4, 4, 0,1))
boxplot (salarios_mil,
         horizontal = TRUE,
         col = "purple")
         

abline (v = media, col = "red", lwd = 2, lty = 2)

Atividade 3: Cotação das empresas

Na atividade 3 nós fizemos a cotação das empresas. Nós criamos os vetores, juntamos as informações em uma tabela, criamos um gráfico de linhas,comparamos as ações das empresas, fizemos a média das cotações e, por fim, fizemos uma tabela simples para analisar os dados.

#Criação dos vetores - Cotação das empresas A e B
A = c(61, 56, 63, 57, 67, 63, 67, 58, 67, 56)
A
##  [1] 61 56 63 57 67 63 67 58 67 56
B = c(67, 48, 52, 82, 77, 33, 67, 42, 90, 57)
B
##  [1] 67 48 52 82 77 33 67 42 90 57
Semana = c(1:10)
Semana
##  [1]  1  2  3  4  5  6  7  8  9 10
#Juntar as informações em uma tabela
acoes = data.frame(Semana, A, B)
acoes
##    Semana  A  B
## 1       1 61 67
## 2       2 56 48
## 3       3 63 52
## 4       4 57 82
## 5       5 67 77
## 6       6 63 33
## 7       7 67 67
## 8       8 58 42
## 9       9 67 90
## 10     10 56 57
#Gráfico de linhas
plot (Semana, A,
      type = "o",
      col = "#9bf2e2",
      lwd = 3,
      pch = 18,
      ylim = c (30,95),
      main = "Cotação das Ações",
      ylab = "Cotações")

lines (B,type = "o",
        col = "#c199de",
        lwd = 2,
        pch = 18)
legend(8.3, 45,
       c("Ações de A", "Ações de B"),
       col = c("#9bf2e2", "#c199de"),
       lty = 1,
       pch = 18,
       cex = 0.5)

#Comparando as ações das empresas A e B

#Média das Cotações

#Média de A
mean(A)
## [1] 61.5
#Média de B
mean(B)
## [1] 61.5
#Mediana de A
median(A)
## [1] 62
#Mediana de B
median (B)
## [1] 62
#Vamos fazer uma tabela simples para analisar
#a moda
table(A)
## A
## 56 57 58 61 63 67 
##  2  1  1  1  2  3
table (B)
## B
## 33 42 48 52 57 67 77 82 90 
##  1  1  1  1  1  2  1  1  1