introducao

No período das aulas, estudamos como organizar e interpretar os números usando as ferramentas da estatística. O objetivo será aprender e entender como os dados se distribuindo e como podemos representá-los visualmente para tirar conclução de forma mais clara e eficiente.

grafico para variaveis quantitativas continuas

Esse tipo de gráfico para variáveis contínuas é praticado para representar os dados númericos que podem influenciar em qualquer valor dentro de um intervalo, como altura, peso, entre outros. Esse gráfico mostra como os valores podem ser distribuidos.

histograma

Um histograma é um gráfico que mostra como os dados numéricos estão distribuídos. Ele organiza os valores em intervalos de classe e usa barras para representar a frequência em cada intervalo. Assim, permite visualizar de forma clara a concentração, dispersão e formato da distribuição dos dados.

atividade 1: notas de fisica

As notas de Física da turma foram organizadas em tabela, gráfico de barras e histograma. Observou-se que a maioria dos alunos ficou entre 6 e 8 pontos. Com a bonificação de +1 ponto, toda a distribuição se deslocou para cima, beneficiando igualmente todos os alunos. Já a bonificação de +20% aumentou as notas proporcionalmente, favorecendo mais os alunos que já tinham notas mais altas.

#Notas de Física 

notas = c(0.8, 2, 2, 2.5, 2.5, 3.5, 4.5, 5, 5.4, 5.5, 5.5, 5.5, 6, 6, 6, 6, 6.3, 6.5, 6.8, 6.8, 7, 7, 7, 7, 7.3, 7.3, 7.5, 7.5, 7.5, 7.5, 7.8, 8, 8, 8, 8)
notas
##  [1] 0.8 2.0 2.0 2.5 2.5 3.5 4.5 5.0 5.4 5.5 5.5 5.5 6.0 6.0 6.0 6.0 6.3 6.5 6.8
## [20] 6.8 7.0 7.0 7.0 7.0 7.3 7.3 7.5 7.5 7.5 7.5 7.8 8.0 8.0 8.0 8.0
#Gráfico de barras com as notas de física
tabnotas = table(notas)

barplot (tabnotas)

#histogramas das notas de física
hist(notas,
     nclass = 5,
     right = FALSE,
     ylim = c(0,30),
     col = c("#d98f8f", "#b85c5c"),
     main = "Histogramadas das Notas de Física",
     xlab = "Notas daTurma",
     ylab = "Freq. Absoluta")

#Histograma das Notas de Física com Bonificação

#Bonificação 1: aumentar 1 ponto
#Novo conjunto de notas somado 1 ponto 
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Bonificação 2: aumentar as notas em 20%
#Novo conjunto de notas aumentados em 20%
notas2 = notas*1.2
notas2
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60
#Histograma de bonificação 1
hist(notas1,
     breaks = c(1,3,5,7,9),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#912424",
     main = "Notas de física Somado 1 ponto",
     xlab = "Notas da Turma",
     ylab = "Freq. Absoluta")

#Histograma de bonificação 2
hist(notas2,
     breaks = c(0,2.4,4.8,7.2,9.6),
     right = FALSE,
     ylim = c(0,30),
     xlim = c(0,10),
     col = "#331313",
     main = "Notas de física Aumentado em 20%",
     xlab = "Notas da Turma",
     ylab = "Freq. Absoluta")

atividade 2: 100 melhores salarios de desenvolvedores de software

Os 100 maiores salários de desenvolvedores de software no Brasil apresentam uma variação considerável, com alguns valores mais altos elevando a média geral. A distribuição mostra que a maioria dos salários se concentra em uma faixa intermediária, enquanto há poucos salários significativamente acima, funcionando como outliers. Isso evidencia que, mesmo entre os melhores salários, existem diferenças importantes relacionadas à experiência, especialização e posição no mercado.

# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)
# Converter salários para mil reais

salarios_mil = salarios/1000

salarios_mil
##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515
# Criar uma base para receber dois gráficos
par(mfrow = c(2,1), mar = c(4, 4, 2, 1))
# Histograma dos 100 maiores salários de desenvolvedores no br
hist(salarios_mil,
     breaks = seq(14.6, 18.6, by = 0.4),
     col = "#f73ec0",
     main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
     xlab = "Salários (mil R$)",
     ylab = "Freq. Absoluta",
     xlim = c(14, 19),
     ylim = c(0, 22))

#Criar as marcações
#Média

media = sum(salarios_mil)/100
media
## [1] 16.55744
# Função de calcular média
mean(salarios_mil)
## [1] 16.55744
# Quartis

q1 = salarios_mil[25]
q2 = salarios_mil[50]
q3 = salarios_mil[75]

boxplot

Um barplot é um gráfico de barras utilizado para representar dados categóricos, ou seja, informações que estão divididas em grupos ou categorias. Cada categoria é representada por uma barra, e o tamanho da barra indica a quantidade, frequência ou valor associado àquela categoria. Esse tipo de gráfico permite comparar visualmente diferentes categorias de forma rápida e clara, mostrando quais têm valores maiores ou menores. Além disso, um barplot pode ser vertical ou horizontal, e cores diferentes podem ser usadas para destacar informações específicas.

#Boxplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#67d1f5")


abline(v = media, col ="#cc46db", lwd = 2, lty = 2)

Juntando dois gráficos

# Criar uma base para receber dois gráficos
par(mfrow = c(2,1), mar = c(4, 4, 2, 1))

# Histograma dos 100 maiores salários de desenvolvedores no br
hist(salarios_mil,
     breaks = seq(14.6, 18.6, by = 0.4),
     col = "#f73ec0",
     main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
     xlab = "Salários (mil R$)",
     ylab = "Freq. Absoluta",
     xlim = c(14, 19),
     ylim = c(0, 30))




#adicionar linhas no histograma
abline( v = media, col = "pink", lwd = 2, lty = 2)
abline(v = q1, col = "purple", lwd = 2, lty = 3)
abline(v = q2, col = "purple", lwd = 2, lty = 3)
abline(v = q3, col = "purple",)

text(15.77, 25, labels = "Q1", cex = 0.6)
text(16.7, 25, labels = "Q2", cex = 0.6)
text(17.3, 25, labels = "Q3", cex = 0.6)
text(16.5, 28, labels = "Média", cex = 0.6, col = "blue")



#Boxplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "#67d1f5")

Atividade3:Criação dos vetores - Cotação das empresas A e B

O estudo das ações das empresas A e B ao longo de 10 semanas mostra que as cotações de A são mais estáveis, enquanto B apresenta maior volatilidade. A média e a mediana ajudam a identificar a tendência central de cada ação, e a moda indica os valores mais frequentes. O gráfico de linhas permite visualizar a evolução das cotações, destacando diferenças entre as duas empresas ao longo do período.

#Criação de vetores
A= c(61,56,63,57,67,63,67,58,67,56)
A
##  [1] 61 56 63 57 67 63 67 58 67 56
B= c(67,48,52,82,77,33,67,42,90,57)
B
##  [1] 67 48 52 82 77 33 67 42 90 57
semana = c(1:10)
semana
##  [1]  1  2  3  4  5  6  7  8  9 10

Juntar as informações em uma tabela

As informações das cotações das ações das empresas A e B foram organizadas em uma tabela, com cada coluna representando uma ação e cada linha correspondendo a uma semana. Essa estrutura facilita a visualização, comparação e análise estatística dos dados ao longo do tempo.

acoes = data.frame(semana, A, B)
acoes
##    semana  A  B
## 1       1 61 67
## 2       2 56 48
## 3       3 63 52
## 4       4 57 82
## 5       5 67 77
## 6       6 63 33
## 7       7 67 67
## 8       8 58 42
## 9       9 67 90
## 10     10 56 57

Cotação de açoes: Gráfico de linhas

O gráfico de linhas mostra a evolução das cotações das ações das empresas A e B ao longo das semanas. Cada ponto representa a cotação em uma semana, e as linhas conectam os pontos, evidenciando tendências e variações. Ele permite comparar visualmente a estabilidade da ação A com a maior volatilidade da ação B.

plot (semana, A,
      type = "o",
      col = "purple",
      lwd = 2,
      pch = 18,
      ylim = c(30, 95),
      main = "Cotação das ações",
      ylab = "Cotações")

lines (B, type = "o",
       col = "red",
       lwd = 2,
       pch = 18)
legend(8.3,45, c("Ações de A", "Ações de B"),
       col = c("purple", "red"),
       lty = 1,
       pch = 18,
       cex = 0.5)