title: “Relatorio 2 trimestre” output: “Raiara” date: “2025-07-28” 0utput: hrml_documentos toc: true toc_float: true theme: cerulean

#INTROCUÇÂO ;ASSUNTOS ABORDADOS O que é histograma?

Um histograma é um gráfico de barras que representa a distribuição de frequência de um conjunto de dados.Ele agrupa os dados em intervalos (classes) e mostra a frequência com que cada intervalo ocorre.

O que são medidas de posição?

São medidas que visam resumir um conjunto de dados em geral em uma única medida em algum lugar geométrico entre os extremos observados do conjunto (mínimo e máximo). Média: soma dos valores do conjunto dividida pelo número de observações. Mediana: valor que ocupa a posição central dos dados ordenados. Moda: é a observação mais frequente de um conjunto de dados.

O que são medidas de dispersão?

medidas que buscam avaliar quão dispersos são os dados em alguns valores situados entre os dados coletados, as medidas de dispersão buscam avaliar quão dispersos são os dados coletados.Amplitude amostral: diferença entre o maior valor. Distância entre quartis: a diferença entre o 3° e o 1° quartis de uma distribuição. Desvio médio: um desvio da média a diferença entre uma observação e a média.Desvio médio absoluto: medida dos desvios da média tomados em valor absoluto.Variância e desvio pardrão: A variância é definida como uma média dos desvios da média elevados ao quadrado.

Gráficos para variáveis quantitativas

Histograma

O que são histogramas? O histograma é uma representação gráfica da distribuição de frequências de uma variável quantitativa contínua agrupada em intervalos usando retângulos adjacentes. Nas nossas aulas, nós usamos as notas e física dos alunos para fazermos o histograma.

Atividade 1: notas de física

Nessa atividade, nós usamos notas de físicas dos alunos para criar o histograma e com as infromações.

Histograma das notas de Física

Notas de Física

notas = c(0.8,2,2,2.5,2.5,3.5,4.5,5,5.4,5.5,5.5,5.5,6,6,6,6,6.3,6.5,6.8,6.8,7,7,7,7,7.3,7.3,7.5,7.5,7.5,7.5,7.8,8,8,8,8)


# Gráfico de barras com as notas de Física

tabnotas = table(notas)

barplot(tabnotas)

##bonificações

## Histograma das notas de Física
hist(notas,
     nclass = 5,
     right = FALSE,
     ylim = c(0,30),
     col = c ("purple"),
     main = "histograma das notas de fisica",
     xlab = "Notas da turma",
     ylab = "freq. Absoluta")

## bonificaçoẽs

# Bonificação 1 : aumentar um ponto nas notas 

#novo conjunto de notas somado 1 ponto
notas1 = notas+1
notas1

##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0

##(1) 1.8 3.0 3.0 3.5 3.5 4.4 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 .7.8
##(20)7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0

#Bonificação 2 : aumentar as notas em 20% 
#novo conjunto de notas aumentando 20%
notas2 = notas*1.2
notas2

##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60

## histograma de bonificação 

``` r
#histograma de bonificação 1 
hist(notas1,
     breaks = c(1,3,5,7,9),
     right = FALSE,
     ylim = c (0,30),
     xlim = c(0,10),
     col = "purple",
     main = "notas de fisica somando 1 ponto ",
     xlab = "notas da turma",
     ylab = "freq.Absoluta")

#histograma da Bonificação 2 
hist(notas2,
     breaks = c(0,2.4,4.8,7.2,9.6),
     right = FALSE,
     ylim = c (0,30),
     xlim = c(0,10),
     col = "purple",
     main = "notas de fisica aumentado 20%",
     xlab = "notas da turma",
     ylab = "freq.Absoluta")

##Histograma de bonificação 1 hist(notas1, breaks = c(1,3,5,7,9), right = FALSE, ylim = c (0,30), xlim = c(0,10), col = “purple”,

Boxplot

O que é um boxplot?

Um boxplot, também conhecido como diagrama de caixa, é um gráfico estatístico que representa visualmente a distribuição de dados numéricos. Ele mostra a dispersão dos dados, a mediana, os quartis (Q1, Q3), e os valores máximos e mínimos, permitindo identificar outliers.

Boxplot

# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)


#converter salários  para mil reais 

salarios_mil = salarios/1000

salarios_mil

##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515

par(mar = c (4, 4, 0,1))
boxplot (salarios_mil,
         horizontal = TRUE,
         col = "purple")

Logo após nós fizemos as marcações, calculamos a média, colocamos os quartis e as linhas no histograma

# Histograma dos 100 maiores salários de desenvolvedores no BR
hist (salarios_mil ,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
      xlab = "Salários (mil R$)",
      ylab = "Frequência Absoluta" ,
      ylim = c(0, 30)
      )


#Criar as marcações
#Média

media = sum (salarios_mil)/100
media

## [1] 16.55744

#Função que calcula média
mean (salarios_mil)

## [1] 16.55744

#Quartis

ql = salarios_mil [25]
q2 = salarios_mil [50]
q3 = salarios_mil [75]

#Adicionar linhas no histograma
abline(v = media, col = "#0fd1be", lwd = 2, lty = 2)
abline(v = ql, col = "pink", lwd = 2, lty = 3)
abline(v = q2, col = "pink", lwd = 2, lty = 3)
abline(v = q3, col = "pink", lwd = 2, lty = 3)


text (15.77, 25, labels = "Ql", cex = 0.6)
text (16.7, 25, labels = "Q2", cex = 0.6)
text (17.3, 25, labels = "Q3", cex = 0.6)
text (16.5, 28, labels= "Média" , cex = 0.6, col= "red")

Boxplot

O que é um boxplot? Um boxplot, também conhecido como diagrama de caixa, é um gráfico estatístico que representa visualmente a distribuição de dados numéricos. Ele mostra a dispersão dos dados, a mediana, os quartis (Q1, Q3), e os valores máximos e mínimos, permitindo identificar outliers.

Boxplot dos 100 salários

E por fim, Nós fizemos o Boxplot com os salários

par(mar = c (4, 4, 0,1))
boxplot (salarios_mil,
         horizontal = TRUE,
         col = "purple")

Juntando os dois gráficos

# Criar uma base para receber dois gráficos
par(mfrow = c(2,1) , mar = c (0, 4, 2, 1))

# Histograma dos 100 maiores salários de desenvolvedores no BR
hist (salarios_mil ,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main = "Histograma dos 100 maiores salários de desenvolvedores de software no Brasil",
      xlab = "Salários (mil R$)",
      ylab = "Frequência Absoluta" ,
      ylim = c(0, 30)
      )



#Criar as marcações
#Média

media = sum (salarios_mil)/100
media

## [1] 16.55744

#Função que calcula média
mean (salarios_mil)

## [1] 16.55744

#Quartis

ql = salarios_mil [25]
q2 = salarios_mil [50]
q3 = salarios_mil [75]

#Adicionar linhas no histograma
abline(v = media, col = "#0fd1be", lwd = 2, lty = 2)
abline(v = ql, col = "pink", lwd = 2, lty = 3)
abline(v = q2, col = "pink", lwd = 2, lty = 3)
abline(v = q3, col = "pink", lwd = 2, lty = 3)


text (15.77, 25, labels = "Ql", cex = 0.6)
text (16.7, 25, labels = "Q2", cex = 0.6)
text (17.3, 25, labels = "Q3", cex = 0.6)
text (16.5, 28, labels= "Média" , cex = 0.6, col= "red")

#Boxplot
par(mar = c (4, 4, 0,1))
boxplot (salarios_mil,
         horizontal = TRUE,
         col = "purple")
         

abline (v = media, col = "red", lwd = 2, lty = 2)

Atividade 3: Cotação das empresas

Na atividade 3 nós fizemos a cotação das empresas. Nós criamos os vetores, juntamos as informações em uma tabela, criamos um gráfico de linhas,comparamos as ações das empresas, fizemos a média das cotações e, por fim, fizemos uma tabela simples para analisar os dados.

#Criação dos vetores - Cotação das empresas A e B
A = c(61, 56, 63, 57, 67, 63, 67, 58, 67, 56)
A

##  [1] 61 56 63 57 67 63 67 58 67 56

B = c(67, 48, 52, 82, 77, 33, 67, 42, 90, 57)
B

##  [1] 67 48 52 82 77 33 67 42 90 57

Semana = c(1:10)
Semana

##  [1]  1  2  3  4  5  6  7  8  9 10

#Juntar as informações em uma tabela
acoes = data.frame(Semana, A, B)
acoes

##    Semana  A  B
## 1       1 61 67
## 2       2 56 48
## 3       3 63 52
## 4       4 57 82
## 5       5 67 77
## 6       6 63 33
## 7       7 67 67
## 8       8 58 42
## 9       9 67 90
## 10     10 56 57

#Gráfico de linhas
plot (Semana, A,
      type = "o",
      col = "#9bf2e2",
      lwd = 3,
      pch = 18,
      ylim = c (30,95),
      main = "Cotação das Ações",
      ylab = "Cotações")

lines (B,type = "o",
        col = "#c199de",
        lwd = 2,
        pch = 18)
legend(8.3, 45,
       c("Ações de A", "Ações de B"),
       col = c("#9bf2e2", "#c199de"),
       lty = 1,
       pch = 18,
       cex = 0.5)

#Comparando as ações das empresas A e B

#Média das Cotações

#Média de A
mean(A)

## [1] 61.5

#Média de B
mean(B)

## [1] 61.5

#Mediana de A
median(A)

## [1] 62

#Mediana de B
median (B)

## [1] 62

#Vamos fazer uma tabela simples para analisar
#a moda
table(A)

## A
## 56 57 58 61 63 67 
##  2  1  1  1  2  3

table (B)

## B
## 33 42 48 52 57 67 77 82 90 
##  1  1  1  1  1  2  1  1  1