Introdução

Aprendemos sobre histograma, diagrama,histograma simétrico, medidas de posição e dispersão (média, mediana, moda, quartis, medidas de posição média para dados agrupados, mediana para dados agrupados), medidas de dispersão (amplitude, amplitude amostral, média, desvios da média, desvio padrão|populacional|amostral,desvio absoluto e variancia|populcional|amostral).

Grafico para variavies quantitativas contínuas

Histograma

O histograma é uma representação gráfico da distribuição de frequência de uma variável qualitativa contínua agrupada em intervalos usando retangulo adjacentes.

atividade 1: notas de fisica

Ao final de um trimestre, um professor de física registrou as seguintes notas de seus 35 alunos. Esse professor verificou que a média da turma foi aproximadamente 5,93 (a soma das notas=207,5 foi dividida com o total de alunos). Se ele acrescentar 1 ponto para cada aluno vai aumentar em 20% da nota de cada aluno da turma.

#notas de física

notas = c(0.8,2,2,2.5,2.5,3.5,4.5,5,5.4,5.5,5.5,5.5,6,6,6,6,6.3,6.5,6.8,6.8,7,7,7,7,7.3,7.3,7.5,7.5,7.5,7.5,7.8,8,8,8,8)
notas
##  [1] 0.8 2.0 2.0 2.5 2.5 3.5 4.5 5.0 5.4 5.5 5.5 5.5 6.0 6.0 6.0 6.0 6.3 6.5 6.8
## [20] 6.8 7.0 7.0 7.0 7.0 7.3 7.3 7.5 7.5 7.5 7.5 7.8 8.0 8.0 8.0 8.0
#gráfico de barras com as notas de física
tabnotas = table(notas)

barplot (tabnotas)

Histograma das notas de física

hist (notas,
      nclass = 5,
      right = FALSE,
      ylim = c(0,30),
      col = c("violet", "black", "aquamarine", "purple"),
      main = "Histograma das notas de física",
      xlab = "Notas da turma",
      ylab = "freq. Absoluta")

Bonificações

# Bonificação 1: aumentar 1 ponto
#novo conjujto de notas somado 1 ponto 
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Bonificação 2: aumentar as notas em 20%
#novo conjunto de notas aumentando 20%
notas2 = notas*1.2
notas2
##  [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60

Histograma da bonificação 1

# Bonificação 1: aumentar 1 ponto
#novo conjujto de notas somado 1 ponto 
notas1 = notas+1
notas1
##  [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Histograma da Bonificação 1
hist (notas1,
      breaks = c(1,3,5,7,9),
      right = FALSE,
      ylim = c(0,30),
      xlim = c(0,10),
      col = c("violet", "black", "aquamarine", "purple"),
      main = "Notas de Física somando 1",
      xlab = "Notas da turma",
      ylab = "freq. Absoluta")

Histograma da bonificação 2

#Histograma da Bonificação 2
hist(notas2,
    breaks = c(0,2.4, 4.8, 7.2, 9.6),
    right = FALSE,
    ylim = c(0,30),
    xlim = c(0,10),
    col = c("violet", "black", "aquamarine", "purple"),
    main = "Notas de Física aumentadas em 20%",
    xlab = "Notas da turma",
    ylab = "freq. Absoluta")

atividade 2: 100 melhores salarios de desenvolvedores de sofwares

# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
  14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
  15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
  15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
  16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
  16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
  16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
  16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
  17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
  17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
  17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)


#converter salários para mil reais

salarios_mil = salarios/1000

salarios_mil
##   [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
##  [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
##  [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
##  [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
##  [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
##  [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
##  [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
##  [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
##  [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
##  [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515
#Histograma dos 100 maiores salarios de desenvolvedores no Br
hist (salarios_mil,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main="histograma dos 100 maiores salarios de desenvolvedores",
      xlab = "salarios (mil R$)",
      ylab = "frequencia absoluta",
      ylim = c(0, 30))

Grafico para variaveis quantativas contínuas: Boxplot

Boxplot, ou diagrama de caixa, é uma ferramenta gráfica utilizada para visualizar a distribuição de um conjunto de dados, mostrando a sua dispersão, tendência central e a presença de valores atípicos (outliers). Ele é formado por uma caixa que representa o intervalo interquartil (Q1 a Q3), uma linha dentro da caixa que indica a mediana (Q2), e “bigodes” que se estendem até os valores mínimo e máximo não considerados outliers.

e no final tem que colocar gráfico

Estrutura

#BOXplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "blue")

Juntando os dois gráficos:

#criar uma base para receber dois graficos 
par (mfrow = c(2,1) , mar = c(0, 4, 2, 1))

#Histograma dos 100 maiores salarios de desenvolvedores no Br
hist (salarios_mil,
      breaks = seq (14.6, 18.6, by = 0.4),
      col = "#dc9be0",
      main="histograma dos 100 maiores salarios de desenvolvedores",
      xlab = "salarios (mil R$)",
      ylab = "frequencia absoluta",
      ylim = c(0, 30))




#criar as mascações
#media

media = sum(salarios_mil)/100
media 
## [1] 16.55744
#função que calcula a media 
mean (salarios_mil)
## [1] 16.55744
#Quartis

q1 = salarios_mil[25]
q2 = salarios_mil[50]
q3 = salarios_mil[75]

#adicionar linhas no histograma
abline(v = media, col = "purple" , lwd = 2, lty = 2 )
abline(v = q1, col = "black" , lwd = 2, lty = 3 )
abline(v = q2, col = "brown" , lwd = 2, lty = 3 )
abline(v = q3, col = "red"  ,  lwd = 2, lty = 3 )



text(15.77, 25, labels = "Q1")
text(16.7, 25, labels = "Q2")
text(17.3, 25, labels = "Q3")
text(16.5, 28, labels = "media", col = "red")





#BOXplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
        horizontal = TRUE,
        col = "blue")

Atividade 3 : analise das cotaçoẽs de duas empresas

A = c(61, 56, 63, 57, 67, 63, 67, 58, 67, 56)
A = 
  
B = c(67, 48, 52, 82, 77, 33, 67, 42, 90, 57)
B
##  [1] 67 48 52 82 77 33 67 42 90 57
semana = c(1:10)
semana
##  [1]  1  2  3  4  5  6  7  8  9 10

Estatiśtica discritiva Medidas de dispersão Quantificam o grau de variação ou espalhamento dos dados num conjunto, indicando o quão distantes os valores estão da média ou de uma outra medida central. As principais medidas incluem a amplitude, que é a diferença entre o valor máximo e mínimo; a variância, que representa a média dos quadrados dos desvios em relação à média; e o desvio-padrão, que é a raiz quadrada da variância e tem a mesma unidade dos dados originais.