Aprendemos sobre histograma, diagrama,histograma simétrico, medidas de posição e dispersão (média, mediana, moda, quartis, medidas de posição média para dados agrupados, mediana para dados agrupados), medidas de dispersão (amplitude, amplitude amostral, média, desvios da média, desvio padrão|populacional|amostral,desvio absoluto e variancia|populcional|amostral).
O histograma é uma representação gráfico da distribuição de frequência de uma variável qualitativa contínua agrupada em intervalos usando retangulo adjacentes.
Ao final de um trimestre, um professor de física registrou as seguintes notas de seus 35 alunos. Esse professor verificou que a média da turma foi aproximadamente 5,93 (a soma das notas=207,5 foi dividida com o total de alunos). Se ele acrescentar 1 ponto para cada aluno vai aumentar em 20% da nota de cada aluno da turma.
#notas de física
notas = c(0.8,2,2,2.5,2.5,3.5,4.5,5,5.4,5.5,5.5,5.5,6,6,6,6,6.3,6.5,6.8,6.8,7,7,7,7,7.3,7.3,7.5,7.5,7.5,7.5,7.8,8,8,8,8)
notas
## [1] 0.8 2.0 2.0 2.5 2.5 3.5 4.5 5.0 5.4 5.5 5.5 5.5 6.0 6.0 6.0 6.0 6.3 6.5 6.8
## [20] 6.8 7.0 7.0 7.0 7.0 7.3 7.3 7.5 7.5 7.5 7.5 7.8 8.0 8.0 8.0 8.0
#gráfico de barras com as notas de física
tabnotas = table(notas)
barplot (tabnotas)
hist (notas,
nclass = 5,
right = FALSE,
ylim = c(0,30),
col = c("violet", "black", "aquamarine", "purple"),
main = "Histograma das notas de física",
xlab = "Notas da turma",
ylab = "freq. Absoluta")
# Bonificação 1: aumentar 1 ponto
#novo conjujto de notas somado 1 ponto
notas1 = notas+1
notas1
## [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Bonificação 2: aumentar as notas em 20%
#novo conjunto de notas aumentando 20%
notas2 = notas*1.2
notas2
## [1] 0.96 2.40 2.40 3.00 3.00 4.20 5.40 6.00 6.48 6.60 6.60 6.60 7.20 7.20 7.20
## [16] 7.20 7.56 7.80 8.16 8.16 8.40 8.40 8.40 8.40 8.76 8.76 9.00 9.00 9.00 9.00
## [31] 9.36 9.60 9.60 9.60 9.60
# Bonificação 1: aumentar 1 ponto
#novo conjujto de notas somado 1 ponto
notas1 = notas+1
notas1
## [1] 1.8 3.0 3.0 3.5 3.5 4.5 5.5 6.0 6.4 6.5 6.5 6.5 7.0 7.0 7.0 7.0 7.3 7.5 7.8
## [20] 7.8 8.0 8.0 8.0 8.0 8.3 8.3 8.5 8.5 8.5 8.5 8.8 9.0 9.0 9.0 9.0
#Histograma da Bonificação 1
hist (notas1,
breaks = c(1,3,5,7,9),
right = FALSE,
ylim = c(0,30),
xlim = c(0,10),
col = c("violet", "black", "aquamarine", "purple"),
main = "Notas de Física somando 1",
xlab = "Notas da turma",
ylab = "freq. Absoluta")
#Histograma da Bonificação 2
hist(notas2,
breaks = c(0,2.4, 4.8, 7.2, 9.6),
right = FALSE,
ylim = c(0,30),
xlim = c(0,10),
col = c("violet", "black", "aquamarine", "purple"),
main = "Notas de Física aumentadas em 20%",
xlab = "Notas da turma",
ylab = "freq. Absoluta")
# Vetor com os 100 maiores salários líquidos mensais (em reais)
salarios <- c(
14688, 14792, 14876, 14912, 15008, 15121, 15188, 15202, 15245, 15300,
15312, 15398, 15422, 15487, 15505, 15534, 15545, 15602, 15656, 15667,
15687, 15702, 15728, 15755, 15769, 15802, 15845, 15900, 15955, 15989,
16000, 16022, 16034, 16088, 16123, 16167, 16202, 16256, 16300, 16345,
16400, 16422, 16430, 16487, 16520, 16566, 16602, 16645, 16689, 16700,
16733, 16765, 16789, 16800, 16845, 16867, 16889, 16900, 16945, 16967,
16988, 17000, 17022, 17045, 16890, 17066, 17089, 17100, 17145, 17189,
17202, 17222, 17256, 17289, 17300, 17322, 17345, 17366, 17389, 17400,
17433, 17456, 17467, 17489, 17500, 17545, 17556, 17567, 17578, 17600,
17622, 17633, 17645, 17667, 17689, 17700, 17733, 17789, 17845, 18515
)
#converter salários para mil reais
salarios_mil = salarios/1000
salarios_mil
## [1] 14.688 14.792 14.876 14.912 15.008 15.121 15.188 15.202 15.245 15.300
## [11] 15.312 15.398 15.422 15.487 15.505 15.534 15.545 15.602 15.656 15.667
## [21] 15.687 15.702 15.728 15.755 15.769 15.802 15.845 15.900 15.955 15.989
## [31] 16.000 16.022 16.034 16.088 16.123 16.167 16.202 16.256 16.300 16.345
## [41] 16.400 16.422 16.430 16.487 16.520 16.566 16.602 16.645 16.689 16.700
## [51] 16.733 16.765 16.789 16.800 16.845 16.867 16.889 16.900 16.945 16.967
## [61] 16.988 17.000 17.022 17.045 16.890 17.066 17.089 17.100 17.145 17.189
## [71] 17.202 17.222 17.256 17.289 17.300 17.322 17.345 17.366 17.389 17.400
## [81] 17.433 17.456 17.467 17.489 17.500 17.545 17.556 17.567 17.578 17.600
## [91] 17.622 17.633 17.645 17.667 17.689 17.700 17.733 17.789 17.845 18.515
#Histograma dos 100 maiores salarios de desenvolvedores no Br
hist (salarios_mil,
breaks = seq (14.6, 18.6, by = 0.4),
col = "#dc9be0",
main="histograma dos 100 maiores salarios de desenvolvedores",
xlab = "salarios (mil R$)",
ylab = "frequencia absoluta",
ylim = c(0, 30))
Boxplot, ou diagrama de caixa, é uma ferramenta gráfica utilizada para visualizar a distribuição de um conjunto de dados, mostrando a sua dispersão, tendência central e a presença de valores atípicos (outliers). Ele é formado por uma caixa que representa o intervalo interquartil (Q1 a Q3), uma linha dentro da caixa que indica a mediana (Q2), e “bigodes” que se estendem até os valores mínimo e máximo não considerados outliers.
e no final tem que colocar gráfico
Estrutura
#BOXplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
horizontal = TRUE,
col = "blue")
#criar uma base para receber dois graficos
par (mfrow = c(2,1) , mar = c(0, 4, 2, 1))
#Histograma dos 100 maiores salarios de desenvolvedores no Br
hist (salarios_mil,
breaks = seq (14.6, 18.6, by = 0.4),
col = "#dc9be0",
main="histograma dos 100 maiores salarios de desenvolvedores",
xlab = "salarios (mil R$)",
ylab = "frequencia absoluta",
ylim = c(0, 30))
#criar as mascações
#media
media = sum(salarios_mil)/100
media
## [1] 16.55744
#função que calcula a media
mean (salarios_mil)
## [1] 16.55744
#Quartis
q1 = salarios_mil[25]
q2 = salarios_mil[50]
q3 = salarios_mil[75]
#adicionar linhas no histograma
abline(v = media, col = "purple" , lwd = 2, lty = 2 )
abline(v = q1, col = "black" , lwd = 2, lty = 3 )
abline(v = q2, col = "brown" , lwd = 2, lty = 3 )
abline(v = q3, col = "red" , lwd = 2, lty = 3 )
text(15.77, 25, labels = "Q1")
text(16.7, 25, labels = "Q2")
text(17.3, 25, labels = "Q3")
text(16.5, 28, labels = "media", col = "red")
#BOXplot
par(mar = c(4,4,0,1))
boxplot(salarios_mil,
horizontal = TRUE,
col = "blue")
A = c(61, 56, 63, 57, 67, 63, 67, 58, 67, 56)
A =
B = c(67, 48, 52, 82, 77, 33, 67, 42, 90, 57)
B
## [1] 67 48 52 82 77 33 67 42 90 57
semana = c(1:10)
semana
## [1] 1 2 3 4 5 6 7 8 9 10
Estatiśtica discritiva Medidas de dispersão Quantificam o grau de variação ou espalhamento dos dados num conjunto, indicando o quão distantes os valores estão da média ou de uma outra medida central. As principais medidas incluem a amplitude, que é a diferença entre o valor máximo e mínimo; a variância, que representa a média dos quadrados dos desvios em relação à média; e o desvio-padrão, que é a raiz quadrada da variância e tem a mesma unidade dos dados originais.