Sobre o Boxplot
O boxplot é uma maneira padronizada de exibir a distribuição de um conjunto de dados com base em seu resumo de cinco números de pontos de dados: o “mínimo”, primeiro quartil [Q1], mediana, terceiro quartil [Q3] e “máximo”
os Boxplots podem dizer-lhe sobre seus outliers e quais são seus valores. Eles também podem informar se seus dados são simétricos, quão estreitamente seus dados estão agrupados e se e como seus dados estão distorcidos.
como funciona o calculo do boxplot
Mediana (percentil Q2/50): O valor médio do conjunto de dados
Primeiro quartil (percentil Q1/25): O número médio entre o menor número (não o “mínimo”) e a mediana do conjunto de dados.
Terceiro quartil (percentil Q3/75): O valor médio entre a mediana e o valor mais alto (não o “máximo”) do conjunto de dados.
Intervalo Interquartil (IIQ): percentil 25 a 75.
*Outliers: observações fora do normal, são mostrados como circulo.
Mínimo: Q1 - 1.5*IQR
Máximo: Q3 + 1.5*IQ
codigo do trabalho a ser realizado por mim
#Passo 1 - importação do arquivo que será utilizado
library(readxl)## Warning: package 'readxl' was built under R version 4.2.3
questionario_usp <- read_excel("C:/Users/14086606798/Downloads/questionario_usp.xlsx")
View(questionario_usp)Usaremos o boxplot da linguagem R.
foi feito dois tipos de graficos para serem avaliados.
Gráfico 1 - se refere a idade dos estudantes versus o numeros de filhos.
# duvida apresentada 1 - quantos filhos possui os estudantes e sua idade
boxplot(questionario_usp$Idade ~ questionario_usp$Filhos,
col = c ("tan","salmon", "purple"),
main = "Gráfico 1 - boxplot por idade de quem tem filhos")Conclusão 1
possui 4 outliers no numero 1 de filhos. O maior numero de filhos são 2 entre a faixa etaria dos 18 até 22.
Gráfico 2 - se refere a idade dos estudantes versus o numeros de horas expostos a Tv.
# duvida apresentada 2 - quantas horas de Tv quanta idade realiza
boxplot(questionario_usp$Idade ~ questionario_usp$TV,
col = c ("red","orange", "yellow","green","blue","purple",
"salmon","grey","brown","#4393C3","#2166AC"),
main = " Gráfico 2 - boxplot por idade versus horas assistidas de tv")Conclusão 2
Entre o numero de horas assistidas de 10 horas e 14 horas, possui dois outliers.