Nas últimas aulas, fizemos várias atividades relacionadas à coleta de dados e ao uso do R Studio. O objetivo era aprender a armazenar, organizar e analisar dados de forma simples, além de entender as diferenças entre tipos de dados no R, como vetores numéricos e de caracteres.
No R, usamos vetores numéricos para armazenar dados que são números, como idades, e podemos realizar cálculos com eles, como somar ou calcular a média. Já os vetores de caracteres são usados para armazenar palavras ou categorias, como as formas de pagamento, e não permitem realizar cálculos, mas podemos manipular as informações de texto, como contar quantas vezes uma palavra aparece. A principal diferença é que vetores numéricos permitem operações matemáticas, enquanto vetores de caracteres são para dados textuais.
#idade da turma 3002
idade = c(17,17,16,16,16,17,17,17,17,18,17,16,18,17,16,18,18)
idade
## [1] 17 17 16 16 16 17 17 17 17 18 17 16 18 17 16 18 18
# Sobre possuir conta em banco
contabanc = c("s","s","s","s","s","n","n","s","s","s","s","s","s","s","s")
contabanc
## [1] "s" "s" "s" "s" "s" "n" "n" "s" "s" "s" "s" "s" "s" "s" "s"
O gráfico de barras serve para representar a quantidade ou frequência de categorias de dados de maneira clara e objetiva. No contexto da aula, ele foi utilizado para ilustrar a distribuição das respostas coletadas nos questionários.
Antes de fazer o gráfico, precisamos tratar os dados brutos e agrupa - los um tabela. No exemplo a baixo, faremos isso utilizando a função “table”
#fazendo uma tabela com "contabanc"
tabela = table (contabanc)
tabela
## contabanc
## n s
## 2 13
#gráfico de contabanc
meuprimeirografico =plot(tabela)
#gráfico de barras
grafbar = barplot(tabela,
main = "alunos da 3002 que possuem conta bancaria",
col = c("red"),
ylab = "frequencia absoluta")
xlab = "alunos"
#grafico para idade dos alunos
#tratamento dos dados - tabelar idades
tabidade = table (idade)
tabidade
## idade
## 16 17 18
## 5 8 4
grafidade = barplot(tabidade,
main = "idade dos alunos da 3002",
col = c("pink"),
ylab = "frequencia absoluta",
xlab = "Alunos")
O gráfico de setores, também conhecido como gráfico de pizza, é uma forma de representação gráfica usada para mostrar proporções ou porcentagens entre categorias de um conjunto de dados. Ele é bastante visual e intuitivo, o que o torna ideal para apresentar comparações simples de partes em relação a um todo.
#principal forma de pagamento
#vamos fazer uma tabela,para isso precisaremos dos vetores com informaçoes coletadas
variaveis = c("pix", "cŕedito", "débito", "dinheiro")
alunos = c(8, 2, 3, 4)
#tabela
formapg = data.frame(variaveis, alunos)
formapg
## variaveis alunos
## 1 pix 8
## 2 cŕedito 2
## 3 débito 3
## 4 dinheiro 4
#gráfico de setores para Principal forma de pagamento
grafformapg = pie (formapg$alunos,
labels = formapg$variaveis,
main = "Principal forma de pagamendo dos alunos da 3002",
col = c("#c70212", "#8f02c7", "#028fc7", "#02c719"))