Gráfico de estatistica

Nas aulas, realizamos uma série de atividades práticas com o objetivo de coletar dados e analisar informações utilizando o R Studio. O foco principal foi na coleta e organização dos dados, além de trabalhar com o armazenamento e manipulação de informações no sistema.

A primeira parte da aula consistiu na coleta de dados dos alunos, abordando diferentes aspectos demográficos e financeiros. As informações que foram coletadas são:

Forma de pagamento: foi perguntado aos alunos sobre a forma como realizam os pagamentos de seus produtos e serviços, classificando-os em diferentes categorias, como cartão de crédito, dinheiro, pix e débito

Idade dos alunos:foi recolhido a faixa etária de cada aluno para análise de possíveis padrões de comportamento relacionados à idade.

Possuem conta em banco: se os alunos possuem conta bancária, visando entender a relação entre a utilização de serviços bancários e os métodos de pagamento utilizados.

Armazenamento de dados no R

Após a coleta dos dados, a próxima etapa foi o armazenamento das informações no R Studio. Utilizamos variáveis para armazenar os dados coletados e empregamos vetores.

Em R, vetores são estruturas de dados que armazenam múltiplos valores de forma sequencial. Existem duas principais diferenças no uso de vetores, dependendo do tipo de dado que armazenam:

Vetores numéricos: São vetores que armazenam números (inteiros ou decimais). Esses vetores são utilizados quando queremos manipular valores quantitativos, como a idade dos alunos. Em R, ao criar um vetor numérico, ele automaticamente trata os valores de forma matemática, permitindo realizar cálculos diretamente sobre eles.

Exemplo:

#idade da turma 3002
idade = c(17,17,16,16,16,17,17,17,17,18,17,16,18,17,16,18,18)

idade
##  [1] 17 17 16 16 16 17 17 17 17 18 17 16 18 17 16 18 18

Vetores de caracteres: São vetores que armazenam texto, como nomes, formas de pagamento e informações qualitativas. Quando criamos vetores de caracteres, os dados são tratados como sequências de caracteres, o que impede que operações matemáticas sejam realizadas diretamente sobre eles.

Exemplo:

# Sobre possuir conta em banco

contabanc = c("s","s","s","s","s","n","n","s","s","s","s","s","s","s","s")

contabanc
##  [1] "s" "s" "s" "s" "s" "n" "n" "s" "s" "s" "s" "s" "s" "s" "s"

Grafico de barras

Um gráfico de barras é um tipo de gráfico usado para comparar valores entre diferentes categorias. Ele é muito usado porque é fácil de entender visualmente.Cada barra representa uma categoria (por exemplo: produtos, anos, regiões).O tamanho da barra (altura ou comprimento) representa o valor dessa categoria (por exemplo: quantidade vendida, número de pessoas, faturamento)

Tratamento de informações

O tratamento de informações na POSIT Cloud envolve as etapas que os dados passam dentro da plataforma para serem analisados, manipulados e visualizados. Isso é muito usado em projetos de ciência de dados, estatística e programação com R.

#fazendo uma tabela com "contabanc"
tabela = table (contabanc)
tabela
## contabanc
##  n  s 
##  2 13

Gráfico sobre conta bancária

#gráfico de contabanc
meuorimeirografico = plot (tabela)

#gráfico de barras
grafbar = barplot(tabela,
                  main = "Alunos da 3002 que possuem conta bancária",
                  col = c ("#ffc7c7"),
                  ylab = "frequẽncia absoluta")

                  xlab = "Alunos"

Gráfico sobre idade

#gráfico para idade dos alunos
#tratamento dos dados - tabelar idades
tabidade = table (idade)
tabidade
## idade
## 16 17 18 
##  5  8  4
grafidade = barplot(tabidade,
                    main = "Idade dos alunos da 3002",
                    col = c ("#9bc1eb"),
                    ylab = "frequẽncia absoluta",
                    xlab = "Alunos")

Gráfico de setores

É um tipo de gráfico usado para mostrar a proporção de cada categoria em relação ao todo. Cada “fatia” representa uma parte dos dados — como se fosse uma divisão de uma pizza.

Tratamento de informações

É o processo de coletar, organizar e representar dados em forma de gráfico de setores, que mostra a porcentagem de cada parte em relação ao todo.

#principal forma de pagamento
#vamos fazer uma tabela, para isso precisaremos dos vetores com as informações coletadas

variaveis = c("PIX", "Crédito","Débito", "Dinheiro")
alunos = c(8, 2, 3, 4)

Gráfico sobre formas de pagamento

#tabela
formapg = data.frame(variaveis, alunos)
formapg
##   variaveis alunos
## 1       PIX      8
## 2   Crédito      2
## 3    Débito      3
## 4  Dinheiro      4
#gráfico de setores para Principal forma de pagamento
grafformapg = pie (formapg$alunos,
                   labels = formapg$variaveis,
                   main = "Principal forma de pagamento dos alunos da 3002",
                   col = c("#cbf783", "#e283f7", "#f783bb", "#83d4f7"))