O primeiro passo para realizarmos o cálculo das tabelas de frequência é importar o banco de dados. Para isso, é preciso selecionar a pasta de origem do arquivo em Session -> Set Working Directory -> Choose Directory. Depois, basta digitar o comando para importar o banco de dados, de acordo com o formato do arquivo, criando um objeto.
knitr::opts_chunk$set(echo = TRUE)
dados <- read.csv2("ex_freq.csv", stringsAsFactors = TRUE, fileEncoding = 'UTF-8')
Para visualizar o banco de dados, basta utilizar a função View(), ou print().
View(dados)
print(dados)
## SÉRIE SEXO Classe_Socioeconomica AF_Classificacao
## 1 2ª Série Feminino C2 Ativo
## 2 2ª Série Feminino C1 Inativo
## 3 3ª Série Feminino C2 Inativo
## 4 3ª Série Masculino C2 Ativo
## 5 3ª Série Feminino B2 Ativo
## 6 3ª Série Feminino C2 Ativo
## 7 3ª Série Feminino C2 Ativo
## 8 2ª Série Feminino B1 Inativo
## 9 1ª Série Feminino C2 Ativo
## 10 3ª Série Masculino C2 Inativo
## 11 3ª Série Feminino DE Inativo
## 12 3ª Série Feminino C2 Ativo
## 13 3ª Série Feminino C2 Ativo
## 14 2ª Série Masculino DE Ativo
## 15 2ª Série Masculino B2 Inativo
## 16 2ª Série Feminino B2 Ativo
## 17 3ª Série Feminino C2 Inativo
## 18 2ª Série Feminino B1 Ativo
## 19 2ª Série Masculino B2 Inativo
## 20 2ª Série Feminino DE Inativo
## 21 3ª Série Masculino C1 Inativo
## 22 2ª Série Feminino C1 Ativo
## 23 2ª Série Masculino B2 Ativo
## 24 3ª Série Feminino DE Ativo
## 25 2ª Série Feminino C1 Inativo
## 26 1ª Série Feminino B2 Ativo
## 27 1ª Série Feminino B1 Ativo
## 28 2ª Série Feminino B2 Ativo
## 29 1ª Série Feminino B2 Inativo
## 30 2ª Série Masculino B2 Ativo
## 31 2ª Série Feminino DE Ativo
## 32 1ª Série Feminino B2 Ativo
## 33 1ª Série Feminino C2 Ativo
## 34 2ª Série Feminino B2 Ativo
## 35 2ª Série Masculino C2 Ativo
## 36 2ª Série Feminino B1 Inativo
## 37 1ª Série Feminino B2 Inativo
## 38 2ª Série Masculino C1 Inativo
## 39 1ª Série Masculino C1 Ativo
## 40 3ª Série Masculino DE Inativo
## 41 1ª Série Feminino C1 Inativo
## 42 1ª Série Masculino C2 Inativo
## 43 2ª Série Masculino DE Inativo
## 44 2ª Série Masculino B2 Ativo
## 45 2ª Série Masculino C2 Ativo
## 46 2ª Série Feminino C2 Inativo
## 47 2ª Série Masculino C1 Ativo
## 48 2ª Série Masculino B1 Ativo
## 49 3ª Série Feminino C1 Ativo
## 50 2ª Série Feminino C1 Ativo
Agora, podemos calcular as Tabelas de Frequência.
Para o nosso exemplo, vamos calcular a Frequência Absoluta da Classe Socioeconômica. Para isso, faremos uso da função table().
t1 <- table(dados$Classe_Socioeconomica)
t1
##
## B1 B2 C1 C2 DE
## 5 13 10 15 7
Com o resultado obtido, sabemos agora que a classe com maior frequência é a classe C2.
COntinuaremos trabalhando com a Classe Socioeconômica para a Frequência Relativa. Para isso, faremos uso do objeto salvo como t1, e da função prop.table().
t2 <- prop.table(t1)
t2
##
## B1 B2 C1 C2 DE
## 0.10 0.26 0.20 0.30 0.14
Com o resultado obtido, sabemos, por exemplo, que a classe B1, equivale à 10% da nossa amostra.
A Frequência Acumulada usualmente é reportada a partir dos valores percentuais de cada categoria. Para isso, faremos uso do objeto t2, que contém a frequência relativa de cada categoria da variável Classe Socioeconômica, e da função cumsum().
t3 <- cumsum(t2)
t3
## B1 B2 C1 C2 DE
## 0.10 0.36 0.56 0.86 1.00
Com o resultado, agora temos acesso à frequência acumulada da nossa variável de interesse, sem precisar fazer uso do Excel ou calculadora.
As Tabelas de Frequência Cruzada, também chamadas de Tabelas de Contigência, nos artigos, fazem uso de mais de duas ou mais variáveis. No R, é possível calcular o cruzamento de duas variáveis sem precisar instalar qualquer pacote adicional. Para isso, usaremos as variáveis Sexo e Classificação do nível de Atividade Física, e a função table().
t4 <- table(dados$SEXO, dados$AF_Classificacao)
t4
##
## Ativo Inativo
## Feminino 20 12
## Masculino 10 8
Com o resultado, sabemos, por exemplo, que existem 20 pessoas do sexo Feminino que são ativas no lazer, e 10 pessoas do sexo Masculino que são ativos no lazer.
Esta é a forma de obter as principais Tabelas de Frequência no R base, exigidas em artigos científicos para variáveis qualitativas.