Estatística descritiva - com figuras

Curso Ninja de Estatística Aplicada com R para Ciências da Saúde

Henrique Gomide
CREPEIA, PET - Psicologia

Antes de começar

Carregando o banco da aula e pacotes

dados  <- read.csv(file.choose(), header=TRUE, sep=",")
require(ggplot2)
require(lattice)

Uma imagem vale mais que mil palavras...

  1. Introdução ao gráficos no R
  2. Histogramas
  3. Gráficos de dispersão
  4. Gráficos de barra
  5. Boxplot

Exemplo

Introdução

  • Existem três pacotes principais para fazer gráficos: base, lattice e ggplot2
  • PQP eles são diferentes! No entanto, existem alguns parâmetros em comum!

Base e Lattice

  • Base - simples e mais fácil de usar. Bom para visualizar poucas variáveis
  • Lattice - feito para explorar relações mais complexas dos dados.

Histogramas

hist(dados$v3)

plot of chunk unnamed-chunk-2

Gráficos de dispersão

plot(dados$v3, dados$somaescala)

plot of chunk unnamed-chunk-3

Gráficos de barra

graphBar <- table(dados$v6)
barplot(graphBar)

plot of chunk unnamed-chunk-4

Boxplot

boxplot(dados$somaescala ~ dados$v9)

plot of chunk unnamed-chunk-5

Lattice

  • Formato típico tipodegrafico(formula, data = nome do banco de dados) A fórmula especifica o valor e os fatores para visualização. Exemplos:
  • ~ x | a - especifica a variável x para os fatores a (idade por gênero)
  • x ~ y | a*b - especifica a relação entre númericas x e y para as combinações dos fatores a e b (soma da escala por idade para gênero divido por religião)

Histogramas

histogram(~v3 | v6, data = dados)

plot of chunk unnamed-chunk-6

Gráficos de dispersão

xyplot(v3 ~ somaescala | v9, data = dados)

plot of chunk unnamed-chunk-7

Gráficos de barra

barchart(~v3 | v8, groups = v6, data = dados)

plot of chunk unnamed-chunk-8

Boxplot

bwplot(somaescala ~ v9 | v6, data = dados)

plot of chunk unnamed-chunk-9

título no gráfico- main

Um exemplo: histogramas

hist(dados$somaescala, main = "Título")

plot of chunk unnamed-chunk-10

rótulos dos eixos no gráfico- xlab e ylab

hist(dados$v3, main = "Título", xlab = "Idade em anos", ylab = "Frequência")

plot of chunk unnamed-chunk-11

limite dos eixos - xlab e ylab

hist(dados$v3, main = "Título", xlab = "Idade em anos", ylab = "Frequência", 
    xlim = c(0, 80), ylim = c(0, 40))

plot of chunk unnamed-chunk-12

cores - col

Você pode especificar cores através de index, names e hexadecimal. Aqui tem um guia

par(mfrow=c(1,3))
hist(dados$v3, main="Título", xlab="Idade em anos", ylab="Frequência", xlim=c(0,80), ylim=c(0,40), col="blue")
boxplot(dados$somaescala, dados$v6, col = "green")
plot(dados$somaescala, dados$v3, col = "red")
par(mfrow=c(1,1))

cores - col

plot of chunk unnamed-chunk-13

Referências