——————————————————————————————————————————————————————————–

Apaga variáveis do ambiente R:

rm(list=ls())

Carregando bibliotecas R:

Biblioteca para Densidade Empírica:

#install.packages(lattice) 
library(lattice)

Biblioteca para Tabela de Distribuição de Frequências:

#install.packages("sm") # comando para instalação da biblioteca sm #
library("sm")
## Package 'sm', version 2.2-5.4: type help(sm) for summary information

LOCAL DA BASE DE DADOS: PENDRIVE (N:)

## [1] "N:/_IFMG/_MESTRADO/ANALISE_DE_DADOS/ex_02/producao_vegetal"

——————————————————————————————————————————————————————————–

Link IBGE - Séries Estatísticas: CLIQUE AQUI

FONTE: Para o exercício será utilizada uma tabela retirada do site do IBGE com uma série estatística da produção vegetal no Brasil de 1920 a 2006, com as seguintes características:

Seleção dos dados:

Resultado gráfico:

Download do arquivo XLS:

——————————————————————————————————————————————————————————–

PROCESSO DE IMPORTAÇÃO:

Arquivo EXCEL (xls)

Arquivo CSV

——————————————————————————————————————————————————————————–

Leitura do arquivo CSV:

TABPROVEG <- read.table(file="tabela_producao_vegetal_brasil_1940a2006.csv",header=TRUE,sep=";",row.names=1)

——————————————————————————————————————————————————————————–

CARACTERÍSTICAS DOS DADOS GERADOS VIA COMANDO read.table:

str(TABPROVEG)
## 'data.frame':    10 obs. of  13 variables:
##  $ cafe    : int  788488 1201186 1952774 4069493 1140510 2502219 2117351 3700004 2838195 2360756
##  $ cacau   : int  66883 108076 146728 169050 204478 301821 352998 428517 242104 199172
##  $ laranja : int  0 6369859 4377451 6735669 15409983 22922586 39223245 59208455 78142437 11690719
##  $ uva     : int  0 114411 196651 358529 509361 546026 426598 109775 274213 828892
##  $ algodao : int  332338 1168130 769528 956249 1261704 935979 1170597 2178455 814188 2350132
##  $ arroz   : int  831495 1196500 2784989 3762212 5271272 7548930 8086747 8986289 8047895 9447257
##  $ cana    : int  13985999 17920711 22920101 39857707 67759180 79959024 139584521 229882037 259806703 384165158
##  $ feijao  : int  725069 681147 1240075 1419602 1518846 1598252 1732044 2066556 1450570 3108983
##  $ fumo    : int  73647 52493 102772 153689 218816 292932 326191 408394 451418 1109036
##  $ mandioca: int  2898570 6297669 9696517 15142094 14588768 11672739 11050601 12432171 9099213 16093942
##  $ milho   : int  4999697 5359863 6660680 8374406 12770216 14343556 15722581 17774404 25510505 42281800
##  $ soja    : int  0 1928 45023 216033 1884227 8721274 12757962 16730087 21563768 40712683
##  $ trigo   : int  87180 96885 364108 503715 1905961 1562819 2411724 3824288 1433116 2257598
class(TABPROVEG)
## [1] "data.frame"
print(TABPROVEG)
##         cafe  cacau  laranja    uva algodao   arroz      cana  feijao
## 1920  788488  66883        0      0  332338  831495  13985999  725069
## 1940 1201186 108076  6369859 114411 1168130 1196500  17920711  681147
## 1950 1952774 146728  4377451 196651  769528 2784989  22920101 1240075
## 1960 4069493 169050  6735669 358529  956249 3762212  39857707 1419602
## 1970 1140510 204478 15409983 509361 1261704 5271272  67759180 1518846
## 1975 2502219 301821 22922586 546026  935979 7548930  79959024 1598252
## 1980 2117351 352998 39223245 426598 1170597 8086747 139584521 1732044
## 1985 3700004 428517 59208455 109775 2178455 8986289 229882037 2066556
## 1996 2838195 242104 78142437 274213  814188 8047895 259806703 1450570
## 2006 2360756 199172 11690719 828892 2350132 9447257 384165158 3108983
##         fumo mandioca    milho     soja   trigo
## 1920   73647  2898570  4999697        0   87180
## 1940   52493  6297669  5359863     1928   96885
## 1950  102772  9696517  6660680    45023  364108
## 1960  153689 15142094  8374406   216033  503715
## 1970  218816 14588768 12770216  1884227 1905961
## 1975  292932 11672739 14343556  8721274 1562819
## 1980  326191 11050601 15722581 12757962 2411724
## 1985  408394 12432171 17774404 16730087 3824288
## 1996  451418  9099213 25510505 21563768 1433116
## 2006 1109036 16093942 42281800 40712683 2257598
summary(TABPROVEG)
##       cafe             cacau           laranja              uva        
##  Min.   : 788488   Min.   : 66883   Min.   :       0   Min.   :     0  
##  1st Qu.:1389083   1st Qu.:152309   1st Qu.: 6461312   1st Qu.:134971  
##  Median :2239054   Median :201825   Median :13550351   Median :316371  
##  Mean   :2267098   Mean   :221983   Mean   :24408040   Mean   :336446  
##  3rd Qu.:2754201   3rd Qu.:286892   3rd Qu.:35148080   3rd Qu.:488670  
##  Max.   :4069493   Max.   :428517   Max.   :78142437   Max.   :828892  
##     algodao            arroz              cana               feijao       
##  Min.   : 332338   Min.   : 831495   Min.   : 13985999   Min.   : 681147  
##  1st Qu.: 844636   1st Qu.:3029295   1st Qu.: 27154502   1st Qu.:1284957  
##  Median :1062190   Median :6410101   Median : 73859102   Median :1484708  
##  Mean   :1193730   Mean   :5596359   Mean   :125584114   Mean   :1554114  
##  3rd Qu.:1238927   3rd Qu.:8077034   3rd Qu.:207307658   3rd Qu.:1698596  
##  Max.   :2350132   Max.   :9447257   Max.   :384165158   Max.   :3108983  
##       fumo            mandioca            milho         
##  Min.   :  52493   Min.   : 2898570   Min.   : 4999697  
##  1st Qu.: 115501   1st Qu.: 9248539   1st Qu.: 7089112  
##  Median : 255874   Median :11361670   Median :13556886  
##  Mean   : 318939   Mean   :10897228   Mean   :15379771  
##  3rd Qu.: 387843   3rd Qu.:14049619   3rd Qu.:17261448  
##  Max.   :1109036   Max.   :16093942   Max.   :42281800  
##       soja              trigo        
##  Min.   :       0   Min.   :  87180  
##  1st Qu.:   87776   1st Qu.: 399010  
##  Median : 5302750   Median :1497968  
##  Mean   :10263298   Mean   :1444739  
##  3rd Qu.:15737056   3rd Qu.:2169689  
##  Max.   :40712683   Max.   :3824288

——————————————————————————————————————————————————————————–

Gráfico de ramos e folhas

Produção de CAFÉ:

stem(TABPROVEG$cafe,scale=2)
## 
##   The decimal point is 6 digit(s) to the right of the |
## 
##   0 | 8
##   1 | 12
##   1 | 
##   2 | 014
##   2 | 58
##   3 | 
##   3 | 7
##   4 | 1

Produção de CACAU:

stem(TABPROVEG$cacau,scale=2)
## 
##   The decimal point is 5 digit(s) to the right of the |
## 
##   0 | 7
##   1 | 1
##   1 | 57
##   2 | 004
##   2 | 
##   3 | 0
##   3 | 5
##   4 | 3

Produção de LARANJA:

stem(TABPROVEG$laranja,scale=2)
## 
##   The decimal point is 7 digit(s) to the right of the |
## 
##   0 | 0467
##   1 | 25
##   2 | 3
##   3 | 9
##   4 | 
##   5 | 9
##   6 | 
##   7 | 8

Produção de FUMO:

stem(TABPROVEG$fumo,scale=2)
## 
##   The decimal point is 5 digit(s) to the right of the |
## 
##    0 | 5705
##    2 | 293
##    4 | 15
##    6 | 
##    8 | 
##   10 | 1

Produção de MILHO:

stem(TABPROVEG$milho,scale=2)
## 
##   The decimal point is 7 digit(s) to the right of the |
## 
##   0 | 
##   0 | 5578
##   1 | 34
##   1 | 68
##   2 | 
##   2 | 6
##   3 | 
##   3 | 
##   4 | 2

Produção de SOJA:

stem(TABPROVEG$soja,scale=2)
## 
##   The decimal point is 7 digit(s) to the right of the |
## 
##   0 | 00002
##   0 | 9
##   1 | 3
##   1 | 7
##   2 | 2
##   2 | 
##   3 | 
##   3 | 
##   4 | 1

——————————————————————————————————————————————————————————–

OBSERVAÇÃO:

  • Todos os modelos a seguir utilizarão a PRODUÇÃO DE MILHO (coluna 11):
  • Nome do vetor: vMILHO
  • ESCALA PRODUÇÃO (toneladas): 1:1000 (para melhor visualização gráfica)
  • Variável xANOS: utilizada para ilustrar os gráficos com a sequência de anos da série estatística
  • DataMatrix dmMILHO: Método de transformação da coluna MILHO em um modelo DATA.MATRIX do R (alternativa para gráficos e cálculos)
vMILHO<-TABPROVEG$milho/1000 #coluna de produção de milho divida por 1000 (MIL)
xANOS<-row.names(TABPROVEG)
dmMILHO<-data.matrix(TABPROVEG[11],)/1000

——————————————————————————————————————————————————————————–

Gráfico de Pontos: dotchar()

Sugestão do professor:

dotchart(vMILHO,main = "Produção de MILHO",cex=0.5,labels=xANOS)

dotchart(vMILHO[order(vMILHO)],main="Produção de MILHO (x1000 toneladas)",cex=0.5)

Usando data.matrix (data.matrix(TABPROVEG[11],) ao invés de referênciamento da coluna (vMILHO):

dotchart(dmMILHO,main="Produção de MILHO",cex=0.5,labels=xANOS)

dotchart(dmMILHO[order(dmMILHO)],main="Produção de MILHO (x1000 toneladas)",cex=0.5,labels=row.names(dmMILHO))

——————————————————————————————————————————————————————————–

Obtendo uma Tabela de Distribuição de Frequências:

paste(as.character(min(vMILHO)*1000)," TONELADAS")
## [1] "4999697  TONELADAS"
paste(as.character(max(vMILHO)*1000)," TONELADAS")
## [1] "42281800  TONELADAS"
binning(vMILHO) # sugerido pelo professor
## $x
## [1]  9659.96 18980.49 28301.01 37621.54
## 
## $x.freq
## [1] 5 3 1 1
## 
## $table.freq
## [1] 5 3 1 1
## 
## $breaks
## [1]  4999.697 14320.223 23640.749 32961.274 42281.800
binning(vMILHO,as.numeric(row.names(TABPROVEG))) # PESQUISA: acrescido de y=ANOS DE PRODUÇÃO
## $x
## [1]  9659.96 18980.49 28301.01 37621.54
## 
## $x.freq
## [1] 5 3 1 1
## 
## $table.freq
## [1] 5 3 1 1
## 
## $breaks
## [1]  4999.697 14320.223 23640.749 32961.274 42281.800
## 
## $means
## [1] 1948 1980 1996 2006
## 
## $sums
## [1] 9740 5940 1996 2006
## 
## $devs
## [1] 1480   50    0    0

——————————————————————————————————————————————————————————–

Histogramas:

1o. Exemplo (padrão):

hist(vMILHO)

2o. Exemplo (breaks=5):

hist(vMILHO,breaks=5,main="HISTOGRAMA",xlab="Produção MILHO (x1000 toneladas)",ylab="Frequência")

3o. Exemplo (colorido + rug):

hist(vMILHO,
     breaks=12,
     col="lightgrey",
     main="",
     xlab="Produção MILHO (x1000 toneladas)",
     ylab="Frequência")
rug(vMILHO)

4o. exemplo (breaks=12 + rug + jitter + lines):

hist(vMILHO, # com densidade empírica
     freq=FALSE,
     breaks=12,
     col="lightgrey",
     main="Com curva de Densidade Empírica",
     xlab="Produção MILHO (toneladas)",
     ylab="Frequência")
rug(jitter(vMILHO))
lines(density(vMILHO),col="red",lwd=2)

——————————————————————————————————————————————————————————–

Densidade Empírica:

densityplot(vMILHO)

——————————————————————————————————————————————————————————–

Boxplot:

boxplot(vMILHO,col="lightgrey",ylab="Produção MILHO (toneladas)")

Gráfico de linhas:

Exemplo 01 (type=l):

plot(row.names(dmMILHO),dmMILHO, type="l", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção")
grid()

Exemplo 02 (type=“o”):

plot(row.names(dmMILHO),dmMILHO, type="o", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção")
grid()

Exemplo 03 (colorido):

plot(row.names(dmMILHO),dmMILHO, type="o", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção",col="blue")
grid()

Exemplo 04 (SIMULAÇÃO DE SÉRIE):

xSERIE <- rnorm(nrow(dmMILHO)) # cria uma série do mesmo comprimento da base de dados (dmMILHO)
seriePRODUCAO <- ts(xSERIE, start=c(dmMILHO[1],dmMILHO[nrow(dmMILHO)]), frequency=1)
seriePRODUCAO
## Time Series:
## Start = 47280.5 
## End = 47289.5 
## Frequency = 1 
##  [1]  0.85556766 -0.39658512 -0.24684625  0.63940221  0.22786702
##  [6]  0.16325606 -0.96937223 -0.06713808 -0.38550387 -1.59229423
plot(row.names(dmMILHO),seriePRODUCAO, type="o", main="SIMULAÇÃO da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção",col="blue")
grid()

——————————————————————————————————————————————————————————–

GRÁFICO DE PROBABILIDADE

qqnorm(seriePRODUCAO, ylab = "quantis amostrais",xlab = "quantis teóricos")
qqline(seriePRODUCAO)

——————————————————————————————————————————————————————————–

GRÁFICO DE BARRAS

Exemplo 01 (Vertical):

dmMILHO
##          milho
## 1920  4999.697
## 1940  5359.863
## 1950  6660.680
## 1960  8374.406
## 1970 12770.216
## 1975 14343.556
## 1980 15722.581
## 1985 17774.404
## 1996 25510.505
## 2006 42281.800
barplot(TABPROVEG$milho/10000,main="PRODUÇÃO DE MILHO - BRASIL - 1920 a 2006 (x10^7 toneladas)",horiz=TRUE)

Exemplo 02 (Horizontal):

barplot(TABPROVEG$milho/10000,main="PRODUÇÃO DE MILHO - BRASIL - 1920 a 2006 (x10^7 toneladas)",horiz=TRUE)

——————————————————————————————————————————————————————————–