——————————————————————————————————————————————————————————–
Apaga variáveis do ambiente R:
rm(list=ls())
Carregando bibliotecas R:
Biblioteca para Densidade Empírica:
#install.packages(lattice)
library(lattice)
Biblioteca para Tabela de Distribuição de Frequências:
#install.packages("sm") # comando para instalação da biblioteca sm #
library("sm")
## Package 'sm', version 2.2-5.4: type help(sm) for summary information
LOCAL DA BASE DE DADOS: PENDRIVE (N:)
## [1] "N:/_IFMG/_MESTRADO/ANALISE_DE_DADOS/ex_02/producao_vegetal"
——————————————————————————————————————————————————————————–
Link IBGE - Séries Estatísticas: CLIQUE AQUI
FONTE: Para o exercício será utilizada uma tabela retirada do site do IBGE com uma série estatística da produção vegetal no Brasil de 1920 a 2006, com as seguintes características:
Seleção dos dados:
Resultado gráfico:
Download do arquivo XLS:
——————————————————————————————————————————————————————————–
PROCESSO DE IMPORTAÇÃO:
Arquivo EXCEL (xls)
Arquivo CSV
——————————————————————————————————————————————————————————–
Leitura do arquivo CSV:
TABPROVEG <- read.table(file="tabela_producao_vegetal_brasil_1940a2006.csv",header=TRUE,sep=";",row.names=1)
——————————————————————————————————————————————————————————–
CARACTERÍSTICAS DOS DADOS GERADOS VIA COMANDO read.table:
str(TABPROVEG)
## 'data.frame': 10 obs. of 13 variables:
## $ cafe : int 788488 1201186 1952774 4069493 1140510 2502219 2117351 3700004 2838195 2360756
## $ cacau : int 66883 108076 146728 169050 204478 301821 352998 428517 242104 199172
## $ laranja : int 0 6369859 4377451 6735669 15409983 22922586 39223245 59208455 78142437 11690719
## $ uva : int 0 114411 196651 358529 509361 546026 426598 109775 274213 828892
## $ algodao : int 332338 1168130 769528 956249 1261704 935979 1170597 2178455 814188 2350132
## $ arroz : int 831495 1196500 2784989 3762212 5271272 7548930 8086747 8986289 8047895 9447257
## $ cana : int 13985999 17920711 22920101 39857707 67759180 79959024 139584521 229882037 259806703 384165158
## $ feijao : int 725069 681147 1240075 1419602 1518846 1598252 1732044 2066556 1450570 3108983
## $ fumo : int 73647 52493 102772 153689 218816 292932 326191 408394 451418 1109036
## $ mandioca: int 2898570 6297669 9696517 15142094 14588768 11672739 11050601 12432171 9099213 16093942
## $ milho : int 4999697 5359863 6660680 8374406 12770216 14343556 15722581 17774404 25510505 42281800
## $ soja : int 0 1928 45023 216033 1884227 8721274 12757962 16730087 21563768 40712683
## $ trigo : int 87180 96885 364108 503715 1905961 1562819 2411724 3824288 1433116 2257598
class(TABPROVEG)
## [1] "data.frame"
print(TABPROVEG)
## cafe cacau laranja uva algodao arroz cana feijao
## 1920 788488 66883 0 0 332338 831495 13985999 725069
## 1940 1201186 108076 6369859 114411 1168130 1196500 17920711 681147
## 1950 1952774 146728 4377451 196651 769528 2784989 22920101 1240075
## 1960 4069493 169050 6735669 358529 956249 3762212 39857707 1419602
## 1970 1140510 204478 15409983 509361 1261704 5271272 67759180 1518846
## 1975 2502219 301821 22922586 546026 935979 7548930 79959024 1598252
## 1980 2117351 352998 39223245 426598 1170597 8086747 139584521 1732044
## 1985 3700004 428517 59208455 109775 2178455 8986289 229882037 2066556
## 1996 2838195 242104 78142437 274213 814188 8047895 259806703 1450570
## 2006 2360756 199172 11690719 828892 2350132 9447257 384165158 3108983
## fumo mandioca milho soja trigo
## 1920 73647 2898570 4999697 0 87180
## 1940 52493 6297669 5359863 1928 96885
## 1950 102772 9696517 6660680 45023 364108
## 1960 153689 15142094 8374406 216033 503715
## 1970 218816 14588768 12770216 1884227 1905961
## 1975 292932 11672739 14343556 8721274 1562819
## 1980 326191 11050601 15722581 12757962 2411724
## 1985 408394 12432171 17774404 16730087 3824288
## 1996 451418 9099213 25510505 21563768 1433116
## 2006 1109036 16093942 42281800 40712683 2257598
summary(TABPROVEG)
## cafe cacau laranja uva
## Min. : 788488 Min. : 66883 Min. : 0 Min. : 0
## 1st Qu.:1389083 1st Qu.:152309 1st Qu.: 6461312 1st Qu.:134971
## Median :2239054 Median :201825 Median :13550351 Median :316371
## Mean :2267098 Mean :221983 Mean :24408040 Mean :336446
## 3rd Qu.:2754201 3rd Qu.:286892 3rd Qu.:35148080 3rd Qu.:488670
## Max. :4069493 Max. :428517 Max. :78142437 Max. :828892
## algodao arroz cana feijao
## Min. : 332338 Min. : 831495 Min. : 13985999 Min. : 681147
## 1st Qu.: 844636 1st Qu.:3029295 1st Qu.: 27154502 1st Qu.:1284957
## Median :1062190 Median :6410101 Median : 73859102 Median :1484708
## Mean :1193730 Mean :5596359 Mean :125584114 Mean :1554114
## 3rd Qu.:1238927 3rd Qu.:8077034 3rd Qu.:207307658 3rd Qu.:1698596
## Max. :2350132 Max. :9447257 Max. :384165158 Max. :3108983
## fumo mandioca milho
## Min. : 52493 Min. : 2898570 Min. : 4999697
## 1st Qu.: 115501 1st Qu.: 9248539 1st Qu.: 7089112
## Median : 255874 Median :11361670 Median :13556886
## Mean : 318939 Mean :10897228 Mean :15379771
## 3rd Qu.: 387843 3rd Qu.:14049619 3rd Qu.:17261448
## Max. :1109036 Max. :16093942 Max. :42281800
## soja trigo
## Min. : 0 Min. : 87180
## 1st Qu.: 87776 1st Qu.: 399010
## Median : 5302750 Median :1497968
## Mean :10263298 Mean :1444739
## 3rd Qu.:15737056 3rd Qu.:2169689
## Max. :40712683 Max. :3824288
——————————————————————————————————————————————————————————–
Produção de CAFÉ:
stem(TABPROVEG$cafe,scale=2)
##
## The decimal point is 6 digit(s) to the right of the |
##
## 0 | 8
## 1 | 12
## 1 |
## 2 | 014
## 2 | 58
## 3 |
## 3 | 7
## 4 | 1
Produção de CACAU:
stem(TABPROVEG$cacau,scale=2)
##
## The decimal point is 5 digit(s) to the right of the |
##
## 0 | 7
## 1 | 1
## 1 | 57
## 2 | 004
## 2 |
## 3 | 0
## 3 | 5
## 4 | 3
Produção de LARANJA:
stem(TABPROVEG$laranja,scale=2)
##
## The decimal point is 7 digit(s) to the right of the |
##
## 0 | 0467
## 1 | 25
## 2 | 3
## 3 | 9
## 4 |
## 5 | 9
## 6 |
## 7 | 8
Produção de FUMO:
stem(TABPROVEG$fumo,scale=2)
##
## The decimal point is 5 digit(s) to the right of the |
##
## 0 | 5705
## 2 | 293
## 4 | 15
## 6 |
## 8 |
## 10 | 1
Produção de MILHO:
stem(TABPROVEG$milho,scale=2)
##
## The decimal point is 7 digit(s) to the right of the |
##
## 0 |
## 0 | 5578
## 1 | 34
## 1 | 68
## 2 |
## 2 | 6
## 3 |
## 3 |
## 4 | 2
Produção de SOJA:
stem(TABPROVEG$soja,scale=2)
##
## The decimal point is 7 digit(s) to the right of the |
##
## 0 | 00002
## 0 | 9
## 1 | 3
## 1 | 7
## 2 | 2
## 2 |
## 3 |
## 3 |
## 4 | 1
——————————————————————————————————————————————————————————–
vMILHO<-TABPROVEG$milho/1000 #coluna de produção de milho divida por 1000 (MIL)
xANOS<-row.names(TABPROVEG)
dmMILHO<-data.matrix(TABPROVEG[11],)/1000
——————————————————————————————————————————————————————————–
Sugestão do professor:
dotchart(vMILHO,main = "Produção de MILHO",cex=0.5,labels=xANOS)
dotchart(vMILHO[order(vMILHO)],main="Produção de MILHO (x1000 toneladas)",cex=0.5)
Usando data.matrix (data.matrix(TABPROVEG[11],) ao invés de referênciamento da coluna (vMILHO):
dotchart(dmMILHO,main="Produção de MILHO",cex=0.5,labels=xANOS)
dotchart(dmMILHO[order(dmMILHO)],main="Produção de MILHO (x1000 toneladas)",cex=0.5,labels=row.names(dmMILHO))
——————————————————————————————————————————————————————————–
paste(as.character(min(vMILHO)*1000)," TONELADAS")
## [1] "4999697 TONELADAS"
paste(as.character(max(vMILHO)*1000)," TONELADAS")
## [1] "42281800 TONELADAS"
binning(vMILHO) # sugerido pelo professor
## $x
## [1] 9659.96 18980.49 28301.01 37621.54
##
## $x.freq
## [1] 5 3 1 1
##
## $table.freq
## [1] 5 3 1 1
##
## $breaks
## [1] 4999.697 14320.223 23640.749 32961.274 42281.800
binning(vMILHO,as.numeric(row.names(TABPROVEG))) # PESQUISA: acrescido de y=ANOS DE PRODUÇÃO
## $x
## [1] 9659.96 18980.49 28301.01 37621.54
##
## $x.freq
## [1] 5 3 1 1
##
## $table.freq
## [1] 5 3 1 1
##
## $breaks
## [1] 4999.697 14320.223 23640.749 32961.274 42281.800
##
## $means
## [1] 1948 1980 1996 2006
##
## $sums
## [1] 9740 5940 1996 2006
##
## $devs
## [1] 1480 50 0 0
——————————————————————————————————————————————————————————–
hist(vMILHO)
hist(vMILHO,breaks=5,main="HISTOGRAMA",xlab="Produção MILHO (x1000 toneladas)",ylab="Frequência")
hist(vMILHO,
breaks=12,
col="lightgrey",
main="",
xlab="Produção MILHO (x1000 toneladas)",
ylab="Frequência")
rug(vMILHO)
hist(vMILHO, # com densidade empírica
freq=FALSE,
breaks=12,
col="lightgrey",
main="Com curva de Densidade Empírica",
xlab="Produção MILHO (toneladas)",
ylab="Frequência")
rug(jitter(vMILHO))
lines(density(vMILHO),col="red",lwd=2)
——————————————————————————————————————————————————————————–
densityplot(vMILHO)
——————————————————————————————————————————————————————————–
boxplot(vMILHO,col="lightgrey",ylab="Produção MILHO (toneladas)")
plot(row.names(dmMILHO),dmMILHO, type="l", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção")
grid()
plot(row.names(dmMILHO),dmMILHO, type="o", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção")
grid()
plot(row.names(dmMILHO),dmMILHO, type="o", main="Volume da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção",col="blue")
grid()
xSERIE <- rnorm(nrow(dmMILHO)) # cria uma série do mesmo comprimento da base de dados (dmMILHO)
seriePRODUCAO <- ts(xSERIE, start=c(dmMILHO[1],dmMILHO[nrow(dmMILHO)]), frequency=1)
seriePRODUCAO
## Time Series:
## Start = 47280.5
## End = 47289.5
## Frequency = 1
## [1] 0.85556766 -0.39658512 -0.24684625 0.63940221 0.22786702
## [6] 0.16325606 -0.96937223 -0.06713808 -0.38550387 -1.59229423
plot(row.names(dmMILHO),seriePRODUCAO, type="o", main="SIMULAÇÃO da produção de MILHO no BRASIL", ylab="Toneladas Produzidas (x1000))", xlab="Ano da Produção",col="blue")
grid()
——————————————————————————————————————————————————————————–
qqnorm(seriePRODUCAO, ylab = "quantis amostrais",xlab = "quantis teóricos")
qqline(seriePRODUCAO)
——————————————————————————————————————————————————————————–
dmMILHO
## milho
## 1920 4999.697
## 1940 5359.863
## 1950 6660.680
## 1960 8374.406
## 1970 12770.216
## 1975 14343.556
## 1980 15722.581
## 1985 17774.404
## 1996 25510.505
## 2006 42281.800
barplot(TABPROVEG$milho/10000,main="PRODUÇÃO DE MILHO - BRASIL - 1920 a 2006 (x10^7 toneladas)",horiz=TRUE)
barplot(TABPROVEG$milho/10000,main="PRODUÇÃO DE MILHO - BRASIL - 1920 a 2006 (x10^7 toneladas)",horiz=TRUE)
——————————————————————————————————————————————————————————–