require(DT) #para a fun??o datatable
require(tidyverse)
require(mice) #para imputação
require(broom.mixed)
require(broom)
require(lme4)
require(readxl)
require(tidyr)
require(factoextra) #para o PCA
require(redres) #para os residuos
require(geoR) #para o Box cox de dois parametros
require(corrplot)
#https://cran.r-project.org/web/packages/htree/htree.pdf
#install.packages("htree")
require(htree)
dados=read_excel("dados_renato.xlsx",sheet=1)
names(dados)=c("Ano","UF","Cod.UF","tx.latrc","tx.pres","gini.ibge","perc.jov.1524","perc.hom","pbf","densidade.urbana1","densidade.urbana2","taxa.casamentos","Taxa.desligamentos","raz.2020","raz.1040")
#datatable(dados,options = list(pageLength = 5))
Abordagem não paramétrica por Random Forest
variaveis = c("Cod.UF","Ano","tx.latrc","perc.jov.1524","pbf","gini.ibge","Taxa.desligamentos","perc.hom","densidade.urbana1","tx.pres","taxa.casamentos")
dados2=dados[complete.cases(dados),]%>%
select(variaveis)
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(variaveis)` instead of `variaveis` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
control=list(se=TRUE)
dados2=as.data.frame(dados2)
ff=hrf(x=dados2,id=dados2$Cod.UF,time=dados2$Ano,yindx=3,control=control,ntrees = 500,method="fracw",historical=TRUE)
Medida de importância das variáveis
# -- variable importance table
vi=varimp_hrf(ff,nperm=20)
teste =vi %>%
data.frame() %>%
arrange(desc(Z.value)) %>%
filter(Z.value > 0)%>%
filter(Predictor != "tx.latrc")
par(xpd = T)
cols=rainbow(nrow(teste))
x=barplot(teste$Z.value,main= "", col=cols, ylab="Z",yaxt='n')
barlab=teste$Z.value
ylab=teste$Z.value
text(x,ylab,labels=barlab, offset=.5,pos=3,xpd=TRUE)
legenda = teste$Predictor
legend(2,0,legend=legenda,fill=cols, bty='n',cex=0.8)