library(rio)
library(ggplot2)
library(ggcorrplot)
library(reticulate)
##
## Attaching package: 'reticulate'
## The following object is masked from 'package:rio':
##
## import
use_python("C:/Users/Charles/anaconda3")
rm(list = ls())
pd <- import("pandas")
ineficiencialink="https://github.com/bocchienjoyer/MaGODllanes/raw/main/ProyectoMagaDeidad/datita/worst_provyear_alto_frec.csv"
inefi_worst_prov<-read.csv(ineficiencialink)
str(inefi_worst_prov)
## 'data.frame': 83 obs. of 3 variables:
## $ departamento: chr "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
## $ provincia : chr "BAGUA" "CHACHAPOYAS" "LUYA" "UTCUBAMBA" ...
## $ casesum : int 4 3 1 5 1 1 4 7 1 2 ...
inefi_worst_prov[inefi_worst_prov$departamento=="LORETO",]
## departamento provincia casesum
## 53 LORETO ALTO AMAZONAS 1
## 54 LORETO LORETO 2
## 55 LORETO MAYNAS 10
inefi_worst_prov[order(-inefi_worst_prov$casesum),]
## departamento provincia casesum
## 52 LIMA LIMA 16
## 14 AREQUIPA AREQUIPA 14
## 59 MOQUEGUA MARISCAL NIETO 14
## 39 ICA ICA 13
## 60 P C DEL CALLAO PROV CONST DEL CALLAO 13
## 57 MADRE DE DIOS TAMBOPATA 12
## 46 LA LIBERTAD TRUJILLO 11
## 65 PIURA PIURA 11
## 80 TUMBES TUMBES 11
## 55 LORETO MAYNAS 10
## 63 PASCO PASCO 10
## 82 UCAYALI CORONEL PORTILLO 10
## 11 APURIMAC ABANCAY 9
## 48 LAMBAYEQUE CHICLAYO 9
## 77 TACNA TACNA 9
## 29 CUSCO LA CONVENCION 8
## 36 HUANUCO HUANUCO 8
## 44 JUNIN SATIPO 8
## 74 SAN MARTIN MOYOBAMBA 8
## 8 ANCASH HUARI 7
## 16 AYACUCHO HUAMANGA 7
## 32 HUANCAVELICA HUANCAVELICA 7
## 21 CAJAMARCA CAJAMARCA 6
## 42 JUNIN HUANCAYO 6
## 4 AMAZONAS UTCUBAMBA 5
## 13 APURIMAC COTABAMBAS 5
## 70 PUNO PUNO 5
## 76 TACNA JORGE BASADRE 5
## 1 AMAZONAS BAGUA 4
## 7 ANCASH HUARAZ 4
## 18 AYACUCHO HUANTA 4
## 23 CAJAMARCA HUALGAYOC 4
## 33 HUANCAVELICA TAYACAJA 4
## 49 LAMBAYEQUE LAMBAYEQUE 4
## 75 SAN MARTIN RIOJA 4
## 2 AMAZONAS CHACHAPOYAS 3
## 27 CUSCO CUSCO 3
## 37 HUANUCO LEONCIO PRADO 3
## 62 PASCO OXAPAMPA 3
## 69 PUNO EL COLLAO 3
## 83 UCAYALI PADRE ABAD 3
## 10 ANCASH SANTA 2
## 22 CAJAMARCA CHOTA 2
## 26 CUSCO CHUMBIVILCAS 2
## 28 CUSCO ESPINAR 2
## 45 LA LIBERTAD ASCOPE 2
## 54 LORETO LORETO 2
## 67 PUNO AZANGARO 2
## 71 PUNO SAN ROMAN 2
## 3 AMAZONAS LUYA 1
## 5 ANCASH ANTONIO RAYMONDI 1
## 6 ANCASH CARHUAZ 1
## 9 ANCASH RECUAY 1
## 12 APURIMAC ANDAHUAYLAS 1
## 15 AYACUCHO CANGALLO 1
## 17 AYACUCHO HUANCA SANCOS 1
## 19 AYACUCHO LA MAR 1
## 20 CAJAMARCA CAJABAMBA 1
## 24 CAJAMARCA SAN MARCOS 1
## 25 CUSCO ANTA 1
## 30 HUANCAVELICA ACOBAMBA 1
## 31 HUANCAVELICA CASTROVIRREYNA 1
## 34 HUANUCO AMBO 1
## 35 HUANUCO HUAMALIES 1
## 38 ICA CHINCHA 1
## 40 ICA PISCO 1
## 41 JUNIN CHANCHAMAYO 1
## 43 JUNIN JAUJA 1
## 47 LA LIBERTAD VIRU 1
## 50 LIMA HUAROCHIRI 1
## 51 LIMA HUAURA 1
## 53 LORETO ALTO AMAZONAS 1
## 56 MADRE DE DIOS MANU 1
## 58 MOQUEGUA ILO 1
## 61 PASCO DANIEL ALCIDES CARRION 1
## 64 PIURA HUANCABAMBA 1
## 66 PIURA SULLANA 1
## 68 PUNO CHUCUITO 1
## 72 SAN MARTIN LAMAS 1
## 73 SAN MARTIN MARISCAL CACERES 1
## 78 TACNA TARATA 1
## 79 TUMBES CONTRALMIRANTE VILLAR 1
## 81 TUMBES ZARUMILLA 1
baseHeat = ggplot(inefi_worst_prov, aes(x = reorder(departamento,casesum), y = reorder(provincia,casesum), fill=casesum)) + theme_classic()
heatDefault = baseHeat + geom_tile() #here
heatBetter=heatDefault +scale_fill_gradient(low = 'green',high = 'red')
heatBetter + theme(axis.text.x = element_text(angle = 60,vjust = 1,hjust = 1),
axis.text.y = element_text(size=4)) +
geom_text(aes(label=ifelse(casesum>=10,casesum,"")),
size=6,fontface='bold', color='white')
