library(rio)
library(ggplot2)
library(ggcorrplot)
library(reticulate)
##
## Attaching package: 'reticulate'
## The following object is masked from 'package:rio':
##
## import
use_python("C:/Users/Charles/anaconda3")
rm(list = ls())
linkinefi="https://github.com/bocchienjoyer/MaGODllanes/raw/main/ProyectoMagaDeidad/datita/costo_inefi_long.pkl"
pd<-import("pandas")
inefistats<- pd$read_pickle(linkinefi)
str(inefistats)
## 'data.frame': 100 obs. of 4 variables:
## $ ano : num 2006 2006 2006 2006 2007 ...
## $ CPRY_RANGOINVERSION: chr "< = 1 millón" "> 1 - 5 millón" "> 10 - 100 millones" "> 100 - 1,000 millones" ...
## $ variable : chr "npry_puntajeirimean" "npry_puntajeirimean" "npry_puntajeirimean" "npry_puntajeirimean" ...
## $ value : num 40 31.1 59.6 51.1 37.9 ...
## - attr(*, "pandas.index")=RangeIndex(start=0, stop=100, step=1)
graf1= ggplot(data=inefistats,
aes(x=ano,y=value,color=CPRY_RANGOINVERSION)) + theme_light() +
scale_y_log10(labels=scales::comma)
graf1 +
geom_smooth() +
facet_grid(variable~.,scales = 'free_y')
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

linkineficosto="https://github.com/bocchienjoyer/MaGODllanes/raw/main/ProyectoMagaDeidad/datita/most_inver_wide_def_def.csv"
most_costo<-pd$read_csv(linkineficosto)
str(most_costo)
## 'data.frame': 85 obs. of 4 variables:
## $ Unnamed: 0 : num 0 1 2 3 4 5 6 7 8 9 ...
## $ departamento : chr "AMAZONAS" "AMAZONAS" "AMAZONAS" "ANCASH" ...
## $ CPRY_RANGOINVERSION: chr "< = 1 millón" "> 1 - 5 millón" "> 5 - 10 millones" "< = 1 millón" ...
## $ casesum : num 1 10 2 3 13 3 9 1 2 1 ...
## - attr(*, "pandas.index")=RangeIndex(start=0, stop=85, step=1)
most_costo[order(-most_costo$casesum),]
## Unnamed: 0 departamento CPRY_RANGOINVERSION casesum
## 5 4 ANCASH > 1 - 5 millón 13
## 20 19 CUSCO > 1 - 5 millón 13
## 11 10 AREQUIPA > 1 - 5 millón 11
## 76 75 TACNA > 1 - 5 millón 11
## 2 1 AMAZONAS > 1 - 5 millón 10
## 32 31 ICA > 1 - 5 millón 10
## 45 44 LIMA > 1 - 5 millón 10
## 66 65 PIURA > 1 - 5 millón 10
## 7 6 APURIMAC > 1 - 5 millón 9
## 18 17 CAJAMARCA > 1 - 5 millón 9
## 38 37 LA LIBERTAD > 1 - 5 millón 9
## 62 61 PASCO > 1 - 5 millón 9
## 80 79 TUMBES > 1 - 5 millón 9
## 24 23 HUANCAVELICA > 1 - 5 millón 8
## 52 51 MADRE DE DIOS > 10 - 100 millones 8
## 54 53 MOQUEGUA > 1 - 5 millón 8
## 28 27 HUANUCO > 1 - 5 millón 7
## 34 33 JUNIN > 1 - 5 millón 7
## 70 69 PUNO > 1 - 5 millón 7
## 41 40 LAMBAYEQUE > 1 - 5 millón 6
## 44 43 LIMA < = 1 millón 6
## 48 47 LORETO > 1 - 5 millón 6
## 69 68 PUNO < = 1 millón 6
## 72 71 SAN MARTIN > 1 - 5 millón 6
## 13 12 AYACUCHO < = 1 millón 5
## 31 30 ICA < = 1 millón 5
## 33 32 JUNIN < = 1 millón 5
## 55 54 MOQUEGUA > 10 - 100 millones 5
## 58 57 P C DEL CALLAO > 1 - 5 millón 5
## 27 26 HUANUCO < = 1 millón 4
## 40 39 LAMBAYEQUE < = 1 millón 4
## 50 49 LORETO > 5 - 10 millones 4
## 51 50 MADRE DE DIOS > 1 - 5 millón 4
## 59 58 P C DEL CALLAO > 10 - 100 millones 4
## 74 73 SAN MARTIN > 10 - 100 millones 4
## 79 78 TUMBES < = 1 millón 4
## 81 80 UCAYALI < = 1 millón 4
## 4 3 ANCASH < = 1 millón 3
## 6 5 APURIMAC < = 1 millón 3
## 14 13 AYACUCHO > 1 - 5 millón 3
## 15 14 AYACUCHO > 10 - 100 millones 3
## 16 15 AYACUCHO > 5 - 10 millones 3
## 17 16 CAJAMARCA < = 1 millón 3
## 23 22 HUANCAVELICA < = 1 millón 3
## 35 34 JUNIN > 10 - 100 millones 3
## 39 38 LA LIBERTAD > 5 - 10 millones 3
## 49 48 LORETO > 10 - 100 millones 3
## 57 56 P C DEL CALLAO < = 1 millón 3
## 82 81 UCAYALI > 1 - 5 millón 3
## 84 83 UCAYALI > 100 - 1,000 millones 3
## 3 2 AMAZONAS > 5 - 10 millones 2
## 9 8 APURIMAC > 5 - 10 millones 2
## 12 11 AREQUIPA > 10 - 100 millones 2
## 19 18 CAJAMARCA > 10 - 100 millones 2
## 21 20 CUSCO > 10 - 100 millones 2
## 37 36 LA LIBERTAD < = 1 millón 2
## 42 41 LAMBAYEQUE > 10 - 100 millones 2
## 56 55 MOQUEGUA > 5 - 10 millones 2
## 61 60 PASCO < = 1 millón 2
## 68 67 PIURA > 5 - 10 millones 2
## 71 70 SAN MARTIN < = 1 millón 2
## 77 76 TACNA > 10 - 100 millones 2
## 78 77 TACNA > 5 - 10 millones 2
## 85 84 UCAYALI > 5 - 10 millones 2
## 1 0 AMAZONAS < = 1 millón 1
## 8 7 APURIMAC > 10 - 100 millones 1
## 10 9 AREQUIPA < = 1 millón 1
## 22 21 CUSCO > 5 - 10 millones 1
## 25 24 HUANCAVELICA > 10 - 100 millones 1
## 26 25 HUANCAVELICA > 5 - 10 millones 1
## 29 28 HUANUCO > 10 - 100 millones 1
## 30 29 HUANUCO > 5 - 10 millones 1
## 36 35 JUNIN > 5 - 10 millones 1
## 43 42 LAMBAYEQUE > 5 - 10 millones 1
## 46 45 LIMA > 10 - 100 millones 1
## 47 46 LIMA > 5 - 10 millones 1
## 53 52 MADRE DE DIOS > 5 - 10 millones 1
## 60 59 P C DEL CALLAO > 5 - 10 millones 1
## 63 62 PASCO > 10 - 100 millones 1
## 64 63 PASCO > 100 - 1,000 millones 1
## 65 64 PASCO > 5 - 10 millones 1
## 67 66 PIURA > 10 - 100 millones 1
## 73 72 SAN MARTIN > 1,000 millones 1
## 75 74 SAN MARTIN > 5 - 10 millones 1
## 83 82 UCAYALI > 10 - 100 millones 1
basecosto = ggplot(most_costo, aes(x = reorder(departamento,casesum), y = reorder(CPRY_RANGOINVERSION,casesum), fill=casesum)) + theme_classic()
heatDefault = basecosto + geom_tile() #here
Bettercosto=heatDefault +scale_fill_gradient(low = 'yellow',high = 'orange')
Bettercosto + theme(axis.text.x = element_text(angle = 60,vjust = 1,hjust = 1),
axis.text.y = element_text(size=4)) +
geom_text(aes(label=ifelse(casesum>=5,casesum,"")),
size=6,fontface='bold', color='white')

linkinefitipo="https://github.com/bocchienjoyer/MaGODllanes/raw/main/ProyectoMagaDeidad/datita/inefi_worst_tipo_wide_almost_def_def.csv"
inefi_tipo<-pd$read_csv(linkinefitipo)
inefi_tipo[order(-inefi_tipo$casesum),]
## Unnamed: 0 departamento tipo01 casesum
## 11 10 AREQUIPA Transportes Y Comunicaciones 12
## 52 51 LIMA Transportes Y Comunicaciones 11
## 6 5 ANCASH Transportes Y Comunicaciones 10
## 7 6 APURIMAC Educación/Cultura 10
## 83 82 TACNA Educación/Cultura 10
## 19 18 CAJAMARCA Vivienda Construcción Y Saneamiento 9
## 3 2 AMAZONAS Vivienda Construcción Y Saneamiento 8
## 24 23 HUANCAVELICA Educación/Cultura 8
## 28 27 HUANUCO Educación/Cultura 8
## 72 71 PASCO Transportes Y Comunicaciones 8
## 21 20 CUSCO Transportes Y Comunicaciones 7
## 44 43 LA LIBERTAD Educación/Cultura 7
## 77 76 PUNO Educación/Cultura 7
## 37 36 ICA Transportes Y Comunicaciones 6
## 41 40 JUNIN Transportes Y Comunicaciones 6
## 42 41 JUNIN Vivienda Construcción Y Saneamiento 6
## 56 55 LORETO Vivienda Construcción Y Saneamiento 6
## 58 57 MADRE DE DIOS Educación/Cultura 6
## 64 63 MOQUEGUA Educación/Cultura 6
## 67 66 P C DEL CALLAO Educación/Cultura 6
## 74 73 PIURA Educación/Cultura 6
## 78 77 PUNO Transportes Y Comunicaciones 6
## 79 78 SAN MARTIN Educación/Cultura 6
## 13 12 AYACUCHO Educación/Cultura 5
## 20 19 CUSCO Educación/Cultura 5
## 48 47 LAMBAYEQUE Transportes Y Comunicaciones 5
## 71 70 PASCO Educación/Cultura 5
## 81 80 SAN MARTIN Vivienda Construcción Y Saneamiento 5
## 93 92 UCAYALI Transportes Y Comunicaciones 5
## 94 93 UCAYALI Vivienda Construcción Y Saneamiento 5
## 15 14 AYACUCHO Transportes Y Comunicaciones 4
## 22 21 CUSCO Vivienda Construcción Y Saneamiento 4
## 45 44 LA LIBERTAD Transportes Y Comunicaciones 4
## 47 46 LAMBAYEQUE Educación/Cultura 4
## 49 48 LAMBAYEQUE Vivienda Construcción Y Saneamiento 4
## 51 50 LIMA Educación/Cultura 4
## 55 54 LORETO Transportes Y Comunicaciones 4
## 66 65 MOQUEGUA Transportes Y Comunicaciones 4
## 75 74 PIURA Transportes Y Comunicaciones 4
## 87 86 TUMBES Educación/Cultura 4
## 1 0 AMAZONAS Educación/Cultura 3
## 4 3 ANCASH Agricultura 3
## 5 4 ANCASH Educación/Cultura 3
## 9 8 APURIMAC Transportes Y Comunicaciones 3
## 12 11 AYACUCHO Agricultura 3
## 16 15 CAJAMARCA Educación/Cultura 3
## 25 24 HUANCAVELICA Transportes Y Comunicaciones 3
## 33 32 ICA Educación/Cultura 3
## 39 38 JUNIN Educación/Cultura 3
## 54 53 LORETO Educación/Cultura 3
## 63 62 MOQUEGUA Agricultura 3
## 69 68 P C DEL CALLAO Otras Infraestructuras 3
## 76 75 PIURA Vivienda Construcción Y Saneamiento 3
## 80 79 SAN MARTIN Transportes Y Comunicaciones 3
## 84 83 TACNA Otras Infraestructuras 3
## 89 88 TUMBES Otras Infraestructuras 3
## 90 89 TUMBES Transportes Y Comunicaciones 3
## 2 1 AMAZONAS Transportes Y Comunicaciones 2
## 8 7 APURIMAC Salud 2
## 10 9 AREQUIPA Educación/Cultura 2
## 14 13 AYACUCHO Otras Infraestructuras 2
## 30 29 HUANUCO Transportes Y Comunicaciones 2
## 32 31 ICA Agricultura 2
## 43 42 LA LIBERTAD Agricultura 2
## 50 49 LIMA Agricultura 2
## 61 60 MADRE DE DIOS Transportes Y Comunicaciones 2
## 62 61 MADRE DE DIOS Vivienda Construcción Y Saneamiento 2
## 65 64 MOQUEGUA Otras Infraestructuras 2
## 68 67 P C DEL CALLAO Orden Público/Defensa Y Seguridad 2
## 70 69 P C DEL CALLAO Transportes Y Comunicaciones 2
## 86 85 TUMBES Agricultura 2
## 91 90 UCAYALI Educación/Cultura 2
## 17 16 CAJAMARCA Energía Y Minas 1
## 18 17 CAJAMARCA Transportes Y Comunicaciones 1
## 23 22 HUANCAVELICA Agricultura 1
## 26 25 HUANCAVELICA Vivienda Construcción Y Saneamiento 1
## 27 26 HUANUCO Agricultura 1
## 29 28 HUANUCO Otras Infraestructuras 1
## 31 30 HUANUCO Vivienda Construcción Y Saneamiento 1
## 34 33 ICA Otras Infraestructuras 1
## 35 34 ICA Protección/Readaptación Social 1
## 36 35 ICA Salud 1
## 38 37 ICA Vivienda Construcción Y Saneamiento 1
## 40 39 JUNIN Salud 1
## 46 45 LA LIBERTAD Vivienda Construcción Y Saneamiento 1
## 53 52 LIMA Vivienda Construcción Y Saneamiento 1
## 57 56 MADRE DE DIOS Agricultura 1
## 59 58 MADRE DE DIOS Otras Infraestructuras 1
## 60 59 MADRE DE DIOS Salud 1
## 73 72 PASCO Vivienda Construcción Y Saneamiento 1
## 82 81 TACNA Agricultura 1
## 85 84 TACNA Transportes Y Comunicaciones 1
## 88 87 TUMBES Orden Público/Defensa Y Seguridad 1
## 92 91 UCAYALI Salud 1
basetipo = ggplot(inefi_tipo, aes(x = reorder(departamento,casesum), y = reorder(tipo01,casesum), fill=casesum)) + theme_classic()
heatDefault = basetipo + geom_tile() #here
Bettertipo=heatDefault +scale_fill_gradient(low = 'yellow',high = 'orange')
Bettertipo + theme(axis.text.x = element_text(angle = 60,vjust = 1,hjust = 1),
axis.text.y = element_text(size=4)) +
geom_text(aes(label=ifelse(casesum>=5,casesum,"")),
size=6,fontface='bold', color='white')
