La data elegida del presente trabajo trata sobre Ratios de Morosidad según días de incumplimiento de los meses: enero, febrero, marzo del años 2019, la cual tiene una extensión “xls” y forma parte de la base de datos de la SBS. La información estadística de Banca Múltiple registrada en la SBS la podemos encontrar [aquí] (http://www.sbs.gob.pe/app/stats_net/stats/EstadisticaBoletinEstadistico.aspx?p=1#)
library(readxl) #Cargo el paquete para leer Excel del tidyverse # parte de los paquetes que queremos usar
################ANTHONY MENDEZ- ALUMNO BEST###############
# OBJETIVO DE LA TAREA N2-BEST: Descargar 1 archivo de la SBS ####
#configurando mi directorio de trabajo!
setwd("C:/Users/ROCIO/Desktop/TAREAN2 BEST")
#copio la url de la SBS a usar sobre Ratios de Morosidad
fileUrl <- "http://intranet2.sbs.gob.pe/estadistica/financiera/2019/Enero/B-220512-en2019.XLS"
# Primero el caso por default
download.file(fileUrl,destfile="MOROSIDAD MALA.XLS")
# Ahora el caso con wb
download.file(fileUrl,destfile="MOROSIDAD.XLS",mode="wb")
mainDir <- “C:/Users/ROCIO/Desktop/TAREAN2 BEST” subDir <- “DATAMOROSIDAD” dir.create(file.path(mainDir, subDir), showWarnings = T)
subfolder_names <- c(“ENERO”,“FEBRERO”,“MARZO”) #cambiar a mi WD!!
mainDir <- “C:/Users/ROCIO/Desktop/TAREAN2 BEST/DATAMOROSIDAD”
for (j in 1:length(subfolder_names)){ dir.create(file.path(mainDir, subfolder_names[j]), showWarnings = T) }
setwd(“C:/Users/ROCIO/Desktop/TAREAN2 BEST/DATAMOROSIDAD/ENERO”) data_ENERO<- readLines(n=1) # leer las siguiente lineas http://intranet2.sbs.gob.pe/estadistica/financiera/2019/Enero/B-220512-en2019.XLS
for (i in data_ENERO) { destfile=strsplit(i,split=“/”) if (!file.exists(destfile[[1]][8])) { download.file(i,destfile[[1]][8],mode=“wb”) }
else print(“El archivo SBS ENERO 2019 esta descargado”)
}
setwd(“C:/Users/ROCIO/Desktop/TAREAN2 BEST/DATAMOROSIDAD/FEBRERO”) data_FEBRERO<- readLines(n=1) http://intranet2.sbs.gob.pe/estadistica/financiera/2019/Febrero/B-220512-fe2019.XLS
for (i in data_FEBRERO) { destfile=strsplit(i,split=“/”) if (!file.exists(destfile[[1]][8])) { download.file(i,destfile[[1]][8],mode=“wb”) } else print(“El archivo SBS FEBRERO 2019 esta descargado”)
}
setwd(“C:/Users/ROCIO/Desktop/TAREAN2 BEST/DATAMOROSIDAD/MARZO”) data_MARZO<- readLines(n=1) http://intranet2.sbs.gob.pe/estadistica/financiera/2019/Marzo/B-220512-ma2019.XLS
for (i in data_MARZO) { destfile=strsplit(i,split=“/”) if (!file.exists(destfile[[1]][8])) { download.file(i,destfile[[1]][8],mode=“wb”) } else print(“El archivo SBS MARZO 2019 esta descargado”)
} #HASTA AQUÍ LA PRIMERA PARTE DE LA TAREA###
library(readxl) #Cargo el paquete para leer Excel del tidyverse setwd(“C:/Users/ROCIO/Desktop/TAREAN2 BEST/DATAMOROSIDAD/ENERO”) # Configuro el directorio de trabajo! data<-readxl::read_xls(“B-220512-en2019.xls”) #carguemos la data de ENERO 2019 DE LA SBS MOROSIDAD View(data)
library(dplyr) library(tidyr)
data<-readxl::read_xls(“B-220512-en2019.xls”,skip = 6) ### QUITAMOS LAS PRIMERAS 6 LÍNEAS DEL EXCEL View(data) data<-data[complete.cases(data),] # USAMOS LA FUNCIÓN PARA USAR FILAS sin ESPACIOS VACÍOS complete.cases(data) View(data)
options(scipen=999) # DESACTIVAMOS LA NOMENCLATURA CIENTÍFICO DE NÚMEROS View(data) names(data) names(data)[7] #SELECCIONAMOS LA EMPRESA 7 data<-data[-7,] # quitamos la FILA 7
names(data) names(data)[15] #SELECCIONAMOS LA EMPRESA 15 data<-data[-15,] # quitamos la FILA 15
exc = !names(data) %in% “EMPRESAS” # Esta forma de elegir todo excepto una columna de un vector exc # va a aplicar todo excepto a la primera columna data[,exc] # ven? no aparece la columns “EMPRESAS” data[,exc] = sapply(data[,exc],as.character) # lo convierto a character. data[,exc] = sapply(data[,exc],as.numeric) # lo convierto a numerico data[,exc] = round(data[,exc],2) #redondeo a 2 cifras View(data)
Creamos una columna para todas las empresas del día de actualizando de la presente data data$Periodo= as.Date(“2019-03-26”) data View(data)
EMPRESAS <- c( “BBVA”,“B.del Comercio”, “BCP”, “Pichincha”,“BIF”,“Scotiabank”, “Interbank”,“Mibanco”, “GNB”,“Falabella”,“Santander”,“Ripley”,“Azteca”,“Cencosud”, “TOTAL BANCA MÚLTIPLE”) cbind(EMPRESAS, data)
data <- data.frame(EMPRESAS, data) data
ELIMINAR FILA 2 names(data) names(data)[2] data<-data[,-2]
CAMBIAR LOS NOMBRES en_filas(data)<-c(“EMPRESAS”, “BBVA”,“B.del Comercio”, “BCP”, “Pichincha”,“BIF”,“Scotiabank”, “Interbank”,“Mibanco”, “GNB”,“Falabella”,“Santander”,“Ripley”,“Azteca”,“Cencosud”, “TOTAL BANCA MÚLTIPLE”) View(data)
data$EMPRESAS[5]=“Morosidad según criterio contable SBS”
saveRDS(data,file=“DatalimpiaMorosidad.RDS”)
data(data)
CON ESTO DAMOS POR CULMINADO LA SEGUNDA PARTE DE LA TAREA###