La base de datos IFC Investment Services Projects
contiene información detallada sobre los proyectos de inversión
gestionados por la Corporación Financiera Internacional (IFC), una
entidad del Grupo Banco Mundial.
Este conjunto de datos proporciona detalles sobre las inversiones
realizadas en diferentes países y sectores, permitiendo analizar la
distribución de los fondos, los tipos de productos financieros
utilizados y el impacto de estas inversiones a nivel global.
La IFC sigue desarrollando nuevos productos financieros para ayudar a las empresas a gestionar riesgos y acceder a los mercados de capital nacionales e internacionales. Estas inversiones buscan fomentar el crecimiento sostenible, reducir la pobreza y promover el emprendimiento.
🔗 Fuente de los Datos: IFC Investment Services Projects
A continuación, se describen las variables incluidas en la base de datos:
Variable | Descripción | Tipo |
---|---|---|
date_disclosed |
Fecha en que el registro fue publicado por primera vez. | DATE |
project_name |
Nombre del proyecto de inversión. | STRING |
document_type |
Tipo de documento asociado al proyecto. | STRING |
project_number |
Código único que identifica el proyecto. | STRING |
project_url |
Enlace a la página del proyecto en el sitio web de la IFC. | STRING |
product_line |
Tipo de producto financiero ofrecido por la IFC. | STRING |
company_name |
Nombre de la empresa beneficiaria de la inversión. | STRING |
country |
País donde se ejecuta la inversión o servicio. | STRING |
ifc_country_code |
Código del país según la clasificación de la IFC. | STRING |
industry |
Sector económico del proyecto, basado en el estándar NAICS. | STRING |
environmental_category |
Categoría de impacto ambiental del proyecto según las políticas de la IFC. | STRING |
department |
Departamento del Grupo Banco Mundial responsable del proyecto. | STRING |
status |
Estado actual del proyecto. | STRING |
projected_board_date |
Fecha estimada para la aprobación del proyecto por la Junta de la IFC. | DATE |
ifc_approval_date |
Fecha de aprobación del proyecto por la IFC. | DATE |
ifc_signed_date |
Fecha en que se firmó el acuerdo de inversión. | DATE |
ifc_invested_date |
Fecha en que la IFC realizó la inversión. | DATE |
ifc_investment_for_risk_management_million_usd |
Inversión en productos diseñados para mitigar riesgos financieros mediante derivados. | NUMBER |
ifc_investment_for_guarantee_million_usd |
Inversión en garantías para respaldar obligaciones financieras. | NUMBER |
ifc_investment_for_loan_million_usd |
Monto de préstamos otorgados en el proyecto. | NUMBER |
ifc_investment_for_equity_million_usd |
Monto de inversión en participación accionaria. | NUMBER |
total_ifc_investment_as_approved_by_board_million_usd |
Suma total de la inversión aprobada para el proyecto. | NUMBER |
wb_country_code |
Código del país según la clasificación del Banco Mundial. | STRING |
as_of_date |
Fecha en la que se tomó el estado de los datos. | DATE |
El análisis de esta base de datos permitirá:
Este análisis contribuirá a una mejor comprensión de las tendencias globales en financiamiento de proyectos y su impacto en el desarrollo sostenible.
datos <- read_csv("C:/Users/franc/Downloads/Dataviz/ifc_investment_services_projects_02-09-2025.csv")
## Rows: 6498 Columns: 24
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (18): Date Disclosed, Project Name, Document Type, Project Url, Product ...
## dbl (6): Project Number, IFC investment for Risk Management(Million - USD),...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
summary(datos)
## Date Disclosed Project Name Document Type Project Number
## Length:6498 Length:6498 Length:6498 Min. : 3402
## Class :character Class :character Class :character 1st Qu.: 24129
## Mode :character Mode :character Mode :character Median : 31565
## Mean : 34009
## 3rd Qu.: 41269
## Max. :574447
##
## Project Url Product Line Company Name Country
## Length:6498 Length:6498 Length:6498 Length:6498
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## IFC Country Code Industry Environmental Category
## Length:6498 Length:6498 Length:6498
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
##
## Department Status Projected Board Date IFC Approval Date
## Length:6498 Length:6498 Length:6498 Length:6498
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## IFC Signed Date IFC Invested Date
## Length:6498 Length:6498
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## IFC investment for Risk Management(Million - USD)
## Min. : 0.000
## 1st Qu.: 1.000
## Median : 2.200
## Mean : 5.598
## 3rd Qu.: 5.000
## Max. :100.000
## NA's :6309
## IFC investment for Guarantee(Million - USD)
## Min. : 0.000
## 1st Qu.: 7.425
## Median : 25.315
## Mean : 105.573
## 3rd Qu.: 100.000
## Max. :1500.000
## NA's :6140
## IFC investment for Loan(Million - USD)
## Min. : 0.00
## 1st Qu.: 10.00
## Median : 25.00
## Mean : 46.39
## 3rd Qu.: 52.43
## Max. :1000.00
## NA's :1868
## IFC investment for Equity(Million - USD)
## Min. : 0.00
## 1st Qu.: 3.00
## Median : 10.00
## Mean : 22.39
## 3rd Qu.: 25.00
## Max. :1003.00
## NA's :4250
## Total IFC investment as approved by Board(Million - USD) WB Country Code
## Min. : 0.02 Length:6498
## 1st Qu.: 10.00 Class :character
## Median : 25.00 Mode :character
## Mean : 48.65
## 3rd Qu.: 50.00
## Max. :1500.00
## NA's :249
## As of Date
## Length:6498
## Class :character
## Mode :character
##
##
##
##
dim(datos)
## [1] 6498 24
str(datos)
## spc_tbl_ [6,498 × 24] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ Date Disclosed : chr [1:6498] "03/30/2023" "12/04/2014" "04/30/2013" "04/19/2010" ...
## $ Project Name : chr [1:6498] "BOP EU Tchad" "Millicom Tchad SA" "Chad Clinic" "Aubaine Graphic SA Printing Chad" ...
## $ Document Type : chr [1:6498] "Summary of Investment Information (AIP Policy 2012)" "Summary of Investment Information (AIP Policy 2012)" "Summary of Investment Information (AIP Policy 2012)" "Summary of Proposed Investment (Disclosure Policy 2006)" ...
## $ Project Number : num [1:6498] 45483 34297 32607 29084 29317 ...
## $ Project Url : chr [1:6498] "https://disclosures.ifc.org/project-detail/SII/45483/bop-eu-tchad" "https://disclosures.ifc.org/project-detail/SII/34297/millicom-tchad-sa" "https://disclosures.ifc.org/project-detail/SII/32607/chad-clinic" "https://disclosures.ifc.org/project-detail/SPI/29084/aubaine-graphic-sa-printing-chad" ...
## $ Product Line : chr [1:6498] "Loan" "Loan" "Loan" "Loan" ...
## $ Company Name : chr [1:6498] "EXPRESS UNION TCHAD" "MOOV AFRICA TCHAD SA" "CLINIQUE PROVIDENCE" "Imprimerie Aubaine Graphic" ...
## $ Country : chr [1:6498] "Chad" "Chad" "Chad" "Chad" ...
## $ IFC Country Code : chr [1:6498] "CHD" "CHD" "CHD" "CHD" ...
## $ Industry : chr [1:6498] "Financial Institutions" "Telecommunications, Media, and Technology" "Health and Education" "Agribusiness and Forestry" ...
## $ Environmental Category : chr [1:6498] "FI-3" "B" "B" "B" ...
## $ Department : chr [1:6498] "Regional Industry - FIG Africa" "TMT, Venture Capital & Funds" "Regional Industry - MAS Africa" "Regional Industry - MAS Africa" ...
## $ Status : chr [1:6498] "Active" "Completed" "Active" "Completed" ...
## $ Projected Board Date : chr [1:6498] "05/01/2023" "05/27/2014" "05/30/2013" "05/20/2010" ...
## $ IFC Approval Date : chr [1:6498] "06/12/2023" "05/30/2014" "05/06/2015" "06/28/2010" ...
## $ IFC Signed Date : chr [1:6498] "06/26/2023" "06/06/2014" "05/27/2015" "06/30/2010" ...
## $ IFC Invested Date : chr [1:6498] "07/17/2024" "08/22/2014" "12/30/2015" "02/22/2012" ...
## $ IFC investment for Risk Management(Million - USD) : num [1:6498] NA NA NA NA NA NA NA NA NA NA ...
## $ IFC investment for Guarantee(Million - USD) : num [1:6498] NA NA NA NA NA NA NA 1 NA NA ...
## $ IFC investment for Loan(Million - USD) : num [1:6498] 1.03 76.06 1.38 2.83 3.08 ...
## $ IFC investment for Equity(Million - USD) : num [1:6498] NA NA NA NA NA NA NA NA NA NA ...
## $ Total IFC investment as approved by Board(Million - USD): num [1:6498] 1.03 76.06 1.38 2.83 3.08 ...
## $ WB Country Code : chr [1:6498] "TD" "TD" "TD" "TD" ...
## $ As of Date : chr [1:6498] "02/09/2025" "02/09/2025" "02/09/2025" "02/09/2025" ...
## - attr(*, "spec")=
## .. cols(
## .. `Date Disclosed` = col_character(),
## .. `Project Name` = col_character(),
## .. `Document Type` = col_character(),
## .. `Project Number` = col_double(),
## .. `Project Url` = col_character(),
## .. `Product Line` = col_character(),
## .. `Company Name` = col_character(),
## .. Country = col_character(),
## .. `IFC Country Code` = col_character(),
## .. Industry = col_character(),
## .. `Environmental Category` = col_character(),
## .. Department = col_character(),
## .. Status = col_character(),
## .. `Projected Board Date` = col_character(),
## .. `IFC Approval Date` = col_character(),
## .. `IFC Signed Date` = col_character(),
## .. `IFC Invested Date` = col_character(),
## .. `IFC investment for Risk Management(Million - USD)` = col_double(),
## .. `IFC investment for Guarantee(Million - USD)` = col_double(),
## .. `IFC investment for Loan(Million - USD)` = col_double(),
## .. `IFC investment for Equity(Million - USD)` = col_double(),
## .. `Total IFC investment as approved by Board(Million - USD)` = col_double(),
## .. `WB Country Code` = col_character(),
## .. `As of Date` = col_character()
## .. )
## - attr(*, "problems")=<externalptr>
names(datos)
## [1] "Date Disclosed"
## [2] "Project Name"
## [3] "Document Type"
## [4] "Project Number"
## [5] "Project Url"
## [6] "Product Line"
## [7] "Company Name"
## [8] "Country"
## [9] "IFC Country Code"
## [10] "Industry"
## [11] "Environmental Category"
## [12] "Department"
## [13] "Status"
## [14] "Projected Board Date"
## [15] "IFC Approval Date"
## [16] "IFC Signed Date"
## [17] "IFC Invested Date"
## [18] "IFC investment for Risk Management(Million - USD)"
## [19] "IFC investment for Guarantee(Million - USD)"
## [20] "IFC investment for Loan(Million - USD)"
## [21] "IFC investment for Equity(Million - USD)"
## [22] "Total IFC investment as approved by Board(Million - USD)"
## [23] "WB Country Code"
## [24] "As of Date"
datos %<>% clean_names
nombres <- list(
date_disclosed = "fecha_divulgada",
project_name = "nombre_proyecto",
document_type = "tipo_documento",
project_number = "numero_proyecto",
project_url = "url_proyecto",
product_line = "linea_producto",
company_name = "nombre_empresa",
country = "pais",
ifc_country_code = "codigo_pais_ifc",
industry = "industria",
environmental_category = "categoria_ambiental",
department = "departamento",
status = "estado",
projected_board_date = "fecha_estimada_junta",
ifc_approval_date = "fecha_aprobacion_ifc",
ifc_signed_date = "fecha_firma_ifc",
ifc_invested_date = "fecha_inversion_ifc",
ifc_investment_for_risk_management_million_usd = "inversion_ifc_gestion_riesgo_millones_usd",
ifc_investment_for_guarantee_million_usd = "inversion_ifc_garantia_millones_usd",
ifc_investment_for_loan_million_usd = "inversion_ifc_prestamo_millones_usd",
ifc_investment_for_equity_million_usd = "inversion_ifc_capital_millones_usd",
total_ifc_investment_as_approved_by_board_million_usd = "total_inversion_ifc_aprobada_junta_millones_usd",
wb_country_code = "codigo_pais_bm",
as_of_date = "fecha_corte"
)
names(datos) <- unname(nombres[names(datos)]) #colocar los nombres en español
## Warning: The `value` argument of `names<-()` must be a character vector as of tibble
## 3.0.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
missmap(datos, main="Mapa de Datos Faltantes")
#porcentaje de NAs
# Calcular el porcentaje de valores NA por columna
# Ordenar de mayor a menor
na_percent_sorted <- sort(colSums(is.na(datos)) / nrow(datos) * 100, decreasing = TRUE)
# Mostrar los resultados
na_percent_sorted
## inversion_ifc_gestion_riesgo_millones_usd
## 97.0914127
## inversion_ifc_garantia_millones_usd
## 94.4906125
## inversion_ifc_capital_millones_usd
## 65.4047399
## inversion_ifc_prestamo_millones_usd
## 28.7473069
## fecha_estimada_junta
## 13.6503540
## fecha_inversion_ifc
## 12.7885503
## codigo_pais_ifc
## 12.0806402
## fecha_firma_ifc
## 6.7867036
## codigo_pais_bm
## 4.9707602
## linea_producto
## 3.8473376
## total_inversion_ifc_aprobada_junta_millones_usd
## 3.8319483
## fecha_aprobacion_ifc
## 3.2471530
## nombre_empresa
## 0.3539551
## fecha_divulgada
## 0.0000000
## nombre_proyecto
## 0.0000000
## tipo_documento
## 0.0000000
## numero_proyecto
## 0.0000000
## url_proyecto
## 0.0000000
## pais
## 0.0000000
## industria
## 0.0000000
## categoria_ambiental
## 0.0000000
## departamento
## 0.0000000
## estado
## 0.0000000
## fecha_corte
## 0.0000000
Se puede observar que existen grandes cantidades de datos faltantes y tenemos que proceder a tratarlos, antes de eso haremos una limpieza para poder realizar la limpieza.
#Revisar duplicados
datos[duplicated(datos), ]
## # A tibble: 4 × 24
## fecha_divulgada nombre_proyecto tipo_documento numero_proyecto url_proyecto
## <chr> <chr> <chr> <dbl> <chr>
## 1 02/06/2025 GSCF-SMBC Summary of In… 48462 https://dis…
## 2 03/06/2014 Landmark Myanmar Summary of In… 33428 https://dis…
## 3 01/29/2025 Element Mexico Summary of In… 49507 https://dis…
## 4 10/07/2013 THE KIBO FUND II … Summary of In… 32989 https://dis…
## # ℹ 19 more variables: linea_producto <chr>, nombre_empresa <chr>, pais <chr>,
## # codigo_pais_ifc <chr>, industria <chr>, categoria_ambiental <chr>,
## # departamento <chr>, estado <chr>, fecha_estimada_junta <chr>,
## # fecha_aprobacion_ifc <chr>, fecha_firma_ifc <chr>,
## # fecha_inversion_ifc <chr>, inversion_ifc_gestion_riesgo_millones_usd <dbl>,
## # inversion_ifc_garantia_millones_usd <dbl>,
## # inversion_ifc_prestamo_millones_usd <dbl>, …
sum(duplicated(datos))
## [1] 4
Hay 4 lineas duplicadas.
datos_limpios <- datos %>% distinct()
sum(duplicated(datos_limpios))
## [1] 0
datos_limpios <- datos_limpios %>% select(-c(fecha_corte,fecha_estimada_junta,fecha_aprobacion_ifc,fecha_firma_ifc,fecha_inversion_ifc))
Reemplazamos los NAs por 0 en variables que se encuentran en términos de dinero.
library(gridExtra)
library(nortest)
# Función para comparar distribuciones antes y después de la imputación
graficar_distribucion <- function(datos_originales, datos_imputados, columna) {
df_original <- data.frame(valor = datos_originales[[columna]], estado = "Antes")
df_imputado <- data.frame(valor = datos_imputados[[columna]], estado = "Después")
p1 <- ggplot(df_original, aes(x = valor)) +
geom_histogram(fill = "blue", alpha = 0.5, bins = 30) +
labs(title = paste("Distribución de", columna, "antes de la imputación")) +
theme_minimal()
p2 <- ggplot(df_imputado, aes(x = valor)) +
geom_histogram(fill = "red", alpha = 0.5, bins = 30) +
labs(title = paste("Distribución de", columna, "después de la imputación")) +
theme_minimal()
grid.arrange(p1, p2, ncol = 2)
# Pruebas de normalidad
lillie_test_original <- lillie.test(datos_originales[[columna]])
lillie_test_imputado <- lillie.test(datos_imputados[[columna]])
cat("\nPrueba de Lilliefors para", columna, "antes de la imputación:")
print(lillie_test_original)
cat("\nPrueba de Lilliefors para", columna, "después de la imputación:")
print(lillie_test_imputado)
wilcox_test <- wilcox.test(datos_originales[[columna]], datos_imputados[[columna]])
cat("\nPrueba de Wilcoxon para comparar distribuciones de", columna, ":")
print(wilcox_test)
}
# Reemplazar NAs con 0 en las columnas que contienen "Million"
# Reemplazar NAs con 0 en las columnas que contienen "millones"
datos_originales <- datos_limpios
variables_a_imputar <- names(datos_limpios)[grepl("millones", names(datos_limpios))]
for (var in variables_a_imputar) {
if (sum(is.na(datos_limpios[[var]])) > 0) {
print(graficar_distribucion(datos_originales, datos_limpios, var))
datos_limpios[[var]] <- replace_na(datos_limpios[[var]], 0)
}
}
##
## Prueba de Lilliefors para inversion_ifc_gestion_riesgo_millones_usd antes de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_originales[[columna]]
## D = 0.32004, p-value < 2.2e-16
##
##
## Prueba de Lilliefors para inversion_ifc_gestion_riesgo_millones_usd después de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_imputados[[columna]]
## D = 0.32004, p-value < 2.2e-16
##
##
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_gestion_riesgo_millones_usd :
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 17861, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
##
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 17861, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
## Prueba de Lilliefors para inversion_ifc_garantia_millones_usd antes de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_originales[[columna]]
## D = 0.29222, p-value < 2.2e-16
##
##
## Prueba de Lilliefors para inversion_ifc_garantia_millones_usd después de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_imputados[[columna]]
## D = 0.29222, p-value < 2.2e-16
##
##
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_garantia_millones_usd :
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 64082, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
##
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 64082, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
## Prueba de Lilliefors para inversion_ifc_prestamo_millones_usd antes de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_originales[[columna]]
## D = 0.23901, p-value < 2.2e-16
##
##
## Prueba de Lilliefors para inversion_ifc_prestamo_millones_usd después de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_imputados[[columna]]
## D = 0.23901, p-value < 2.2e-16
##
##
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_prestamo_millones_usd :
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 10709192, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
##
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 10709192, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
## Prueba de Lilliefors para inversion_ifc_capital_millones_usd antes de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_originales[[columna]]
## D = 0.29749, p-value < 2.2e-16
##
##
## Prueba de Lilliefors para inversion_ifc_capital_millones_usd después de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_imputados[[columna]]
## D = 0.29749, p-value < 2.2e-16
##
##
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_capital_millones_usd :
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 2522258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
##
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 2522258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
## Prueba de Lilliefors para total_inversion_ifc_aprobada_junta_millones_usd antes de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_originales[[columna]]
## D = 0.27673, p-value < 2.2e-16
##
##
## Prueba de Lilliefors para total_inversion_ifc_aprobada_junta_millones_usd después de la imputación:
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: datos_imputados[[columna]]
## D = 0.27673, p-value < 2.2e-16
##
##
## Prueba de Wilcoxon para comparar distribuciones de total_inversion_ifc_aprobada_junta_millones_usd :
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 19506258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
##
##
## Wilcoxon rank sum test with continuity correction
##
## data: datos_originales[[columna]] and datos_imputados[[columna]]
## W = 19506258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
Los datos no cambian su distribucion con las imputaciones.
Convertimos el formato de fecha y de los identificadores.
# Convertir a formato de fecha las columnas relacionadas con fechas
datos_limpios <- datos_limpios %>%
mutate(across(contains("fecha"), as.Date, format = "%m/%d/%Y")) # Ajustar formato según sea necesario
# Convertir los códigos (Country Code, Project Number, etc.) a factores o caracteres
datos_limpios <- datos_limpios %>%
mutate(across(contains("codigo") | contains("numero"), as.factor))
# Verificar estructura de la base de datos
summary(datos_limpios)
## fecha_divulgada nombre_proyecto tipo_documento numero_proyecto
## Min. :1994-10-31 Length:6494 Length:6494 24374 : 2
## 1st Qu.:2005-05-10 Class :character Class :character 24635 : 2
## Median :2012-03-23 Mode :character Mode :character 27589 : 2
## Mean :2011-10-04 29952 : 2
## 3rd Qu.:2018-11-27 30445 : 2
## Max. :2025-02-07 30962 : 2
## (Other):6482
## url_proyecto linea_producto nombre_empresa pais
## Length:6494 Length:6494 Length:6494 Length:6494
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## codigo_pais_ifc industria categoria_ambiental departamento
## IND : 507 Length:6494 Length:6494 Length:6494
## BRA : 325 Class :character Class :character Class :character
## CHA : 308 Mode :character Mode :character Mode :character
## WLD : 262
## AFR : 204
## (Other):4103
## NA's : 785
## estado inversion_ifc_gestion_riesgo_millones_usd
## Length:6494 Min. : 0.0000
## Class :character 1st Qu.: 0.0000
## Mode :character Median : 0.0000
## Mean : 0.1629
## 3rd Qu.: 0.0000
## Max. :100.0000
##
## inversion_ifc_garantia_millones_usd inversion_ifc_prestamo_millones_usd
## Min. : 0.00 Min. : 0.00
## 1st Qu.: 0.00 1st Qu.: 0.00
## Median : 0.00 Median : 12.10
## Mean : 5.82 Mean : 33.03
## 3rd Qu.: 0.00 3rd Qu.: 40.00
## Max. :1500.00 Max. :1000.00
##
## inversion_ifc_capital_millones_usd
## Min. : 0.000
## 1st Qu.: 0.000
## Median : 0.000
## Mean : 7.747
## 3rd Qu.: 4.000
## Max. :1003.000
##
## total_inversion_ifc_aprobada_junta_millones_usd codigo_pais_bm
## Min. : 0.000 IN : 507
## 1st Qu.: 9.062 BR : 325
## Median : 22.295 CN : 308
## Mean : 46.760 TR : 266
## 3rd Qu.: 50.000 99 : 262
## Max. :1500.000 (Other):4503
## NA's : 323
# Ordenar de mayor a menor
sort(colSums(is.na(datos_limpios)) / nrow(datos) * 100, decreasing = TRUE)
## codigo_pais_ifc
## 12.0806402
## codigo_pais_bm
## 4.9707602
## linea_producto
## 3.8319483
## nombre_empresa
## 0.3539551
## fecha_divulgada
## 0.0000000
## nombre_proyecto
## 0.0000000
## tipo_documento
## 0.0000000
## numero_proyecto
## 0.0000000
## url_proyecto
## 0.0000000
## pais
## 0.0000000
## industria
## 0.0000000
## categoria_ambiental
## 0.0000000
## departamento
## 0.0000000
## estado
## 0.0000000
## inversion_ifc_gestion_riesgo_millones_usd
## 0.0000000
## inversion_ifc_garantia_millones_usd
## 0.0000000
## inversion_ifc_prestamo_millones_usd
## 0.0000000
## inversion_ifc_capital_millones_usd
## 0.0000000
## total_inversion_ifc_aprobada_junta_millones_usd
## 0.0000000
Para las variables que no tienen NAs no se les reliza imputación. Y las variables que son identificadoras no se pueden imputar.
Este histograma muestra la distribución de la inversión total aprobada por la junta de la IFC (Corporación Financiera Internacional) en millones de USD. Algunas observaciones clave:
Sesgo a la derecha: La mayoría de las inversiones son pequeñas, concentrándose en valores bajos. A medida que la inversión aumenta, la frecuencia disminuye rápidamente.
Valores extremos: Existen algunos valores significativamente grandes (inversiones superiores a 500 millones USD), pero son poco frecuentes.
Distribución altamente asimétrica: La gran mayoría de los datos están en el rango de 0 a 100 millones USD.
Este gráfico de barras muestra la distribución de proyectos por categoría ambiental.
La categoría B es la más común con aproximadamente 3000 proyectos, lo que indica que la mayoría de los proyectos tienen impactos ambientales moderados.
Las categorías FI y FI-2 también tienen una cantidad significativa de proyectos, superando los 1000, lo que sugiere una alta actividad en proyectos financieros con riesgo ambiental.
Las categorías A, FI-1 y “Other” tienen el menor número de proyectos, lo que podría indicar que los proyectos con alto impacto ambiental (categoría A) son menos frecuentes.
Este gráfico muestra la distribución de proyectos por industria.
Las instituciones financieras lideran en cantidad de proyectos, con más de 2,500, lo que sugiere una fuerte actividad en el sector financiero. Las industrias de infraestructura y manufactura también tienen un número considerable de proyectos, superando los 1,000, lo que indica que estos sectores son relevantes en términos de inversión y desarrollo. El sector de agronegocios y silvicultura también tiene una participación significativa, aunque menor que las instituciones financieras. Las industrias con menor cantidad de proyectos incluyen petróleo, gas y minería, telecomunicaciones y tecnología, y turismo, comercio minorista y propiedad.
Este gráfico muestra los 10 países con más proyectos.
India lidera la lista con más de 500 proyectos, lo que indica una alta actividad en inversión o desarrollo en el país. Brasil y China le siguen con alrededor de 300 proyectos cada uno. Turquía y la categoría “World Region” tienen un número similar de proyectos, algo menor que China. Colombia aparece en la lista, aunque con un número de proyectos menor en comparación con países como India y Brasil. Egipto cierra el ranking con la menor cantidad dentro del top 10.
Este gráfico muestra la distribución del estado de los proyectos.
La mayoría de los proyectos están completados (~4000), lo que indica un alto nivel de finalización. Los proyectos activos también son significativos (~2000), mostrando que todavía hay una cantidad considerable en ejecución. Los estados “Hold”, “Pending Approval”, “Pending Disbursement” y “Pending Signing” tienen muy pocos proyectos, lo que sugiere que la mayoría de los proyectos avanzan sin grandes bloqueos.
El gráfico muestra la distribución de la inversión aprobada por la IFC en distintas industrias. Se observa que la mayoría de las inversiones están en rangos bajos, pero hay valores atípicos significativos, especialmente en Financial Institutions, Infrastructure y Manufacturing, donde algunas inversiones superan los 1000 millones de USD. La mediana de inversión es baja en casi todas las industrias, indicando que solo unos pocos proyectos reciben montos muy altos.
## # A tibble: 10 × 2
## pais total_inversion
## <chr> <dbl>
## 1 World Region 35051.
## 2 India 23636.
## 3 Brazil 18458.
## 4 Turkiye 16176.
## 5 China 13715.
## 6 Africa Region 10469.
## 7 South Africa 8428.
## 8 Mexico 8410.
## 9 Colombia 6855.
## 10 Nigeria 6687.
El gráfico muestra los 10 países con mayor inversión aprobada por la IFC, destacando que la World Region recibe la mayor cantidad de fondos, seguida por India y Brasil. Otros países como Turquía, China y Sudáfrica también presentan inversiones significativas. Colombia se encuentra en los últimos lugares del top 10, con una inversión similar a la de México y Nigeria. Esto sugiere que la IFC concentra sus recursos en regiones estratégicas con economías emergentes y de alto impacto.
El gráfico muestra la evolución del número de proyectos divulgados por año, reflejando una tendencia general de crecimiento con fluctuaciones. Se observa un rápido aumento a finales de los años 90, seguido de variaciones entre 2000 y 2020. En los últimos años, hubo un fuerte incremento, alcanzando un pico reciente, pero con una caída abrupta en el último dato disponible. Esto podría indicar un cambio en las políticas de divulgación o una variación excepcional en la cantidad de proyectos aprobados.
El gráfico muestra los 10 años con más proyectos aprobados, destacando que 2024 y 2023 fueron los años con la mayor cantidad. Esto sugiere un aumento significativo en la aprobación de proyectos en los últimos años, posiblemente debido a cambios en políticas de financiamiento, aumento en la cantidad de propuestas o mejoras en los procesos de evaluación. También se observan otros picos en años como 2010, 2007 y 2014, lo que podría indicar períodos de mayor inversión o iniciativas estratégicas en esos momentos.
## 139 codes from your data successfully matched countries in the map
## 29 codes from your data failed to match with a country code in the map
## 104 codes from the map weren't represented in your data
Se observa que países de América Latina, África y Asia Central tienen inversión aprobada en distintos niveles.
Rusia y algunos países de Asia, así como partes de África, presentan colores más oscuros, indicando mayor inversión.
En América Latina, Brasil y otros países tienen una inversión relativamente alta.
Este análisis examina cómo varía la inversión aprobada según la categoría ambiental y la región del proyecto.
## # A tibble: 722 × 6
## # Groups: categoria_ambiental [8]
## categoria_ambiental pais inversion_media inversion_mediana inversion_maxima
## <chr> <chr> <dbl> <dbl> <dbl>
## 1 A Afric… 89.2 45 230
## 2 A Alban… 45.9 46.1 58.5
## 3 A Argen… 51.5 40 100
## 4 A Armen… 65 65 65
## 5 A Azerb… 21.4 21.4 32.8
## 6 A Bangl… 75.8 65 126.
## 7 A Barba… 0 0 0
## 8 A Benin 21.7 21.7 21.7
## 9 A Boliv… 7.17 7.17 8.34
## 10 A Brazil 100. 75 288
## # ℹ 712 more rows
## # ℹ 1 more variable: inversion_minima <dbl>
El gráfico muestra la distribución de la inversión total aprobada en millones de USD por categoría ambiental y región. Se destacan algunas diferencias clave entre regiones, con México y “Otras regiones” mostrando los valores de inversión más altos, particularmente en la categoría B. En países como India y China, las inversiones están más distribuidas, con la categoría FI-2 destacando. Otros países, como Rusia y Turquía, presentan inversiones más concentradas en pocas categorías. Esto sugiere que la asignación de inversión varía según las estrategias ambientales y prioridades de cada región, posiblemente debido a políticas locales, necesidades específicas de desarrollo o acceso a financiamiento diferenciado.
Se analiza cómo se distribuye la inversión entre distintas industrias y regiones.
## # A tibble: 6 × 3
## industria pais inversion_total
## <chr> <chr> <dbl>
## 1 Agribusiness and Forestry Afghanistan 2.5
## 2 Agribusiness and Forestry Africa Region 931.
## 3 Agribusiness and Forestry Angola 0
## 4 Agribusiness and Forestry Argentina 1005.
## 5 Agribusiness and Forestry Azerbaijan 12.8
## 6 Agribusiness and Forestry Bangladesh 263.
El gráfico muestra la distribución de la inversión total aprobada en millones de USD por categoría ambiental e industria. Se observa que el sector Manufacturing y Business and Forestry reciben las mayores inversiones, especialmente en la categoría FI-2. En contraste, sectores como Health and Education y Funds tienen una distribución más equilibrada, con una fuerte presencia de la categoría B. Oil, Gas, and Mining muestra una inversión significativa en la categoría A, lo que podría estar relacionado con regulaciones ambientales más estrictas. Esto sugiere que la asignación de inversión varía según la naturaleza de la industria, posiblemente debido a factores como el impacto ambiental, regulaciones específicas y acceso a financiamiento especializado.
El gráfico muestra la distribución de la inversión total aprobada en millones de USD por industria y región. Se observa que el sector Financial Institutions recibe la mayor inversión, destacando significativamente sobre las demás industrias. También se identifican picos importantes en Infrastructure y Manufacturing, lo que sugiere un enfoque en el desarrollo de estos sectores. La inversión está distribuida en múltiples regiones, con Otras regiones siendo la categoría predominante en la mayoría de las industrias. Esto podría indicar una estrategia global de financiamiento diversificado, con un énfasis en sectores clave para el crecimiento económico y el desarrollo estructural.