Análisis de la Evolución de IFC Investment Services Projects

Descripción General

La base de datos IFC Investment Services Projects contiene información detallada sobre los proyectos de inversión gestionados por la Corporación Financiera Internacional (IFC), una entidad del Grupo Banco Mundial.
Este conjunto de datos proporciona detalles sobre las inversiones realizadas en diferentes países y sectores, permitiendo analizar la distribución de los fondos, los tipos de productos financieros utilizados y el impacto de estas inversiones a nivel global.

La IFC sigue desarrollando nuevos productos financieros para ayudar a las empresas a gestionar riesgos y acceder a los mercados de capital nacionales e internacionales. Estas inversiones buscan fomentar el crecimiento sostenible, reducir la pobreza y promover el emprendimiento.

🔗 Fuente de los Datos: IFC Investment Services Projects


Diccionario de Datos

A continuación, se describen las variables incluidas en la base de datos:

Variable Descripción Tipo
date_disclosed Fecha en que el registro fue publicado por primera vez. DATE
project_name Nombre del proyecto de inversión. STRING
document_type Tipo de documento asociado al proyecto. STRING
project_number Código único que identifica el proyecto. STRING
project_url Enlace a la página del proyecto en el sitio web de la IFC. STRING
product_line Tipo de producto financiero ofrecido por la IFC. STRING
company_name Nombre de la empresa beneficiaria de la inversión. STRING
country País donde se ejecuta la inversión o servicio. STRING
ifc_country_code Código del país según la clasificación de la IFC. STRING
industry Sector económico del proyecto, basado en el estándar NAICS. STRING
environmental_category Categoría de impacto ambiental del proyecto según las políticas de la IFC. STRING
department Departamento del Grupo Banco Mundial responsable del proyecto. STRING
status Estado actual del proyecto. STRING
projected_board_date Fecha estimada para la aprobación del proyecto por la Junta de la IFC. DATE
ifc_approval_date Fecha de aprobación del proyecto por la IFC. DATE
ifc_signed_date Fecha en que se firmó el acuerdo de inversión. DATE
ifc_invested_date Fecha en que la IFC realizó la inversión. DATE
ifc_investment_for_risk_management_million_usd Inversión en productos diseñados para mitigar riesgos financieros mediante derivados. NUMBER
ifc_investment_for_guarantee_million_usd Inversión en garantías para respaldar obligaciones financieras. NUMBER
ifc_investment_for_loan_million_usd Monto de préstamos otorgados en el proyecto. NUMBER
ifc_investment_for_equity_million_usd Monto de inversión en participación accionaria. NUMBER
total_ifc_investment_as_approved_by_board_million_usd Suma total de la inversión aprobada para el proyecto. NUMBER
wb_country_code Código del país según la clasificación del Banco Mundial. STRING
as_of_date Fecha en la que se tomó el estado de los datos. DATE

Objetivo del Análisis

El análisis de esta base de datos permitirá:

  • Identificar los países y sectores que reciben mayor inversión por parte de la IFC.
  • Evaluar la distribución de los tipos de inversión (préstamos, capital, garantías, gestión de riesgo).
  • Analizar la evolución de la inversión en diferentes períodos de tiempo.
  • Examinar el impacto ambiental y social de los proyectos financiados.

Este análisis contribuirá a una mejor comprensión de las tendencias globales en financiamiento de proyectos y su impacto en el desarrollo sostenible.

Etapa 1: Carga y Limpieza

1. Cargar librerias.

2. Importar la base de datos y visualizarlos.

datos <- read_csv("C:/Users/franc/Downloads/Dataviz/ifc_investment_services_projects_02-09-2025.csv")
## Rows: 6498 Columns: 24
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (18): Date Disclosed, Project Name, Document Type, Project Url, Product ...
## dbl  (6): Project Number, IFC investment for Risk Management(Million - USD),...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

3. Resumen de los datos y visualización de Encabezados.

summary(datos)
##  Date Disclosed     Project Name       Document Type      Project Number  
##  Length:6498        Length:6498        Length:6498        Min.   :  3402  
##  Class :character   Class :character   Class :character   1st Qu.: 24129  
##  Mode  :character   Mode  :character   Mode  :character   Median : 31565  
##                                                           Mean   : 34009  
##                                                           3rd Qu.: 41269  
##                                                           Max.   :574447  
##                                                                           
##  Project Url        Product Line       Company Name         Country         
##  Length:6498        Length:6498        Length:6498        Length:6498       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  IFC Country Code     Industry         Environmental Category
##  Length:6498        Length:6498        Length:6498           
##  Class :character   Class :character   Class :character      
##  Mode  :character   Mode  :character   Mode  :character      
##                                                              
##                                                              
##                                                              
##                                                              
##   Department           Status          Projected Board Date IFC Approval Date 
##  Length:6498        Length:6498        Length:6498          Length:6498       
##  Class :character   Class :character   Class :character     Class :character  
##  Mode  :character   Mode  :character   Mode  :character     Mode  :character  
##                                                                               
##                                                                               
##                                                                               
##                                                                               
##  IFC Signed Date    IFC Invested Date 
##  Length:6498        Length:6498       
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
##                                       
##                                       
##  IFC investment for Risk Management(Million - USD)
##  Min.   :  0.000                                  
##  1st Qu.:  1.000                                  
##  Median :  2.200                                  
##  Mean   :  5.598                                  
##  3rd Qu.:  5.000                                  
##  Max.   :100.000                                  
##  NA's   :6309                                     
##  IFC investment for Guarantee(Million - USD)
##  Min.   :   0.000                           
##  1st Qu.:   7.425                           
##  Median :  25.315                           
##  Mean   : 105.573                           
##  3rd Qu.: 100.000                           
##  Max.   :1500.000                           
##  NA's   :6140                               
##  IFC investment for Loan(Million - USD)
##  Min.   :   0.00                       
##  1st Qu.:  10.00                       
##  Median :  25.00                       
##  Mean   :  46.39                       
##  3rd Qu.:  52.43                       
##  Max.   :1000.00                       
##  NA's   :1868                          
##  IFC investment for Equity(Million - USD)
##  Min.   :   0.00                         
##  1st Qu.:   3.00                         
##  Median :  10.00                         
##  Mean   :  22.39                         
##  3rd Qu.:  25.00                         
##  Max.   :1003.00                         
##  NA's   :4250                            
##  Total IFC investment as approved by Board(Million - USD) WB Country Code   
##  Min.   :   0.02                                          Length:6498       
##  1st Qu.:  10.00                                          Class :character  
##  Median :  25.00                                          Mode  :character  
##  Mean   :  48.65                                                            
##  3rd Qu.:  50.00                                                            
##  Max.   :1500.00                                                            
##  NA's   :249                                                                
##   As of Date       
##  Length:6498       
##  Class :character  
##  Mode  :character  
##                    
##                    
##                    
## 
dim(datos)
## [1] 6498   24
str(datos)
## spc_tbl_ [6,498 × 24] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ Date Disclosed                                          : chr [1:6498] "03/30/2023" "12/04/2014" "04/30/2013" "04/19/2010" ...
##  $ Project Name                                            : chr [1:6498] "BOP EU Tchad" "Millicom Tchad SA" "Chad Clinic" "Aubaine Graphic SA Printing Chad" ...
##  $ Document Type                                           : chr [1:6498] "Summary of Investment Information (AIP Policy 2012)" "Summary of Investment Information (AIP Policy 2012)" "Summary of Investment Information (AIP Policy 2012)" "Summary of Proposed Investment (Disclosure Policy 2006)" ...
##  $ Project Number                                          : num [1:6498] 45483 34297 32607 29084 29317 ...
##  $ Project Url                                             : chr [1:6498] "https://disclosures.ifc.org/project-detail/SII/45483/bop-eu-tchad" "https://disclosures.ifc.org/project-detail/SII/34297/millicom-tchad-sa" "https://disclosures.ifc.org/project-detail/SII/32607/chad-clinic" "https://disclosures.ifc.org/project-detail/SPI/29084/aubaine-graphic-sa-printing-chad" ...
##  $ Product Line                                            : chr [1:6498] "Loan" "Loan" "Loan" "Loan" ...
##  $ Company Name                                            : chr [1:6498] "EXPRESS UNION TCHAD" "MOOV AFRICA TCHAD SA" "CLINIQUE PROVIDENCE" "Imprimerie Aubaine Graphic" ...
##  $ Country                                                 : chr [1:6498] "Chad" "Chad" "Chad" "Chad" ...
##  $ IFC Country Code                                        : chr [1:6498] "CHD" "CHD" "CHD" "CHD" ...
##  $ Industry                                                : chr [1:6498] "Financial Institutions" "Telecommunications, Media, and Technology" "Health and Education" "Agribusiness and Forestry" ...
##  $ Environmental Category                                  : chr [1:6498] "FI-3" "B" "B" "B" ...
##  $ Department                                              : chr [1:6498] "Regional Industry - FIG Africa" "TMT, Venture Capital &amp; Funds" "Regional Industry - MAS Africa" "Regional Industry - MAS Africa" ...
##  $ Status                                                  : chr [1:6498] "Active" "Completed" "Active" "Completed" ...
##  $ Projected Board Date                                    : chr [1:6498] "05/01/2023" "05/27/2014" "05/30/2013" "05/20/2010" ...
##  $ IFC Approval Date                                       : chr [1:6498] "06/12/2023" "05/30/2014" "05/06/2015" "06/28/2010" ...
##  $ IFC Signed Date                                         : chr [1:6498] "06/26/2023" "06/06/2014" "05/27/2015" "06/30/2010" ...
##  $ IFC Invested Date                                       : chr [1:6498] "07/17/2024" "08/22/2014" "12/30/2015" "02/22/2012" ...
##  $ IFC investment for Risk Management(Million - USD)       : num [1:6498] NA NA NA NA NA NA NA NA NA NA ...
##  $ IFC investment for Guarantee(Million - USD)             : num [1:6498] NA NA NA NA NA NA NA 1 NA NA ...
##  $ IFC investment for Loan(Million - USD)                  : num [1:6498] 1.03 76.06 1.38 2.83 3.08 ...
##  $ IFC investment for Equity(Million - USD)                : num [1:6498] NA NA NA NA NA NA NA NA NA NA ...
##  $ Total IFC investment as approved by Board(Million - USD): num [1:6498] 1.03 76.06 1.38 2.83 3.08 ...
##  $ WB Country Code                                         : chr [1:6498] "TD" "TD" "TD" "TD" ...
##  $ As of Date                                              : chr [1:6498] "02/09/2025" "02/09/2025" "02/09/2025" "02/09/2025" ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   `Date Disclosed` = col_character(),
##   ..   `Project Name` = col_character(),
##   ..   `Document Type` = col_character(),
##   ..   `Project Number` = col_double(),
##   ..   `Project Url` = col_character(),
##   ..   `Product Line` = col_character(),
##   ..   `Company Name` = col_character(),
##   ..   Country = col_character(),
##   ..   `IFC Country Code` = col_character(),
##   ..   Industry = col_character(),
##   ..   `Environmental Category` = col_character(),
##   ..   Department = col_character(),
##   ..   Status = col_character(),
##   ..   `Projected Board Date` = col_character(),
##   ..   `IFC Approval Date` = col_character(),
##   ..   `IFC Signed Date` = col_character(),
##   ..   `IFC Invested Date` = col_character(),
##   ..   `IFC investment for Risk Management(Million - USD)` = col_double(),
##   ..   `IFC investment for Guarantee(Million - USD)` = col_double(),
##   ..   `IFC investment for Loan(Million - USD)` = col_double(),
##   ..   `IFC investment for Equity(Million - USD)` = col_double(),
##   ..   `Total IFC investment as approved by Board(Million - USD)` = col_double(),
##   ..   `WB Country Code` = col_character(),
##   ..   `As of Date` = col_character()
##   .. )
##  - attr(*, "problems")=<externalptr>

4. Visualización y limpieza de nombres de las variables.

4.1. Nombres de las variables originales

names(datos)
##  [1] "Date Disclosed"                                          
##  [2] "Project Name"                                            
##  [3] "Document Type"                                           
##  [4] "Project Number"                                          
##  [5] "Project Url"                                             
##  [6] "Product Line"                                            
##  [7] "Company Name"                                            
##  [8] "Country"                                                 
##  [9] "IFC Country Code"                                        
## [10] "Industry"                                                
## [11] "Environmental Category"                                  
## [12] "Department"                                              
## [13] "Status"                                                  
## [14] "Projected Board Date"                                    
## [15] "IFC Approval Date"                                       
## [16] "IFC Signed Date"                                         
## [17] "IFC Invested Date"                                       
## [18] "IFC investment for Risk Management(Million - USD)"       
## [19] "IFC investment for Guarantee(Million - USD)"             
## [20] "IFC investment for Loan(Million - USD)"                  
## [21] "IFC investment for Equity(Million - USD)"                
## [22] "Total IFC investment as approved by Board(Million - USD)"
## [23] "WB Country Code"                                         
## [24] "As of Date"

4.2. Traducción de nombres

datos %<>% clean_names
nombres <- list(
  date_disclosed = "fecha_divulgada",
  project_name = "nombre_proyecto",
  document_type = "tipo_documento",
  project_number = "numero_proyecto",
  project_url = "url_proyecto",
  product_line = "linea_producto",
  company_name = "nombre_empresa",
  country = "pais",
  ifc_country_code = "codigo_pais_ifc",
  industry = "industria",
  environmental_category = "categoria_ambiental",
  department = "departamento",
  status = "estado",
  projected_board_date = "fecha_estimada_junta",
  ifc_approval_date = "fecha_aprobacion_ifc",
  ifc_signed_date = "fecha_firma_ifc",
  ifc_invested_date = "fecha_inversion_ifc",
  ifc_investment_for_risk_management_million_usd = "inversion_ifc_gestion_riesgo_millones_usd",
  ifc_investment_for_guarantee_million_usd = "inversion_ifc_garantia_millones_usd",
  ifc_investment_for_loan_million_usd = "inversion_ifc_prestamo_millones_usd",
  ifc_investment_for_equity_million_usd = "inversion_ifc_capital_millones_usd",
  total_ifc_investment_as_approved_by_board_million_usd = "total_inversion_ifc_aprobada_junta_millones_usd",
  wb_country_code = "codigo_pais_bm",
  as_of_date = "fecha_corte"
)

names(datos) <- unname(nombres[names(datos)]) #colocar los nombres en español
## Warning: The `value` argument of `names<-()` must be a character vector as of tibble
## 3.0.0.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

5. Gráfico de datos faltantes.

5.1. Datos faltantes originales

missmap(datos, main="Mapa de Datos Faltantes")

5.2. Porcentaje de valores NA por variable de mayor a menor

#porcentaje de NAs
# Calcular el porcentaje de valores NA por columna
# Ordenar de mayor a menor
na_percent_sorted <- sort(colSums(is.na(datos)) / nrow(datos) * 100, decreasing = TRUE)

# Mostrar los resultados
na_percent_sorted
##       inversion_ifc_gestion_riesgo_millones_usd 
##                                      97.0914127 
##             inversion_ifc_garantia_millones_usd 
##                                      94.4906125 
##              inversion_ifc_capital_millones_usd 
##                                      65.4047399 
##             inversion_ifc_prestamo_millones_usd 
##                                      28.7473069 
##                            fecha_estimada_junta 
##                                      13.6503540 
##                             fecha_inversion_ifc 
##                                      12.7885503 
##                                 codigo_pais_ifc 
##                                      12.0806402 
##                                 fecha_firma_ifc 
##                                       6.7867036 
##                                  codigo_pais_bm 
##                                       4.9707602 
##                                  linea_producto 
##                                       3.8473376 
## total_inversion_ifc_aprobada_junta_millones_usd 
##                                       3.8319483 
##                            fecha_aprobacion_ifc 
##                                       3.2471530 
##                                  nombre_empresa 
##                                       0.3539551 
##                                 fecha_divulgada 
##                                       0.0000000 
##                                 nombre_proyecto 
##                                       0.0000000 
##                                  tipo_documento 
##                                       0.0000000 
##                                 numero_proyecto 
##                                       0.0000000 
##                                    url_proyecto 
##                                       0.0000000 
##                                            pais 
##                                       0.0000000 
##                                       industria 
##                                       0.0000000 
##                             categoria_ambiental 
##                                       0.0000000 
##                                    departamento 
##                                       0.0000000 
##                                          estado 
##                                       0.0000000 
##                                     fecha_corte 
##                                       0.0000000

Se puede observar que existen grandes cantidades de datos faltantes y tenemos que proceder a tratarlos, antes de eso haremos una limpieza para poder realizar la limpieza.

6. Revisión y eliminación de duplicados

6.1. Revisión de Duplicados

#Revisar duplicados
datos[duplicated(datos), ]
## # A tibble: 4 × 24
##   fecha_divulgada nombre_proyecto    tipo_documento numero_proyecto url_proyecto
##   <chr>           <chr>              <chr>                    <dbl> <chr>       
## 1 02/06/2025      GSCF-SMBC          Summary of In…           48462 https://dis…
## 2 03/06/2014      Landmark Myanmar   Summary of In…           33428 https://dis…
## 3 01/29/2025      Element Mexico     Summary of In…           49507 https://dis…
## 4 10/07/2013      THE KIBO FUND II … Summary of In…           32989 https://dis…
## # ℹ 19 more variables: linea_producto <chr>, nombre_empresa <chr>, pais <chr>,
## #   codigo_pais_ifc <chr>, industria <chr>, categoria_ambiental <chr>,
## #   departamento <chr>, estado <chr>, fecha_estimada_junta <chr>,
## #   fecha_aprobacion_ifc <chr>, fecha_firma_ifc <chr>,
## #   fecha_inversion_ifc <chr>, inversion_ifc_gestion_riesgo_millones_usd <dbl>,
## #   inversion_ifc_garantia_millones_usd <dbl>,
## #   inversion_ifc_prestamo_millones_usd <dbl>, …
sum(duplicated(datos))
## [1] 4

Hay 4 lineas duplicadas.

6.2. Eliminación de duplicados

datos_limpios <- datos %>% distinct()
sum(duplicated(datos_limpios))
## [1] 0

6.3. Eliminación de variables NO útiles

datos_limpios <- datos_limpios %>% select(-c(fecha_corte,fecha_estimada_junta,fecha_aprobacion_ifc,fecha_firma_ifc,fecha_inversion_ifc))

Etapa 2: Manejo de NAs

Reemplazamos los NAs por 0 en variables que se encuentran en términos de dinero.

library(gridExtra)
library(nortest)
# Función para comparar distribuciones antes y después de la imputación
graficar_distribucion <- function(datos_originales, datos_imputados, columna) {
  df_original <- data.frame(valor = datos_originales[[columna]], estado = "Antes")
  df_imputado <- data.frame(valor = datos_imputados[[columna]], estado = "Después")
  
  p1 <- ggplot(df_original, aes(x = valor)) +
    geom_histogram(fill = "blue", alpha = 0.5, bins = 30) +
    labs(title = paste("Distribución de", columna, "antes de la imputación")) +
    theme_minimal()
  
  p2 <- ggplot(df_imputado, aes(x = valor)) +
    geom_histogram(fill = "red", alpha = 0.5, bins = 30) +
    labs(title = paste("Distribución de", columna, "después de la imputación")) +
    theme_minimal()
  
  grid.arrange(p1, p2, ncol = 2)
  
  # Pruebas de normalidad
  
    lillie_test_original <- lillie.test(datos_originales[[columna]])
    lillie_test_imputado <- lillie.test(datos_imputados[[columna]])
    
    cat("\nPrueba de Lilliefors para", columna, "antes de la imputación:")
    print(lillie_test_original)
    
    cat("\nPrueba de Lilliefors para", columna, "después de la imputación:")
    print(lillie_test_imputado)
    
    wilcox_test <- wilcox.test(datos_originales[[columna]], datos_imputados[[columna]])
    cat("\nPrueba de Wilcoxon para comparar distribuciones de", columna, ":")
    print(wilcox_test)
}


# Reemplazar NAs con 0 en las columnas que contienen "Million"
# Reemplazar NAs con 0 en las columnas que contienen "millones"
datos_originales <- datos_limpios
variables_a_imputar <- names(datos_limpios)[grepl("millones", names(datos_limpios))]
for (var in variables_a_imputar) {
  if (sum(is.na(datos_limpios[[var]])) > 0) {
    print(graficar_distribucion(datos_originales, datos_limpios, var))
    datos_limpios[[var]] <- replace_na(datos_limpios[[var]], 0)
  }
}

## 
## Prueba de Lilliefors para inversion_ifc_gestion_riesgo_millones_usd antes de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_originales[[columna]]
## D = 0.32004, p-value < 2.2e-16
## 
## 
## Prueba de Lilliefors para inversion_ifc_gestion_riesgo_millones_usd después de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_imputados[[columna]]
## D = 0.32004, p-value < 2.2e-16
## 
## 
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_gestion_riesgo_millones_usd :
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 17861, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
## 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 17861, p-value = 1
## alternative hypothesis: true location shift is not equal to 0

## 
## Prueba de Lilliefors para inversion_ifc_garantia_millones_usd antes de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_originales[[columna]]
## D = 0.29222, p-value < 2.2e-16
## 
## 
## Prueba de Lilliefors para inversion_ifc_garantia_millones_usd después de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_imputados[[columna]]
## D = 0.29222, p-value < 2.2e-16
## 
## 
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_garantia_millones_usd :
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 64082, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
## 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 64082, p-value = 1
## alternative hypothesis: true location shift is not equal to 0

## 
## Prueba de Lilliefors para inversion_ifc_prestamo_millones_usd antes de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_originales[[columna]]
## D = 0.23901, p-value < 2.2e-16
## 
## 
## Prueba de Lilliefors para inversion_ifc_prestamo_millones_usd después de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_imputados[[columna]]
## D = 0.23901, p-value < 2.2e-16
## 
## 
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_prestamo_millones_usd :
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 10709192, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
## 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 10709192, p-value = 1
## alternative hypothesis: true location shift is not equal to 0

## 
## Prueba de Lilliefors para inversion_ifc_capital_millones_usd antes de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_originales[[columna]]
## D = 0.29749, p-value < 2.2e-16
## 
## 
## Prueba de Lilliefors para inversion_ifc_capital_millones_usd después de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_imputados[[columna]]
## D = 0.29749, p-value < 2.2e-16
## 
## 
## Prueba de Wilcoxon para comparar distribuciones de inversion_ifc_capital_millones_usd :
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 2522258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
## 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 2522258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0

## 
## Prueba de Lilliefors para total_inversion_ifc_aprobada_junta_millones_usd antes de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_originales[[columna]]
## D = 0.27673, p-value < 2.2e-16
## 
## 
## Prueba de Lilliefors para total_inversion_ifc_aprobada_junta_millones_usd después de la imputación:
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  datos_imputados[[columna]]
## D = 0.27673, p-value < 2.2e-16
## 
## 
## Prueba de Wilcoxon para comparar distribuciones de total_inversion_ifc_aprobada_junta_millones_usd :
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 19506258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0
## 
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  datos_originales[[columna]] and datos_imputados[[columna]]
## W = 19506258, p-value = 1
## alternative hypothesis: true location shift is not equal to 0

Los datos no cambian su distribucion con las imputaciones.

Convertimos el formato de fecha y de los identificadores.

# Convertir a formato de fecha las columnas relacionadas con fechas
datos_limpios <- datos_limpios %>%
  mutate(across(contains("fecha"), as.Date, format = "%m/%d/%Y"))  # Ajustar formato según sea necesario

# Convertir los códigos (Country Code, Project Number, etc.) a factores o caracteres
datos_limpios <- datos_limpios %>%
  mutate(across(contains("codigo") | contains("numero"), as.factor))  

# Verificar estructura de la base de datos
summary(datos_limpios)
##  fecha_divulgada      nombre_proyecto    tipo_documento     numero_proyecto
##  Min.   :1994-10-31   Length:6494        Length:6494        24374  :   2   
##  1st Qu.:2005-05-10   Class :character   Class :character   24635  :   2   
##  Median :2012-03-23   Mode  :character   Mode  :character   27589  :   2   
##  Mean   :2011-10-04                                         29952  :   2   
##  3rd Qu.:2018-11-27                                         30445  :   2   
##  Max.   :2025-02-07                                         30962  :   2   
##                                                             (Other):6482   
##  url_proyecto       linea_producto     nombre_empresa         pais          
##  Length:6494        Length:6494        Length:6494        Length:6494       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  codigo_pais_ifc  industria         categoria_ambiental departamento      
##  IND    : 507    Length:6494        Length:6494         Length:6494       
##  BRA    : 325    Class :character   Class :character    Class :character  
##  CHA    : 308    Mode  :character   Mode  :character    Mode  :character  
##  WLD    : 262                                                             
##  AFR    : 204                                                             
##  (Other):4103                                                             
##  NA's   : 785                                                             
##     estado          inversion_ifc_gestion_riesgo_millones_usd
##  Length:6494        Min.   :  0.0000                         
##  Class :character   1st Qu.:  0.0000                         
##  Mode  :character   Median :  0.0000                         
##                     Mean   :  0.1629                         
##                     3rd Qu.:  0.0000                         
##                     Max.   :100.0000                         
##                                                              
##  inversion_ifc_garantia_millones_usd inversion_ifc_prestamo_millones_usd
##  Min.   :   0.00                     Min.   :   0.00                    
##  1st Qu.:   0.00                     1st Qu.:   0.00                    
##  Median :   0.00                     Median :  12.10                    
##  Mean   :   5.82                     Mean   :  33.03                    
##  3rd Qu.:   0.00                     3rd Qu.:  40.00                    
##  Max.   :1500.00                     Max.   :1000.00                    
##                                                                         
##  inversion_ifc_capital_millones_usd
##  Min.   :   0.000                  
##  1st Qu.:   0.000                  
##  Median :   0.000                  
##  Mean   :   7.747                  
##  3rd Qu.:   4.000                  
##  Max.   :1003.000                  
##                                    
##  total_inversion_ifc_aprobada_junta_millones_usd codigo_pais_bm
##  Min.   :   0.000                                IN     : 507  
##  1st Qu.:   9.062                                BR     : 325  
##  Median :  22.295                                CN     : 308  
##  Mean   :  46.760                                TR     : 266  
##  3rd Qu.:  50.000                                99     : 262  
##  Max.   :1500.000                                (Other):4503  
##                                                  NA's   : 323
# Ordenar de mayor a menor
 sort(colSums(is.na(datos_limpios)) / nrow(datos) * 100, decreasing = TRUE)
##                                 codigo_pais_ifc 
##                                      12.0806402 
##                                  codigo_pais_bm 
##                                       4.9707602 
##                                  linea_producto 
##                                       3.8319483 
##                                  nombre_empresa 
##                                       0.3539551 
##                                 fecha_divulgada 
##                                       0.0000000 
##                                 nombre_proyecto 
##                                       0.0000000 
##                                  tipo_documento 
##                                       0.0000000 
##                                 numero_proyecto 
##                                       0.0000000 
##                                    url_proyecto 
##                                       0.0000000 
##                                            pais 
##                                       0.0000000 
##                                       industria 
##                                       0.0000000 
##                             categoria_ambiental 
##                                       0.0000000 
##                                    departamento 
##                                       0.0000000 
##                                          estado 
##                                       0.0000000 
##       inversion_ifc_gestion_riesgo_millones_usd 
##                                       0.0000000 
##             inversion_ifc_garantia_millones_usd 
##                                       0.0000000 
##             inversion_ifc_prestamo_millones_usd 
##                                       0.0000000 
##              inversion_ifc_capital_millones_usd 
##                                       0.0000000 
## total_inversion_ifc_aprobada_junta_millones_usd 
##                                       0.0000000

Para las variables que no tienen NAs no se les reliza imputación. Y las variables que son identificadoras no se pueden imputar.

Etapa 3: Análisis

1. Analisis Univariado

1.1. Distribución de la inversión IFC aprobada

Este histograma muestra la distribución de la inversión total aprobada por la junta de la IFC (Corporación Financiera Internacional) en millones de USD. Algunas observaciones clave:

Sesgo a la derecha: La mayoría de las inversiones son pequeñas, concentrándose en valores bajos. A medida que la inversión aumenta, la frecuencia disminuye rápidamente.

Valores extremos: Existen algunos valores significativamente grandes (inversiones superiores a 500 millones USD), pero son poco frecuentes.

Distribución altamente asimétrica: La gran mayoría de los datos están en el rango de 0 a 100 millones USD.

1.2. Proporción de proyectos por categoría ambiental

Este gráfico de barras muestra la distribución de proyectos por categoría ambiental.

La categoría B es la más común con aproximadamente 3000 proyectos, lo que indica que la mayoría de los proyectos tienen impactos ambientales moderados.

Las categorías FI y FI-2 también tienen una cantidad significativa de proyectos, superando los 1000, lo que sugiere una alta actividad en proyectos financieros con riesgo ambiental.

Las categorías A, FI-1 y “Other” tienen el menor número de proyectos, lo que podría indicar que los proyectos con alto impacto ambiental (categoría A) son menos frecuentes.

1.3. Cantidad de proyectos por industria

Este gráfico muestra la distribución de proyectos por industria.

Las instituciones financieras lideran en cantidad de proyectos, con más de 2,500, lo que sugiere una fuerte actividad en el sector financiero. Las industrias de infraestructura y manufactura también tienen un número considerable de proyectos, superando los 1,000, lo que indica que estos sectores son relevantes en términos de inversión y desarrollo. El sector de agronegocios y silvicultura también tiene una participación significativa, aunque menor que las instituciones financieras. Las industrias con menor cantidad de proyectos incluyen petróleo, gas y minería, telecomunicaciones y tecnología, y turismo, comercio minorista y propiedad.

1.4. Cantidad de proyectos por país

Este gráfico muestra los 10 países con más proyectos.

India lidera la lista con más de 500 proyectos, lo que indica una alta actividad en inversión o desarrollo en el país. Brasil y China le siguen con alrededor de 300 proyectos cada uno. Turquía y la categoría “World Region” tienen un número similar de proyectos, algo menor que China. Colombia aparece en la lista, aunque con un número de proyectos menor en comparación con países como India y Brasil. Egipto cierra el ranking con la menor cantidad dentro del top 10.

1.5. Estado de los proyectos

Este gráfico muestra la distribución del estado de los proyectos.

La mayoría de los proyectos están completados (~4000), lo que indica un alto nivel de finalización. Los proyectos activos también son significativos (~2000), mostrando que todavía hay una cantidad considerable en ejecución. Los estados “Hold”, “Pending Approval”, “Pending Disbursement” y “Pending Signing” tienen muy pocos proyectos, lo que sugiere que la mayoría de los proyectos avanzan sin grandes bloqueos.

2. Analisis Bivariado

2.1. Industria vs. Inversión Total IFC

El gráfico muestra la distribución de la inversión aprobada por la IFC en distintas industrias. Se observa que la mayoría de las inversiones están en rangos bajos, pero hay valores atípicos significativos, especialmente en Financial Institutions, Infrastructure y Manufacturing, donde algunas inversiones superan los 1000 millones de USD. La mediana de inversión es baja en casi todas las industrias, indicando que solo unos pocos proyectos reciben montos muy altos.

2.2. País vs. Inversión Total IFC

## # A tibble: 10 × 2
##    pais          total_inversion
##    <chr>                   <dbl>
##  1 World Region           35051.
##  2 India                  23636.
##  3 Brazil                 18458.
##  4 Turkiye                16176.
##  5 China                  13715.
##  6 Africa Region          10469.
##  7 South Africa            8428.
##  8 Mexico                  8410.
##  9 Colombia                6855.
## 10 Nigeria                 6687.

El gráfico muestra los 10 países con mayor inversión aprobada por la IFC, destacando que la World Region recibe la mayor cantidad de fondos, seguida por India y Brasil. Otros países como Turquía, China y Sudáfrica también presentan inversiones significativas. Colombia se encuentra en los últimos lugares del top 10, con una inversión similar a la de México y Nigeria. Esto sugiere que la IFC concentra sus recursos en regiones estratégicas con economías emergentes y de alto impacto.

2.3. Cantidad de proyectos divulgados por año

El gráfico muestra la evolución del número de proyectos divulgados por año, reflejando una tendencia general de crecimiento con fluctuaciones. Se observa un rápido aumento a finales de los años 90, seguido de variaciones entre 2000 y 2020. En los últimos años, hubo un fuerte incremento, alcanzando un pico reciente, pero con una caída abrupta en el último dato disponible. Esto podría indicar un cambio en las políticas de divulgación o una variación excepcional en la cantidad de proyectos aprobados.

2.4. Los 10 años con más proyectos aprobados

El gráfico muestra los 10 años con más proyectos aprobados, destacando que 2024 y 2023 fueron los años con la mayor cantidad. Esto sugiere un aumento significativo en la aprobación de proyectos en los últimos años, posiblemente debido a cambios en políticas de financiamiento, aumento en la cantidad de propuestas o mejoras en los procesos de evaluación. También se observan otros picos en años como 2010, 2007 y 2014, lo que podría indicar períodos de mayor inversión o iniciativas estratégicas en esos momentos.

2.5. Mapa de inversión IFC aprobada por país

## 139 codes from your data successfully matched countries in the map
## 29 codes from your data failed to match with a country code in the map
## 104 codes from the map weren't represented in your data

Se observa que países de América Latina, África y Asia Central tienen inversión aprobada en distintos niveles.

Rusia y algunos países de Asia, así como partes de África, presentan colores más oscuros, indicando mayor inversión.

En América Latina, Brasil y otros países tienen una inversión relativamente alta.

3. Análisis Multivariado

3.1. Relación entre Inversión, Categoría Ambiental y Región

Este análisis examina cómo varía la inversión aprobada según la categoría ambiental y la región del proyecto.

## # A tibble: 722 × 6
## # Groups:   categoria_ambiental [8]
##    categoria_ambiental pais   inversion_media inversion_mediana inversion_maxima
##    <chr>               <chr>            <dbl>             <dbl>            <dbl>
##  1 A                   Afric…           89.2              45              230   
##  2 A                   Alban…           45.9              46.1             58.5 
##  3 A                   Argen…           51.5              40              100   
##  4 A                   Armen…           65                65               65   
##  5 A                   Azerb…           21.4              21.4             32.8 
##  6 A                   Bangl…           75.8              65              126.  
##  7 A                   Barba…            0                 0                0   
##  8 A                   Benin            21.7              21.7             21.7 
##  9 A                   Boliv…            7.17              7.17             8.34
## 10 A                   Brazil          100.               75              288   
## # ℹ 712 more rows
## # ℹ 1 more variable: inversion_minima <dbl>

El gráfico muestra la distribución de la inversión total aprobada en millones de USD por categoría ambiental y región. Se destacan algunas diferencias clave entre regiones, con México y “Otras regiones” mostrando los valores de inversión más altos, particularmente en la categoría B. En países como India y China, las inversiones están más distribuidas, con la categoría FI-2 destacando. Otros países, como Rusia y Turquía, presentan inversiones más concentradas en pocas categorías. Esto sugiere que la asignación de inversión varía según las estrategias ambientales y prioridades de cada región, posiblemente debido a políticas locales, necesidades específicas de desarrollo o acceso a financiamiento diferenciado.

3.2. Relación entre Industria, Región y Monto de Inversión

Se analiza cómo se distribuye la inversión entre distintas industrias y regiones.

## # A tibble: 6 × 3
##   industria                 pais          inversion_total
##   <chr>                     <chr>                   <dbl>
## 1 Agribusiness and Forestry Afghanistan               2.5
## 2 Agribusiness and Forestry Africa Region           931. 
## 3 Agribusiness and Forestry Angola                    0  
## 4 Agribusiness and Forestry Argentina              1005. 
## 5 Agribusiness and Forestry Azerbaijan               12.8
## 6 Agribusiness and Forestry Bangladesh              263.

El gráfico muestra la distribución de la inversión total aprobada en millones de USD por categoría ambiental e industria. Se observa que el sector Manufacturing y Business and Forestry reciben las mayores inversiones, especialmente en la categoría FI-2. En contraste, sectores como Health and Education y Funds tienen una distribución más equilibrada, con una fuerte presencia de la categoría B. Oil, Gas, and Mining muestra una inversión significativa en la categoría A, lo que podría estar relacionado con regulaciones ambientales más estrictas. Esto sugiere que la asignación de inversión varía según la naturaleza de la industria, posiblemente debido a factores como el impacto ambiental, regulaciones específicas y acceso a financiamiento especializado.

El gráfico muestra la distribución de la inversión total aprobada en millones de USD por industria y región. Se observa que el sector Financial Institutions recibe la mayor inversión, destacando significativamente sobre las demás industrias. También se identifican picos importantes en Infrastructure y Manufacturing, lo que sugiere un enfoque en el desarrollo de estos sectores. La inversión está distribuida en múltiples regiones, con Otras regiones siendo la categoría predominante en la mayoría de las industrias. Esto podría indicar una estrategia global de financiamiento diversificado, con un énfasis en sectores clave para el crecimiento económico y el desarrollo estructural.