library(readxl)
# Cargar el archivo de Excel
file_path <- 'dataOK_all.xlsx'
df <- read_excel(file_path, sheet = 'dataOK_all')
## New names:
## * `` -> `...1`
# Mostrar las primeras filas del dataframe para entender su estructura
head(df)
## # A tibble: 6 x 50
##    ...1 key       Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
##   <dbl> <chr>      <dbl>           <dbl>         <dbl>        <dbl>        <dbl>
## 1     1 AMAZONAS~    102            4633            46         6639          222
## 2     2 AMAZONAS~    103            1602             9         2729          240
## 3     3 AMAZONAS~    101            3782            22         5881         2476
## 4     4 AMAZONAS~    104             291             7          672            8
## 5     5 AMAZONAS~    105             430             7         5217         6052
## 6     6 AMAZONAS~    106            1546             7         2778          155
## # i 43 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## #   pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## #   pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## #   techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## #   techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## #   techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## #   piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...
# Inspeccionar las columnas del dataframe para identificar las necesarias
colnames(df)
##  [1] "...1"                    "key"                    
##  [3] "Código"                  "pared1_Ladrillo"        
##  [5] "pared2_Piedra"           "pared3_Adobe"           
##  [7] "pared4_Tapia"            "pared5_Quincha"         
##  [9] "pared6_Piedra"           "pared7_Madera"          
## [11] "pared8_Triplay"          "pared9_Otro"            
## [13] "pared10_Total"           "techo1_Concreto"        
## [15] "techo2_Madera"           "techo3_Tejas"           
## [17] "techo4_Planchas"         "techo5_Caña"            
## [19] "techo6_Triplay"          "techo7_Paja"            
## [21] "techo8_Otro"             "techo9_Total"           
## [23] "piso1_Parquet"           "piso2_Láminas"          
## [25] "piso3_Losetas"           "piso4_Madera"           
## [27] "piso5_Cemento"           "piso6_Tierra"           
## [29] "piso7_Otro"              "piso8_Total"            
## [31] "agua1_Red"               "agua2_Red_fueraVivienda"
## [33] "agua3_Pilón"             "agua4_Camión"           
## [35] "agua5_Pozo"              "agua6_Manantial"        
## [37] "agua7_Río"               "agua8_Otro"             
## [39] "agua9_Vecino"            "agua10_Total"           
## [41] "elec1_Sí"                "elec2_No"               
## [43] "elec3_Total"             "departamento"           
## [45] "provincia"               "Castillo"               
## [47] "Keiko"                   "ganaCastillo"           
## [49] "covidPositivos"          "covidFallecidos"
# Revisar el contenido del dataframe para asegurarme de que se ha cargado correctamente
print(head(df))
## # A tibble: 6 x 50
##    ...1 key       Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
##   <dbl> <chr>      <dbl>           <dbl>         <dbl>        <dbl>        <dbl>
## 1     1 AMAZONAS~    102            4633            46         6639          222
## 2     2 AMAZONAS~    103            1602             9         2729          240
## 3     3 AMAZONAS~    101            3782            22         5881         2476
## 4     4 AMAZONAS~    104             291             7          672            8
## 5     5 AMAZONAS~    105             430             7         5217         6052
## 6     6 AMAZONAS~    106            1546             7         2778          155
## # i 43 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## #   pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## #   pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## #   techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## #   techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## #   techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## #   piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...
df$total_viviendas <- df$agua1_Red + df$agua2_Red_fueraVivienda + df$agua3_Pilón + df$agua4_Camión + df$agua5_Pozo + df$agua6_Manantial + df$agua7_Río + df$agua8_Otro + df$agua9_Vecino

df$porcentaje_agua_red <- (df$agua1_Red / df$total_viviendas) * 100


df$razon_votacion <- df$Keiko / df$Castillo


df$tasa_fallecidos_por_1000 <- (df$covidFallecidos / df$covidPositivos) * 1000

head(df)
## # A tibble: 6 x 54
##    ...1 key       Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
##   <dbl> <chr>      <dbl>           <dbl>         <dbl>        <dbl>        <dbl>
## 1     1 AMAZONAS~    102            4633            46         6639          222
## 2     2 AMAZONAS~    103            1602             9         2729          240
## 3     3 AMAZONAS~    101            3782            22         5881         2476
## 4     4 AMAZONAS~    104             291             7          672            8
## 5     5 AMAZONAS~    105             430             7         5217         6052
## 6     6 AMAZONAS~    106            1546             7         2778          155
## # i 47 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## #   pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## #   pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## #   techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## #   techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## #   techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## #   piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...