library(readxl)
# Cargar el archivo de Excel
file_path <- 'dataOK_all.xlsx'
df <- read_excel(file_path, sheet = 'dataOK_all')
## New names:
## * `` -> `...1`
# Mostrar las primeras filas del dataframe para entender su estructura
head(df)
## # A tibble: 6 x 50
## ...1 key Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 AMAZONAS~ 102 4633 46 6639 222
## 2 2 AMAZONAS~ 103 1602 9 2729 240
## 3 3 AMAZONAS~ 101 3782 22 5881 2476
## 4 4 AMAZONAS~ 104 291 7 672 8
## 5 5 AMAZONAS~ 105 430 7 5217 6052
## 6 6 AMAZONAS~ 106 1546 7 2778 155
## # i 43 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## # pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## # pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## # techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## # techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## # techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## # piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...
# Inspeccionar las columnas del dataframe para identificar las necesarias
colnames(df)
## [1] "...1" "key"
## [3] "Código" "pared1_Ladrillo"
## [5] "pared2_Piedra" "pared3_Adobe"
## [7] "pared4_Tapia" "pared5_Quincha"
## [9] "pared6_Piedra" "pared7_Madera"
## [11] "pared8_Triplay" "pared9_Otro"
## [13] "pared10_Total" "techo1_Concreto"
## [15] "techo2_Madera" "techo3_Tejas"
## [17] "techo4_Planchas" "techo5_Caña"
## [19] "techo6_Triplay" "techo7_Paja"
## [21] "techo8_Otro" "techo9_Total"
## [23] "piso1_Parquet" "piso2_Láminas"
## [25] "piso3_Losetas" "piso4_Madera"
## [27] "piso5_Cemento" "piso6_Tierra"
## [29] "piso7_Otro" "piso8_Total"
## [31] "agua1_Red" "agua2_Red_fueraVivienda"
## [33] "agua3_Pilón" "agua4_Camión"
## [35] "agua5_Pozo" "agua6_Manantial"
## [37] "agua7_Río" "agua8_Otro"
## [39] "agua9_Vecino" "agua10_Total"
## [41] "elec1_Sí" "elec2_No"
## [43] "elec3_Total" "departamento"
## [45] "provincia" "Castillo"
## [47] "Keiko" "ganaCastillo"
## [49] "covidPositivos" "covidFallecidos"
# Revisar el contenido del dataframe para asegurarme de que se ha cargado correctamente
print(head(df))
## # A tibble: 6 x 50
## ...1 key Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 AMAZONAS~ 102 4633 46 6639 222
## 2 2 AMAZONAS~ 103 1602 9 2729 240
## 3 3 AMAZONAS~ 101 3782 22 5881 2476
## 4 4 AMAZONAS~ 104 291 7 672 8
## 5 5 AMAZONAS~ 105 430 7 5217 6052
## 6 6 AMAZONAS~ 106 1546 7 2778 155
## # i 43 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## # pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## # pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## # techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## # techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## # techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## # piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...
df$total_viviendas <- df$agua1_Red + df$agua2_Red_fueraVivienda + df$agua3_Pilón + df$agua4_Camión + df$agua5_Pozo + df$agua6_Manantial + df$agua7_Río + df$agua8_Otro + df$agua9_Vecino
df$porcentaje_agua_red <- (df$agua1_Red / df$total_viviendas) * 100
df$razon_votacion <- df$Keiko / df$Castillo
df$tasa_fallecidos_por_1000 <- (df$covidFallecidos / df$covidPositivos) * 1000
head(df)
## # A tibble: 6 x 54
## ...1 key Código pared1_Ladrillo pared2_Piedra pared3_Adobe pared4_Tapia
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 AMAZONAS~ 102 4633 46 6639 222
## 2 2 AMAZONAS~ 103 1602 9 2729 240
## 3 3 AMAZONAS~ 101 3782 22 5881 2476
## 4 4 AMAZONAS~ 104 291 7 672 8
## 5 5 AMAZONAS~ 105 430 7 5217 6052
## 6 6 AMAZONAS~ 106 1546 7 2778 155
## # i 47 more variables: pared5_Quincha <dbl>, pared6_Piedra <dbl>,
## # pared7_Madera <dbl>, pared8_Triplay <dbl>, pared9_Otro <dbl>,
## # pared10_Total <dbl>, techo1_Concreto <dbl>, techo2_Madera <dbl>,
## # techo3_Tejas <dbl>, techo4_Planchas <dbl>, techo5_Caña <dbl>,
## # techo6_Triplay <dbl>, techo7_Paja <dbl>, techo8_Otro <dbl>,
## # techo9_Total <dbl>, piso1_Parquet <dbl>, piso2_Láminas <dbl>,
## # piso3_Losetas <dbl>, piso4_Madera <dbl>, piso5_Cemento <dbl>, ...