Grupo: 5
Integrantes: Anthony Calderon, Héctor Rojas y Julissa Navarro

Pasos Previos

options(warn=-1)
library(rio) #esta libreria sirve para abrir archivos
library(dplyr)    #procesamiento de datos
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2) #graficos
library(descr) #algunos descriptos 
library(tidyverse) #manipulacion de datos
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.1
## ✔ readr     2.1.5
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(gtsummary) #tablas en formato apa
library(survey) #ponderar bases
## Cargando paquete requerido: grid
## Cargando paquete requerido: Matrix
## 
## Adjuntando el paquete: 'Matrix'
## 
## The following objects are masked from 'package:tidyr':
## 
##     expand, pack, unpack
## 
## Cargando paquete requerido: survival
## 
## Adjuntando el paquete: 'survey'
## 
## The following object is masked from 'package:graphics':
## 
##     dotchart

Importación de la base de datos que denominaremos “enades”

enades = import ("https://github.com/azula89/bases/raw/main/OXFAM_IEP_ENADES_2024.sav")

A modo de precaución pondremos todas los carácteres en minúsculas, esto evitará problemas en la sintaxis

colnames(enades) <- tolower(colnames(enades)) #pone los códigos en minúsculas

Limpiamos la data, dejando de lado los valores perdidos (no eliminandolos, sino dejándolos fuera de nuestro análisis)

enades [enades == 99] <- NA #el valor dependerá de la base de datos, en esta ocasión los valores perdidos se representan con 99.

Pasos previos a la creación de la base de datos con las variables a utilizar

  1. Recodificación de los grupos de edad “edadr”
enades$edadr <- factor(enades$edadr, labels = c("De 18 a 24 años", "De 25 a 39 años", "De 40 a más años")) 

No se lee el “Menos de 18 años” debido a que si el encuestado marca tal opción se termina la encuesta -no es posible aceptar a menores de edad en el cuestionario-

  1. Recodificación de sexo del encuestado “sexo”
enades$sexo <- factor(enades$sexo, labels = c("Hombre", "Mujer"))
  1. Recodificación del nivel de estudios “edu2”
enades$edu2 <- factor(enades$edu2, labels = c("Educación básica", "Educación superior"))
  1. Recodificación de nivel socioeconómico “nse2”
enades$nse2 <- factor(enades$nse2, labels = c("NSA/B", "NSC", "NSD/E"))
  1. Recodificación de la percepción sobre la diferencia entre ricos y pobres “p08”
enades$p08 <- factor(enades$p08, labels = c("Ha aumentado", "Se mantiene igual", "Ha disminuido"))
  1. Recodificación de percepción sobre la desigualdad entre ciudades y las zonas rurales “p17”
enades$p17 <- factor(enades$p17, labels = c("Muy grave", "Algo grave", "Poco grave", "Nada grave"))
  1. Recodificación de percepción sobre la desigualdad entre hombres y mujeres “p20”
enades$p20 <- factor(enades$p20, labels = c("Muy grave", "Algo grave", "Poco grave", "Nada grave"))

Pregunta 1

design <- svydesign(~1, data = as.data.frame(enades), weights = ~ponderab)
  1. Tablas de frecuencia absoluta y relativa sobre sexo
design %>% tbl_svysummary(percent = "column", include = c(sexo), missing = "no")
Characteristic N = 1,5081
sexo
    Hombre 751 (50%)
    Mujer 757 (50%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre edadr
design %>% tbl_svysummary(percent = "column", include = c(edadr), missing = "no")
Characteristic N = 1,5081
edadr
    De 18 a 24 años 238 (16%)
    De 25 a 39 años 510 (34%)
    De 40 a más años 760 (50%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre edu2
design %>% tbl_svysummary(percent = "column", include = c(edu2), missing = "no")
Characteristic N = 1,5081
edu2
    Educación básica 799 (53%)
    Educación superior 709 (47%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre nse2
design %>% tbl_svysummary(percent = "column", include = c(nse2), missing = "no")
Characteristic N = 1,5081
nse2
    NSA/B 215 (14%)
    NSC 441 (29%)
    NSD/E 851 (56%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre p17
design %>% tbl_svysummary(percent = "column", include = c(p17), missing = "no")
Characteristic N = 1,5081
p17
    Muy grave 789 (53%)
    Algo grave 357 (24%)
    Poco grave 270 (18%)
    Nada grave 64 (4.3%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre p20
design %>% tbl_svysummary(percent = "column", include = c(p20), missing = "no")
Characteristic N = 1,5081
p20
    Muy grave 358 (24%)
    Algo grave 411 (28%)
    Poco grave 453 (31%)
    Nada grave 256 (17%)
1 n (%)
  1. Tablas de frecuencia absoluta y relativa sobre p08
design %>% tbl_svysummary(percent = "column", include = c(p08), missing = "no")
Characteristic N = 1,5081
p08
    Ha aumentado 896 (62%)
    Se mantiene igual 353 (24%)
    Ha disminuido 206 (14%)
1 n (%)

Interpretación de la información

  1. Sobre sexo

De un total de 1508 encuestados, 751 son hombres y 757 son mujeres. Esta distribución permite representar equitativamente ambos géneros en la muestra, lo cual es importante para interpretar percepciones sin sesgo por cada sexo.

  1. Sobre grupos de edad

El grupo de personas de 40 años a más representa la mitad de la muestra (50%), seguido por el grupo de 25 a 39 años (34%) y finalmente los jóvenes de 18 a 24 años (16%). La mayoría de los encuestados, por tanto, son adultos mayores.

  1. Sobre nivel educativo

La mayoría de los encuestados tiene educación básica (53%), mientras que el 47% ha alcanzado educación superior. La distribución presenta una predominancia en personas que tienen niveles educativos básicos, con una una diferencia de 6 puntos porcentuales respecto a los que poseen una educación superior.

  1. Sobre nivel socioeconómico

El grupo más representado es el sector D/E (56%), seguido del C (29%) y finalmente el A/B (14%). Esta distribución refleja la estructura socioeconómica del país y otorga mayor peso a las percepciones de los sectores con menores ingresos.

  1. Sobre percepción de desigualdad entre ciudades y zonas rurales

Una mayoría significativa considera que la desigualdad territorial es un problema serio. El 53% lo percibe como muy grave y el 24% como algo grave, lo cual suma un 77% con una visión crítica. Solo el 4.3% considera que no es grave.

  1. Sobre percepción de desigualdad entre hombres y mujeres

Las opiniones están más divididas. El 24% considera que la desigualdad de género es muy grave y el 28% algo grave. Sin embargo, un 31% la considera poco grave y un 17% nada grave. Estos niveles evidencian una menor preocupación sobre la desigualdad de género.

  1. Sobre percepción entre diferencia entre ricos y pobres

Más de la mitad de personas (62%) perciben un aumento en la diferencia entre ricos y pobres. Un 24% de los encuestados considera que se ha mantenido la brecha, mientras que un sector reducido (14%) cree que ha disminuido. Esto refleja que una importante cantidad de personas presencian que esta brechas van aumentando.

Pregunta 2

  1. Crearemos una base de datos con las siguientes variables: edad, edadr, sexo, edu2, nse2, p08, p17, p20, ponderab. Filtramos las variables que utilizaremos para nuestro análisis descriptivo.
variables <- enades [c("edad", "edadr", "sexo", "edu2", "nse2", "p08", "p17", "p20", "ponderab")]
  1. Ponderación de nuestra base de datos “variables”
design <- svydesign(~1, data = as.data.frame(variables), weights = ~ponderab)
  1. Tablas cruzadas de percepción sobre diferencia entre ricos y pobres según grupos de edad
variables %>% tbl_summary(include = c(edadr), missing = "no", percent = "column",  by = "p08") 
## 51 missing rows in the "p08" column have been removed.
Characteristic Ha aumentado
N = 901
1
Se mantiene igual
N = 351
1
Ha disminuido
N = 205
1
edadr


    De 18 a 24 años 106 (12%) 64 (18%) 28 (14%)
    De 25 a 39 años 327 (36%) 119 (34%) 73 (36%)
    De 40 a más años 468 (52%) 168 (48%) 104 (51%)
1 n (%)
  1. Tablas cruzadas de percepción sobre la diferencia entre ricos y pobres según nivel socioeconómico
variables %>% tbl_summary(include = c(nse2), missing = "no", percent = "column",  by = "p08") 
## 51 missing rows in the "p08" column have been removed.
Characteristic Ha aumentado
N = 901
1
Se mantiene igual
N = 351
1
Ha disminuido
N = 205
1
nse2


    NSA/B 138 (15%) 45 (13%) 24 (12%)
    NSC 280 (31%) 106 (30%) 55 (27%)
    NSD/E 483 (54%) 200 (57%) 126 (61%)
1 n (%)
  1. Gráfico sobre percepción sobre la diferencia entre ricos y pobres según nivel socioeconómico
tabla <- svytable(~ nse2 + p08, design)
tabla = as.data.frame(tabla)  %>% group_by(p08) %>% mutate(percent = round(Freq/sum(Freq)*100,0))
ggplot (tabla, aes (fill=p08, y=percent, x=nse2)) + geom_bar (position = 'dodge', stat = 'identity') + 
  theme_bw()+xlab(NULL)+ylab(NULL) + 
  geom_text(aes(label=paste(percent, "%")), position=position_dodge(width=0.9), size=3.5, vjust=-0.30) + labs(fill = "diferencia entre ricos y pobres")

  1. Gráfico sobre percepción sobre diferencia entre ricos y pobres según grupos de edad
tabla <- svytable(~ edadr + p08, design)
tabla = as.data.frame(tabla)  %>% group_by(p08) %>% mutate(percent = round(Freq/sum(Freq)*100,0))
ggplot (tabla, aes (fill=p08, y=percent, x=edadr)) + geom_bar (position = 'dodge', stat = 'identity') + 
  theme_bw()+xlab(NULL)+ylab(NULL) + 
  geom_text(aes(label=paste(percent, "%")), position=position_dodge(width=0.9), size=3.5, vjust=-0.30) + labs(fill = "diferencia entre ricos y pobres")

Respuesta de las preguntas

1 ¿Cuál es la percepción de los peruanos respecto a la variación de la diferencia entre ricos y pobres en el Perú según grupo de edad?

A partir de la tabla cruzada y el gráfico de barras sobre la percepción de los peruanos sobre la variación en la desigualdad entre ricos y pobres según el grupo etario, consideramos lo siguiente. En primer lugar, alrededor de 5 de cada 10 personas de 40 años perciben que la situación ha empeorado, representado por el 52% que considera que esta ha aumentado. En segundo lugar, el grupo de 25 a 39 años, la opinión se muestra en niveles cercanos por cada categoría: un 35% percibe un aumento, el 32% contempla que se mantiene igual y el 34% sopesa que ha disminuido la desigualdad. En tercer lugar, el grupo más joven, de 18 a 24 años, presenta una visión más optimista a diferencia de los otros grupos de edad, puesto que un 13% considera que la desigualdad ha aumentado, pero el 21% evidencia que se mantiene igual y presencian cierta estabilidad respecto a la desigualdad.

2 ¿Cómo se da esta percepción según nivel socioeconómico?

Partimos de la tabla cruzada y el gráfico de barras sobre la percepción de la desigualdad entre ricos y pobres según nivel socioeconómico. El sector D/E expone una percepción más negativa de la desigualdad, con un 54% en la categoría “ha aumentado”, a comparación de los sectores más altos como el A y el B. Asimismo, tiene los niveles más altos tanto en “se mantiene igual” (57%) y “ha disminuido” (63%). Por otro lado, el sector C muestra una postura intermedia, sin una opinión predominante, pues sus porcentajes son del 26% que considera que ha disminuido, el 29% percibe que se mantiene igual y el 30% sopesa un aumento en la desigualdad. Por su parte, el sector A/B presenta una visión menos crítica y sus valores son menores a diferencia de los anteriores sectores. A su vez, solo el 15% considera que la desigualdad ha aumentado, así como otros niveles similares de “se ha mantenido igual con el 14% y “ha disminuido” con el 12%.

Gracias:D