Integrantes: Antonella Giletta, Enzo Veleizan, Luciana Victoria Paez, María Rocío Lemos, Gianna Agostina Mastrolinardo y Camila Gisel Coria.

Trabajaremos sobre los datos obtenidos fruto de la realización de una encuesta en la Ciudad de Córdoba entre finales de agosto y principios de septiembre de 2024, por alumnxs de la Cátedra de Estadística 2.

Comenzamos cargando la base de datos a utilizar

Para eso descargamos la base de datos que obtuvimos de la realización de encuestas, desde Google Sheets y la cargamos en R

head(datos)

## # A tibble: 6 × 40
##   `Marca temporal`    mail    edad genero generales balotaje problemas_inflacion
##   <dttm>              <chr>  <dbl> <chr>  <chr>     <chr>                  <dbl>
## 1 2024-08-28 09:39:22 franc…    20 varón  Sergio M… Sergio …                   7
## 2 2024-08-28 09:43:12 estre…    50 varón  Javier M… Javier …                   9
## 3 2024-08-28 10:06:00 ana.p…    20 mujer  Juan Sch… Javier …                   9
## 4 2024-08-28 10:16:48 ana.p…    19 mujer  Juan Sch… En blan…                   8
## 5 2024-08-28 10:26:21 josef…    20 varón  Sergio M… Sergio …                   9
## 6 2024-08-28 10:32:07 facun…    31 varón  Javier M… Javier …                   9
## # ℹ 33 more variables: problemas_inseguridad <dbl>, problemas_pobreza <dbl>,
## #   problemas_desempleo <dbl>, problemas_corrupcion <dbl>,
## #   problemas_desigualdad <dbl>, problemas_educacion <dbl>,
## #   problemas_deficit <dbl>, orden_inflacion <chr>, orden_inseguridad <chr>,
## #   orden_pobreza <chr>, orden_desempleo <chr>, orden_corrupcion <chr>,
## #   orden_desigualdad <chr>, orden_educacion <chr>, orden_deficit <chr>,
## #   politicas_tarifas <dbl>, politicas_boleto <dbl>, …

Lo que vemos son las primeras filas del archivo de Google Sheets, para procesar la información primero necesitamos ordenarla. Para eso necesitamos conocer las variables de nuestra base de datos.

names(datos)

##  [1] "Marca temporal"          "mail"                   
##  [3] "edad"                    "genero"                 
##  [5] "generales"               "balotaje"               
##  [7] "problemas_inflacion"     "problemas_inseguridad"  
##  [9] "problemas_pobreza"       "problemas_desempleo"    
## [11] "problemas_corrupcion"    "problemas_desigualdad"  
## [13] "problemas_educacion"     "problemas_deficit"      
## [15] "orden_inflacion"         "orden_inseguridad"      
## [17] "orden_pobreza"           "orden_desempleo"        
## [19] "orden_corrupcion"        "orden_desigualdad"      
## [21] "orden_educacion"         "orden_deficit"          
## [23] "politicas_tarifas"       "politicas_boleto"       
## [25] "politicas_impuestos"     "politicas_obras"        
## [27] "politicas_universidades" "imagen_milei"           
## [29] "imagen_grabois"          "imagen_bullrich"        
## [31] "imagen_villarruel"       "imagen_llaryora"        
## [33] "imagen_kicillof"         "imagen_moreno"          
## [35] "imagen_deloredo"         "imagen_cfk"             
## [37] "imagen_macri"            "control_precios"        
## [39] "control_privatizacion"   "control_punibilidad"

Y tenemos que saber cúal es el tamaño de nuestra muestra, es decir, con cuantas encuestas o resultados estamos trabajando, sabiendo que la población total serían los habitantes de la Ciudad de Córdoba, donde fue aplicado el instrumento de recolección de datos.

nrow(datos)

## [1] 925

Estamos trabajando con un total de 925 resultados. Sabemos que entre estos se encuentran tanto variables numéricas como categóricas

Como trabajaremos con tablas, para hacerlas más estéticas y visualmente transparentes, usaremos la función kable, que se introduce:

# install.packages("kableExtra")
library(kableExtra)

Estamos en condiciones de generar la primera tabla, que de cuenta de los géneros de las personas encuestadas, para conocer con que población estamos trabajando.

kable(table(datos$genero), col.names = c("Género", "Frecuencia"))

Género	Frecuencia
mujer	452
mujer trans / travesti	4
no binario	5
otra identidad / ninguna de las anteriores	2
Prefiero no contestar	2
varón	456
varón trans / masculinidad trans	4

Observamos que hay una distribución polarizada entre los géneros “mujer” y “hombre” que son la amplia mayoria, acumulando cada categoria casi la mitad de la muestra.

Por otro lado, para conocer las edades con las que estamos trabajando buscaremos observar la edad media de nuestra muestra y los extremos, edades de la persona más joven y más anciana encuestadas.

summary(datos$edad)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.00   26.00   39.00   41.21   53.00   92.00

Observamos que: La persona más joven encuestada tiene 16 años La persona más anciana encuestada tiene 92 años La media de edad de la muestra es de 39 años

Un histograma ayuda a observar la distribución de estas edades Aclaración importante! Todos nuestros gráficos seran rosas en este trabajo.

hist(datos$edad, main = "Histograma de las edades de lxs encuestadxs", ylab = "Cantidad de personas", xlab = "Edades", col = "pink")

Análisis del voto emitido en las últimas elecciones presidenciales

Primero buscaremos generar una tabla donde se de cuenta del voto emitido en las Elecciones generales para presidente en 2023

kable(table(datos$generales), col.names = c("Voto emitido en las Generales", "Frecuencia, cantidad de votos relevados"))

Voto emitido en las Generales	Frecuencia, cantidad de votos relevados
En blanco	29
Javier Milei	253
Juan Schiaretti	130
Miriam Bregman	52
No me acuerdo	5
No voté	87
Patricia Bullrich	155
Sergio Massa	214

Observamos que el candidato más votado fue Javier Milei, con Segrio Massa en segundo lugar, lo que es coherente con la realización del balotaje, entre estos dos candidatos.

En cuento a la segunda vuelta, contruimos una segunda tabla, que de cuenta del voto emitido en las Elecciones de Balotaje en 2023

table(datos$balotaje) %>% kable(col.names = c("Voto emitido en el Balotaje", "Frecuencia, cantidad de votos relevados"))

Voto emitido en el Balotaje	Frecuencia, cantidad de votos relevados
En blanco	79
Javier Milei	414
No me acuerdo	6
No voté	113
Sergio Massa	313

El claro ganador en nuestra muestra es Javie Milei!

Imagen de distintas figuras políticas

Otro punto relevado en la encuesta fue la imágen de distintas figuras políticas, donde se encuentran diputados, gobernadores o exgobernadores, presidentes/as y vicepresidentes/as, ministras, etc. Se le preguntó a las personas la opinión sobre estos políticos y políticas en una escala del 1 al 10.

El primer punto impotante a tener en cuenta es que al preguntar por la imagen de estos/as politicos/as se daba a las personas la opción de responder “no sé” o “no lo/la conozco”, se trata de valores no numéricos por lo que necesitamos convertir las variables en numéricas para analizar su distribución. Esto lo haremos con la función “as.numeric”. Por otro lado, introduciremos en el código la exclusión de los valores no numéricos, para que no nos muestre como error o advertencia los mismos.

Para cada individuo sobre el que se preguntó construiremos además de la tabla que da cuenta de la distribución de la puntuación obtenida, un histograma.

Comenzamos con la imagen del presidente Javier Milei

datos$imagen_milei = as.numeric(datos$imagen_milei)
summary(datos$imagen_milei)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   5.000   4.691   8.000  10.000      17

Observamos que posee una imagen promedio de 4,61 puntos y que 17 personas respondieron “no sé” o “no lo conozco”

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el mandatario.

hist(datos$imagen_milei, main = "Histograma de la imagen de Javier Milei", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen de la vicepresidenta Victoria Villarruel

datos$imagen_villarruel = as.numeric(datos$imagen_villarruel)
summary(datos$imagen_villarruel)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   5.000   4.647   7.000  10.000      50

Observamos que tiene una imagen promedio de 4,64 pero que 50 personas respondieron “no sé” o “no la conozco”.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la mandataria.

hist(datos$imagen_villarruel, main = "Histograma de la imagen de Victoria Villarruel", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen de la ex presidenta y vicepresidenta Cristina Fernandez de Kirchner

datos$imagen_cfk = as.numeric(datos$imagen_cfk)
summary(datos$imagen_cfk)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   2.000   3.485   6.000  10.000      29

Observamos que en ella el promedio de imagen es menor a la de los ejemplos anteriores, de 3,48, y que 29 personas respondieron “no sé” o “no la conozco”.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la ex mandataria.

hist(datos$imagen_cfk, main = "Histograma de la imagen de Cristina Fernandez", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen de la ministra Patricia Bullrich

datos$imagen_bullrich = as.numeric(datos$imagen_bullrich)
summary(datos$imagen_bullrich)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   4.000   4.352   7.000  10.000      22

Observamos que la media obtenida es de 4,35 y que 22 personas respondieron “no sé” o “no la conozco”.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la ministra.

hist(datos$imagen_bullrich, main = "Histograma de la imagen de Patricia Bullrich", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen del expresidente Mauricio Macri

datos$imagen_macri = as.numeric(datos$imagen_macri)
summary(datos$imagen_macri)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   4.000   3.882   6.000  10.000      22

Observamos que su promedio de imahen es similar a la del anterior caso, siendo de 3,88 puntos y la cantidad de personas que respondieron “no sé” o “no lo conozco”.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el ex mandatario.

hist(datos$imagen_macri, main = "Histograma de la imagen de Mauricio Macri", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen del actual gobernador de la provincia de Córdoba Martín Llaryora

datos$imagen_llaryora = as.numeric(datos$imagen_llaryora)
summary(datos$imagen_llaryora)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   3.000   4.000   4.386   6.000  10.000      69

Observamos que la media también se ubica en 4,38 puntos pero que se eleva el número de personas que respondieron “no sé” o “no lo conozco”, a 69 individuos.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el gobernador.

hist(datos$imagen_llaryora, main = "Histograma de la imagen de Martín Llaryora", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Todos los histogramas realizados hasta el momento presentan una polarización clara hacia la izquierda, en los valores más bajos, este es el primero donde hacia la mitad del gráfico se elevan las barras!

Continuamos con la imagen del actual gobernador de la provincia de Buenos Aires Axel Kicillof

datos$imagen_kicillof = as.numeric(datos$imagen_kicillof)
summary(datos$imagen_kicillof)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   3.000   3.528   6.000  10.000      61

Observamos que en este candidato la media baja a 3,52 y también es más elevada la cantidad de personas que respondieron “no sé” o “no lo conozco”, 61 personas.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el gobernador.

hist(datos$imagen_kicillof, main = "Histograma de la imagen de Axel Kicillof", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen del diputado nacional por Córdoba Rodrigo De Loredo

datos$imagen_deloredo = as.numeric(datos$imagen_deloredo)
summary(datos$imagen_deloredo)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   2.000   4.000   3.801   5.000  10.000     211

Observamos que la media se ubica en 3,8, siendo la que más se repite entre todos los relevados y que sube mucho la cantidad de personas que respondieron “no sé” o “no lo conozco”, a 211 individuos, lo que es una cantidad relevante en relación con la cantidad de casos contemplados, casi una quinta parte de la muestra no tiene opinión o no conoce al candidato. Es el candidato que registra más respuestas de este tipo.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el diputado.

hist(datos$imagen_deloredo, main = "Histograma de la imagen de Rodrigo De Loredo", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen del dirigente del Frente Patria Grande Juan Grabois

datos$imagen_grabois = as.numeric(datos$imagen_grabois)
summary(datos$imagen_grabois)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   3.000   3.661   6.000  10.000     165

Observamos que la media es de 3,66 y que 165 personas respondieron “no sé” o “no lo conozco”, siendo junto con Rodrigo De Loredo y Guillero Moreno, los candidatos que más altos registran este valor.

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el candidato.

hist(datos$imagen_grabois, main = "Histograma de la imagen de Juan Grabois", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Continuamos con la imagen del dirigente del partido “Principios y Valores” Guillermo Moreno

datos$imagen_moreno = as.numeric(datos$imagen_moreno)
summary(datos$imagen_moreno)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   2.000   3.061   5.000  10.000     204

Observamos que la media en este candidato es de 3,06, siendo junto con la de Cristina Fernandez, las dos más bajas. Además, 204 personas respondieron sobre él “no sé” o “no lo conozco”

Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el candidato.

hist(datos$imagen_moreno, main = "Histograma de la imagen de Guillermo Moreno", ylab =  "Frecuencia", xlab = "Puntaje", col = "pink")

Sobre la pregunta: ¿Cuál es la figura con mejor imagen en Córdoba?

Debemos iniciar con algunas precisiones. Comparar las medias sería lo instintivo, sin embargo utilizarlas puede llevar a equivocaciones porque si los resultados están muy polarizados hacia ciertos valores, cosa que sucede con la mayoría de candidatos/as, la media no es representativa. Para solucionar este problema debemos general intervalos de confianza de las imágenes de distintos candidatos. Para esto primero debemos instalar una serie de librerias que nos ayudarán para lograrlo!

# install.packages("ggplot2")
# install.packages("dplyr")
# install.packages("tidyr")
# install.packages("gmodels")

library(ggplot2)
library(dplyr)
library(tidyr)
library(gmodels)

Imagen de Javier Milei con intervalos de confianza:

datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(datos$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.6905286  4.4856372  4.8954201  0.1043989

Imagen de Victoria Villarruel con intervalos de confianza:

datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(datos$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.6468571  4.4454417  4.8482726  0.1026226

Imagen de Cristina Fernandez con intervalos de confianza:

datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(datos$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.4854911  3.2847932  3.6861890  0.1022603

Imagen de Patricia Bullrich con intervalos de confianza:

datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(datos$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 4.35215947 4.17008732 4.53423161 0.09277101

Imagen de Mauricio Macri con intervalos de confianza:

datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(datos$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 3.88150609 3.71404142 4.04897076 0.08532808

Imagen de Martín Llaryora con intervalos de confianza:

datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(datos$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 4.38551402 4.23699201 4.53403603 0.07567066

Imagen de Axel Kicillof con intervalos de confianza:

datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(datos$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 3.52777778 3.34487243 3.71068312 0.09318989

Imagen de Rodrigo De Loredo con intervalos de confianza:

datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(datos$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 3.80112045 3.63402164 3.96821925 0.08511133

Imagen de Juan Grabois con intervalos de confianza:

datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(datos$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 3.66052632 3.46758055 3.85347208 0.09828655

Imagen de Guillermo Moreno con intervalos de confianza:

datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(datos$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 3.06102635 2.88995967 3.23209304 0.08713381

Para poder afirmar que una figura tiene mejor imagen de otra debemos comprobar que los intervalos de confianza de ambas no se superpongan en algún punto, para esto un gráfico será de gran ayuda como apoyo visual.

A continuación crearemos una tabla resumen con las medias de la imagen de cada figura política, excluyendo las variables categóricas como lo hicimos anteriormente.

resumen_datos_imagenes <- datos %>%
  summarise(
    Imagen_Milei = mean(as.numeric(imagen_milei), na.rm = TRUE),
    Imagen_Grabois = mean(as.numeric(imagen_grabois), na.rm = TRUE),
    Imagen_Bullrich = mean(as.numeric(imagen_bullrich), na.rm = TRUE),
    Imagen_Villarruel = mean(as.numeric(imagen_villarruel), na.rm = TRUE),
    Imagen_Llaryora = mean(as.numeric(imagen_llaryora), na.rm = TRUE),
    Imagen_Kicillof = mean(as.numeric(imagen_kicillof), na.rm = TRUE),
    Imagen_Moreno = mean(as.numeric(imagen_moreno), na.rm = TRUE),
    Imagen_Deloredo = mean(as.numeric(imagen_deloredo), na.rm = TRUE),
    Imagen_CFK = mean(as.numeric(imagen_cfk), na.rm = TRUE),
    Imagen_Macri = mean(as.numeric(imagen_macri), na.rm = TRUE)
  ) %>%
  pivot_longer(cols = everything(), names_to = "Candidato", values_to = "Valoracion")
knitr::kable(resumen_datos_imagenes)

Candidato	Valoracion
Imagen_Milei	4.690529
Imagen_Grabois	3.660526
Imagen_Bullrich	4.352159
Imagen_Villarruel	4.646857
Imagen_Llaryora	4.385514
Imagen_Kicillof	3.527778
Imagen_Moreno	3.061026
Imagen_Deloredo	3.801120
Imagen_CFK	3.485491
Imagen_Macri	3.881506

Calculamos los errores estándar para cada figura y los uniremos en una sola tabla

errores_datos_imagenes <- datos %>%
  summarise(
    Imagen_Milei = sd(as.numeric(imagen_milei), na.rm = TRUE) / sqrt(sum(!is.na(imagen_milei))),
    Imagen_Grabois = sd(as.numeric(imagen_grabois), na.rm = TRUE) / sqrt(sum(!is.na(imagen_grabois))),
    Imagen_Bullrich = sd(as.numeric(imagen_bullrich), na.rm = TRUE) / sqrt(sum(!is.na(imagen_bullrich))),
    Imagen_Villarruel = sd(as.numeric(imagen_villarruel), na.rm = TRUE) / sqrt(sum(!is.na(imagen_villarruel))),
    Imagen_Llaryora = sd(as.numeric(imagen_llaryora), na.rm = TRUE) / sqrt(sum(!is.na(imagen_llaryora))),
    Imagen_Kicillof = sd(as.numeric(imagen_kicillof), na.rm = TRUE) / sqrt(sum(!is.na(imagen_kicillof))),
    Imagen_Moreno = sd(as.numeric(imagen_moreno), na.rm = TRUE) / sqrt(sum(!is.na(imagen_moreno))),
    Imagen_Deloredo = sd(as.numeric(imagen_deloredo), na.rm = TRUE) / sqrt(sum(!is.na(imagen_deloredo))),
    Imagen_CFK = sd(as.numeric(imagen_cfk), na.rm = TRUE) / sqrt(sum(!is.na(imagen_cfk))),
    Imagen_Macri = sd(as.numeric(imagen_macri), na.rm = TRUE) / sqrt(sum(!is.na(imagen_macri)))
  ) %>%
  pivot_longer(cols = everything(), names_to = "Candidato", values_to = "Error")
knitr::kable(errores_datos_imagenes)

Candidato	Error
Imagen_Milei	0.1043989
Imagen_Grabois	0.0982865
Imagen_Bullrich	0.0927710
Imagen_Villarruel	0.1026226
Imagen_Llaryora	0.0756707
Imagen_Kicillof	0.0931899
Imagen_Moreno	0.0871338
Imagen_Deloredo	0.0851113
Imagen_CFK	0.1022603
Imagen_Macri	0.0853281

Y graficamos, pidiendole al código que muestre los valores y el error calculado.

df_final_imagenes <- left_join(resumen_datos_imagenes, errores_datos_imagenes, by = "Candidato")
ggplot(df_final_imagenes, aes(x = Valoracion, y = Candidato)) +
  geom_point(size = 2, color = "blue") +  # Cambiar color y tamaño de los puntos
  geom_errorbarh(aes(xmin = Valoracion - Error, xmax = Valoracion + Error), height = 0.2, color = "red") +
  geom_text(aes(label = round(Valoracion, 2)), hjust = 0.5, vjust = 1.8, color = "blue", size = 3) +  # Etiqueta para la media
  geom_text(aes(label = paste0("±", round(Error, 2))), hjust = 0.5, vjust = -1, color = "red", size = 3) +  # Etiqueta para el error
  labs(x = "Valoración", y = "Candidato") +
  theme_minimal()

Es así que podemos afirmar que existen dos figuras políticas que poseen la mejor imagen: Javier Milei y Victoria Villarruel, sin embargo los intervalos de confianza de ambos se superponen por lo que no podemos afirmar que la imagen de uno sea mejor que la del otro. En el otro extremo, quien cuenta con la peor imagen es Guillermo Moreno, como su intervalo no se superpone con ningún otro podemos afirmarlo.

Análisis de imagen de politicos/as según grupos de género

En esta parte buscaremos dar cuenta de como distintos grupos de personas conceptualizan a distintos politicos/as. Para esto utilizaremos filtros! Y los ya conocidos intervalos de confianza. Comenzaremos con la imagen según identidad de género de las personas encuestadas

Javier Milei

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.1968326  3.9224974  4.4711678  0.1395854

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   5.287305   4.986453   5.588157   0.153084

-Entre las personas que no se identifican ni como varones ni como mujeres. Debemos promero elaborar un filtro que agrupe estas otras opciones de identidad:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))

Y ahora generamos el intervalo de confianza de la imagen de este político entre estas personas:

ci (otras_identidades$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  1.5454545  0.9178513  2.1730578  0.2816715

Vemos que en el caso de Javier Milei entre las mujeres su imagen promedio es más baja que la observada en la población total, mientras que entre los varones es mas alta pero estan los intervalos de población total se superponen con los de hombres y mujeres Respecto de las demás identidades la valoración es mucho más baja, pudiendo afirmar que efectivamente lo conceptual peor, porque el intervalo de este grupo no se pisa con ninguno de los anteriores.

Victoria Villarruel

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.3785714  4.0939069  4.6632360  0.1448202

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  5.0045558  4.7169331  5.2921785  0.1463435

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  1.7000000  1.1110663  2.2889337  0.2603417

Respecto de Victoria Villarruel se repite lo identificado en Javier Milei, al comparar con su imagen en el total poblacional encontramos que los varones la valoran por encima de esta, mientras que las mujeres en promedio lo hacen por debajo pero superponiendose ambos intervalos entre si y con el general. También se repite lo identificado en el grupo de las demás identidades con Javier Milei, la conceptuan peor que mujeres, hombres y el general de la población, sin superposición de intervalos.

Cristina Fernandez

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.5251142  3.2364393  3.8137890  0.1468779

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3537415  3.0711786  3.6363044  0.1437708

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  5.5454545  3.8100625  7.2808466  0.7788527

En esta política encontramos por primera vez que las mujeres la valoran por encima del promedio general, mientras que los varones por debajo de este, aunque los intervalos se superponen por lo que no podemos afirmarlo certeramente. Entre las demás identidades hay una mejor valoración de esta candidata, su intervalo no se superpone ni con los varones ni con la valoración general, por lo que podemos afirmar que este grupo la conceptua mejor que el total poblacional y que quienes se identifican como hombres. El intervalo si se superpone con el de mujeres, aunque en poco, por lo que no podemos afirmarlo en ese caso.

Patricia Bullrich

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.3303167  4.0704525  4.5901810  0.1322224

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   4.472973   4.213038   4.732908   0.132260

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  1.6363636  0.9464757  2.3262516  0.3096252

En el caso de esta política las valoraciones de varones y mujeres no difieren en promedio demasiado del promedio general, ambos intervalos se superponen entre si y con el de imagen general. Se repite lo observado en Milei y Villarruel respecto de la imagen de otras identidades, que la conceptuan muy por debajo, sin superposición de intervalos por lo que podemos afirmar que efectivamente tiene peor imagen entre estos grupos identitarios.

Mauricio Macri

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.8931818  3.6453268  4.1410368  0.1261103

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.9439462  3.7121193  4.1757730  0.1179595

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  2.1818182  1.1936337  3.1700027  0.4435022

En el caso de este candidato observamos por primera vez que tanto varones como mujeres lo conceptuan por encima del promedio general, aunque por diferencias pequeñas y como se superponen los intervalos de estos grupos con el general no podemos afirmarlo. En contraste, los demás grupos identitarios lo conceptúan peor, sin siperposición de intervalos.

Martín Llaryora

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.3519417  4.1390565  4.5648270  0.1082971

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.4439252  4.2315485  4.6563020  0.1080504

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3636364  1.7661220  4.9611507  0.7169725

En el caso de este político observamos que los varones y las mujeres lo conceptuan por encima del intervalo general, pero son diferencias pequeñas, con superposición de intervalos. Respecto de las demás identidades la conceptualización empeora pero también se superpone con la de hombres y mujeres y la opinion general.

Axel Kicillof

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6489104  3.3763173  3.9215035  0.1386721

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3387097  3.0909890  3.5864304  0.1260372

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.8181818  2.9951591  6.6412045  0.8181818

En el caso de este político observamos que las mujeres lo conceptuan mejor que los varones y su intervalo tiene un limite superior mayor al del intervalo general, sin embargo hay superposición entre los intervalos de hombres, mujeres y el general de la población, por lo que no podemos afirmar estas diferencias. Respecto de las demás identidades, observamos un intervalo más amplio, que contiene a todos los demás por empezar antes y terminar después.

Rodrigo De Loredo

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.8219585  3.5689492  4.0749677  0.1286237

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   3.835165   3.607939   4.062390   0.115547

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   2.555556   1.605456   3.505655   0.412011

Respecto de este político observamos que tanto mujeres como varones lo conceptuan con intervalos casi iguales y que poco difieren del general, al haber superposición, no podemos establecer diferencias. Respecto de las personas que no se identifican ni como hombres ni como mujeres la imagen que se tiene de él si es peor, sin superposición de intervalos por lo que es una afirmación certera.

Juan Grabois

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.9562682  3.6591710  4.2533654  0.1510466

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3192020  3.0674145  3.5709895  0.1280767

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  5.1818182  3.5412228  6.8224136  0.7363075

En el caso de este político encontramos que las mujeres lo conceptuan mejor que el general de la población y los varones peor, sin embargo los tres intervalos tenidos en cuenta se superponen por lo que no podemos afirmar diferencias. Respecto del resto de identidades agrupadas observamos que el intervalo es de mayor amplitud, superponiendose con los demás pero llegando más alto su límite superior.

Guillermo Moreno

-Entre las personas identificadas como mujeres:

mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  2.8416149  2.6073995  3.0758303  0.1190493

-Entre las personas identificadas como varones:

varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.2036554  2.9536133  3.4536974  0.1271706

-Entre las personas que no se identifican ni como varones ni como mujeres:

otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6000000  2.6343418  4.5656582  0.4268749

Este político posee entre las mujeres una imagen peor que en el general de la población y entre los varones una mejor. Sin embargo como hay superposiciones entre los intervalos no podemos afirmarlo realmente En cuanto a los demás grupos identitarios identidicamos que de nuevo el intervalo de opinión es más amplio, conteniendo a los de varones y mujeres y llegando a un límite superior mayor, aunque tampoco podemos afirmar diferencias porque se superponen entre sí.

Análisis de la imagen de politicos/as según grupo etario

Buscamos analizar la imagen de los distintos políticos según las edades de las personas que respondieron. Además de obtener la media, buscaremos generar el intervalo de confianza de cada imagen.

En primer lugar, trabajaremos con personas de menos de 30 años:

menores_30 = filter(datos, datos$edad <= 30, datos$edad >=16)

Y lo aplicamos a las distintas figuras políticas. Imagen de Javier Milei

datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(menores_30$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.7582090  4.4174624  5.0989556  0.1732235

Imagen de Victoria Villarruel

datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(menores_30$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.5593750  4.2262322  4.8925178  0.1693291

Imagen de Cristina Fernandez

datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(menores_30$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.5337423  3.1970619  3.8704227  0.1711392

Imagen de Patricia Bullrich

datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(menores_30$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.1185410  3.8418760  4.3952060  0.1406374

Imagen de Mauricio Macri

datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(menores_30$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.8287462  3.5685796  4.0889127  0.1322477

Imagen de Martín Llaryora

datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(menores_30$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   4.277228   4.036733   4.517723   0.122212

Imagen de Axel Kicillof

datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(menores_30$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6123779  3.3036220  3.9211337  0.1569083

Imagen de Rodrigo De Loredo

datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(menores_30$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6228814  3.3434836  3.9022791  0.1418184

Imagen de Juan Grabois

datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(menores_30$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.8759690  3.5456138  4.2063242  0.1677579

Imagen de Guillermo Moreno

datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(menores_30$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3407080  3.0386528  3.6427631  0.1532837

A continuación, la imagen de los políticos entre las personas de entre 30 y 50 años:

Construimos el filtro de este grupo etario.

entre_3050 = filter(datos, datos$edad <=50, datos$edad >=30)

Imagen de Javier Milei

datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(entre_3050$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.5653595  4.2032085  4.9275105  0.1840411

Imagen de Victoria Villarruel

datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(entre_3050$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.6317568  4.2739162  4.9895974  0.1818261

Imagen de Cristina Fernandez

datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(entre_3050$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6963696  3.3398184  4.0529209  0.1811882

Imagen de Patricia Bullrich

datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(entre_3050$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.1928105  3.8770211  4.5085998  0.1604806

Imagen de Mauricio Macri

datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(entre_3050$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6535948  3.3605905  3.9465990  0.1489015

Imagen de Martín Llaryora

datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(entre_3050$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.2600000  4.0067311  4.5132689  0.1286981

Imagen de Axel Kicillof

datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(entre_3050$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.6354515  3.3200094  3.9508937  0.1602892

Imagen de Rodrigo De Loredo

datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(entre_3050$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.7000000  3.4219525  3.9780475  0.1412007

Imagen de Juan Grabois

datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(entre_3050$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.7985348  3.4770631  4.1200065  0.1632894

Imagen de Guillermo Moreno

datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(entre_3050$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.0846154  2.8055819  3.3636488  0.1417014

Y por último buscamos ver como es la imagen de los distintos políticos/as entre las personas mayores de 50 años:

mayores_50 = filter(datos, datos$edad >= 50)

Imagen de Javier Milei

datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(mayores_50$imagen_milei, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.7373737  4.3880684  5.0866791  0.1774916

Imagen de Victoria Villarruel

datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(mayores_50$imagen_villarruel, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.7854671  4.4453968  5.1255374  0.1727793

Imagen de Cristina Fernandez

datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(mayores_50$imagen_cfk, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.2338983  2.8944003  3.5733963  0.1725034

Imagen de Patricia Bullrich

datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(mayores_50$imagen_bullrich, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.8087248  4.4696029  5.1478467  0.1723195

Imagen de Mauricio Macri

datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(mayores_50$imagen_macri, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##   4.190635   3.883935   4.497335   0.155847

Imagen de Martín Llaryora

datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(mayores_50$imagen_llaryora, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.6514085  4.3904631  4.9123538  0.1325685

Imagen de Axel Kicillof

datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(mayores_50$imagen_kicillof, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.3623693  3.0502263  3.6745124  0.1585856

Imagen de Rodrigo De Loredo

datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(mayores_50$imagen_deloredo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  4.0699588  3.7755295  4.3643882  0.1494705

Imagen de Juan Grabois

datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(mayores_50$imagen_grabois, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  3.2578125  2.9308953  3.5847297  0.1660059

Imagen de Guillermo Moreno

datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(mayores_50$imagen_moreno, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
##  2.7547893  2.4657302  3.0438484  0.1467953

En conclusión, podemos observar que entre las personas de menos de 30 años son mejor conceptuados Javier Milei, Victoria Villarruel y Martín Llaryora, pero entre estas figuras no podemos afirmar que una tenga mejor imagen porque los intervalos de todas se pisan entre si. La imagen de Patricia Bullrich en este grupo tiene la particularidad de solaparse con los intervalos de la actual vicepresidenta y el actual gobernador, por lo que no podemos establecer diferencias entre los 3, pero no se solapa con la imagen del presidente, por lo que si podemos afirmar que ete es mejor conceptuado que la ministra. En este mismo grupo, el intervalo más bajo corresponde a Guillermo Moreno, sin embargo este se superpone con el intervalo de Cristina Fernandez, Mauricio Macri, Juan Grabois, Rodrigo De Loredo y Axel Kicillof, por lo que no podemos afirmar que se tenga un concepto peor de uno que de otro.

Entre las personas que tienen más de 30 años pero menos de 50 la figura con el intervalo más alto es Victoria Villarruel, sin embargo este se superpone con los intervalos de imagen de Javier Milei, Patricia Bullrich y Martín Llaryora, por lo que no podemos afirmar a ciencia cierta que entre estos exista uno mejor conceptuado que los demás. En el otro extremo, encontremos que de nuevo la figura peor conceptuada es Guillermo Moreno pero que el intervalo de este se superpone con el de Axel Kicillof, Cristina Fernandez y Mauricio Macri, entre estos 4 candidatos tampoco podemos afirmar que uno sea el que tiene peor imagen. En la mitad de tabla para este grupo etario quedan Juan Grabois y Rodrigo De Loredo, quienes casualmente también poseen intervalos que se pisan por lo que no podemos afirmar que uno sea mejor que el otro, aunque si sabemos que ellos tienen una mejor imagen que Kicillof, Moreno, Macri y Cristina, y una peor que Milei, Bullrich, Llaryora y Villarruel.

Y, entre las personas mayores de 50 años, la figura con el intervalo mas alto es Patricia Bullrich, aunque este se solapa con el de Javier Milei, Victoria Villarruel, Mauricio Macri y Martín Llaryora, entre las 5 figuras no podemos afirmar que una tenga mejor imagen que las demás. Para este grupo, el político peor conceptuado tambiés es Guillermo Moreno, aunque su intervalo se superpone con el de Juan Grabois y Cristina Kirchner, entre ellos no podemos establecer diferencias. Axel Kicillof y Rodrigo De Loredo, cuyos intervalos se solapan, se ubican por encima de Moreno en cuanto a concepto, pero por debajo de Bullrich, Milei, Villarruel, Macri y Llaryora, sin embargo no podemos decir que esten por encima de Cristina o Grabois, dado que con ellos comparten tramos de distancia intervalar.

Si comparamos los grupos etarios en relación con las figuras, las diferencias entre los intervalos de cada grupo etario no permiten afirmar que cierto grupo tenga mejor o peor concepto del mismo candidato en relación con los otros (puesto que se solapan entre si los intervalos de distintos grupos etarios respecto de una figura), pero nos parecio interesante verificar en que grupo etario tenia mejor y peor intervalo de imagen cada candidato/a:

Javier Milei tiene mejor imagen entre las personas de menos de 30 años y peor entre las personas de edades entre 30 y 50 años, .
Victoria Villarruel tiene mejor imagen entre las personas de más de 50 años y peor entre las personas de menos de 30.
Cristina Fernandez tiene mejor imagen entre las personas de entre 30 y 50 años y peor entre las personas de mpas de 50 años.
Patricia Bullrich tiene mejor imagen entre las personas de más de 50 años y peor entre las personas de menos de 30 años.
Mauricio Macri tiene mejor imagen entre las personas de más de 50 años y peor entre las personas de entre 30 y 50 años.
Martín Llaryora tiene mejor imagen entre las personas de más de 50 años y peor entre las personas de entre 30 y 50 años.
Axel Kicillof tiene mejor imagen entre las personas de entre 30 y 50 años y peor entre las personas de más de 50 años.
Rodrigo De Loredo tiene mejor imagen entre las personas de más de 50 años y peor entre las personas de menos de 30 años.
Juan Grabois tiene mejor imagen entre las personas de menos de 30 años y peor entre las personas de más de 50 años.
Guillermo Moreno tiene mejor imagen entre las personas de menos de 30 años y peor entre las personas de más de 50 años.

Valoración de problemas

A continuación analizaremos que valoración le dan las personas a una serie de problemas, en una escala del 1 al 10. Para hacer estas comparaciones debemos hacer uso de los intervalos de confianza y para esto utilizamos la desviación esándar muestral dado que es la que conocemos y que estamos trabajando con una muestra y no con una población completa. Solo podemos estimar el valor de la desviación estandar poblacional pero no observarla o saberla a ciencia cierta, para eso deberiamos relevar a toda la población de Córdoba Capital.

El cálculo de un intervalo de confianza implica determinar un nivel de confianza, que R utiliza por defecto una confianza del 95%, y calcular el límite inferior y el superior del intervalo.

Valoración del problema inflación con intervalo de confianza:

datos$problemas_inflacion = as.numeric(datos$problemas_inflacion)
ci(datos$problemas_inflacion, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.35243243 8.22881457 8.47605030 0.06298888

Valoración del problema inseguridad con intervalo de confianza:

datos$problemas_inseguridad = as.numeric(datos$problemas_inseguridad)
ci(datos$problemas_inseguridad, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.50918919 8.39804708 8.62033130 0.05663192

Valoración del problema pobreza con intervalo de confianza:

datos$problemas_pobreza = as.numeric(datos$problemas_pobreza)
ci(datos$problemas_pobreza, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.63783784 8.52523547 8.75044020 0.05737599

Valoración del problema desempleo con intervalo de confianza:

datos$problemas_desempleo = as.numeric(datos$problemas_desempleo)
ci(datos$problemas_desempleo, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.24216216 8.12268461 8.36163972 0.06087921

Valoración del problema corrupción con intervalo de confianza:

datos$problemas_corrupcion = as.numeric(datos$problemas_corrupcion)
ci(datos$problemas_corrupcion, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.02162162 7.88349934 8.15974390 0.07037954

Valoración del problema desigualdad con intervalo de confianza:

datos$problemas_desigualdad = as.numeric(datos$problemas_desigualdad)
ci(datos$problemas_desigualdad, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 7.41945946 7.27081371 7.56810521 0.07574172

Valoración del problema educación con intervalo de confianza:

datos$problemas_educacion = as.numeric(datos$problemas_educacion)
ci(datos$problemas_educacion, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 8.57189189 8.45108815 8.69269563 0.06155496

Valoración del problema deficit con intervalo de confianza:

datos$problemas_deficit = as.numeric(datos$problemas_deficit)
ci(datos$problemas_deficit, na.rm = TRUE)

##   Estimate   CI lower   CI upper Std. Error 
## 6.73189189 6.57292910 6.89085469 0.08099872

Vamos a crear una tabla resumen con las medias de valoración de los distintos problemas:

resumen_datos <- datos %>%
summarise(Inflacion = mean(problemas_inflacion, na.rm = TRUE), Inseguridad = mean(problemas_inseguridad, na.rm = TRUE), Pobreza = mean(problemas_pobreza, na.rm = TRUE), Desempleo = mean(problemas_desempleo, na.rm = TRUE), Corrupcion = mean(problemas_corrupcion, na.rm = TRUE),  Desigualdad = mean(problemas_desigualdad, na.rm = TRUE), Educacion = mean(problemas_educacion, na.rm = TRUE), Deficit = mean(problemas_deficit, na.rm = TRUE)) %>%
    pivot_longer(cols = everything(), names_to = "Problema", values_to = "Valoracion")
knitr::kable(resumen_datos)

Problema	Valoracion
Inflacion	8.352432
Inseguridad	8.509189
Pobreza	8.637838
Desempleo	8.242162
Corrupcion	8.021622
Desigualdad	7.419460
Educacion	8.571892
Deficit	6.731892

Y vamos a calcular los errores estándar de estimación de cada problema, sabiendo que por defecto R hace los cálculos con un intervalo de confianza del 95%:

errores_datos <- datos %>%
summarise(Inflacion = sd(problemas_inflacion, na.rm = TRUE) / sqrt(n()), Inseguridad = sd(problemas_inseguridad, na.rm = TRUE) / sqrt(n()), Pobreza = sd(problemas_pobreza, na.rm = TRUE) / sqrt(n()),  Desempleo = sd(problemas_desempleo, na.rm = TRUE) / sqrt(n()),  Corrupcion = sd(problemas_corrupcion, na.rm = TRUE) / sqrt(n()),  Desigualdad = sd(problemas_desigualdad, na.rm = TRUE) / sqrt(n()),  Educacion = sd(problemas_educacion, na.rm = TRUE) / sqrt(n()),  Deficit = sd(problemas_deficit, na.rm = TRUE) / sqrt(n())) %>%
pivot_longer(cols = everything(), names_to = "Problema", values_to = "Error")

df_final <- left_join(resumen_datos, errores_datos, by = "Problema")
knitr::kable(errores_datos)

Problema	Error
Inflacion	0.0629889
Inseguridad	0.0566319
Pobreza	0.0573760
Desempleo	0.0608792
Corrupcion	0.0703795
Desigualdad	0.0757417
Educacion	0.0615550
Deficit	0.0809987

Y graficamos para poder apreciar visualmente si existen problemas que podamos afirmar son más importantes que otros, para lo cual debemos observar si sus intervalos se superponen con otros.

ggplot(df_final, aes(x = Valoracion, y = Problema)) +
  geom_point(size = 2, color = "blue") +  # Cambiar color y tamaño de los puntos
  geom_errorbarh(aes(xmin = Valoracion - Error, xmax = Valoracion + Error), height = 0.2, color = "red") +
  geom_text(aes(label = round(Valoracion, 2)), hjust = 0.5, vjust = 1.8, color = "blue") +  # Etiqueta para la media
  geom_text(aes(label = paste0("±", round(Error, 2))), hjust = 0.5, vjust = -1, color = "red") +  # Etiqueta para el error
  labs(x = "Valoración", y = "Problema") +
  theme_minimal()

Es así que podemos concluir que no podemos afirmar que exista un único problema más importante, dado que los intervalos de los problemas “Pobreza” y “Educación” se superponen, por otro lado, en cuanto al problema considerado menos importante, podemos afirmar que se trata del “Deficit”, que tiene la valoración más baja y su intervalo no se superpone con el de otros problemas.

Si optaramos por ampliar el nivel de confianza al 99% el intervalo sería más amplio pero la estimación menos precisa porque el error de estimación sería mayor.

Trabajo Práctico Estadística II

2024-10-21

Comenzamos cargando la base de datos a utilizar

Análisis del voto emitido en las últimas elecciones presidenciales

Imagen de distintas figuras políticas

Análisis de imagen de politicos/as según grupos de género

Análisis de la imagen de politicos/as según grupo etario

Valoración de problemas