Integrantes: Antonella Giletta, Enzo Veleizan, Luciana Victoria Paez, María Rocío Lemos, Gianna Agostina Mastrolinardo y Camila Gisel Coria.
Trabajaremos sobre los datos obtenidos fruto de la realización de una encuesta en la Ciudad de Córdoba entre finales de agosto y principios de septiembre de 2024, por alumnxs de la Cátedra de Estadística 2.
Para eso descargamos la base de datos que obtuvimos de la realización de encuestas, desde Google Sheets y la cargamos en R
head(datos)
## # A tibble: 6 × 40
## `Marca temporal` mail edad genero generales balotaje problemas_inflacion
## <dttm> <chr> <dbl> <chr> <chr> <chr> <dbl>
## 1 2024-08-28 09:39:22 franc… 20 varón Sergio M… Sergio … 7
## 2 2024-08-28 09:43:12 estre… 50 varón Javier M… Javier … 9
## 3 2024-08-28 10:06:00 ana.p… 20 mujer Juan Sch… Javier … 9
## 4 2024-08-28 10:16:48 ana.p… 19 mujer Juan Sch… En blan… 8
## 5 2024-08-28 10:26:21 josef… 20 varón Sergio M… Sergio … 9
## 6 2024-08-28 10:32:07 facun… 31 varón Javier M… Javier … 9
## # ℹ 33 more variables: problemas_inseguridad <dbl>, problemas_pobreza <dbl>,
## # problemas_desempleo <dbl>, problemas_corrupcion <dbl>,
## # problemas_desigualdad <dbl>, problemas_educacion <dbl>,
## # problemas_deficit <dbl>, orden_inflacion <chr>, orden_inseguridad <chr>,
## # orden_pobreza <chr>, orden_desempleo <chr>, orden_corrupcion <chr>,
## # orden_desigualdad <chr>, orden_educacion <chr>, orden_deficit <chr>,
## # politicas_tarifas <dbl>, politicas_boleto <dbl>, …
Lo que vemos son las primeras filas del archivo de Google Sheets, para procesar la información primero necesitamos ordenarla. Para eso necesitamos conocer las variables de nuestra base de datos.
names(datos)
## [1] "Marca temporal" "mail"
## [3] "edad" "genero"
## [5] "generales" "balotaje"
## [7] "problemas_inflacion" "problemas_inseguridad"
## [9] "problemas_pobreza" "problemas_desempleo"
## [11] "problemas_corrupcion" "problemas_desigualdad"
## [13] "problemas_educacion" "problemas_deficit"
## [15] "orden_inflacion" "orden_inseguridad"
## [17] "orden_pobreza" "orden_desempleo"
## [19] "orden_corrupcion" "orden_desigualdad"
## [21] "orden_educacion" "orden_deficit"
## [23] "politicas_tarifas" "politicas_boleto"
## [25] "politicas_impuestos" "politicas_obras"
## [27] "politicas_universidades" "imagen_milei"
## [29] "imagen_grabois" "imagen_bullrich"
## [31] "imagen_villarruel" "imagen_llaryora"
## [33] "imagen_kicillof" "imagen_moreno"
## [35] "imagen_deloredo" "imagen_cfk"
## [37] "imagen_macri" "control_precios"
## [39] "control_privatizacion" "control_punibilidad"
Y tenemos que saber cúal es el tamaño de nuestra muestra, es decir, con cuantas encuestas o resultados estamos trabajando, sabiendo que la población total serían los habitantes de la Ciudad de Córdoba, donde fue aplicado el instrumento de recolección de datos.
nrow(datos)
## [1] 925
Estamos trabajando con un total de 925 resultados. Sabemos que entre estos se encuentran tanto variables numéricas como categóricas
Como trabajaremos con tablas, para hacerlas más estéticas y visualmente transparentes, usaremos la función kable, que se introduce:
# install.packages("kableExtra")
library(kableExtra)
Estamos en condiciones de generar la primera tabla, que de cuenta de los géneros de las personas encuestadas, para conocer con que población estamos trabajando.
kable(table(datos$genero), col.names = c("Género", "Frecuencia"))
| Género | Frecuencia |
|---|---|
| mujer | 452 |
| mujer trans / travesti | 4 |
| no binario | 5 |
| otra identidad / ninguna de las anteriores | 2 |
| Prefiero no contestar | 2 |
| varón | 456 |
| varón trans / masculinidad trans | 4 |
Observamos que hay una distribución polarizada entre los géneros “mujer” y “hombre” que son la amplia mayoria, acumulando cada categoria casi la mitad de la muestra.
Por otro lado, para conocer las edades con las que estamos trabajando buscaremos observar la edad media de nuestra muestra y los extremos, edades de la persona más joven y más anciana encuestadas.
summary(datos$edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.00 26.00 39.00 41.21 53.00 92.00
Observamos que: La persona más joven encuestada tiene 16 años La persona más anciana encuestada tiene 92 años La media de edad de la muestra es de 39 años
Un histograma ayuda a observar la distribución de estas edades Aclaración importante! Todos nuestros gráficos seran rosas en este trabajo.
hist(datos$edad, main = "Histograma de las edades de lxs encuestadxs", ylab = "Cantidad de personas", xlab = "Edades", col = "pink")
Primero buscaremos generar una tabla donde se de cuenta del voto emitido en las Elecciones generales para presidente en 2023
kable(table(datos$generales), col.names = c("Voto emitido en las Generales", "Frecuencia, cantidad de votos relevados"))
| Voto emitido en las Generales | Frecuencia, cantidad de votos relevados |
|---|---|
| En blanco | 29 |
| Javier Milei | 253 |
| Juan Schiaretti | 130 |
| Miriam Bregman | 52 |
| No me acuerdo | 5 |
| No voté | 87 |
| Patricia Bullrich | 155 |
| Sergio Massa | 214 |
Observamos que el candidato más votado fue Javier Milei, con Segrio Massa en segundo lugar, lo que es coherente con la realización del balotaje, entre estos dos candidatos.
En cuento a la segunda vuelta, contruimos una segunda tabla, que de cuenta del voto emitido en las Elecciones de Balotaje en 2023
table(datos$balotaje) %>% kable(col.names = c("Voto emitido en el Balotaje", "Frecuencia, cantidad de votos relevados"))
| Voto emitido en el Balotaje | Frecuencia, cantidad de votos relevados |
|---|---|
| En blanco | 79 |
| Javier Milei | 414 |
| No me acuerdo | 6 |
| No voté | 113 |
| Sergio Massa | 313 |
El claro ganador en nuestra muestra es Javie Milei!
Otro punto relevado en la encuesta fue la imágen de distintas figuras políticas, donde se encuentran diputados, gobernadores o exgobernadores, presidentes/as y vicepresidentes/as, ministras, etc. Se le preguntó a las personas la opinión sobre estos políticos y políticas en una escala del 1 al 10.
El primer punto impotante a tener en cuenta es que al preguntar por la imagen de estos/as politicos/as se daba a las personas la opción de responder “no sé” o “no lo/la conozco”, se trata de valores no numéricos por lo que necesitamos convertir las variables en numéricas para analizar su distribución. Esto lo haremos con la función “as.numeric”. Por otro lado, introduciremos en el código la exclusión de los valores no numéricos, para que no nos muestre como error o advertencia los mismos.
Para cada individuo sobre el que se preguntó construiremos además de la tabla que da cuenta de la distribución de la puntuación obtenida, un histograma.
Comenzamos con la imagen del presidente Javier Milei
datos$imagen_milei = as.numeric(datos$imagen_milei)
summary(datos$imagen_milei)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 5.000 4.691 8.000 10.000 17
Observamos que posee una imagen promedio de 4,61 puntos y que 17 personas respondieron “no sé” o “no lo conozco”
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el mandatario.
hist(datos$imagen_milei, main = "Histograma de la imagen de Javier Milei", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen de la vicepresidenta Victoria Villarruel
datos$imagen_villarruel = as.numeric(datos$imagen_villarruel)
summary(datos$imagen_villarruel)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 5.000 4.647 7.000 10.000 50
Observamos que tiene una imagen promedio de 4,64 pero que 50 personas respondieron “no sé” o “no la conozco”.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la mandataria.
hist(datos$imagen_villarruel, main = "Histograma de la imagen de Victoria Villarruel", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen de la ex presidenta y vicepresidenta Cristina Fernandez de Kirchner
datos$imagen_cfk = as.numeric(datos$imagen_cfk)
summary(datos$imagen_cfk)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 2.000 3.485 6.000 10.000 29
Observamos que en ella el promedio de imagen es menor a la de los ejemplos anteriores, de 3,48, y que 29 personas respondieron “no sé” o “no la conozco”.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la ex mandataria.
hist(datos$imagen_cfk, main = "Histograma de la imagen de Cristina Fernandez", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen de la ministra Patricia Bullrich
datos$imagen_bullrich = as.numeric(datos$imagen_bullrich)
summary(datos$imagen_bullrich)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 4.000 4.352 7.000 10.000 22
Observamos que la media obtenida es de 4,35 y que 22 personas respondieron “no sé” o “no la conozco”.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por la ministra.
hist(datos$imagen_bullrich, main = "Histograma de la imagen de Patricia Bullrich", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen del expresidente Mauricio Macri
datos$imagen_macri = as.numeric(datos$imagen_macri)
summary(datos$imagen_macri)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 4.000 3.882 6.000 10.000 22
Observamos que su promedio de imahen es similar a la del anterior caso, siendo de 3,88 puntos y la cantidad de personas que respondieron “no sé” o “no lo conozco”.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el ex mandatario.
hist(datos$imagen_macri, main = "Histograma de la imagen de Mauricio Macri", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen del actual gobernador de la provincia de Córdoba Martín Llaryora
datos$imagen_llaryora = as.numeric(datos$imagen_llaryora)
summary(datos$imagen_llaryora)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 3.000 4.000 4.386 6.000 10.000 69
Observamos que la media también se ubica en 4,38 puntos pero que se eleva el número de personas que respondieron “no sé” o “no lo conozco”, a 69 individuos.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el gobernador.
hist(datos$imagen_llaryora, main = "Histograma de la imagen de Martín Llaryora", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Todos los histogramas realizados hasta el momento presentan una polarización clara hacia la izquierda, en los valores más bajos, este es el primero donde hacia la mitad del gráfico se elevan las barras!
Continuamos con la imagen del actual gobernador de la provincia de Buenos Aires Axel Kicillof
datos$imagen_kicillof = as.numeric(datos$imagen_kicillof)
summary(datos$imagen_kicillof)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 3.000 3.528 6.000 10.000 61
Observamos que en este candidato la media baja a 3,52 y también es más elevada la cantidad de personas que respondieron “no sé” o “no lo conozco”, 61 personas.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el gobernador.
hist(datos$imagen_kicillof, main = "Histograma de la imagen de Axel Kicillof", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen del diputado nacional por Córdoba Rodrigo De Loredo
datos$imagen_deloredo = as.numeric(datos$imagen_deloredo)
summary(datos$imagen_deloredo)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 2.000 4.000 3.801 5.000 10.000 211
Observamos que la media se ubica en 3,8, siendo la que más se repite entre todos los relevados y que sube mucho la cantidad de personas que respondieron “no sé” o “no lo conozco”, a 211 individuos, lo que es una cantidad relevante en relación con la cantidad de casos contemplados, casi una quinta parte de la muestra no tiene opinión o no conoce al candidato. Es el candidato que registra más respuestas de este tipo.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el diputado.
hist(datos$imagen_deloredo, main = "Histograma de la imagen de Rodrigo De Loredo", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen del dirigente del Frente Patria Grande Juan Grabois
datos$imagen_grabois = as.numeric(datos$imagen_grabois)
summary(datos$imagen_grabois)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 3.000 3.661 6.000 10.000 165
Observamos que la media es de 3,66 y que 165 personas respondieron “no sé” o “no lo conozco”, siendo junto con Rodrigo De Loredo y Guillero Moreno, los candidatos que más altos registran este valor.
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el candidato.
hist(datos$imagen_grabois, main = "Histograma de la imagen de Juan Grabois", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Continuamos con la imagen del dirigente del partido “Principios y Valores” Guillermo Moreno
datos$imagen_moreno = as.numeric(datos$imagen_moreno)
summary(datos$imagen_moreno)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 2.000 3.061 5.000 10.000 204
Observamos que la media en este candidato es de 3,06, siendo junto con la de Cristina Fernandez, las dos más bajas. Además, 204 personas respondieron sobre él “no sé” o “no lo conozco”
Construimos el correspondiente histograma para observar la distribución del puntaje obtenido por el candidato.
hist(datos$imagen_moreno, main = "Histograma de la imagen de Guillermo Moreno", ylab = "Frecuencia", xlab = "Puntaje", col = "pink")
Sobre la pregunta: ¿Cuál es la figura con mejor imagen en Córdoba?
Debemos iniciar con algunas precisiones. Comparar las medias sería lo instintivo, sin embargo utilizarlas puede llevar a equivocaciones porque si los resultados están muy polarizados hacia ciertos valores, cosa que sucede con la mayoría de candidatos/as, la media no es representativa. Para solucionar este problema debemos general intervalos de confianza de las imágenes de distintos candidatos. Para esto primero debemos instalar una serie de librerias que nos ayudarán para lograrlo!
# install.packages("ggplot2")
# install.packages("dplyr")
# install.packages("tidyr")
# install.packages("gmodels")
library(ggplot2)
library(dplyr)
library(tidyr)
library(gmodels)
Imagen de Javier Milei con intervalos de confianza:
datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(datos$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.6905286 4.4856372 4.8954201 0.1043989
Imagen de Victoria Villarruel con intervalos de confianza:
datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(datos$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.6468571 4.4454417 4.8482726 0.1026226
Imagen de Cristina Fernandez con intervalos de confianza:
datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(datos$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.4854911 3.2847932 3.6861890 0.1022603
Imagen de Patricia Bullrich con intervalos de confianza:
datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(datos$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.35215947 4.17008732 4.53423161 0.09277101
Imagen de Mauricio Macri con intervalos de confianza:
datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(datos$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.88150609 3.71404142 4.04897076 0.08532808
Imagen de Martín Llaryora con intervalos de confianza:
datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(datos$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.38551402 4.23699201 4.53403603 0.07567066
Imagen de Axel Kicillof con intervalos de confianza:
datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(datos$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.52777778 3.34487243 3.71068312 0.09318989
Imagen de Rodrigo De Loredo con intervalos de confianza:
datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(datos$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.80112045 3.63402164 3.96821925 0.08511133
Imagen de Juan Grabois con intervalos de confianza:
datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(datos$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.66052632 3.46758055 3.85347208 0.09828655
Imagen de Guillermo Moreno con intervalos de confianza:
datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(datos$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.06102635 2.88995967 3.23209304 0.08713381
Para poder afirmar que una figura tiene mejor imagen de otra debemos comprobar que los intervalos de confianza de ambas no se superpongan en algún punto, para esto un gráfico será de gran ayuda como apoyo visual.
A continuación crearemos una tabla resumen con las medias de la imagen de cada figura política, excluyendo las variables categóricas como lo hicimos anteriormente.
resumen_datos_imagenes <- datos %>%
summarise(
Imagen_Milei = mean(as.numeric(imagen_milei), na.rm = TRUE),
Imagen_Grabois = mean(as.numeric(imagen_grabois), na.rm = TRUE),
Imagen_Bullrich = mean(as.numeric(imagen_bullrich), na.rm = TRUE),
Imagen_Villarruel = mean(as.numeric(imagen_villarruel), na.rm = TRUE),
Imagen_Llaryora = mean(as.numeric(imagen_llaryora), na.rm = TRUE),
Imagen_Kicillof = mean(as.numeric(imagen_kicillof), na.rm = TRUE),
Imagen_Moreno = mean(as.numeric(imagen_moreno), na.rm = TRUE),
Imagen_Deloredo = mean(as.numeric(imagen_deloredo), na.rm = TRUE),
Imagen_CFK = mean(as.numeric(imagen_cfk), na.rm = TRUE),
Imagen_Macri = mean(as.numeric(imagen_macri), na.rm = TRUE)
) %>%
pivot_longer(cols = everything(), names_to = "Candidato", values_to = "Valoracion")
knitr::kable(resumen_datos_imagenes)
| Candidato | Valoracion |
|---|---|
| Imagen_Milei | 4.690529 |
| Imagen_Grabois | 3.660526 |
| Imagen_Bullrich | 4.352159 |
| Imagen_Villarruel | 4.646857 |
| Imagen_Llaryora | 4.385514 |
| Imagen_Kicillof | 3.527778 |
| Imagen_Moreno | 3.061026 |
| Imagen_Deloredo | 3.801120 |
| Imagen_CFK | 3.485491 |
| Imagen_Macri | 3.881506 |
Calculamos los errores estándar para cada figura y los uniremos en una sola tabla
errores_datos_imagenes <- datos %>%
summarise(
Imagen_Milei = sd(as.numeric(imagen_milei), na.rm = TRUE) / sqrt(sum(!is.na(imagen_milei))),
Imagen_Grabois = sd(as.numeric(imagen_grabois), na.rm = TRUE) / sqrt(sum(!is.na(imagen_grabois))),
Imagen_Bullrich = sd(as.numeric(imagen_bullrich), na.rm = TRUE) / sqrt(sum(!is.na(imagen_bullrich))),
Imagen_Villarruel = sd(as.numeric(imagen_villarruel), na.rm = TRUE) / sqrt(sum(!is.na(imagen_villarruel))),
Imagen_Llaryora = sd(as.numeric(imagen_llaryora), na.rm = TRUE) / sqrt(sum(!is.na(imagen_llaryora))),
Imagen_Kicillof = sd(as.numeric(imagen_kicillof), na.rm = TRUE) / sqrt(sum(!is.na(imagen_kicillof))),
Imagen_Moreno = sd(as.numeric(imagen_moreno), na.rm = TRUE) / sqrt(sum(!is.na(imagen_moreno))),
Imagen_Deloredo = sd(as.numeric(imagen_deloredo), na.rm = TRUE) / sqrt(sum(!is.na(imagen_deloredo))),
Imagen_CFK = sd(as.numeric(imagen_cfk), na.rm = TRUE) / sqrt(sum(!is.na(imagen_cfk))),
Imagen_Macri = sd(as.numeric(imagen_macri), na.rm = TRUE) / sqrt(sum(!is.na(imagen_macri)))
) %>%
pivot_longer(cols = everything(), names_to = "Candidato", values_to = "Error")
knitr::kable(errores_datos_imagenes)
| Candidato | Error |
|---|---|
| Imagen_Milei | 0.1043989 |
| Imagen_Grabois | 0.0982865 |
| Imagen_Bullrich | 0.0927710 |
| Imagen_Villarruel | 0.1026226 |
| Imagen_Llaryora | 0.0756707 |
| Imagen_Kicillof | 0.0931899 |
| Imagen_Moreno | 0.0871338 |
| Imagen_Deloredo | 0.0851113 |
| Imagen_CFK | 0.1022603 |
| Imagen_Macri | 0.0853281 |
Y graficamos, pidiendole al código que muestre los valores y el error calculado.
df_final_imagenes <- left_join(resumen_datos_imagenes, errores_datos_imagenes, by = "Candidato")
ggplot(df_final_imagenes, aes(x = Valoracion, y = Candidato)) +
geom_point(size = 2, color = "blue") + # Cambiar color y tamaño de los puntos
geom_errorbarh(aes(xmin = Valoracion - Error, xmax = Valoracion + Error), height = 0.2, color = "red") +
geom_text(aes(label = round(Valoracion, 2)), hjust = 0.5, vjust = 1.8, color = "blue", size = 3) + # Etiqueta para la media
geom_text(aes(label = paste0("±", round(Error, 2))), hjust = 0.5, vjust = -1, color = "red", size = 3) + # Etiqueta para el error
labs(x = "Valoración", y = "Candidato") +
theme_minimal()
Es así que podemos afirmar que existen dos figuras políticas que poseen la mejor imagen: Javier Milei y Victoria Villarruel, sin embargo los intervalos de confianza de ambos se superponen por lo que no podemos afirmar que la imagen de uno sea mejor que la del otro. En el otro extremo, quien cuenta con la peor imagen es Guillermo Moreno, como su intervalo no se superpone con ningún otro podemos afirmarlo.
En esta parte buscaremos dar cuenta de como distintos grupos de personas conceptualizan a distintos politicos/as. Para esto utilizaremos filtros! Y los ya conocidos intervalos de confianza. Comenzaremos con la imagen según identidad de género de las personas encuestadas
Javier Milei
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.1968326 3.9224974 4.4711678 0.1395854
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 5.287305 4.986453 5.588157 0.153084
-Entre las personas que no se identifican ni como varones ni como mujeres. Debemos promero elaborar un filtro que agrupe estas otras opciones de identidad:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
Y ahora generamos el intervalo de confianza de la imagen de este político entre estas personas:
ci (otras_identidades$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 1.5454545 0.9178513 2.1730578 0.2816715
Vemos que en el caso de Javier Milei entre las mujeres su imagen promedio es más baja que la observada en la población total, mientras que entre los varones es mas alta pero estan los intervalos de población total se superponen con los de hombres y mujeres Respecto de las demás identidades la valoración es mucho más baja, pudiendo afirmar que efectivamente lo conceptual peor, porque el intervalo de este grupo no se pisa con ninguno de los anteriores.
Victoria Villarruel
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.3785714 4.0939069 4.6632360 0.1448202
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 5.0045558 4.7169331 5.2921785 0.1463435
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 1.7000000 1.1110663 2.2889337 0.2603417
Respecto de Victoria Villarruel se repite lo identificado en Javier Milei, al comparar con su imagen en el total poblacional encontramos que los varones la valoran por encima de esta, mientras que las mujeres en promedio lo hacen por debajo pero superponiendose ambos intervalos entre si y con el general. También se repite lo identificado en el grupo de las demás identidades con Javier Milei, la conceptuan peor que mujeres, hombres y el general de la población, sin superposición de intervalos.
Cristina Fernandez
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.5251142 3.2364393 3.8137890 0.1468779
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3537415 3.0711786 3.6363044 0.1437708
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 5.5454545 3.8100625 7.2808466 0.7788527
En esta política encontramos por primera vez que las mujeres la valoran por encima del promedio general, mientras que los varones por debajo de este, aunque los intervalos se superponen por lo que no podemos afirmarlo certeramente. Entre las demás identidades hay una mejor valoración de esta candidata, su intervalo no se superpone ni con los varones ni con la valoración general, por lo que podemos afirmar que este grupo la conceptua mejor que el total poblacional y que quienes se identifican como hombres. El intervalo si se superpone con el de mujeres, aunque en poco, por lo que no podemos afirmarlo en ese caso.
Patricia Bullrich
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.3303167 4.0704525 4.5901810 0.1322224
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.472973 4.213038 4.732908 0.132260
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 1.6363636 0.9464757 2.3262516 0.3096252
En el caso de esta política las valoraciones de varones y mujeres no difieren en promedio demasiado del promedio general, ambos intervalos se superponen entre si y con el de imagen general. Se repite lo observado en Milei y Villarruel respecto de la imagen de otras identidades, que la conceptuan muy por debajo, sin superposición de intervalos por lo que podemos afirmar que efectivamente tiene peor imagen entre estos grupos identitarios.
Mauricio Macri
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.8931818 3.6453268 4.1410368 0.1261103
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.9439462 3.7121193 4.1757730 0.1179595
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 2.1818182 1.1936337 3.1700027 0.4435022
En el caso de este candidato observamos por primera vez que tanto varones como mujeres lo conceptuan por encima del promedio general, aunque por diferencias pequeñas y como se superponen los intervalos de estos grupos con el general no podemos afirmarlo. En contraste, los demás grupos identitarios lo conceptúan peor, sin siperposición de intervalos.
Martín Llaryora
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.3519417 4.1390565 4.5648270 0.1082971
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.4439252 4.2315485 4.6563020 0.1080504
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3636364 1.7661220 4.9611507 0.7169725
En el caso de este político observamos que los varones y las mujeres lo conceptuan por encima del intervalo general, pero son diferencias pequeñas, con superposición de intervalos. Respecto de las demás identidades la conceptualización empeora pero también se superpone con la de hombres y mujeres y la opinion general.
Axel Kicillof
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6489104 3.3763173 3.9215035 0.1386721
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3387097 3.0909890 3.5864304 0.1260372
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.8181818 2.9951591 6.6412045 0.8181818
En el caso de este político observamos que las mujeres lo conceptuan mejor que los varones y su intervalo tiene un limite superior mayor al del intervalo general, sin embargo hay superposición entre los intervalos de hombres, mujeres y el general de la población, por lo que no podemos afirmar estas diferencias. Respecto de las demás identidades, observamos un intervalo más amplio, que contiene a todos los demás por empezar antes y terminar después.
Rodrigo De Loredo
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.8219585 3.5689492 4.0749677 0.1286237
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.835165 3.607939 4.062390 0.115547
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 2.555556 1.605456 3.505655 0.412011
Respecto de este político observamos que tanto mujeres como varones lo conceptuan con intervalos casi iguales y que poco difieren del general, al haber superposición, no podemos establecer diferencias. Respecto de las personas que no se identifican ni como hombres ni como mujeres la imagen que se tiene de él si es peor, sin superposición de intervalos por lo que es una afirmación certera.
Juan Grabois
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.9562682 3.6591710 4.2533654 0.1510466
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3192020 3.0674145 3.5709895 0.1280767
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 5.1818182 3.5412228 6.8224136 0.7363075
En el caso de este político encontramos que las mujeres lo conceptuan mejor que el general de la población y los varones peor, sin embargo los tres intervalos tenidos en cuenta se superponen por lo que no podemos afirmar diferencias. Respecto del resto de identidades agrupadas observamos que el intervalo es de mayor amplitud, superponiendose con los demás pero llegando más alto su límite superior.
Guillermo Moreno
-Entre las personas identificadas como mujeres:
mujeres = filter(datos, datos$genero == "mujer")
ci(mujeres$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 2.8416149 2.6073995 3.0758303 0.1190493
-Entre las personas identificadas como varones:
varones = filter(datos, datos$genero == "varón")
ci(varones$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.2036554 2.9536133 3.4536974 0.1271706
-Entre las personas que no se identifican ni como varones ni como mujeres:
otras_identidades = filter(datos, genero %in% c("no binario", "mujer trans / travesti", "varon trans / masculinidad trans", "otra identidad / ninguna de las anteriores", "prefiero no contestar"))
ci (otras_identidades$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6000000 2.6343418 4.5656582 0.4268749
Este político posee entre las mujeres una imagen peor que en el general de la población y entre los varones una mejor. Sin embargo como hay superposiciones entre los intervalos no podemos afirmarlo realmente En cuanto a los demás grupos identitarios identidicamos que de nuevo el intervalo de opinión es más amplio, conteniendo a los de varones y mujeres y llegando a un límite superior mayor, aunque tampoco podemos afirmar diferencias porque se superponen entre sí.
Buscamos analizar la imagen de los distintos políticos según las edades de las personas que respondieron. Además de obtener la media, buscaremos generar el intervalo de confianza de cada imagen.
En primer lugar, trabajaremos con personas de menos de 30 años:
menores_30 = filter(datos, datos$edad <= 30, datos$edad >=16)
Y lo aplicamos a las distintas figuras políticas. Imagen de Javier Milei
datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(menores_30$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.7582090 4.4174624 5.0989556 0.1732235
Imagen de Victoria Villarruel
datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(menores_30$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.5593750 4.2262322 4.8925178 0.1693291
Imagen de Cristina Fernandez
datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(menores_30$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.5337423 3.1970619 3.8704227 0.1711392
Imagen de Patricia Bullrich
datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(menores_30$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.1185410 3.8418760 4.3952060 0.1406374
Imagen de Mauricio Macri
datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(menores_30$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.8287462 3.5685796 4.0889127 0.1322477
Imagen de Martín Llaryora
datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(menores_30$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.277228 4.036733 4.517723 0.122212
Imagen de Axel Kicillof
datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(menores_30$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6123779 3.3036220 3.9211337 0.1569083
Imagen de Rodrigo De Loredo
datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(menores_30$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6228814 3.3434836 3.9022791 0.1418184
Imagen de Juan Grabois
datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(menores_30$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.8759690 3.5456138 4.2063242 0.1677579
Imagen de Guillermo Moreno
datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(menores_30$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3407080 3.0386528 3.6427631 0.1532837
A continuación, la imagen de los políticos entre las personas de entre 30 y 50 años:
Construimos el filtro de este grupo etario.
entre_3050 = filter(datos, datos$edad <=50, datos$edad >=30)
Imagen de Javier Milei
datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(entre_3050$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.5653595 4.2032085 4.9275105 0.1840411
Imagen de Victoria Villarruel
datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(entre_3050$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.6317568 4.2739162 4.9895974 0.1818261
Imagen de Cristina Fernandez
datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(entre_3050$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6963696 3.3398184 4.0529209 0.1811882
Imagen de Patricia Bullrich
datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(entre_3050$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.1928105 3.8770211 4.5085998 0.1604806
Imagen de Mauricio Macri
datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(entre_3050$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6535948 3.3605905 3.9465990 0.1489015
Imagen de Martín Llaryora
datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(entre_3050$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.2600000 4.0067311 4.5132689 0.1286981
Imagen de Axel Kicillof
datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(entre_3050$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.6354515 3.3200094 3.9508937 0.1602892
Imagen de Rodrigo De Loredo
datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(entre_3050$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.7000000 3.4219525 3.9780475 0.1412007
Imagen de Juan Grabois
datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(entre_3050$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.7985348 3.4770631 4.1200065 0.1632894
Imagen de Guillermo Moreno
datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(entre_3050$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.0846154 2.8055819 3.3636488 0.1417014
Y por último buscamos ver como es la imagen de los distintos políticos/as entre las personas mayores de 50 años:
mayores_50 = filter(datos, datos$edad >= 50)
Imagen de Javier Milei
datos$imagen_milei=as.numeric(datos$imagen_milei)
ci(mayores_50$imagen_milei, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.7373737 4.3880684 5.0866791 0.1774916
Imagen de Victoria Villarruel
datos$imagen_villarruel=as.numeric(datos$imagen_villarruel)
ci(mayores_50$imagen_villarruel, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.7854671 4.4453968 5.1255374 0.1727793
Imagen de Cristina Fernandez
datos$imagen_cfk=as.numeric(datos$imagen_cfk)
ci(mayores_50$imagen_cfk, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.2338983 2.8944003 3.5733963 0.1725034
Imagen de Patricia Bullrich
datos$imagen_bullrich=as.numeric(datos$imagen_bullrich)
ci(mayores_50$imagen_bullrich, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.8087248 4.4696029 5.1478467 0.1723195
Imagen de Mauricio Macri
datos$imagen_macri=as.numeric(datos$imagen_macri)
ci(mayores_50$imagen_macri, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.190635 3.883935 4.497335 0.155847
Imagen de Martín Llaryora
datos$imagen_llaryora=as.numeric(datos$imagen_llaryora)
ci(mayores_50$imagen_llaryora, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.6514085 4.3904631 4.9123538 0.1325685
Imagen de Axel Kicillof
datos$imagen_kicillof=as.numeric(datos$imagen_kicillof)
ci(mayores_50$imagen_kicillof, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.3623693 3.0502263 3.6745124 0.1585856
Imagen de Rodrigo De Loredo
datos$imagen_deloredo=as.numeric(datos$imagen_deloredo)
ci(mayores_50$imagen_deloredo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 4.0699588 3.7755295 4.3643882 0.1494705
Imagen de Juan Grabois
datos$imagen_grabois=as.numeric(datos$imagen_grabois)
ci(mayores_50$imagen_grabois, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 3.2578125 2.9308953 3.5847297 0.1660059
Imagen de Guillermo Moreno
datos$imagen_moreno=as.numeric(datos$imagen_moreno)
ci(mayores_50$imagen_moreno, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 2.7547893 2.4657302 3.0438484 0.1467953
En conclusión, podemos observar que entre las personas de menos de 30 años son mejor conceptuados Javier Milei, Victoria Villarruel y Martín Llaryora, pero entre estas figuras no podemos afirmar que una tenga mejor imagen porque los intervalos de todas se pisan entre si. La imagen de Patricia Bullrich en este grupo tiene la particularidad de solaparse con los intervalos de la actual vicepresidenta y el actual gobernador, por lo que no podemos establecer diferencias entre los 3, pero no se solapa con la imagen del presidente, por lo que si podemos afirmar que ete es mejor conceptuado que la ministra. En este mismo grupo, el intervalo más bajo corresponde a Guillermo Moreno, sin embargo este se superpone con el intervalo de Cristina Fernandez, Mauricio Macri, Juan Grabois, Rodrigo De Loredo y Axel Kicillof, por lo que no podemos afirmar que se tenga un concepto peor de uno que de otro.
Entre las personas que tienen más de 30 años pero menos de 50 la figura con el intervalo más alto es Victoria Villarruel, sin embargo este se superpone con los intervalos de imagen de Javier Milei, Patricia Bullrich y Martín Llaryora, por lo que no podemos afirmar a ciencia cierta que entre estos exista uno mejor conceptuado que los demás. En el otro extremo, encontremos que de nuevo la figura peor conceptuada es Guillermo Moreno pero que el intervalo de este se superpone con el de Axel Kicillof, Cristina Fernandez y Mauricio Macri, entre estos 4 candidatos tampoco podemos afirmar que uno sea el que tiene peor imagen. En la mitad de tabla para este grupo etario quedan Juan Grabois y Rodrigo De Loredo, quienes casualmente también poseen intervalos que se pisan por lo que no podemos afirmar que uno sea mejor que el otro, aunque si sabemos que ellos tienen una mejor imagen que Kicillof, Moreno, Macri y Cristina, y una peor que Milei, Bullrich, Llaryora y Villarruel.
Y, entre las personas mayores de 50 años, la figura con el intervalo mas alto es Patricia Bullrich, aunque este se solapa con el de Javier Milei, Victoria Villarruel, Mauricio Macri y Martín Llaryora, entre las 5 figuras no podemos afirmar que una tenga mejor imagen que las demás. Para este grupo, el político peor conceptuado tambiés es Guillermo Moreno, aunque su intervalo se superpone con el de Juan Grabois y Cristina Kirchner, entre ellos no podemos establecer diferencias. Axel Kicillof y Rodrigo De Loredo, cuyos intervalos se solapan, se ubican por encima de Moreno en cuanto a concepto, pero por debajo de Bullrich, Milei, Villarruel, Macri y Llaryora, sin embargo no podemos decir que esten por encima de Cristina o Grabois, dado que con ellos comparten tramos de distancia intervalar.
Si comparamos los grupos etarios en relación con las figuras, las diferencias entre los intervalos de cada grupo etario no permiten afirmar que cierto grupo tenga mejor o peor concepto del mismo candidato en relación con los otros (puesto que se solapan entre si los intervalos de distintos grupos etarios respecto de una figura), pero nos parecio interesante verificar en que grupo etario tenia mejor y peor intervalo de imagen cada candidato/a:
A continuación analizaremos que valoración le dan las personas a una serie de problemas, en una escala del 1 al 10. Para hacer estas comparaciones debemos hacer uso de los intervalos de confianza y para esto utilizamos la desviación esándar muestral dado que es la que conocemos y que estamos trabajando con una muestra y no con una población completa. Solo podemos estimar el valor de la desviación estandar poblacional pero no observarla o saberla a ciencia cierta, para eso deberiamos relevar a toda la población de Córdoba Capital.
El cálculo de un intervalo de confianza implica determinar un nivel de confianza, que R utiliza por defecto una confianza del 95%, y calcular el límite inferior y el superior del intervalo.
Valoración del problema inflación con intervalo de confianza:
datos$problemas_inflacion = as.numeric(datos$problemas_inflacion)
ci(datos$problemas_inflacion, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.35243243 8.22881457 8.47605030 0.06298888
Valoración del problema inseguridad con intervalo de confianza:
datos$problemas_inseguridad = as.numeric(datos$problemas_inseguridad)
ci(datos$problemas_inseguridad, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.50918919 8.39804708 8.62033130 0.05663192
Valoración del problema pobreza con intervalo de confianza:
datos$problemas_pobreza = as.numeric(datos$problemas_pobreza)
ci(datos$problemas_pobreza, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.63783784 8.52523547 8.75044020 0.05737599
Valoración del problema desempleo con intervalo de confianza:
datos$problemas_desempleo = as.numeric(datos$problemas_desempleo)
ci(datos$problemas_desempleo, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.24216216 8.12268461 8.36163972 0.06087921
Valoración del problema corrupción con intervalo de confianza:
datos$problemas_corrupcion = as.numeric(datos$problemas_corrupcion)
ci(datos$problemas_corrupcion, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.02162162 7.88349934 8.15974390 0.07037954
Valoración del problema desigualdad con intervalo de confianza:
datos$problemas_desigualdad = as.numeric(datos$problemas_desigualdad)
ci(datos$problemas_desigualdad, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 7.41945946 7.27081371 7.56810521 0.07574172
Valoración del problema educación con intervalo de confianza:
datos$problemas_educacion = as.numeric(datos$problemas_educacion)
ci(datos$problemas_educacion, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 8.57189189 8.45108815 8.69269563 0.06155496
Valoración del problema deficit con intervalo de confianza:
datos$problemas_deficit = as.numeric(datos$problemas_deficit)
ci(datos$problemas_deficit, na.rm = TRUE)
## Estimate CI lower CI upper Std. Error
## 6.73189189 6.57292910 6.89085469 0.08099872
Vamos a crear una tabla resumen con las medias de valoración de los distintos problemas:
resumen_datos <- datos %>%
summarise(Inflacion = mean(problemas_inflacion, na.rm = TRUE), Inseguridad = mean(problemas_inseguridad, na.rm = TRUE), Pobreza = mean(problemas_pobreza, na.rm = TRUE), Desempleo = mean(problemas_desempleo, na.rm = TRUE), Corrupcion = mean(problemas_corrupcion, na.rm = TRUE), Desigualdad = mean(problemas_desigualdad, na.rm = TRUE), Educacion = mean(problemas_educacion, na.rm = TRUE), Deficit = mean(problemas_deficit, na.rm = TRUE)) %>%
pivot_longer(cols = everything(), names_to = "Problema", values_to = "Valoracion")
knitr::kable(resumen_datos)
| Problema | Valoracion |
|---|---|
| Inflacion | 8.352432 |
| Inseguridad | 8.509189 |
| Pobreza | 8.637838 |
| Desempleo | 8.242162 |
| Corrupcion | 8.021622 |
| Desigualdad | 7.419460 |
| Educacion | 8.571892 |
| Deficit | 6.731892 |
Y vamos a calcular los errores estándar de estimación de cada problema, sabiendo que por defecto R hace los cálculos con un intervalo de confianza del 95%:
errores_datos <- datos %>%
summarise(Inflacion = sd(problemas_inflacion, na.rm = TRUE) / sqrt(n()), Inseguridad = sd(problemas_inseguridad, na.rm = TRUE) / sqrt(n()), Pobreza = sd(problemas_pobreza, na.rm = TRUE) / sqrt(n()), Desempleo = sd(problemas_desempleo, na.rm = TRUE) / sqrt(n()), Corrupcion = sd(problemas_corrupcion, na.rm = TRUE) / sqrt(n()), Desigualdad = sd(problemas_desigualdad, na.rm = TRUE) / sqrt(n()), Educacion = sd(problemas_educacion, na.rm = TRUE) / sqrt(n()), Deficit = sd(problemas_deficit, na.rm = TRUE) / sqrt(n())) %>%
pivot_longer(cols = everything(), names_to = "Problema", values_to = "Error")
df_final <- left_join(resumen_datos, errores_datos, by = "Problema")
knitr::kable(errores_datos)
| Problema | Error |
|---|---|
| Inflacion | 0.0629889 |
| Inseguridad | 0.0566319 |
| Pobreza | 0.0573760 |
| Desempleo | 0.0608792 |
| Corrupcion | 0.0703795 |
| Desigualdad | 0.0757417 |
| Educacion | 0.0615550 |
| Deficit | 0.0809987 |
Y graficamos para poder apreciar visualmente si existen problemas que podamos afirmar son más importantes que otros, para lo cual debemos observar si sus intervalos se superponen con otros.
ggplot(df_final, aes(x = Valoracion, y = Problema)) +
geom_point(size = 2, color = "blue") + # Cambiar color y tamaño de los puntos
geom_errorbarh(aes(xmin = Valoracion - Error, xmax = Valoracion + Error), height = 0.2, color = "red") +
geom_text(aes(label = round(Valoracion, 2)), hjust = 0.5, vjust = 1.8, color = "blue") + # Etiqueta para la media
geom_text(aes(label = paste0("±", round(Error, 2))), hjust = 0.5, vjust = -1, color = "red") + # Etiqueta para el error
labs(x = "Valoración", y = "Problema") +
theme_minimal()
Es así que podemos concluir que no podemos afirmar que exista un único problema más importante, dado que los intervalos de los problemas “Pobreza” y “Educación” se superponen, por otro lado, en cuanto al problema considerado menos importante, podemos afirmar que se trata del “Deficit”, que tiene la valoración más baja y su intervalo no se superpone con el de otros problemas.
Si optaramos por ampliar el nivel de confianza al 99% el intervalo sería más amplio pero la estimación menos precisa porque el error de estimación sería mayor.