¿La edad influye en la percepción política?

Grupo 5

Pregunta de investigación

El texto gira en torno a una cuestión muy interesante: ¿la edad es un factor influyente en las decisiones y percepciones de los votantes en torno a las personalidades que hacen carrera política?

  • Percepciones al momento de votar por candidatos (data1)
  • Percepciones sobre la performance del legislador ya elegido (data2)

Datos: Unidad de análisis y variables (1)

Unidad de analisis: encuestados, divididos en grupos de edad

  • Jovenes (18-30), edad media (31-60) y mayores (61-90)

Las variables analizadas en el documento se distribuyen en dos bases de datos:

DATA1: 2020 CES age experiment (replication data)

DATA2: 2006-2020 CES age and approval survey (replication data)

Datos: Unidad de análisis y variables (2)

DATA1: Experimento destinado a entender si las percepciones de la gente cambian en funcion de la edad del candidato.

  • Se colocan 3 perfiles idénticos de candidatos ficticios cuya única diferencia es la edad (23, 50 y 77 años)
  • Se espera que las personas valoren positivamente a los candidatos con edades parecidas.
  • Se espera que los jovenes valoren negativamente a los candidatos mayores (y viceversa), y que el candidato de edad media sea el favorito con más valoraciones positivas

Variables de la data1

Sobre los candidatos ficticios:

  • Edad del candidato ficticio (agetreat)

Las diversas percepciones en relación con los perfiles y la edad:

  • Probabilidad de votar al candidato para legislador estatal del 0-100 (aelvote)

  • Calidad de representacion de los intereses de los votantes del 0-100 (aeqrep)

Variables de la data1

  • Capacidad percibida: Las capacidades del candidato para llevar el cargo. Bien calificado para el puesto (aequal), conocedor de las problematicas (aeknow), sin experiencia (aeinex)

  • Receptividad percibida: Ser abierto de mente ante las necesidades de los ciudadanos. Se preocupa por gente como tú (aecare), alejado de la gente corriente (aeoot), confiabilidad (aetrust) y lucha por lo que cree (aestand)

  • Inclinaciones ideológicas percibidas: liberal (aeib) o conservador (aecon)

Variables de la data1

Algunas características de los encuestados:

  • Edad del encuestado (age)

  • Género del encuestado (female)

  • Inclinacion politica del encuestado (ideo7)

Sobre la raza de los encuestados:

  • Latino (latino)

  • Afroamericano (black)

  • Asiatico-americano (asian)

  • Otros (nonwhite)

Datos: Unidad de análisis y variables (3)

DATA2: Encuesta que recopila datos sobre de la percepción de la gente sobre la performance de politicos reales del Congreso de los EEUU entre los años 2006-2020

  • Recoge datos tanto de los encuestados como de los congresistas

  • El estudio de data2 no se centra unicamente en el analisis de la edad, sino tambien en afiliacion ideologica y de partido como variables principales. No obstante, los autores se centran más en la edad por los objetivos del estudio.

Variables de la data2

A. Sobre los congresistas:

  • Edad del congresista (mcage)

  • Partido político del congresista (mcdem)

  • Efectividad del congresista (leff)

  • Años de trabajo del congresista (mctenure)

  • Género del congresista (frep)

Variables de la data2

Sobre la raza del congresista:

  • Afroamericano (brep)

  • Latino/hispanic (lrep)

  • Asiatico-americano (arep)

Variable de la data2

B. Sobre las caracteristicas de los encuestados:

  • Aprobacion del miembro del congreso por parte del encuestado (mcapp)

  • Edad del encuestado (age)

  • Partido del encuestado (pid)

  • Inclinacion politica del encuestado -> Muy Liberal-Muy Conservador (ideo7)

  • Educacion del encuestado

  • Género del encuestado (female)

Variable de la data2

Sobre la raza del encuestado:

  • Afroamericano (black)

  • Latino (latino)

  • Asiatico-americano (asian)

Literatura y marco teórico (1)

Roberts y Wolak (2022) inician su estudio desde una situación que les parece interesante de analizar: en el piso congresal, los congresistas mayores representan a gente mucho más joven que ellos y los jovenes estan infrarepresentados.

¿Esto significa que existen percepciones negativas o prejuicios en contra de los jovenes que impide su eleccion?

Literatura y marco teórico (2)

Varios estudios demuestran que los jovenes que inician carrera política son muchas veces vistos como sin experiencia, menos cualificados y menos conservadores.

No obstante, también existen prejuicios contra las personas muy mayores: se les ve como como menos competentes, menos dignos de confianza y con menos probabilidades de representar eficazmente los intereses de sus electores.

Literatura y marco teórico (3)

Se tienen razones para creer que los votantes tienden a elegir representantes congresales que se alineen a sus intereses. No obstante, tambien hay razones para creer que existen razones estructurales que favorecen a candidatos de mayor edad

  • Ejemplo: edad minima para postular a un cargo público

Importancia del estudio:

Se intenta dar luz sobre la importancia de la edad como categoría política.

Así como se analiza el accionar político y preferencias de los votantes bajo lupas de raza, género, orientación, etc, las valoraciones en función de edad se están dejando de lado puesto que hay evidencia confusa al respecto.

Con este estudio, se abre nuevamente el debate y se intenta dar una respuesta afirmativa ante la pregunta: ¿la edad es importante para la gente al momento de evaluar politicos?

Hipótesis:

  • La edad de un candidato SÍ ES un factor importante para el votante al momento de elegir un candidato representativo y puntuar su desempeño

Los votantes jóvenes o de generaciones recientes tenderán a elegir a candidatos iguales a ellos o que sientan que los representan mejor, a pesar de que puedan ser percibidos como faltos de experiencia o sin fuertes convicciones.

Por otro lado, se espera que los votantes viejos tiendan a elegir a candidatos con un mismo rango de edad, puesto que los consideran experimentados y que siguen sus ideales políticos conservadores.

¡Comenzamos con el trabajo en R!

  1. Primero seteamos el directorio:
setwd("C:/Users/Adriana/Desktop/ADRIANA - R SESSIONS -/PD11 - REGRESION MULTIPLE")
  1. Abrimos las librerias a utilizar:
library(rio)
library(dplyr)
library(taylor)
library(ggplot2)
library(tidyverse)
library(kableExtra)
library(scales)
library(labelled)

Abrimos las dos bases de datos (data1 y data2)

library(rio)

#PRIMER DATABASE:
data1 = import("2020 CES age experiment replication data.dta")

#SEGUNDA DATABASE:
data2=import("2006-2020 CES age and approval survey replication data.dta")

ANALISIS BIVARIADO Y MULTIVARIADO

DATA1: Analisis bivariado

  • Queremos determinar si la variable “edad del encuestado” (age) impacta en la Posibilidad de voto al legislador (aelvote):
Modelo1=lm(aelvote ~ age, data=data1)
summary(Modelo1)

Call:
lm(formula = aelvote ~ age, data = data1)

Residuals:
    Min      1Q  Median      3Q     Max 
-55.599  -5.974  -2.595  13.090  48.381 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 50.26773    1.94652  25.824   <2e-16 ***
age          0.07509    0.03788   1.982   0.0477 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 21.26 on 997 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.003927,  Adjusted R-squared:  0.002928 
F-statistic:  3.93 on 1 and 997 DF,  p-value: 0.0477

Interpretación

p-value=0.0477<0.05 (se aprueba el modelo)

Podemos afirmar que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que el modelo sí es válido como modelo de predicción.

Multiple R squared =0.003927 = 0,3%

En nuestro modelo, este arrojó el valor de 0.003927 , por lo que podemos concluir el modelo explica aproximadamente el 0,3% de la variabilidad en la probabilidad de votar por el legislador.

Esto nos confirma que la edad de los encuestados no es determinante en la posibilidad de voto a los legisladores, por sí misma; deben existir otros factores que la expliquen mejor

Modelo multivariado 1-3: ¿Qué factores influyen en la posibilidad de voto al candidato?

Primero, establecemos las variables de nuestro modelo

Variable Dependiente: Posibilidad de voto (aelvote)

  • Esta variable está en una escala de 0-100

  • Expone la probabilidad de votar por el legislador estatal para los encuestados

Variables Independientes:

Se describe al legislador como:

  • “confiable”= (aetrust)

  • “conocedor de los problemas” = (aeknow)

  • “bien calificado para legislar” = (aequal)

  • “conservador” = (aecon)/ “liberal” = (aelib)

  • “inexperto” = (aeinex)

  • “lucha por lo que cree” = (aestand)

  • “fuera de contacto con las personas” = (aeoot)

  • “se preocupa por alguien como tú” = (aecare)

  • Edad de los encuestados = (age)

  • Género del encuestado = (female)

El encuestado se identifica como:

  • “latino” = (latino)

  • “afrodescendiente” = (black)

  • “asiático” = (asian)

  • “otro” = (nonwhite)

Construimos el modelo

Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente:

Como nos interesan las diferencias entre los GRUPOS DE EDAD, procedemos a hacer los modelos en funcion del perfil del candidato JOVEN, MAYOR y EDAD MEDIA

MODELO 1: Perfil de candidato joven (23 años)

ModeloPosibilidadVotoJOVEN=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, youngsl==1))
summary(ModeloPosibilidadVotoJOVEN)

Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, youngsl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-75.203  -8.663   0.312   9.157  48.206 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  50.00058    3.61864  13.817  < 2e-16 ***
aetrust       3.73092    3.71069   1.005 0.315422    
aeknow        2.60592    2.92553   0.891 0.373718    
aequal        4.96723    3.23775   1.534 0.125957    
aecon         6.50705    3.50098   1.859 0.063977 .  
aelib         2.42146    3.51091   0.690 0.490875    
aeinex       -7.39582    2.20914  -3.348 0.000909 ***
aestand       6.51453    2.26381   2.878 0.004270 ** 
aeoot       -16.55904    4.21489  -3.929 0.000104 ***
aecare       10.04396    2.61488   3.841 0.000147 ***
age           0.03815    0.06291   0.606 0.544610    
female       -1.68206    2.13141  -0.789 0.430582    
nonwhite      1.38528    4.87975   0.284 0.776679    
latino       -0.69805    5.56018  -0.126 0.900169    
black         3.87727    5.66996   0.684 0.494569    
asian        -3.74013    9.01251  -0.415 0.678419    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 18.44 on 327 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.2882,    Adjusted R-squared:  0.2556 
F-statistic: 8.829 on 15 and 327 DF,  p-value: < 2.2e-16

MODELO 2: Perfil de candidato mayor (77 años)

ModeloPosibilidadVotoVIEJO=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, oldsl==1))
summary(ModeloPosibilidadVotoVIEJO)

Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, oldsl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-58.053  -9.208   0.787  12.042  44.748 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  46.16384    4.00229  11.534  < 2e-16 ***
aetrust      10.62529    3.55241   2.991  0.00300 ** 
aeknow        7.50027    2.82863   2.652  0.00842 ** 
aequal        7.73211    3.40326   2.272  0.02377 *  
aecon        -0.16573    3.18219  -0.052  0.95850    
aelib         6.31626    4.50021   1.404  0.16145    
aeinex       -8.58312    2.74126  -3.131  0.00191 ** 
aestand       2.23749    2.37289   0.943  0.34645    
aeoot       -18.95298    3.75995  -5.041 7.89e-07 ***
aecare        5.94588    2.59507   2.291  0.02262 *  
age           0.05460    0.06654   0.820  0.41256    
female        0.59207    2.26106   0.262  0.79361    
nonwhite     -3.69332    5.43431  -0.680  0.49724    
latino        4.06670    6.07206   0.670  0.50352    
black         5.60805    5.98108   0.938  0.34916    
asian        -4.90886    8.47025  -0.580  0.56264    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 19.52 on 311 degrees of freedom
Multiple R-squared:  0.3027,    Adjusted R-squared:  0.2691 
F-statistic: 9.001 on 15 and 311 DF,  p-value: < 2.2e-16

MODELO 3: Perfil de candidato de edad media (50 años)

ModeloPosibilidadVotoCONTROL=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, consl==1))
summary(ModeloPosibilidadVotoCONTROL)

Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, consl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-48.846  -8.098   0.060   7.975  49.066 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  48.29179    3.18111  15.181  < 2e-16 ***
aetrust       5.88676    2.88768   2.039  0.04233 *  
aeknow        5.15149    2.39484   2.151  0.03224 *  
aequal        1.72322    2.43749   0.707  0.48011    
aecon        -1.68688    2.49689  -0.676  0.49980    
aelib        10.45747    3.92859   2.662  0.00817 ** 
aeinex       -2.30064    2.24694  -1.024  0.30667    
aestand       2.12454    2.04593   1.038  0.29988    
aeoot       -14.75289    3.31833  -4.446 1.22e-05 ***
aecare       15.36262    2.22322   6.910 2.72e-11 ***
age           0.06079    0.05145   1.182  0.23827    
female       -3.91409    1.82680  -2.143  0.03292 *  
nonwhite     -4.82712    4.64185  -1.040  0.29918    
latino        5.25688    5.19106   1.013  0.31200    
black        16.50162    5.54030   2.978  0.00312 ** 
asian         3.35369    6.23317   0.538  0.59093    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 15.9 on 313 degrees of freedom
Multiple R-squared:  0.3657,    Adjusted R-squared:  0.3353 
F-statistic: 12.03 on 15 and 313 DF,  p-value: < 2.2e-16

Interpretación del Modelo MM 1, 2 y 3 (aelvote):

p-value de los 3 modelos segun grupo de edad = 2.2e-16 <0.05 (se aprueban los modelos 1, 2 y 3)

Vemos que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que los 3 modelos son válidos como modelos de predicción.

Adjusted R squared

  • 23 años = 0.2556 = 25,56%

  • 77 años = 0.2691 =26,91%

  • 50 años = 0.3353 = 33,53%

Interpretación del Adjusted R-squared

Concluimos que el modelo1 explica aproximadamente el 25,56% de la variabilidad en la probabilidad de votar por el legislador joven (23 años)

El modelo2 explica el 26,91% de la variabilidad en la probabilidad de votar por el legislador mayor (77 años), y el modelo3 explicaría el 33,53% de la variabilidad en la probabilidad de votar por el legislador de edad media (50 años)

Algunas conclusiones…

A pesar que todos los modelos sean validos, nos damos cuenta que la variable “edad de los encuestados” (age) no aporta a ninguno de estos modelos.

Así, concluimos que hay otros factores mucho más importantes que afectasn a la percepcion de los cadidatos y la probabilidad de votar por ellos.

Ejem: confiabilidad/que inspire confianza

DATA1: analisis bivariado (age->aeqrep)

Queremos determinar si la variable “edad del encuestado” (age) impacta en la Calidad de representación (aeqrep):

Modelo2=lm(aeqrep ~ age, data= data1)
summary(Modelo2)

Call:
lm(formula = aeqrep ~ age, data = data1)

Residuals:
    Min      1Q  Median      3Q     Max 
-55.799  -6.265  -3.073  12.923  47.720 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 51.08515    1.86574   27.38   <2e-16 ***
age          0.06639    0.03627    1.83   0.0675 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 20.33 on 994 degrees of freedom
  (4 observations deleted due to missingness)
Multiple R-squared:  0.003359,  Adjusted R-squared:  0.002357 
F-statistic:  3.35 on 1 and 994 DF,  p-value: 0.06749

Interpretación

p-value=0.06749>0.05 (se rechaza el modelo)

Podemos afirmar que NO hay suficiente evidencia para rechazar la H0; por lo que, concluimos que el modelo NO es válido como modelo de predicción. Asimismo, tampoco hay necesidad de interpretar el R2, puesto que sería un tanto irrelevante debido al rechazo del modelo.

Por lo tanto, debemos utilizar otro modelo que tome en cuenta más factores que influyan en esta variable.

Modelo multivariado 4-6: ¿Qué factores influyen en la calidad de representación percibida?

Primero, establecemos las variables de nuestro modelo

Variable Dependiente: Calidad de representación percibida (aeqrep)

  • Esta variable está en una escala de 0-100

  • Expone la percepción de los encuestados sobre la calidad del la representación del candidato a nivel político, es decir, si creen que su trabajo en materia política sería fructífero

Variables Independientes:

Se describe al legislador como:

  • “confiable”= (aetrust)

  • “conocedor de los problemas” = (aeknow)

  • “bien calificado para legislar” = (aequal)

  • “conservador” = (aecon)/ “liberal” = (aelib)

  • “inexperto” = (aeinex)

  • “lucha por lo que cree” = (aestand)

  • “fuera de contacto con las personas” = (aeoot)

  • “se preocupa por alguien como tú” = (aecare)

  • Edad de los encuestados = (age)

  • Género del encuestado = (female)

El encuestado se identifica como:

  • “latino” = (latino)

  • “afrodescendiente” = (black)

  • “asiático” = (asian)

  • “otro” = (nonwhite)

Construimos el modelo

Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente:

Como nos interesan las diferencias entre los GRUPOS DE EDAD, procedemos a hacer los modelos en funcion del perfil del candidato JOVEN, MAYOR y EDAD MEDIA

MODELO 4: Perfil de candidato joven (23 años)

ModeloCalidadRepresentacionJOVEN=lm(aeqrep ~ aetrust +aeknow +aequal+aecon +aelib +aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black +asian, data=subset(data1, youngsl == 1))
summary(ModeloCalidadRepresentacionJOVEN) 

Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, youngsl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-83.325  -6.969   0.359   7.498  46.427 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  51.013980   3.270332  15.599  < 2e-16 ***
aetrust       8.100231   3.344231   2.422  0.01597 *  
aeknow        3.831886   2.636766   1.453  0.14712    
aequal        4.364727   2.918185   1.496  0.13570    
aecon         2.566783   3.155613   0.813  0.41658    
aelib         3.089207   3.164334   0.976  0.32966    
aeinex       -6.273498   1.993340  -3.147  0.00180 ** 
aestand       6.734698   2.041474   3.299  0.00108 ** 
aeoot       -19.529953   3.798911  -5.141 4.72e-07 ***
aecare       10.616780   2.357235   4.504 9.30e-06 ***
age          -0.005372   0.056741  -0.095  0.92463    
female       -0.052296   1.922604  -0.027  0.97832    
nonwhite     -2.183438   4.398681  -0.496  0.61996    
latino        1.437163   5.011049   0.287  0.77445    
black         3.669063   5.110049   0.718  0.47327    
asian        -0.354061   8.122459  -0.044  0.96526    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 16.62 on 326 degrees of freedom
  (2 observations deleted due to missingness)
Multiple R-squared:  0.3635,    Adjusted R-squared:  0.3342 
F-statistic: 12.41 on 15 and 326 DF,  p-value: < 2.2e-16

MODELO 5: Perfil de candidato de edad mayor (77 años)


Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, oldsl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-54.475  -8.250  -0.045  10.390  40.893 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  43.65095    3.56341  12.250  < 2e-16 ***
aetrust      10.69190    3.16090   3.383 0.000811 ***
aeknow        4.91366    2.52125   1.949 0.052212 .  
aequal       11.51640    3.02472   3.807 0.000169 ***
aecon         2.62673    2.85210   0.921 0.357779    
aelib         4.45947    4.07096   1.095 0.274179    
aeinex       -8.02420    2.43630  -3.294 0.001104 ** 
aestand       4.12123    2.10922   1.954 0.051613 .  
aeoot       -19.24505    3.34403  -5.755 2.09e-08 ***
aecare        6.12689    2.30854   2.654 0.008366 ** 
age           0.09778    0.05923   1.651 0.099810 .  
female        1.52058    2.01280   0.755 0.450552    
nonwhite     -1.66639    4.82809  -0.345 0.730220    
latino        3.84579    5.40594   0.711 0.477373    
black         0.99615    5.32606   0.187 0.851758    
asian        -5.72205    7.52617  -0.760 0.447663    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 17.34 on 309 degrees of freedom
  (2 observations deleted due to missingness)
Multiple R-squared:  0.372, Adjusted R-squared:  0.3415 
F-statistic:  12.2 on 15 and 309 DF,  p-value: < 2.2e-16

MODELO 6: Perfil de candidato de edad media (50 años)


Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib + 
    aeinex + aestand + aeoot + aecare + age + female + nonwhite + 
    latino + black + asian, data = subset(data1, consl == 1))

Residuals:
    Min      1Q  Median      3Q     Max 
-50.290  -8.503   0.565   7.996  39.610 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  50.58460    3.06909  16.482  < 2e-16 ***
aetrust       9.40224    2.78600   3.375 0.000832 ***
aeknow        4.68221    2.31051   2.026 0.043563 *  
aequal        3.17073    2.35166   1.348 0.178540    
aecon        -2.36167    2.40897  -0.980 0.327662    
aelib         8.13477    3.79025   2.146 0.032623 *  
aeinex       -3.36981    2.16782  -1.554 0.121082    
aestand       3.32786    1.97389   1.686 0.092804 .  
aeoot       -13.78405    3.20148  -4.306 2.23e-05 ***
aecare       14.90481    2.14493   6.949 2.14e-11 ***
age           0.01115    0.04964   0.225 0.822466    
female       -3.96786    1.76247  -2.251 0.025060 *  
nonwhite     -3.21051    4.47839  -0.717 0.473978    
latino        1.44763    5.00827   0.289 0.772736    
black        13.49408    5.34521   2.525 0.012080 *  
asian         0.72617    6.01368   0.121 0.903965    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 15.34 on 313 degrees of freedom
Multiple R-squared:  0.398, Adjusted R-squared:  0.3691 
F-statistic: 13.79 on 15 and 313 DF,  p-value: < 2.2e-16

Interpretación del Modelo MM 2:

p-value = 2.2e-16 <0.05 para los 3 modelos con diferentes grupos de edad (se aprueban los modelos 4, 5 y 6)

Vemos que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que los 3 modelos son válidos como modelos de predicción.

Adjusted R squared

  • 23 años = 0.3342 = 33,42%

  • 77 años = 0.3415 =34,15%

  • 50 años = 0.3691 = 36,91%

Interpretación del Adjusted R-squared

Concluimos que el modelo4 explica aproximadamente el 33,42% de la variabilidad en la calidad de representacion percibida del legislador joven (23 años)

El modelo 5 explica aproximadamente el 34,15% de la variabilidad en la calidad de representacion percibida del legislador mayor (77 años), y, por ultimo, el modelo 6 explica la variabilidad de la calidad de representacion percibida del legislador de edad media (50 años).

Algunas conclusiones…

Concluimos que en los 3 casos, no todas las variables aportan al modelo. De hecho, la variable que más nos interesa AGE, la edad de los encuestados, no cumple con el p-value<0,05. Por lo que podemos decir que hay otras variables mucho más importantes que la edad de los encuestados que pueden explicar la forma en que se percibe la calidad de la representacion de los distintos perfiles de candidatos.

Algunas de estas categorías puede ser género o raza, no obstante, la relación es baja.

DATA2: analisis bivariado (mcage->mcapp)

Queremos determinar si la variable “edad del Congresista” (mcage) impacta en la Aprobación del miembro del Congreso (mcapp) por parte de los encuestados:

Modelo3=lm(mcapp ~ mcage, data=data2)
summary(Modelo3)

Call:
lm(formula = mcapp ~ mcage, data = data2)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.6358 -0.5837  0.4163  0.4620  1.4989 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 1.4381391  0.0100398  143.24   <2e-16 ***
mcage       0.0021719  0.0001694   12.82   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.029 on 323905 degrees of freedom
  (97051 observations deleted due to missingness)
Multiple R-squared:  0.0005075, Adjusted R-squared:  0.0005045 
F-statistic: 164.5 on 1 and 323905 DF,  p-value: < 2.2e-16

Analisis bivariado (age->mcapp)

Como no es determinante, tal vez la variable “edad del encuestado” (age) impacta en la Aprobación del miembro del Congreso (mcapp) por parte de los encuestados:


Call:
lm(formula = mcapp ~ age, data = data2)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.6371 -0.5849  0.4150  0.4672  1.4851 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 1.4880288  0.0061313  242.69   <2e-16 ***
age         0.0014910  0.0001126   13.24   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.029 on 324424 degrees of freedom
  (96532 observations deleted due to missingness)
Multiple R-squared:  0.0005398, Adjusted R-squared:  0.0005367 
F-statistic: 175.2 on 1 and 324424 DF,  p-value: < 2.2e-16

Interpretación de estos 2 modelos bivariados

p-value=2.2e-16<0.05 (se aprueban los modelos)

Podemos afirmar que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que ambos modelos son validos para fines de predicción.

No obstante, al mirar al Multiple R squared, nos damos cuenta de que ni la edad de los encuestados (0,05% de variabilidad) ni la edad de los congresistas (0,05% de variabilidad) por sí mismas, son suficientes para determinar la aprobación de los congresistas: deben existir otros factores que la expliquen mejor

Modelo multivariado 1: ¿Qué factores influyen en la aprobación de los congresistas?

Primero, establecemos las variables de nuestro modelo

Variable Dependiente: Aprobacion de los congresistas por los encuestados (mcapp)

  • Expone que tanto aprueban los encuestados el trabajo y la personalidad del congresista

Variables Independientes:

A. Sobre los congresistas:

  • Edad del congresista (mcage)

  • Partido político del congresista (mcdem)

  • Efectividad del congresista (leff)

  • Años de trabajo del congresista (mctenure)

  • Género del congresista (frep)

  • Raza del congresista: Afroamericano (brep), Latino/hispanic (lrep), Asiatico-americano (arep)

B. Sobre las caracteristicas de los encuestados:

  • Aprobacion del miembro del congreso por parte del encuestado (mcapp)

  • Edad del encuestado (age)

  • Partido del encuestado (pid)

  • Inclinacion politica del encuestado -> Muy Liberal-Muy Conservador (ideo7)

  • Educacion del encuestado

  • Género del encuestado (female)

  • Raza del encuestado: Afroamericano (black), Latino (latino), Asiatico-americano (asian)

Construimos el modelo

Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente

Como nos interesa analizar el comportamiento de los tres grupos de edad: jovenes, mayores y edad media. Así que construimos los modelos en función de ello.

GRUPO JOVENES (18-30 años)

ModeloAprobacionJOVEN=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
  +leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 18 & age <= 30))
summary(ModeloAprobacionJOVEN) 

Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff + 
    mctenure + brep + lrep + arep + frep + pid + ideo7 + educ + 
    female + black + latino + asian, data = subset(data2, age >= 
    18 & age <= 30))

Residuals:
     Min       1Q   Median       3Q      Max 
-2.17762 -0.76335  0.05781  0.72674  2.04710 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.2276549  0.0484713  25.327  < 2e-16 ***
mcage       -0.0014052  0.0005176  -2.715  0.00663 ** 
age         -0.0003815  0.0013792  -0.277  0.78207    
mcdem       -0.0881923  0.0314480  -2.804  0.00504 ** 
ownmc        0.6886318  0.0095177  72.353  < 2e-16 ***
dwnom       -0.2476651  0.0365757  -6.771 1.30e-11 ***
leff         0.0028446  0.0038775   0.734  0.46318    
mctenure    -0.0003704  0.0006313  -0.587  0.55739    
brep         0.0144509  0.0161475   0.895  0.37083    
lrep         0.0114358  0.0193553   0.591  0.55464    
arep         0.0871973  0.0292382   2.982  0.00286 ** 
frep         0.0142198  0.0117885   1.206  0.22773    
pid         -0.0006421  0.0028006  -0.229  0.81866    
ideo7        0.0296834  0.0030570   9.710  < 2e-16 ***
educ         0.0137557  0.0181194   0.759  0.44776    
female       0.0078053  0.0092328   0.845  0.39790    
black        0.0461584  0.0145221   3.178  0.00148 ** 
latino       0.0148453  0.0126583   1.173  0.24089    
asian        0.1156414  0.0203426   5.685 1.32e-08 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8159 on 32534 degrees of freedom
  (42674 observations deleted due to missingness)
Multiple R-squared:  0.1758,    Adjusted R-squared:  0.1753 
F-statistic: 385.5 on 18 and 32534 DF,  p-value: < 2.2e-16

Relación negativa entre edad del congresista (+) y aprobacion de gente joven (-)

GRUPO MAYORES (65-100 años)

ModeloAprobacionVIEJO=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
  +leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 65 & age <= 100))
summary(ModeloAprobacionVIEJO) 

Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff + 
    mctenure + brep + lrep + arep + frep + pid + ideo7 + educ + 
    female + black + latino + asian, data = subset(data2, age >= 
    65 & age <= 100))

Residuals:
    Min      1Q  Median      3Q     Max 
-2.4694 -0.7402 -0.1942  0.7167  2.3800 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.5019281  0.0485205  10.345  < 2e-16 ***
mcage       -0.0005829  0.0003674  -1.586 0.112663    
age          0.0055326  0.0005777   9.576  < 2e-16 ***
mcdem       -0.0913160  0.0211103  -4.326 1.52e-05 ***
ownmc        1.4335232  0.0064893 220.906  < 2e-16 ***
dwnom       -0.1374553  0.0247437  -5.555 2.78e-08 ***
leff        -0.0042106  0.0026188  -1.608 0.107871    
mctenure     0.0003938  0.0004548   0.866 0.386554    
brep        -0.0788057  0.0138756  -5.679 1.36e-08 ***
lrep        -0.0890570  0.0162436  -5.483 4.21e-08 ***
arep         0.0027191  0.0235789   0.115 0.908194    
frep        -0.0244833  0.0087614  -2.794 0.005200 ** 
pid         -0.0194522  0.0022725  -8.560  < 2e-16 ***
ideo7        0.0240728  0.0027961   8.610  < 2e-16 ***
educ        -0.0404433  0.0108807  -3.717 0.000202 ***
female       0.0520536  0.0066060   7.880 3.33e-15 ***
black        0.1024896  0.0151004   6.787 1.15e-11 ***
latino       0.0470387  0.0165497   2.842 0.004481 ** 
asian        0.1507179  0.0406728   3.706 0.000211 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8046 on 63566 degrees of freedom
  (21648 observations deleted due to missingness)
Multiple R-squared:  0.4424,    Adjusted R-squared:  0.4423 
F-statistic:  2802 on 18 and 63566 DF,  p-value: < 2.2e-16

La variable edad del congresista no aporta al modelo. +edad encuestado + aprobacion de gente mayor

GRUPO EDAD MEDIA: 31-64 años

ModeloAprobacionMEDIO=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
  +leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 31 & age <= 64))
summary(ModeloAprobacionMEDIO)

Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff + 
    mctenure + brep + lrep + arep + frep + pid + ideo7 + educ + 
    female + black + latino + asian, data = subset(data2, age >= 
    31 & age <= 64))

Residuals:
     Min       1Q   Median       3Q      Max 
-2.32308 -0.86580 -0.05994  0.87418  2.24408 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.9801584  0.0207663  47.199  < 2e-16 ***
mcage       -0.0008344  0.0002402  -3.474 0.000513 ***
age          0.0006483  0.0002226   2.913 0.003580 ** 
mcdem       -0.1360709  0.0140615  -9.677  < 2e-16 ***
ownmc        1.1758154  0.0042233 278.409  < 2e-16 ***
dwnom       -0.1877758  0.0165322 -11.358  < 2e-16 ***
leff        -0.0033239  0.0017519  -1.897 0.057790 .  
mctenure     0.0007195  0.0002934   2.453 0.014179 *  
brep        -0.0585170  0.0081018  -7.223 5.12e-13 ***
lrep        -0.0507182  0.0099494  -5.098 3.44e-07 ***
arep         0.0505128  0.0146906   3.438 0.000585 ***
frep         0.0014967  0.0055592   0.269 0.787758    
pid         -0.0105541  0.0013716  -7.695 1.42e-14 ***
ideo7        0.0163196  0.0015718  10.383  < 2e-16 ***
educ        -0.0253323  0.0073157  -3.463 0.000535 ***
female       0.0391162  0.0042290   9.250  < 2e-16 ***
black        0.0933573  0.0073537  12.695  < 2e-16 ***
latino       0.0362714  0.0073352   4.945 7.63e-07 ***
asian        0.0698586  0.0160722   4.347 1.38e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8336 on 160008 degrees of freedom
  (100469 observations deleted due to missingness)
Multiple R-squared:  0.3362,    Adjusted R-squared:  0.3361 
F-statistic:  4502 on 18 and 160008 DF,  p-value: < 2.2e-16

Relación negativa entre edad del congresista (+) y aprobacion de gente de edad media (-)

Por lo tanto, concluimos que…

  • Se rechaza la hipótesis principal: no hay evidencia de que la categoría EDAD es lo suficientemente influyente en la percepcion y aprobacion de un candidato.

  • Hay otros factores que influyen mucho más tanto en la percepcion como valoracion del politico

  • Los jovenes no tienden a votar por otros jovenes

  • La gente apoya por igual a un candidato de 23, 50 o 77 años

También…

  • Los candidatos más jovenes tienden a ser considerados como inexpertos y menos calificados

  • Podría haber factores estructurales que escapan del ambito de investigacion del estudio y que afectan a la infrarrepresentacion de los jovenes. Ejm: edad minima para ocupar cargos públicos

GRACIAS!!