El texto gira en torno a una cuestión muy interesante: ¿la edad es un factor influyente en las decisiones y percepciones de los votantes en torno a las personalidades que hacen carrera política?
Unidad de analisis: encuestados, divididos en grupos de edad
Las variables analizadas en el documento se distribuyen en dos bases de datos:
DATA1: 2020 CES age experiment (replication data)
DATA2: 2006-2020 CES age and approval survey (replication data)
DATA1: Experimento destinado a entender si las percepciones de la gente cambian en funcion de la edad del candidato.
Sobre los candidatos ficticios:
Las diversas percepciones en relación con los perfiles y la edad:
Probabilidad de votar al candidato para legislador estatal del 0-100 (aelvote)
Calidad de representacion de los intereses de los votantes del 0-100 (aeqrep)
Capacidad percibida: Las capacidades del candidato para llevar el cargo. Bien calificado para el puesto (aequal), conocedor de las problematicas (aeknow), sin experiencia (aeinex)
Receptividad percibida: Ser abierto de mente ante las necesidades de los ciudadanos. Se preocupa por gente como tú (aecare), alejado de la gente corriente (aeoot), confiabilidad (aetrust) y lucha por lo que cree (aestand)
Inclinaciones ideológicas percibidas: liberal (aeib) o conservador (aecon)
Algunas características de los encuestados:
Edad del encuestado (age)
Género del encuestado (female)
Inclinacion politica del encuestado (ideo7)
Sobre la raza de los encuestados:
Latino (latino)
Afroamericano (black)
Asiatico-americano (asian)
Otros (nonwhite)
DATA2: Encuesta que recopila datos sobre de la percepción de la gente sobre la performance de politicos reales del Congreso de los EEUU entre los años 2006-2020
Recoge datos tanto de los encuestados como de los congresistas
El estudio de data2 no se centra unicamente en el analisis de la edad, sino tambien en afiliacion ideologica y de partido como variables principales. No obstante, los autores se centran más en la edad por los objetivos del estudio.
A. Sobre los congresistas:
Edad del congresista (mcage)
Partido político del congresista (mcdem)
Efectividad del congresista (leff)
Años de trabajo del congresista (mctenure)
Género del congresista (frep)
Sobre la raza del congresista:
Afroamericano (brep)
Latino/hispanic (lrep)
Asiatico-americano (arep)
B. Sobre las caracteristicas de los encuestados:
Aprobacion del miembro del congreso por parte del encuestado (mcapp)
Edad del encuestado (age)
Partido del encuestado (pid)
Inclinacion politica del encuestado -> Muy Liberal-Muy Conservador (ideo7)
Educacion del encuestado
Género del encuestado (female)
Sobre la raza del encuestado:
Afroamericano (black)
Latino (latino)
Asiatico-americano (asian)
Roberts y Wolak (2022) inician su estudio desde una situación que les parece interesante de analizar: en el piso congresal, los congresistas mayores representan a gente mucho más joven que ellos y los jovenes estan infrarepresentados.
¿Esto significa que existen percepciones negativas o prejuicios en contra de los jovenes que impide su eleccion?
Varios estudios demuestran que los jovenes que inician carrera política son muchas veces vistos como sin experiencia, menos cualificados y menos conservadores.
No obstante, también existen prejuicios contra las personas muy mayores: se les ve como como menos competentes, menos dignos de confianza y con menos probabilidades de representar eficazmente los intereses de sus electores.
Se tienen razones para creer que los votantes tienden a elegir representantes congresales que se alineen a sus intereses. No obstante, tambien hay razones para creer que existen razones estructurales que favorecen a candidatos de mayor edad
Se intenta dar luz sobre la importancia de la edad como categoría política.
Así como se analiza el accionar político y preferencias de los votantes bajo lupas de raza, género, orientación, etc, las valoraciones en función de edad se están dejando de lado puesto que hay evidencia confusa al respecto.
Con este estudio, se abre nuevamente el debate y se intenta dar una respuesta afirmativa ante la pregunta: ¿la edad es importante para la gente al momento de evaluar politicos?
Los votantes jóvenes o de generaciones recientes tenderán a elegir a candidatos iguales a ellos o que sientan que los representan mejor, a pesar de que puedan ser percibidos como faltos de experiencia o sin fuertes convicciones.
Por otro lado, se espera que los votantes viejos tiendan a elegir a candidatos con un mismo rango de edad, puesto que los consideran experimentados y que siguen sus ideales políticos conservadores.
Call:
lm(formula = aelvote ~ age, data = data1)
Residuals:
Min 1Q Median 3Q Max
-55.599 -5.974 -2.595 13.090 48.381
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 50.26773 1.94652 25.824 <2e-16 ***
age 0.07509 0.03788 1.982 0.0477 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 21.26 on 997 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.003927, Adjusted R-squared: 0.002928
F-statistic: 3.93 on 1 and 997 DF, p-value: 0.0477
p-value=0.0477<0.05 (se aprueba el modelo)
Podemos afirmar que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que el modelo sí es válido como modelo de predicción.
Multiple R squared =0.003927 = 0,3%
En nuestro modelo, este arrojó el valor de 0.003927 , por lo que podemos concluir el modelo explica aproximadamente el 0,3% de la variabilidad en la probabilidad de votar por el legislador.
Esto nos confirma que la edad de los encuestados no es determinante en la posibilidad de voto a los legisladores, por sí misma; deben existir otros factores que la expliquen mejor
Primero, establecemos las variables de nuestro modelo
Variable Dependiente: Posibilidad de voto (aelvote)
Esta variable está en una escala de 0-100
Expone la probabilidad de votar por el legislador estatal para los encuestados
Variables Independientes:
Se describe al legislador como:
“confiable”= (aetrust)
“conocedor de los problemas” = (aeknow)
“bien calificado para legislar” = (aequal)
“conservador” = (aecon)/ “liberal” = (aelib)
“inexperto” = (aeinex)
“lucha por lo que cree” = (aestand)
“fuera de contacto con las personas” = (aeoot)
“se preocupa por alguien como tú” = (aecare)
Edad de los encuestados = (age)
Género del encuestado = (female)
El encuestado se identifica como:
“latino” = (latino)
“afrodescendiente” = (black)
“asiático” = (asian)
“otro” = (nonwhite)
Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente:
Como nos interesan las diferencias entre los GRUPOS DE EDAD, procedemos a hacer los modelos en funcion del perfil del candidato JOVEN, MAYOR y EDAD MEDIA
ModeloPosibilidadVotoJOVEN=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, youngsl==1))
summary(ModeloPosibilidadVotoJOVEN)
Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, youngsl == 1))
Residuals:
Min 1Q Median 3Q Max
-75.203 -8.663 0.312 9.157 48.206
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 50.00058 3.61864 13.817 < 2e-16 ***
aetrust 3.73092 3.71069 1.005 0.315422
aeknow 2.60592 2.92553 0.891 0.373718
aequal 4.96723 3.23775 1.534 0.125957
aecon 6.50705 3.50098 1.859 0.063977 .
aelib 2.42146 3.51091 0.690 0.490875
aeinex -7.39582 2.20914 -3.348 0.000909 ***
aestand 6.51453 2.26381 2.878 0.004270 **
aeoot -16.55904 4.21489 -3.929 0.000104 ***
aecare 10.04396 2.61488 3.841 0.000147 ***
age 0.03815 0.06291 0.606 0.544610
female -1.68206 2.13141 -0.789 0.430582
nonwhite 1.38528 4.87975 0.284 0.776679
latino -0.69805 5.56018 -0.126 0.900169
black 3.87727 5.66996 0.684 0.494569
asian -3.74013 9.01251 -0.415 0.678419
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 18.44 on 327 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.2882, Adjusted R-squared: 0.2556
F-statistic: 8.829 on 15 and 327 DF, p-value: < 2.2e-16
ModeloPosibilidadVotoVIEJO=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, oldsl==1))
summary(ModeloPosibilidadVotoVIEJO)
Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, oldsl == 1))
Residuals:
Min 1Q Median 3Q Max
-58.053 -9.208 0.787 12.042 44.748
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 46.16384 4.00229 11.534 < 2e-16 ***
aetrust 10.62529 3.55241 2.991 0.00300 **
aeknow 7.50027 2.82863 2.652 0.00842 **
aequal 7.73211 3.40326 2.272 0.02377 *
aecon -0.16573 3.18219 -0.052 0.95850
aelib 6.31626 4.50021 1.404 0.16145
aeinex -8.58312 2.74126 -3.131 0.00191 **
aestand 2.23749 2.37289 0.943 0.34645
aeoot -18.95298 3.75995 -5.041 7.89e-07 ***
aecare 5.94588 2.59507 2.291 0.02262 *
age 0.05460 0.06654 0.820 0.41256
female 0.59207 2.26106 0.262 0.79361
nonwhite -3.69332 5.43431 -0.680 0.49724
latino 4.06670 6.07206 0.670 0.50352
black 5.60805 5.98108 0.938 0.34916
asian -4.90886 8.47025 -0.580 0.56264
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 19.52 on 311 degrees of freedom
Multiple R-squared: 0.3027, Adjusted R-squared: 0.2691
F-statistic: 9.001 on 15 and 311 DF, p-value: < 2.2e-16
ModeloPosibilidadVotoCONTROL=lm(aelvote ~ aetrust +aeknow +aequal+aecon +aelib
+aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black
+asian, data=subset(data1, consl==1))
summary(ModeloPosibilidadVotoCONTROL)
Call:
lm(formula = aelvote ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, consl == 1))
Residuals:
Min 1Q Median 3Q Max
-48.846 -8.098 0.060 7.975 49.066
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 48.29179 3.18111 15.181 < 2e-16 ***
aetrust 5.88676 2.88768 2.039 0.04233 *
aeknow 5.15149 2.39484 2.151 0.03224 *
aequal 1.72322 2.43749 0.707 0.48011
aecon -1.68688 2.49689 -0.676 0.49980
aelib 10.45747 3.92859 2.662 0.00817 **
aeinex -2.30064 2.24694 -1.024 0.30667
aestand 2.12454 2.04593 1.038 0.29988
aeoot -14.75289 3.31833 -4.446 1.22e-05 ***
aecare 15.36262 2.22322 6.910 2.72e-11 ***
age 0.06079 0.05145 1.182 0.23827
female -3.91409 1.82680 -2.143 0.03292 *
nonwhite -4.82712 4.64185 -1.040 0.29918
latino 5.25688 5.19106 1.013 0.31200
black 16.50162 5.54030 2.978 0.00312 **
asian 3.35369 6.23317 0.538 0.59093
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 15.9 on 313 degrees of freedom
Multiple R-squared: 0.3657, Adjusted R-squared: 0.3353
F-statistic: 12.03 on 15 and 313 DF, p-value: < 2.2e-16
p-value de los 3 modelos segun grupo de edad = 2.2e-16 <0.05 (se aprueban los modelos 1, 2 y 3)
Vemos que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que los 3 modelos SÍ son válidos como modelos de predicción.
Adjusted R squared
23 años = 0.2556 = 25,56%
77 años = 0.2691 =26,91%
50 años = 0.3353 = 33,53%
Concluimos que el modelo1 explica aproximadamente el 25,56% de la variabilidad en la probabilidad de votar por el legislador joven (23 años)
El modelo2 explica el 26,91% de la variabilidad en la probabilidad de votar por el legislador mayor (77 años), y el modelo3 explicaría el 33,53% de la variabilidad en la probabilidad de votar por el legislador de edad media (50 años)
A pesar que todos los modelos sean validos, nos damos cuenta que la variable “edad de los encuestados” (age) no aporta a ninguno de estos modelos.
Así, concluimos que hay otros factores mucho más importantes que afectasn a la percepcion de los cadidatos y la probabilidad de votar por ellos.
Ejem: confiabilidad/que inspire confianza
Queremos determinar si la variable “edad del encuestado” (age) impacta en la Calidad de representación (aeqrep):
Call:
lm(formula = aeqrep ~ age, data = data1)
Residuals:
Min 1Q Median 3Q Max
-55.799 -6.265 -3.073 12.923 47.720
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 51.08515 1.86574 27.38 <2e-16 ***
age 0.06639 0.03627 1.83 0.0675 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 20.33 on 994 degrees of freedom
(4 observations deleted due to missingness)
Multiple R-squared: 0.003359, Adjusted R-squared: 0.002357
F-statistic: 3.35 on 1 and 994 DF, p-value: 0.06749
p-value=0.06749>0.05 (se rechaza el modelo)
Podemos afirmar que NO hay suficiente evidencia para rechazar la H0; por lo que, concluimos que el modelo NO es válido como modelo de predicción. Asimismo, tampoco hay necesidad de interpretar el R2, puesto que sería un tanto irrelevante debido al rechazo del modelo.
Por lo tanto, debemos utilizar otro modelo que tome en cuenta más factores que influyan en esta variable.
Primero, establecemos las variables de nuestro modelo
Variable Dependiente: Calidad de representación percibida (aeqrep)
Esta variable está en una escala de 0-100
Expone la percepción de los encuestados sobre la calidad del la representación del candidato a nivel político, es decir, si creen que su trabajo en materia política sería fructífero
Variables Independientes:
Se describe al legislador como:
“confiable”= (aetrust)
“conocedor de los problemas” = (aeknow)
“bien calificado para legislar” = (aequal)
“conservador” = (aecon)/ “liberal” = (aelib)
“inexperto” = (aeinex)
“lucha por lo que cree” = (aestand)
“fuera de contacto con las personas” = (aeoot)
“se preocupa por alguien como tú” = (aecare)
Edad de los encuestados = (age)
Género del encuestado = (female)
El encuestado se identifica como:
“latino” = (latino)
“afrodescendiente” = (black)
“asiático” = (asian)
“otro” = (nonwhite)
Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente:
Como nos interesan las diferencias entre los GRUPOS DE EDAD, procedemos a hacer los modelos en funcion del perfil del candidato JOVEN, MAYOR y EDAD MEDIA
ModeloCalidadRepresentacionJOVEN=lm(aeqrep ~ aetrust +aeknow +aequal+aecon +aelib +aeinex +aestand +aeoot +aecare +age +female +nonwhite +latino +black +asian, data=subset(data1, youngsl == 1))
summary(ModeloCalidadRepresentacionJOVEN)
Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, youngsl == 1))
Residuals:
Min 1Q Median 3Q Max
-83.325 -6.969 0.359 7.498 46.427
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 51.013980 3.270332 15.599 < 2e-16 ***
aetrust 8.100231 3.344231 2.422 0.01597 *
aeknow 3.831886 2.636766 1.453 0.14712
aequal 4.364727 2.918185 1.496 0.13570
aecon 2.566783 3.155613 0.813 0.41658
aelib 3.089207 3.164334 0.976 0.32966
aeinex -6.273498 1.993340 -3.147 0.00180 **
aestand 6.734698 2.041474 3.299 0.00108 **
aeoot -19.529953 3.798911 -5.141 4.72e-07 ***
aecare 10.616780 2.357235 4.504 9.30e-06 ***
age -0.005372 0.056741 -0.095 0.92463
female -0.052296 1.922604 -0.027 0.97832
nonwhite -2.183438 4.398681 -0.496 0.61996
latino 1.437163 5.011049 0.287 0.77445
black 3.669063 5.110049 0.718 0.47327
asian -0.354061 8.122459 -0.044 0.96526
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 16.62 on 326 degrees of freedom
(2 observations deleted due to missingness)
Multiple R-squared: 0.3635, Adjusted R-squared: 0.3342
F-statistic: 12.41 on 15 and 326 DF, p-value: < 2.2e-16
Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, oldsl == 1))
Residuals:
Min 1Q Median 3Q Max
-54.475 -8.250 -0.045 10.390 40.893
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 43.65095 3.56341 12.250 < 2e-16 ***
aetrust 10.69190 3.16090 3.383 0.000811 ***
aeknow 4.91366 2.52125 1.949 0.052212 .
aequal 11.51640 3.02472 3.807 0.000169 ***
aecon 2.62673 2.85210 0.921 0.357779
aelib 4.45947 4.07096 1.095 0.274179
aeinex -8.02420 2.43630 -3.294 0.001104 **
aestand 4.12123 2.10922 1.954 0.051613 .
aeoot -19.24505 3.34403 -5.755 2.09e-08 ***
aecare 6.12689 2.30854 2.654 0.008366 **
age 0.09778 0.05923 1.651 0.099810 .
female 1.52058 2.01280 0.755 0.450552
nonwhite -1.66639 4.82809 -0.345 0.730220
latino 3.84579 5.40594 0.711 0.477373
black 0.99615 5.32606 0.187 0.851758
asian -5.72205 7.52617 -0.760 0.447663
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 17.34 on 309 degrees of freedom
(2 observations deleted due to missingness)
Multiple R-squared: 0.372, Adjusted R-squared: 0.3415
F-statistic: 12.2 on 15 and 309 DF, p-value: < 2.2e-16
Call:
lm(formula = aeqrep ~ aetrust + aeknow + aequal + aecon + aelib +
aeinex + aestand + aeoot + aecare + age + female + nonwhite +
latino + black + asian, data = subset(data1, consl == 1))
Residuals:
Min 1Q Median 3Q Max
-50.290 -8.503 0.565 7.996 39.610
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 50.58460 3.06909 16.482 < 2e-16 ***
aetrust 9.40224 2.78600 3.375 0.000832 ***
aeknow 4.68221 2.31051 2.026 0.043563 *
aequal 3.17073 2.35166 1.348 0.178540
aecon -2.36167 2.40897 -0.980 0.327662
aelib 8.13477 3.79025 2.146 0.032623 *
aeinex -3.36981 2.16782 -1.554 0.121082
aestand 3.32786 1.97389 1.686 0.092804 .
aeoot -13.78405 3.20148 -4.306 2.23e-05 ***
aecare 14.90481 2.14493 6.949 2.14e-11 ***
age 0.01115 0.04964 0.225 0.822466
female -3.96786 1.76247 -2.251 0.025060 *
nonwhite -3.21051 4.47839 -0.717 0.473978
latino 1.44763 5.00827 0.289 0.772736
black 13.49408 5.34521 2.525 0.012080 *
asian 0.72617 6.01368 0.121 0.903965
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 15.34 on 313 degrees of freedom
Multiple R-squared: 0.398, Adjusted R-squared: 0.3691
F-statistic: 13.79 on 15 and 313 DF, p-value: < 2.2e-16
p-value = 2.2e-16 <0.05 para los 3 modelos con diferentes grupos de edad (se aprueban los modelos 4, 5 y 6)
Vemos que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que los 3 modelos SÍ son válidos como modelos de predicción.
Adjusted R squared
23 años = 0.3342 = 33,42%
77 años = 0.3415 =34,15%
50 años = 0.3691 = 36,91%
Concluimos que el modelo4 explica aproximadamente el 33,42% de la variabilidad en la calidad de representacion percibida del legislador joven (23 años)
El modelo 5 explica aproximadamente el 34,15% de la variabilidad en la calidad de representacion percibida del legislador mayor (77 años), y, por ultimo, el modelo 6 explica la variabilidad de la calidad de representacion percibida del legislador de edad media (50 años).
Concluimos que en los 3 casos, no todas las variables aportan al modelo. De hecho, la variable que más nos interesa AGE, la edad de los encuestados, no cumple con el p-value<0,05. Por lo que podemos decir que hay otras variables mucho más importantes que la edad de los encuestados que pueden explicar la forma en que se percibe la calidad de la representacion de los distintos perfiles de candidatos.
Algunas de estas categorías puede ser género o raza, no obstante, la relación es baja.
Queremos determinar si la variable “edad del Congresista” (mcage) impacta en la Aprobación del miembro del Congreso (mcapp) por parte de los encuestados:
Call:
lm(formula = mcapp ~ mcage, data = data2)
Residuals:
Min 1Q Median 3Q Max
-1.6358 -0.5837 0.4163 0.4620 1.4989
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4381391 0.0100398 143.24 <2e-16 ***
mcage 0.0021719 0.0001694 12.82 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.029 on 323905 degrees of freedom
(97051 observations deleted due to missingness)
Multiple R-squared: 0.0005075, Adjusted R-squared: 0.0005045
F-statistic: 164.5 on 1 and 323905 DF, p-value: < 2.2e-16
Como no es determinante, tal vez la variable “edad del encuestado” (age) impacta en la Aprobación del miembro del Congreso (mcapp) por parte de los encuestados:
Call:
lm(formula = mcapp ~ age, data = data2)
Residuals:
Min 1Q Median 3Q Max
-1.6371 -0.5849 0.4150 0.4672 1.4851
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4880288 0.0061313 242.69 <2e-16 ***
age 0.0014910 0.0001126 13.24 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.029 on 324424 degrees of freedom
(96532 observations deleted due to missingness)
Multiple R-squared: 0.0005398, Adjusted R-squared: 0.0005367
F-statistic: 175.2 on 1 and 324424 DF, p-value: < 2.2e-16
p-value=2.2e-16<0.05 (se aprueban los modelos)
Podemos afirmar que hay suficiente evidencia para rechazar la H0; por lo que, concluimos que ambos modelos son validos para fines de predicción.
No obstante, al mirar al Multiple R squared, nos damos cuenta de que ni la edad de los encuestados (0,05% de variabilidad) ni la edad de los congresistas (0,05% de variabilidad) por sí mismas, son suficientes para determinar la aprobación de los congresistas: deben existir otros factores que la expliquen mejor
Primero, establecemos las variables de nuestro modelo
Variable Dependiente: Aprobacion de los congresistas por los encuestados (mcapp)
Variables Independientes:
A. Sobre los congresistas:
Edad del congresista (mcage)
Partido político del congresista (mcdem)
Efectividad del congresista (leff)
Años de trabajo del congresista (mctenure)
Género del congresista (frep)
Raza del congresista: Afroamericano (brep), Latino/hispanic (lrep), Asiatico-americano (arep)
B. Sobre las caracteristicas de los encuestados:
Aprobacion del miembro del congreso por parte del encuestado (mcapp)
Edad del encuestado (age)
Partido del encuestado (pid)
Inclinacion politica del encuestado -> Muy Liberal-Muy Conservador (ideo7)
Educacion del encuestado
Género del encuestado (female)
Raza del encuestado: Afroamericano (black), Latino (latino), Asiatico-americano (asian)
Segundo, se plantea el modelo aterrizando las variables independientes sobre la variable dependiente
Como nos interesa analizar el comportamiento de los tres grupos de edad: jovenes, mayores y edad media. Así que construimos los modelos en función de ello.
ModeloAprobacionJOVEN=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
+leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 18 & age <= 30))
summary(ModeloAprobacionJOVEN)
Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff +
mctenure + brep + lrep + arep + frep + pid + ideo7 + educ +
female + black + latino + asian, data = subset(data2, age >=
18 & age <= 30))
Residuals:
Min 1Q Median 3Q Max
-2.17762 -0.76335 0.05781 0.72674 2.04710
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.2276549 0.0484713 25.327 < 2e-16 ***
mcage -0.0014052 0.0005176 -2.715 0.00663 **
age -0.0003815 0.0013792 -0.277 0.78207
mcdem -0.0881923 0.0314480 -2.804 0.00504 **
ownmc 0.6886318 0.0095177 72.353 < 2e-16 ***
dwnom -0.2476651 0.0365757 -6.771 1.30e-11 ***
leff 0.0028446 0.0038775 0.734 0.46318
mctenure -0.0003704 0.0006313 -0.587 0.55739
brep 0.0144509 0.0161475 0.895 0.37083
lrep 0.0114358 0.0193553 0.591 0.55464
arep 0.0871973 0.0292382 2.982 0.00286 **
frep 0.0142198 0.0117885 1.206 0.22773
pid -0.0006421 0.0028006 -0.229 0.81866
ideo7 0.0296834 0.0030570 9.710 < 2e-16 ***
educ 0.0137557 0.0181194 0.759 0.44776
female 0.0078053 0.0092328 0.845 0.39790
black 0.0461584 0.0145221 3.178 0.00148 **
latino 0.0148453 0.0126583 1.173 0.24089
asian 0.1156414 0.0203426 5.685 1.32e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8159 on 32534 degrees of freedom
(42674 observations deleted due to missingness)
Multiple R-squared: 0.1758, Adjusted R-squared: 0.1753
F-statistic: 385.5 on 18 and 32534 DF, p-value: < 2.2e-16
Relación negativa entre edad del congresista (+) y aprobacion de gente joven (-)
ModeloAprobacionVIEJO=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
+leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 65 & age <= 100))
summary(ModeloAprobacionVIEJO)
Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff +
mctenure + brep + lrep + arep + frep + pid + ideo7 + educ +
female + black + latino + asian, data = subset(data2, age >=
65 & age <= 100))
Residuals:
Min 1Q Median 3Q Max
-2.4694 -0.7402 -0.1942 0.7167 2.3800
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.5019281 0.0485205 10.345 < 2e-16 ***
mcage -0.0005829 0.0003674 -1.586 0.112663
age 0.0055326 0.0005777 9.576 < 2e-16 ***
mcdem -0.0913160 0.0211103 -4.326 1.52e-05 ***
ownmc 1.4335232 0.0064893 220.906 < 2e-16 ***
dwnom -0.1374553 0.0247437 -5.555 2.78e-08 ***
leff -0.0042106 0.0026188 -1.608 0.107871
mctenure 0.0003938 0.0004548 0.866 0.386554
brep -0.0788057 0.0138756 -5.679 1.36e-08 ***
lrep -0.0890570 0.0162436 -5.483 4.21e-08 ***
arep 0.0027191 0.0235789 0.115 0.908194
frep -0.0244833 0.0087614 -2.794 0.005200 **
pid -0.0194522 0.0022725 -8.560 < 2e-16 ***
ideo7 0.0240728 0.0027961 8.610 < 2e-16 ***
educ -0.0404433 0.0108807 -3.717 0.000202 ***
female 0.0520536 0.0066060 7.880 3.33e-15 ***
black 0.1024896 0.0151004 6.787 1.15e-11 ***
latino 0.0470387 0.0165497 2.842 0.004481 **
asian 0.1507179 0.0406728 3.706 0.000211 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8046 on 63566 degrees of freedom
(21648 observations deleted due to missingness)
Multiple R-squared: 0.4424, Adjusted R-squared: 0.4423
F-statistic: 2802 on 18 and 63566 DF, p-value: < 2.2e-16
La variable edad del congresista no aporta al modelo. +edad encuestado + aprobacion de gente mayor
ModeloAprobacionMEDIO=lm(mcapp ~ mcage +age+mcdem+ownmc +dwnom
+leff +mctenure +brep +lrep +arep +frep +pid +ideo7 +educ +female+black+latino+asian, data = subset(data2, age >= 31 & age <= 64))
summary(ModeloAprobacionMEDIO)
Call:
lm(formula = mcapp ~ mcage + age + mcdem + ownmc + dwnom + leff +
mctenure + brep + lrep + arep + frep + pid + ideo7 + educ +
female + black + latino + asian, data = subset(data2, age >=
31 & age <= 64))
Residuals:
Min 1Q Median 3Q Max
-2.32308 -0.86580 -0.05994 0.87418 2.24408
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.9801584 0.0207663 47.199 < 2e-16 ***
mcage -0.0008344 0.0002402 -3.474 0.000513 ***
age 0.0006483 0.0002226 2.913 0.003580 **
mcdem -0.1360709 0.0140615 -9.677 < 2e-16 ***
ownmc 1.1758154 0.0042233 278.409 < 2e-16 ***
dwnom -0.1877758 0.0165322 -11.358 < 2e-16 ***
leff -0.0033239 0.0017519 -1.897 0.057790 .
mctenure 0.0007195 0.0002934 2.453 0.014179 *
brep -0.0585170 0.0081018 -7.223 5.12e-13 ***
lrep -0.0507182 0.0099494 -5.098 3.44e-07 ***
arep 0.0505128 0.0146906 3.438 0.000585 ***
frep 0.0014967 0.0055592 0.269 0.787758
pid -0.0105541 0.0013716 -7.695 1.42e-14 ***
ideo7 0.0163196 0.0015718 10.383 < 2e-16 ***
educ -0.0253323 0.0073157 -3.463 0.000535 ***
female 0.0391162 0.0042290 9.250 < 2e-16 ***
black 0.0933573 0.0073537 12.695 < 2e-16 ***
latino 0.0362714 0.0073352 4.945 7.63e-07 ***
asian 0.0698586 0.0160722 4.347 1.38e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.8336 on 160008 degrees of freedom
(100469 observations deleted due to missingness)
Multiple R-squared: 0.3362, Adjusted R-squared: 0.3361
F-statistic: 4502 on 18 and 160008 DF, p-value: < 2.2e-16
Relación negativa entre edad del congresista (+) y aprobacion de gente de edad media (-)
Se rechaza la hipótesis principal: no hay evidencia de que la categoría EDAD es lo suficientemente influyente en la percepcion y aprobacion de un candidato.
Hay otros factores que influyen mucho más tanto en la percepcion como valoracion del politico
Los jovenes no tienden a votar por otros jovenes
La gente apoya por igual a un candidato de 23, 50 o 77 años
Los candidatos más jovenes tienden a ser considerados como inexpertos y menos calificados
Podría haber factores estructurales que escapan del ambito de investigacion del estudio y que afectan a la infrarrepresentacion de los jovenes. Ejm: edad minima para ocupar cargos públicos