skim(WHR_2023)
“World Happiness Report 2023” es un juego de datos que muestra la percepción de 137 paises sobre la felicidad, soporte social, esperanza de vida sana, libertad para tomar decisiones, generosidad y la corrupción.
La base de datos contiene 2 variables qualitatives et 7 variables quantitatives.
Happiness score: Esta variable presenta valores en un rango total de 1.8 a 7.8. La mediana de 5.6 indica que, en general, la mayoría de los países reportan niveles de felicidad en el rango medio-alto. Sin embargo, también sugiere que existe una diversidad significativa en los niveles de felicidad, ya que hay países con valores tanto muy bajos como muy altos.
GDP per capita: Presenta valores un rango total de 0 a 2.2. La mediana de 1.44 sugiere que más de la mitad de paises tiene un nivel de GDP en un rango medio-alto pero también demuestra una inequidad significativa con el resto de paises cuyos niveles son bajos.
Social support: Esta variable presenta valores en un rango total de 0 a 1.6. La mediana de 1.22 indica que la mayoria de paises siente que tiene una persona en quien apoyarse en tiempos dificiles.
Healthy Life Expectancy: Esta variable presenta valores en un rango total de 0 a 0.7 con una mediana de 0.38 (redondeado a 0.4). Sin embargo, observamos una distribución bimodal, lo que sugiere la existencia de dos grupos. El primer grupo serían los paises que tienen valores bajos entre 0 y 0.3 y el segundo grupo con valores entre 0.3 a 0.7, siendo este último el más numeroso.
Freedom to make life choices: Esta variable presenta valores en un rango total de 0 a 0.77. La mediana de 0.55 indica que la mayoria de paises se encuentra satisfecho con la libertad que tiene para tomar decisiones sobre su propia vida.
Generosity: Esta variable presenta valores en un rango total de 0 a 0.4. La mediana de 0.1 indica un bajo nivel de donaciones a la caridad a nivel mundial. Esto se ve reflejado en la distribución extendida hacia la derecha.
Perception of Corruption: Esta variable presenta valores en un rango total de 0 a 0.56. La mediana de 0.1 indica que una gran cantidad de países tiene una percepción casi nula de corrupción en su gobierno o en las empresas.
Correlación:
Questions:
Esto me lleva a cuestionarme lo siguiente:
¿Cuáles son las variables que afectan significativamente los niveles de felicidad?
##
## Call:
## lm(formula = happiness_score ~ freedom_to_make_life_choices,
## data = whr_choisi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.2992 -0.5250 0.1120 0.6585 1.8671
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.8105 0.2774 10.13 <2e-16 ***
## freedom_to_make_life_choices 5.0544 0.4944 10.22 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8598 on 134 degrees of freedom
## Multiple R-squared: 0.4382, Adjusted R-squared: 0.434
## F-statistic: 104.5 on 1 and 134 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = happiness_score ~ social_support, data = whr_choisi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.77551 -0.37403 0.02242 0.45499 1.50213
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.1635 0.1975 10.96 <2e-16 ***
## social_support 2.9270 0.1645 17.79 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.6257 on 134 degrees of freedom
## Multiple R-squared: 0.7025, Adjusted R-squared: 0.7003
## F-statistic: 316.4 on 1 and 134 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = happiness_score ~ freedom_to_make_life_choices *
## social_support, data = whr_choisi)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.65008 -0.31715 0.04405 0.36436 1.17285
##
## Coefficients:
## Estimate Std. Error t value
## (Intercept) 2.3364 0.4023 5.808
## freedom_to_make_life_choices 0.6101 0.8566 0.712
## social_support 1.6012 0.4067 3.937
## freedom_to_make_life_choices:social_support 1.5790 0.7526 2.098
## Pr(>|t|)
## (Intercept) 4.49e-08 ***
## freedom_to_make_life_choices 0.477540
## social_support 0.000133 ***
## freedom_to_make_life_choices:social_support 0.037813 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5549 on 132 degrees of freedom
## Multiple R-squared: 0.7695, Adjusted R-squared: 0.7642
## F-statistic: 146.9 on 3 and 132 DF, p-value: < 2.2e-16
## No scatter3d mode specifed:
## Setting the mode to markers
## Read more about this attribute -> https://plotly.com/r/reference/#scatter-mode
Resultados de la regresión linear :
Encontramos que las variables libertad y el soporte social afectan los niveles de felicidad, siendo el soporte social mas significativo que la libertad. Además, cuando ambas variables (freedom_to_make_life_choices y social_support) tienen valores altos, el happiness_score también es alto. A medida que ambas disminuyen, el happiness_score baja, como se observa en la inclinación del plano naranja. Esto coincide con los coeficientes de la regresión previa: las variables por separado tienen efectos, pero su combinación amplifica el impacto.
Graphe causal:
Aunque los resultados estan alejados del valor 0, no se encuentra evidencia suficiente para afirmar que exista una relación significativa entre libertad y soporte social cuando la variable felicidad está presente. Esto implica que ambas variables afectan directamente la felicidad pero no parecen estar fuertemente interrelacionadas entre sí.
d_whr <- dagitty('
dag {
bb="0,0,1,1"
happiness_score [pos="0.436,0.623"]
freedom_to_make_life_choices [pos="0.300,0.466"]
social_support [pos="0.591,0.464"]
freedom_to_make_life_choices -> happiness_score
social_support -> happiness_score
}
')
impliedConditionalIndependencies(d_whr) # indépendances théoriques impliquées par le graphe
plotLocalTestResults(localTests(d_whr, whr_choisi)) # test de toutes les indépendances vis-à-vis des corrélations dans les données
Conclusion: