Se definen los parametros generales del documento y se cargan las librerias
ggplot
dplyr
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
Este primer ejercicio fue revisado el 12/07/2022 con el profesor en una After Class. Los objetivos era repasar los siguientes contenidos:
Operaciones básicas
Tidyverse
Markdown
¿Qué factores explican, según los datos disponibles, que algunos paises tengan más ingreso disponible que otros? ¿tengo los datos para contestar esto?
Entrega la suma y promedio de los ahorros personales de todos los paises juntos y la cantidad de países que hay en la muestra
| Suma países | Suma ahorros | Promedio ahorros | Desv Std ahorros |
|---|---|---|---|
| 50 | 483.55 | 9.67 | 4.4804 |
Selecciona los 5 mejores y peores países según su ingreso disponible per-capita
Buscar mejor manera de mostrarlos para comparar.
| sr | pop15 | pop75 | dpi | ddpi | |
|---|---|---|---|---|---|
| MAYOR INGRESO | |||||
| United States | 7.56 | 29.81 | 3.43 | 4001.89 | 2.45 |
| Sweden | 6.86 | 21.44 | 4.54 | 3299.49 | 3.01 |
| Canada | 8.79 | 31.72 | 2.85 | 2982.88 | 2.43 |
| Switzerland | 14.13 | 23.49 | 3.73 | 2630.96 | 2.70 |
| Denmark | 16.85 | 24.42 | 3.93 | 2496.53 | 3.99 |
| MENOR INGRESO | |||||
| Bolivia | 5.75 | 41.89 | 1.67 | 189.13 | 0.22 |
| Philippines | 12.78 | 46.26 | 1.12 | 152.01 | 2.00 |
| Zambia | 18.56 | 45.25 | 0.56 | 138.33 | 5.14 |
| Libya | 8.89 | 43.69 | 2.07 | 123.58 | 16.71 |
| India | 9.00 | 41.31 | 0.96 | 88.94 | 1.54 |
Selecciona solo aquellos países donde la cantidad de personas sobre 75 es mayor que un 3% y calcula el promedio de ingreso disponible per-capita y el promedio del total de ahorros personales por país. Luego compáralo con aquelllos paises con más de un 40% de personas bajo 15
| Grupos | Número de países | Ahorro promedio | Ingreso personal promedio |
|---|---|---|---|
| Población mayor de 75 años > 3% | 17 | 11.007059 | 2102.3376 |
| Población menor de 15 años > 40% | 22 | 7.720454 | 321.1941 |
Resuelto en los 2 y 3.
Lo más lógico sería plantear una regresión lineal, donde la variable dependiente sería la tasa de ahorro, que sería explicada por el ingreso personal, el porcentaje disponible del ingreso personal y las características demográficas de la población. Según la forma:
sr = f( dpi + dppi + pop15 + pop75)
Como se ve abajo, al correr el modelo. Tres coeficinetes dan significativos: la intersección, el ingreso disponible y la proporcion de la población por encima de 75 años. Se mantienen las demás variables porque incrementan el poder explicativo del modelo.
##
## Call:
## lm(formula = sr ~ dpi + ddpi + pop15 + pop75, data = LifeCycleSavings)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.2422 -2.6857 -0.2488 2.4280 9.7509
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.5660865 7.3545161 3.884 0.000334 ***
## dpi -0.0003369 0.0009311 -0.362 0.719173
## ddpi 0.4096949 0.1961971 2.088 0.042471 *
## pop15 -0.4611931 0.1446422 -3.189 0.002603 **
## pop75 -1.6914977 1.0835989 -1.561 0.125530
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.803 on 45 degrees of freedom
## Multiple R-squared: 0.3385, Adjusted R-squared: 0.2797
## F-statistic: 5.756 on 4 and 45 DF, p-value: 0.0007904