Setup

Se definen los parametros generales del documento y se cargan las librerias

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows

Objetivos

Este primer ejercicio fue revisado el 12/07/2022 con el profesor en una After Class. Los objetivos era repasar los siguientes contenidos:

  1. Operaciones básicas

  2. Tidyverse

  3. Markdown

Pregunta a contestar

¿Qué factores explican, según los datos disponibles, que algunos paises tengan más ingreso disponible que otros? ¿tengo los datos para contestar esto?

Ejercicio 1

Entrega la suma y promedio de los ahorros personales de todos los paises juntos y la cantidad de países que hay en la muestra

Suma países Suma ahorros Promedio ahorros Desv Std ahorros
50 483.55 9.67 4.4804

Ejercicio 2 y 4

Selecciona los 5 mejores y peores países según su ingreso disponible per-capita

Buscar mejor manera de mostrarlos para comparar.

PAÍSES CON EL MAYOR Y MENOR INGRESO PÉR CÁPITA (DPI)
sr pop15 pop75 dpi ddpi
MAYOR INGRESO
United States 7.56 29.81 3.43 4001.89 2.45
Sweden 6.86 21.44 4.54 3299.49 3.01
Canada 8.79 31.72 2.85 2982.88 2.43
Switzerland 14.13 23.49 3.73 2630.96 2.70
Denmark 16.85 24.42 3.93 2496.53 3.99
MENOR INGRESO
Bolivia 5.75 41.89 1.67 189.13 0.22
Philippines 12.78 46.26 1.12 152.01 2.00
Zambia 18.56 45.25 0.56 138.33 5.14
Libya 8.89 43.69 2.07 123.58 16.71
India 9.00 41.31 0.96 88.94 1.54

Ejercicio 3 y 4

Selecciona solo aquellos países donde la cantidad de personas sobre 75 es mayor que un 3% y calcula el promedio de ingreso disponible per-capita y el promedio del total de ahorros personales por país. Luego compáralo con aquelllos paises con más de un 40% de personas bajo 15

COMPARACIÓN DE PAÍSES
Grupos Número de países Ahorro promedio Ingreso personal promedio
Población mayor de 75 años > 3% 17 11.007059 2102.3376
Población menor de 15 años > 40% 22 7.720454 321.1941

Ejercicio 4

Resuelto en los 2 y 3.

Ejercicio 5

Lo más lógico sería plantear una regresión lineal, donde la variable dependiente sería la tasa de ahorro, que sería explicada por el ingreso personal, el porcentaje disponible del ingreso personal y las características demográficas de la población. Según la forma:

sr = f( dpi + dppi + pop15 + pop75)

Como se ve abajo, al correr el modelo. Tres coeficinetes dan significativos: la intersección, el ingreso disponible y la proporcion de la población por encima de 75 años. Se mantienen las demás variables porque incrementan el poder explicativo del modelo.

## 
## Call:
## lm(formula = sr ~ dpi + ddpi + pop15 + pop75, data = LifeCycleSavings)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.2422 -2.6857 -0.2488  2.4280  9.7509 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 28.5660865  7.3545161   3.884 0.000334 ***
## dpi         -0.0003369  0.0009311  -0.362 0.719173    
## ddpi         0.4096949  0.1961971   2.088 0.042471 *  
## pop15       -0.4611931  0.1446422  -3.189 0.002603 ** 
## pop75       -1.6914977  1.0835989  -1.561 0.125530    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.803 on 45 degrees of freedom
## Multiple R-squared:  0.3385, Adjusted R-squared:  0.2797 
## F-statistic: 5.756 on 4 and 45 DF,  p-value: 0.0007904