Introducción

En este trabajo analizaremos la relación que tiene el monto aportado de algunos afiliados a la SNP con los aportes, la remuneración de cada afiliado y el número de aportes hasta el mes de agosto del año 2020.

library(pacman)
p_load(readxl,dplyr,GGally)
read_excel("Afiliados_SNP_ago2020.xlsx") -> datos
#datos |> select_if(is.numeric) |> pairs()
datos
## # A tibble: 14 x 4
##    Remuneración aporte nro_aportes monto_aportes
##           <dbl>  <dbl>       <dbl>         <dbl>
##  1         516    67.1         210        16870.
##  2         300    39             6          215 
##  3         115.   15             2           30 
##  4        1656   215.          130        27350 
##  5         754.   98            11         1145.
##  6        2500   325           113        30803.
##  7        3411.  433.            5         6523.
##  8         462.   60             2          113 
##  9         404.   52.6          11          849.
## 10        1050   136.          254        59748.
## 11         931.  121            40         4557 
## 12        5162.  671.          121        15424.
## 13        1085   141.          125        22245.
## 14         138.   18             1           18
options(scipen=9999)

Estimación puntual de coeficientes de regresión

X <- model.matrix(monto_aportes ~ 
                    nro_aportes + 
                    aporte +
                    Remuneración ,
                  data = datos)
y <- matrix(datos$monto_aportes)
b <- solve(t(X)%*%X)%*%t(X)%*%y
b
##                    [,1]
## (Intercept)  -851.64432
## nro_aportes   182.81482
## aporte       -577.98465
## Remuneración   75.33178

Comprobando

library(broom)
lm(monto_aportes ~ ., data = datos) -> modelo
modelo |> summary()
## 
## Call:
## lm(formula = monto_aportes ~ ., data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -20769.3   -331.4     27.8    622.4  13960.7 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -851.64    3731.69  -0.228 0.824075    
## Remuneración    75.33     141.69   0.532 0.606574    
## aporte        -577.98    1097.43  -0.527 0.609904    
## nro_aportes    182.81      32.04   5.705 0.000197 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8979 on 10 degrees of freedom
## Multiple R-squared:  0.7923, Adjusted R-squared:  0.7299 
## F-statistic: 12.71 on 3 and 10 DF,  p-value: 0.0009522
modelo |> tidy()
## # A tibble: 4 x 5
##   term         estimate std.error statistic  p.value
##   <chr>           <dbl>     <dbl>     <dbl>    <dbl>
## 1 (Intercept)    -852.     3732.     -0.228 0.824   
## 2 Remuneración     75.3     142.      0.532 0.607   
## 3 aporte         -578.     1097.     -0.527 0.610   
## 4 nro_aportes     183.       32.0     5.71  0.000197

Gráfico

datos |> ggpairs()

Ecuación de la Regresión

y = β0 + β1XRemuneración + β2XAporte + β3XNumerodeAportes

y = -851.64432 + 75.33178X1 - 577.98465X2 + 182.81482X3

Interpretación

β0: No hay interpretación, puesto que el monto aportado no puede ser negativo.

β1: Cuando la remuneración se incrementa, el monto aportado aumenta en 75.33178 soles, manteniendo las demás variables constantes.

β2: Cuando el aporte disminuye, el monto aportado se reduce en 577.98465 soles,manteniendo las demás variables constantes.

β3: Por mayor cantidad de número de aportes, el monto aportado se incrementa en 182.81482 soles,manteniendo las demás variables constantes.