“El Ahorro de los Hogares Colombianos :Un Desafío de Política Pública”
Teoría Keynesiana: ¿El ahorro depende principalmente del ingreso corriente?
La Teoría Keynesiana especifica el ahorro como una función del ingreso corriente, es decir, que los individuos ahorran solo cuando sus ingresos superan sus necesidades de consumo (Keynes, 1936), el cual planteaba, una relación directa y sencilla del consumo (y, por tanto, del ahorro) con la renta disponible (Argandoña, 1994). Representada matemáticamente como, S = Y - C Desde esta perspectiva, el ahorro es una variable dependiente del ingreso presente, lo que implica que, en periodos de bajo crecimiento económico, el ahorro agregado disminuye. Además, Keynes argumentó que un aumento del ahorro puede reducir la demanda agregada y generar recesión, lo que se conoce como la “paradoja del ahorro” (Keynes, 1936). Por lo tanto, el ahorro tiende a ser mayor en los hogares con altos ingresos (Propensión marginal a consumir menor)
Teoría Ciclo Vital: ¿Varía según la edad y el ingreso permanente?
la teoría del ciclo vital, formulada por Modigliani y Brumberg (1954), propone que los individuos planifican su consumo y ahorro a lo largo de su vida, buscando suavizar su consumo en el tiempo. En este modelo, el ahorro no depende solo del ingreso presente, sino del ingreso esperado en el futuro. Supone que el individuo maximiza la utilidad derivada de su consumo a lo largo de toda su vida, …, Esto lleva a una función de consumo para cada periodo que depende de la renta corriente, de las rentas futuras esperadas, de la riqueza heredada o acumulada hasta el momento actual, de la edad y de otras variables (Argandoña, 1994). Está teoría fue objeto de otra elaboración, paralela e independiente, a cargo de Milton Friedman (1957), dando lugar a la hipótesis de la renta permanente, incluyendo además las rentas derivadas de la riqueza humana (educación, salud, capacitación) como la no humana, dando resultado a una función de consumo muy parecida a la del ciclo vital, que se contempla con unos supuestos empíricos acerca de las relaciones entre los componentes permanentes y transitorios, principalmente, que las rentas transitorias se dedican íntegramente al ahorro (Argandoña, 1994).
Modelo Keynesiano con datos atipicos
library(dplyr)
variables_keynes <- base_GEIH %>%
select("ingreso", "ahorro")
options(scipen = 999)
modelo_keynes <- lm(ahorro ~ ingreso, data = variables_keynes)
summary(modelo_keynes$model)
## ahorro ingreso
## Min. : -53790 Min. : 0
## 1st Qu.: 0 1st Qu.: 1300000
## Median : 115000 Median : 2300000
## Mean : 149079 Mean : 3226356
## 3rd Qu.: 190000 3rd Qu.: 3800000
## Max. :14465000 Max. :289300000
El ingreso mínimo es cero, lo que indica que algunas personas no tienen ingresos reportados, ya sea por desempleo, trabajo informal o ausencia de datos en la muestra. Por otro lado, el ingreso máximo registrado es de 289,300,000, lo que sugiere la presencia de individuos con ingresos extremadamente altos, posiblemente pertenecientes a sectores empresariales o de inversión.La media del ingreso es de 3,226,356, un valor influenciado por la presencia de valores extremadamente altos
Por otro lado el ahorro mínimo registrado es de -53,790, depronto influenciado por los datos de ingreso=0. En contraste, el ahorro máximo alcanza los 14,465,000, reflejando que ciertos individuos reciben ingresos extremadamnete altos.La media del ahorro es de 149,079, lo que sugiere que hay algunos casos con ahorros muy elevados que están influyendo en el promedio general
library(ggplot2)
options(scipen = 999)
plot(variables_keynes$ingreso, variables_keynes$ahorro,
main = "Grafico de dispersion Mod Keynes",
xlab = "Ingreso", ylab = "Ahorro",
pch = 16, col = "blue")
abline(modelo_keynes, col = "red", lwd = 2)
La gráfica muestra una fuerte relación positiva entre ingreso y ahorro, coherente con el modelo keynesiano. Sin embargo, se observan datos atípicos con ingresos muy altos que afectan la pendiente de la recta de regresión. Estos valores extremos podrían distorsionar el modelo.
library(ggplot2)
ggplot(variables_keynes, aes(y = ingreso)) +
geom_boxplot(fill = "skyblue", color = "black") +
labs(title = "Boxplot del Ingreso") +
coord_flip() + # 📌 Hace que el boxplot sea horizontal
theme_minimal()
La gráfica muestra un ingreso altamente sesgado, donde la mayoría de los valores están concentrados cerca de cero y hay una gran cantidad de valores atípicos extremos hacia la derecha. Esto indica una distribución muy asimétrica, con pocos individuos que tienen ingresos excesivamente altos en comparación con el resto.
library(ggplot2)
ggplot(variables_keynes, aes(y = ahorro)) +
geom_boxplot(fill = "lightgreen", color = "black") +
labs(title = "Boxplot del Ahorro") +
coord_flip() + # 📌 Hace que el boxplot sea horizontal
theme_minimal()
El boxplot del ahorro revela una fuerte concentración de observaciones cercanas a cero, indicando que la mayoría de los individuos tienen bajos niveles de ahorro. Sin embargo, se identifican múltiples valores atípicos hacia la derecha, correspondientes a personas con niveles de ahorro excepcionalmente altos.
Modelo Keynes sin datos atipicos
library(dplyr)
library(ggplot2)
# Calcular cuartiles y rango intercuartil (IQR)
Q1 <- quantile(base_GEIH$ingreso, 0.25, na.rm = TRUE) # Primer cuartil (Q1)
Q3 <- quantile(base_GEIH$ingreso, 0.75, na.rm = TRUE) # Tercer cuartil (Q3)
IQR <- Q3 - Q1 # Rango intercuartil
# Filtrar datos sin valores atípicos
base_sin_atipicos <- base_GEIH %>%
filter(ingreso >= (Q1 - 1.5 * IQR) & ingreso <= (Q3 + 1.5 * IQR))
variables_keynes_sin_datipicos <- base_sin_atipicos %>%
select("ahorro", "ingreso")
modelo_keynes_sin_datipicos <- lm(ahorro ~ ingreso, data = variables_keynes_sin_datipicos)
summary(modelo_keynes_sin_datipicos$model)
## ahorro ingreso
## Min. :-53790 Min. : 0
## 1st Qu.: 0 1st Qu.:1300000
## Median :105000 Median :2100000
## Mean :111432 Mean :2490605
## 3rd Qu.:168500 3rd Qu.:3370000
## Max. :377500 Max. :7550000
El ingreso mínimo es cero, lo que indica que algunas personas no tienen ingresos reportados, ya sea por desempleo, trabajo informal o ausencia de datos en la muestra. Por otro lado, el ingreso máximo registrado es de 7,550,000, lo que sugiere la presencia de individuos con altos ingresos.La media del ingreso es de 2,490,605, un valor influenciado por la presencia de valores altos.
Por otro lado el ahorro mínimo registrado es de -53,790, depronto influenciado por los datos de ingreso=0. En contraste, el ahorro máximo alcanza los 377,500.La media del ahorro es de 111,432.
library(ggplot2)
plot(variables_keynes_sin_datipicos$ingreso, variables_keynes_sin_datipicos$ahorro,
main = "Grafica de Dispersion Mod Keynes sin datos atipicos",
xlab = "Ingreso", ylab = "Ahorro",
pch = 16, col = "blue")
abline(modelo_keynes, col = "red", lwd = 2)
Esta gráfica muestra la regresión lineal de Ahorro vs Ingreso sin datos atípicos, lo cual mejora notablemente la calidad del ajuste. La nube de puntos (azul) se alinea de forma más uniforme en torno a la recta roja, que representa el modelo estimado. Esto indica una relación lineal más estable y representativa del comportamiento general de los datos.
library(ggplot2)
library(gridExtra)
# Boxplot de Ahorro
p1 <- ggplot(variables_keynes_sin_datipicos, aes(x = "", y = ahorro)) +
geom_boxplot(fill = "steelblue", color = "black") +
coord_flip() + # Hace el boxplot horizontal
scale_y_continuous(expand = expansion(mult = c(0.05, 0.05))) +
labs(title = "Distribucion del Ahorro sin valores atipicos",
y = "Ahorro",
x = "") +
theme_minimal()
# Boxplot de Ingreso
p2 <- ggplot(variables_keynes_sin_datipicos, aes(x = "", y = ingreso)) +
geom_boxplot(fill = "steelblue", color = "black") +
coord_flip() + # Hace el boxplot horizontal
scale_y_continuous(expand = expansion(mult = c(0.05, 0.05))) +
labs(title = "Distribucion del Ingreso sin valores atipicos",
y = "Ingreso",
x = "") +
theme_minimal()
# Mostrar ambos gráficos juntos en una misma figura
grid.arrange(p1, p2, ncol = 2) # Los pone en la misma fila (horizontal)
Al remover los valores atípicos, tanto el ahorro como el ingreso muestran distribuciones más simétricas y centradas. En el caso del ahorro, se observa una mayor concentración de datos alrededor de la mediana, lo que refleja una distribución más homogénea. Por su parte, el ingreso, aunque mantiene cierta asimetría, presenta menor dispersión y permite un análisis más representativo de la mayoría de la población. Esta depuración mejora la calidad del análisis econométrico, reduciendo la influencia de observaciones extremas.
Modelo Ciclo Vital con datos atipicos
library(dplyr)
variables_ciclo_vital <- base_GEIH %>%
select("ingreso", "ahorro", "edad", "edad2", "nivel_educ", "años_educ")
options(scipen = 999)
modelo_ciclo_vital <- lm(ahorro ~ ingreso + edad + edad2 + nivel_educ + años_educ, data = variables_ciclo_vital)
summary(modelo_ciclo_vital$model)
## ahorro ingreso edad edad2
## Min. : -53790 Min. : 0 Min. : 3.00 Min. : 9
## 1st Qu.: 0 1st Qu.: 1300000 1st Qu.: 19.00 1st Qu.: 361
## Median : 115000 Median : 2300000 Median : 34.00 Median : 1156
## Mean : 149079 Mean : 3226356 Mean : 35.91 Mean : 1703
## 3rd Qu.: 190000 3rd Qu.: 3800000 3rd Qu.: 51.00 3rd Qu.: 2601
## Max. :14465000 Max. :289300000 Max. :104.00 Max. :10816
## nivel_educ años_educ
## Min. : 1.000 Min. : 0.000
## 1st Qu.: 3.000 1st Qu.: 2.000
## Median : 5.000 Median : 2.000
## Mean : 5.561 Mean : 3.339
## 3rd Qu.: 8.000 3rd Qu.: 4.000
## Max. :99.000 Max. :99.000
El ahorro varía significativamente en la muestra, el valor mínimo es -53,790, mientras que el valor máximo alcanza 14,465,000, lo que sugiere que algunos individuos han acumulado una cantidad considerable de ahorro. La media 149,079 está influenciada por estos valores extremos, ya que el 75% de los individuos tienen un ahorro inferior a 190,000.
El ingreso presenta una distribución altamente dispersa, el valor mínimo es 0, lo que indica la existencia de personas sin ingresos, mientras que el valor máximo es 289,300,000, lo que sugiere que algunos individuos tienen ingresos excepcionalmente altos. La media 3,226,356 es mucho mayor que la mediana 2,300,000, lo que confirma que la distribución está sesgada hacia valores altos.
La edad mínima en la muestra es de 3 años, mientras que la máxima es de 104 años. La media de edad es 35.91 años. La variable edad2 simplemente refleja la transformación cuadrática de la edad, lo que acentúa las diferencias entre edades más altas y bajas.
El nivel educativo mínimo es 1, mientras que el máximo es 99, lo que podría indicar valores atípicos. El percentil 75 (8) sugiere que la mayoría de los individuos tienen un nivel educativo medio-alto. En cuanto a los años de educación, el valor mínimo es 0 (posiblemente personas sin escolaridad), y el máximo también es 99, lo que nuevamente podría indicar errores en la base de datos.
par(mfrow = c(2, 3)) # Divide la ventana en una matriz de 2x3
plot(variables_ciclo_vital$ingreso, variables_ciclo_vital$ahorro,
main = "Ingreso vs Ahorro", xlab = "Ingreso", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital$edad, variables_ciclo_vital$ahorro,
main = "Edad vs Ahorro", xlab = "Edad", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital$edad2, variables_ciclo_vital$ahorro,
main = "Edad^2 vs Ahorro", xlab = "Edad^2", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital$nivel_educ, variables_ciclo_vital$ahorro,
main = "Nivel Educativo vs Ahorro", xlab = "Nivel Educ", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital$años_educ, variables_ciclo_vital$ahorro,
main = "Años de Educación vs Ahorro", xlab = "Años Educ", ylab = "Ahorro", pch = 16, col = "blue")
par(mfrow = c(1, 1)) # Restaurar el layout a 1 gráfico
Ingreso vs Ahorro: Hay una relación lineal positiva clara, pero existen valores extremadamente altos de ingreso y ahorro que pueden influir fuertemente en la pendiente del modelo. Edad vs Ahorro y Edad2 vs Ahorro: No se observa una relación clara. Los puntos están muy dispersos, lo que puede dificultar la estimación precisa de efectos no lineales. Nivel Educativo vs Ahorro y Años de Educación vs Ahorro: La mayoría de los datos se concentran en los niveles más bajos de educación.
library(ggplot2)
library(gridExtra) # Para organizar múltiples gráficos
p1 <- ggplot(variables_ciclo_vital, aes(x = "", y = ingreso)) +
geom_boxplot(fill = "orange") +
labs(title = "Ingreso") +
theme(axis.text.y = element_blank()) +
coord_flip() # Hace el boxplot horizontal
p2 <- ggplot(variables_ciclo_vital, aes(x = "", y = edad)) +
geom_boxplot(fill = "blue") +
labs(title = "Edad") +
theme(axis.text.y = element_blank()) +
coord_flip()
p3 <- ggplot(variables_ciclo_vital, aes(x = "", y = edad2)) +
geom_boxplot(fill = "green") +
labs(title = "Edad²") +
theme(axis.text.y = element_blank()) +
coord_flip()
p4 <- ggplot(variables_ciclo_vital, aes(x = "", y = nivel_educ)) +
geom_boxplot(fill = "red") +
labs(title = "Nivel Educativo") +
theme(axis.text.y = element_blank()) +
coord_flip()
p5 <- ggplot(variables_ciclo_vital, aes(x = "", y = años_educ)) +
geom_boxplot(fill = "purple") +
labs(title = "Años de Educación") +
theme(axis.text.y = element_blank()) +
coord_flip()
p6 <- ggplot(variables_ciclo_vital, aes(x = "", y = ahorro)) +
geom_boxplot(fill = "cyan") +
labs(title = "Ahorro") +
theme(axis.text.y = element_blank()) +
coord_flip()
# Organizar todos los gráficos en una sola figura
grid.arrange(p1, p2, p3, p4, p5, p6, ncol = 3)
Los boxplots presentados evidencian la presencia de datos atípicos en todas las variables analizadas. Las variables de ingreso y ahorro son las más afectadas, mostrando múltiples valores extremos alejados del rango central de los datos. Las variables edad y edad2 también presentan algunos valores atípicos, aunque en menor medida. Por su parte, nivel educativo y años de educación muestran una distribución más concentrada, pero aún así presentan casos aislados que se apartan significativamente de la mayoría.
library(ggplot2)
library(reshape2)
library(viridis)
# Crear matriz de correlación
cor_matrix <- cor(variables_ciclo_vital)
# Convertir a formato largo para ggplot
cor_long <- melt(cor_matrix)
# Graficar con mejoras
ggplot(cor_long, aes(Var1, Var2, fill = value)) +
geom_tile() +
geom_text(aes(label = round(value, 2)), fontface = "bold.italic", size = 5) + # Texto en negrita y cursiva
scale_fill_viridis(option = "magma", limits = c(-1,1)) +
theme_minimal() +
theme(
axis.text.x = element_text(angle = 45, hjust = 1, size = 12, face = "bold.italic"), # Ajuste del texto eje X
axis.text.y = element_text(size = 12, face = "bold.italic"), # Ajuste del texto eje Y
plot.title = element_text(size = 16, face = "bold") # Título más grande
) +
labs(title = "Matriz de Correlación - Análisis Económico", x = "", y = "")
Entre ingreso y ahorro existe una correlación positiva significativa entre el ingreso y el ahorro, lo cual respalda tanto la teoría del ciclo vital como el enfoque keynesiano. A medida que el ingreso aumenta, también lo hace la capacidad de ahorro de los individuos. Esto indica una mayor propensión marginal a ahorrar entre los hogares con mayores ingresos. Edad y ahorro (incluyendo Edad2), la variable Edad presenta una correlación positiva con el ahorro, indicando que las personas tienden a ahorrar más a medida que envejecen. Sin embargo, Edad2 muestra una correlación negativa, lo cual sugiere una relación cóncava. En otras palabras, el ahorro aumenta hasta cierto punto con la edad y luego comienza a disminuir, un patrón coherente con el modelo del ciclo vital: mayor consumo en la juventud y la vejez, y mayor ahorro en la adultez media. Educación y ahorro tanto el nivel educativo como los años de educación están positivamente correlacionados con el ahorro. Esto indica que una mayor formación académica está asociada con mejores ingresos y decisiones financieras más responsables, como una mayor capacidad de ahorro.
El análisis de la matriz de correlación apoya los supuestos del modelo del ciclo vital. Factores como el ingreso, la edad y la educación tienen un papel clave en la determinación del ahorro.
Modelo Ciclo Vital sin datos atipicos
library(dplyr)
variables_ciclo_vital_sin_datipicos <- base_sin_atipicos %>%
select("ahorro", "ingreso", "edad", "edad2", "nivel_educ", "años_educ")
options(scipen = 999)
modelo_ciclo_vital_sin_datipicos <- lm(ahorro ~ ingreso + edad + edad2 + nivel_educ + años_educ, data = variables_ciclo_vital_sin_datipicos)
summary(modelo_ciclo_vital_sin_datipicos$model)
## ahorro ingreso edad edad2
## Min. :-53790 Min. : 0 Min. : 3.00 Min. : 9
## 1st Qu.: 0 1st Qu.:1300000 1st Qu.: 19.00 1st Qu.: 361
## Median :105000 Median :2100000 Median : 33.00 Median : 1089
## Mean :111432 Mean :2490605 Mean : 35.75 Mean : 1693
## 3rd Qu.:168500 3rd Qu.:3370000 3rd Qu.: 51.00 3rd Qu.: 2601
## Max. :377500 Max. :7550000 Max. :104.00 Max. :10816
## nivel_educ años_educ
## Min. : 1.000 Min. : 0.000
## 1st Qu.: 3.000 1st Qu.: 2.000
## Median : 5.000 Median : 2.000
## Mean : 5.392 Mean : 3.245
## 3rd Qu.: 8.000 3rd Qu.: 4.000
## Max. :99.000 Max. :99.000
El ahorro presenta una amplia variabilidad en la muestra. El valor mínimo es -53,790, mientras que el máximo es 377,500, reflejando que otros han acumulado un monto significativo. La media 111,432.
El ingreso muestra una gran dispersión. Su valor mínimo es 0, indicando la presencia de personas sin ingresos, mientras que el máximo alcanza 7,550,000, lo que sugiere la existencia de individuos con ingresos elevados. La media 2,490,60) es superior a la mediana 2,100,000, lo que indica que la distribución está sesgada hacia valores altos.
La edad de los individuos oscila entre 3 y 104 años, con una media de 35.75 años. La variable edad2 simplemente refleja la transformación cuadrática de la edad, aumentando la distancia entre edades más avanzadas.
El nivel educativo mínimo es 1, mientras que el máximo es 99, lo que podría reflejar valores atípicos. La media es 5.39, lo que indica que la mayoría de las personas tienen niveles educativos intermedios. En cuanto a los años de educación, los valores oscilan entre 0 y 99, lo que nuevamente podría sugerir errores en la base de datos.
par(mfrow = c(2, 3)) # Divide la ventana en una matriz de 2x3
plot(variables_ciclo_vital_sin_datipicos$ingreso, variables_ciclo_vital_sin_datipicos$ahorro,
main = "Ingreso vs Ahorro", xlab = "Ingreso", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital_sin_datipicos$edad, variables_ciclo_vital_sin_datipicos$ahorro,
main = "Edad vs Ahorro", xlab = "Edad", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital_sin_datipicos$edad2, variables_ciclo_vital_sin_datipicos$ahorro,
main = "Edad^2 vs Ahorro", xlab = "Edad^2", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital_sin_datipicos$nivel_educ, variables_ciclo_vital_sin_datipicos$ahorro,
main = "Nivel Educativo vs Ahorro", xlab = "Nivel Educ", ylab = "Ahorro", pch = 16, col = "blue")
plot(variables_ciclo_vital_sin_datipicos$años_educ, variables_ciclo_vital_sin_datipicos$ahorro,
main = "Años de Educación vs Ahorro", xlab = "Años Educ", ylab = "Ahorro", pch = 16, col = "blue")
par(mfrow = c(1, 1)) # Restaurar el layout a 1 gráfico
Los gráficos de dispersión muestran la relación entre el ahorro y diversas variables explicativas, como ingreso, edad, edad2, nivel educativo y años de educación. A diferencia de análisis anteriores, en esta ocasión los datos atípicos han sido eliminados, lo cual se refleja en una distribución más concentrada y homogénea de los puntos.
La relación entre ingreso y ahorro se mantiene positiva y clara, con una tendencia lineal visible. En las demás variables, como edad y educación, la dispersión es más amplia, pero sin presencia de valores extremos que distorsionen la visualización.
library(ggplot2)
library(gridExtra)
p1 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = ingreso)) +
geom_boxplot(fill = "orange") +
labs(title = "Ingreso") +
theme(axis.text.y = element_blank()) +
coord_flip() # Hace el boxplot horizontal
p2 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = edad)) +
geom_boxplot(fill = "blue") +
labs(title = "Edad") +
theme(axis.text.y = element_blank()) +
coord_flip()
p3 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = edad2)) +
geom_boxplot(fill = "green") +
labs(title = "Edad²") +
theme(axis.text.y = element_blank()) +
coord_flip()
p4 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = nivel_educ)) +
geom_boxplot(fill = "red") +
labs(title = "Nivel Educativo") +
theme(axis.text.y = element_blank()) +
coord_flip()
p5 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = años_educ)) +
geom_boxplot(fill = "purple") +
labs(title = "Años de Educación") +
theme(axis.text.y = element_blank()) +
coord_flip()
p6 <- ggplot(variables_ciclo_vital_sin_datipicos, aes(x = "", y = ahorro)) +
geom_boxplot(fill = "cyan") +
labs(title = "Ahorro") +
theme(axis.text.y = element_blank()) +
coord_flip()
# Organizar todos los gráficos en una sola figura
grid.arrange(p1, p2, p3, p4, p5, p6, ncol = 3)
Los boxplots muestran la distribución de las variables ingreso, edad, edad2, nivel educativo, años de educación y ahorro tras la eliminación de los datos atípicos. Se observa una distribución más centrada y simétrica en la mayoría de las variables, especialmente en ingreso y ahorro, lo que sugiere una mayor homogeneidad en los datos.
La ausencia de valores extremos permite una representación más fiel del comportamiento general de la muestra. Por ejemplo, en “nivel educativo” y “años de educación”, los valores están concentrados en rangos bajos, lo que es esperable en muchos contextos latinoamericanos. Esta limpieza facilita un análisis estadístico más robusto y fiable, ya que reduce la influencia de valores anómalos que podrían sesgar los resultados.
library(ggplot2)
library(reshape2)
library(viridis)
# Crear matriz de correlación
cor_matrix <- cor(variables_ciclo_vital_sin_datipicos)
# Convertir a formato largo para ggplot
cor_long <- melt(cor_matrix)
# Graficar con mejoras
ggplot(cor_long, aes(Var1, Var2, fill = value)) +
geom_tile() +
geom_text(aes(label = round(value, 2)), fontface = "bold.italic", size = 5) + # Texto en negrita y cursiva
scale_fill_viridis(option = "magma", limits = c(-1,1)) +
theme_minimal() +
theme(
axis.text.x = element_text(angle = 45, hjust = 1, size = 12, face = "bold.italic"), # Ajuste del texto eje X
axis.text.y = element_text(size = 12, face = "bold.italic"), # Ajuste del texto eje Y
plot.title = element_text(size = 16, face = "bold") # Título más grande
) +
labs(title = "Matriz de Correlación - Análisis Económico", x = "", y = "")
Existe una correlación positiva significativa entre el ingreso y el ahorro, incluso al excluir los datos atípicos. Esto refuerza la robustez de la relación: a medida que el ingreso aumenta, también lo hace la capacidad de ahorro. Se confirma la hipótesis tanto desde el enfoque keynesiano como desde el modelo del ciclo vital. Entre Edad y ahorro (incluyendo Edad2), se mantiene la correlación positiva entre Edad y Ahorro, y la correlación negativa con Edad2. Esto indica una relación cóncava, donde el ahorro tiende a aumentar con la edad hasta alcanzar un pico en la adultez media, y luego disminuye en la vejez. Al eliminar los datos atípicos, este patrón se vuelve más claro y consistente con las predicciones teóricas del ciclo vital. Entre la Educación y ahorro, tanto el nivel educativo como los años de educación siguen mostrando una correlación positiva con el ahorro.
Planteamiento de la ecuación de ahorro según Keynes
Ahorro=B1 + B2ingreso + Ui
Planteamiento de la ecuación de ahorro según la teoría del ciclo vital
Ahorro=B1 + B2ingreso + B3edad + B4edad2 + B5nivel_educ + B6años_educ + Ui
Análisis R^2
Modelo Keynesiano con datos atipicos
options(scipen = 999)
library(stargazer)
stargazer(modelo_keynes, type = 'text', title = 'Modelo de keynes')
##
## Modelo de keynes
## ======================================================
## Dependent variable:
## ----------------------------------
## ahorro
## ------------------------------------------------------
## ingreso 0.051***
## (0.00001)
##
## Constant -16,501.780***
## (45.131)
##
## ------------------------------------------------------
## Observations 346,435
## R2 0.991
## Adjusted R2 0.991
## Residual Std. Error 21,528.030 (df = 346433)
## F Statistic 39,221,759.000*** (df = 1; 346433)
## ======================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
En el modelo keynesiano con datos atipicos, el modelo se ajusta casi que perfectamente, esto quiere decir que el ahorro si depende del ingreso ya que el alto valor de R^2 sugiere que el ingreso explica casi toda la variabilidad del ahorro.
Modelo Keynesiano sin datos atipicos
library(stargazer)
stargazer(modelo_keynes_sin_datipicos, type = 'text', title = 'Modelo de keynes sin datos atipicos')
##
## Modelo de keynes sin datos atipicos
## =====================================================
## Dependent variable:
## ---------------------------------
## ahorro
## -----------------------------------------------------
## ingreso 0.057***
## (0.00002)
##
## Constant -30,544.400***
## (63.655)
##
## -----------------------------------------------------
## Observations 323,701
## R2 0.956
## Adjusted R2 0.956
## Residual Std. Error 19,802.920 (df = 323699)
## F Statistic 7,096,333.000*** (df = 1; 323699)
## =====================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
En el modelo keynesiano sin los datos atipicos, el modelo sigue ajustandose confirmandonos que el ahorro si esta relacionado con el ingreso.
Modelo Ciclo Vital con datos atipicos
library(stargazer)
stargazer(modelo_ciclo_vital, type = 'text', title = 'Modelo de Ciclo Vital')
##
## Modelo de Ciclo Vital
## =====================================================
## Dependent variable:
## ---------------------------------
## ahorro
## -----------------------------------------------------
## ingreso 0.051***
## (0.00001)
##
## edad -47.157***
## (7.438)
##
## edad2 0.685***
## (0.090)
##
## nivel_educ 619.023***
## (17.402)
##
## años_educ 178.926***
## (16.997)
##
## Constant -19,687.760***
## (124.983)
##
## -----------------------------------------------------
## Observations 346,435
## R2 0.991
## Adjusted R2 0.991
## Residual Std. Error 21,436.200 (df = 346429)
## F Statistic 7,912,296.000*** (df = 5; 346429)
## =====================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
En el modelo de Ciclo Vital, R^2 nos indica que el 99.13% de la variabilidad en el ahorro es explicada por las variables incluidas en el modelo. Esto sugiere que el modelo tiene un excelente poder explicativo, lo que puede ser una señal de que las variables seleccionadas son altamente relevantes para predecir el ahorro.
Modelo Ciclo Vital sin datos atipicos
stargazer(modelo_ciclo_vital_sin_datipicos, type = 'text', title = 'Modelo de Ciclo Vital sin datos atipicos')
##
## Modelo de Ciclo Vital sin datos atipicos
## =====================================================
## Dependent variable:
## ---------------------------------
## ahorro
## -----------------------------------------------------
## ingreso 0.057***
## (0.00002)
##
## edad 14.167**
## (7.038)
##
## edad2 -0.031
## (0.085)
##
## nivel_educ -9.449
## (17.342)
##
## años_educ 78.651***
## (16.916)
##
## Constant -31,154.950***
## (125.979)
##
## -----------------------------------------------------
## Observations 323,701
## R2 0.956
## Adjusted R2 0.956
## Residual Std. Error 19,800.100 (df = 323695)
## F Statistic 1,419,690.000*** (df = 5; 323695)
## =====================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
En el modelo Ciclo Vital sin los datos atipicos, el modelo sigue ajustandose confirmandonos que el ahorro si esta relacionado con el ingreso, la edad,la ezperanza de vidad(Edad2), el nivel de educacion y los años de educacion
Signo y magnitud de los coeficientes / Discusión de significancia estadística (p < 0.05).
Modelo Keynesiano con datos atipicos
summary(modelo_keynes)
##
## Call:
## lm(formula = ahorro ~ ingreso, data = variables_keynes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -365725 -4027 11349 13331 16502
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -16501.779103006 45.131019488 -365.6 <0.0000000000000002 ***
## ingreso 0.051321214 0.000008195 6262.7 <0.0000000000000002 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21530 on 346433 degrees of freedom
## Multiple R-squared: 0.9912, Adjusted R-squared: 0.9912
## F-statistic: 3.922e+07 on 1 and 346433 DF, p-value: < 0.00000000000000022
El coeficiente “Intercept” representa el ahorro estimado cuando el ingreso es cero,en este caso, el modelo predice que si una persona no tiene ingresos, su ahorro esperado sería de -16,500. Sin embargo un intercepto negativo no siempre tiene una interpretación realista; como sabemos en la practica si una persona tiene como ingresos=cero, su capacidad para ahorrar seria nula ya que no dispone de recursos para destinar al ahorro
El coeficiente “ingreso” nos indica que por cada unidad adicional de ingreso, el ahorro aumenta en 0.05132 unidades.La relación entre ingreso y ahorro es positiva, lo que significa que a mayor ingreso tendremos una capacidad mayor para ahorrar.
Ambos coeficientes tienen p-valor < 0.05 de hecho, casi 0, lo que significa que son estadísticamente significativos,esto confirma que el ingreso tiene un impacto real sobre el ahorro.
Modelo Keynesiano sin datos atipicos
summary(modelo_keynes_sin_datipicos)
##
## Call:
## lm(formula = ahorro ~ ingreso, data = variables_keynes_sin_datipicos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -105902 -10783 6939 15134 30544
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -30544.3982874 63.6551831 -479.8 <0.0000000000000002 ***
## ingreso 0.0570046 0.0000214 2663.9 <0.0000000000000002 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19800 on 323699 degrees of freedom
## Multiple R-squared: 0.9564, Adjusted R-squared: 0.9564
## F-statistic: 7.096e+06 on 1 and 323699 DF, p-value: < 0.00000000000000022
El coeficiente “Intercept” representa el ahorro estimado cuando el ingreso es cero,en este caso, el modelo predice que si una persona no tiene ingresos, su ahorro esperado sería de -30544.39. Sin embargo un intercepto negativo no siempre tiene una interpretación realista; como sabemos en la practica si una persona tiene como ingresos=cero, su capacidad para ahorrar seria nula ya que no dispone de recursos para destinar al ahorro
El coeficiente “ingreso” nos indica que por cada unidad adicional de ingreso, el ahorro aumenta en 0.0570046 unidades.La relación entre ingreso y ahorro es positiva, lo que significa que a mayor ingreso tendremos una capacidad mayor para ahorrar.
Ambos coeficientes tienen p-valor < 0.05 de hecho, casi 0, lo que significa que son estadísticamente significativos,esto confirma que el ingreso tiene un compactor real sobre el ahorro.
Modelo Ciclo Vital con datos atipicos
summary(modelo_ciclo_vital)
##
## Call:
## lm(formula = ahorro ~ ingreso + edad + edad2 + nivel_educ + años_educ,
## data = variables_ciclo_vital)
##
## Residuals:
## Min 1Q Median 3Q Max
## -340743 -3626 10475 13871 19860
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -19687.765213070 124.982718632 -157.524 < 0.0000000000000002 ***
## ingreso 0.051219889 0.000008382 6110.765 < 0.0000000000000002 ***
## edad -47.156835344 7.437939231 -6.340 0.0000000002299861 ***
## edad2 0.684913900 0.089574124 7.646 0.0000000000000207 ***
## nivel_educ 619.022888024 17.402126781 35.572 < 0.0000000000000002 ***
## años_educ 178.926174696 16.997231677 10.527 < 0.0000000000000002 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21440 on 346429 degrees of freedom
## Multiple R-squared: 0.9913, Adjusted R-squared: 0.9913
## F-statistic: 7.912e+06 on 5 and 346429 DF, p-value: < 0.00000000000000022
El coeficiente “Intercept” representa el ahorro estimado cuando todas las variables(ingreso,edad,edad2,nivel_edu,años_educ) son cero,en este caso, el modelo predice que si una persona no tiene ingresos, su ahorro esperado sería de -19,690. Sin embargo un intercepto negativo no siempre tiene una interpretación realista; como sabemos en la practica si una persona tiene como ingresos=cero, su capacidad para ahorrar seria nula ya que no dispone de recursos para destinar al ahorro
El coeficiente “ingreso” nos indica que por cada unidad adicional de ingreso, el ahorro aumenta en 0.05122 unidades.La relación entre ingreso y ahorro es positiva, lo que significa que a mayor ingreso tendremos una capacidad mayor para ahorrar.
El coeficiente negativo de la variable “edad” nos indica que a medida que aumenta la edad el ahorro disminuye en 47.16 unidades.
teniendo en cuenta las caracteristicas de la variable anterior(edad),esta tiene una relación no lineal con el ahorro. Inicialmente, el ahorro disminuye con la edad, pero este efecto se atenúa con el tiempo incluso pudiendo llegar a revertirse como lo muestra el coeficiente “edad2”(0.6849). El coeficiente positivo de edad2 refleja un ciclo de acumulación y desacumulación de activos: en la juventud, los gastos elevados(educacion,compra de vivienda o la crianza de hijos) reducen el ahorro, mientras que en la etapa avanzada de la vida, con ingresos más estables y menos obligaciones economicas, el ahorro puede aumentar nuevamente.
El coeficiente “nivel_educ” sugiere que cada nivel adicional de educación se asocia con un aumento de 619 unidades en el ahorro.Esto respalda la idea de que un mayor nivel de educación puede llevar a mejores oportunidades laborales y, por ende, a mayores ingresos y capacidad de ahorro.
El coeficiente “años_educ” nos indica que por cada año adicional de educación formal, el ahorro aumenta en 178.9 unidades. Esto refuerza la importancia de la educación en la capacidad de generar ingresos y, en consecuencia, de ahorrar.
Todos los coeficientes son estadísticamente significativos (p<0.0000000000000002), lo que indica una alta confianza en su relación con el ahorro.Sin embargo, el “intercept” negativo podría indicar que faltan otras variables que afectan el ahorro.
Modelo Ciclo Vital sin datos atipicos
summary(modelo_ciclo_vital_sin_datipicos)
##
## Call:
## lm(formula = ahorro ~ ingreso + edad + edad2 + nivel_educ + años_educ,
## data = variables_ciclo_vital_sin_datipicos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -106411 -10902 6980 15007 31132
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -31154.951041 125.978661 -247.303 < 0.0000000000000002 ***
## ingreso 0.056985 0.000022 2589.687 < 0.0000000000000002 ***
## edad 14.167314 7.038070 2.013 0.0441 *
## edad2 -0.030829 0.084925 -0.363 0.7166
## nivel_educ -9.448692 17.342335 -0.545 0.5859
## años_educ 78.651458 16.916028 4.650 0.00000333 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19800 on 323695 degrees of freedom
## Multiple R-squared: 0.9564, Adjusted R-squared: 0.9564
## F-statistic: 1.42e+06 on 5 and 323695 DF, p-value: < 0.00000000000000022
El coeficiente “Intercept” representa el ahorro estimado cuando todas las variables(ingreso,edad,edad2,nivel_edu,años_educ) son cero,en este caso, el modelo predice que si una persona no tiene ingresos, su ahorro esperado sería de -31154.95. Sin embargo un intercepto negativo no siempre tiene una interpretación realista; como sabemos en la practica si una persona tiene como ingresos=cero, su capacidad para ahorrar seria nula ya que no dispone de recursos para destinar al ahorro
El coeficiente “ingreso” nos indica que por cada unidad adicional de ingreso, el ahorro aumenta en 0.056985 unidades.La relación entre ingreso y ahorro es positiva, lo que significa que a mayor ingreso tendremos una capacidad mayor para ahorrar.
En este modelo el coeficiente “edad” indica que, en promedio, cada año adicional de edad aumenta el ahorro en 14.167 unidades
El coeficiente negativo de “edad2” sugiere que el impacto positivo de la edad en el ahorro se desacelera con el tiempo e incluso podría revertirse en edades más avanzadas. Además su p-valor alto (0.7166) indica que no es estadísticamente significativa en este modelo.
El coeficiente “nivel_educ” aunque es negativo, su p-valor alto (0.5859) sugiere que no hay evidencia suficiente para afirmar que el nivel educativo tiene un efecto significativo sobre el ahorro en este modelo.
El coeficiente “años_educ” nos indica que, por cada año adicional de educación, el ahorro aumenta en 78.651 unidades. Su bajo p-valor (<0.001) indica que este efecto es estadísticamente significativo en este modelo.
Teniendo en cuenta los p-valor este modelo sugiere que el ingreso y los años de educación tienen un impacto positivo y significativo sobre el ahorro, mientras que la edad presenta un efecto positivo pero con una relación altamente no lineal. Sin embargo, las variables “edad2” y “nivel educ” no resultan significativos en este análisis, lo que sugiere que su impacto sobre el ahorro no es determinante dentro de este modelo específico.
Modelo Keynesiano con datos atipicos
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p0 <- plot(modelo_keynes$residuals, main = "Residuos del Modelo keynes", ylab = "Residuos", xlab = "Índice", col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p1 <- plot(variables_keynes$ahorro, modelo_keynes$residuals,
main = "Residuos vs ahorro",
xlab = "ahorro", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p2 <- plot(variables_keynes$ingreso, modelo_keynes$residuals,
main = "Residuos vs ingreso",
xlab = "ingreso", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
Los gráficos de residuos revelan problemas de heterocedasticidad y presencia de datos atípicos. En el gráfico “Residuos vs Índice”, los residuos no están distribuidos aleatoriamente en torno a cero, lo que indica que el modelo podría estar sesgado o que faltan variables explicativas importantes.
En “Residuos vs Ahorro” y “Residuos vs Ingreso”, se observa una clara tendencia descendente, lo que sugiere que los residuos aumentan en magnitud a medida que aumentan las variables independientes. Además, los puntos extremos y dispersos indican la presencia de datos atípicos que están afectando el ajuste del modelo, posiblemente influyendo excesivamente en los coeficientes estimados.
Modelo Keynesiano sin datos atipicos
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p0 <- plot(modelo_keynes_sin_datipicos$residuals, main = "Residuos del Modelo keynes sin atipicos", ylab = "Residuos", xlab = "Índice", col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p1 <- plot(variables_keynes_sin_datipicos$ahorro, modelo_keynes_sin_datipicos$residuals,
main = "Residuos vs ahorro",
xlab = "ahorro", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p2 <- plot(variables_keynes_sin_datipicos$ingreso, modelo_keynes_sin_datipicos$residuals,
main = "Residuos vs ingreso",
xlab = "ingreso", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
Al eliminar los datos atípicos, se observa una mejora notable en la distribución de los residuos. En el gráfico “Residuos del Modelo Keynes sin atípicos”, los residuos se concentran más en torno a cero y presentan una dispersión más uniforme, lo cual refuerza la validez del modelo. Sin embargo, en los gráficos “Residuos vs Ahorro” y “Residuos vs Ingreso” aún se percibe una ligera tendencia sistemática, lo que podría indicar que la relación entre las variables no es completamente lineal o que todavía existen ciertos patrones no explicados por el modelo. En general, la eliminación de los atípicos reduce la heterocedasticidad y mejora el ajuste del modelo.
Modelo Ciclo Vital con datos atipicos
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p0 <- plot(modelo_ciclo_vital$residuals, main = "Residuos del Modelo Ciclo Vital", ylab = "Residuos", xlab = "Índice", col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p1 <- plot(variables_ciclo_vital$ahorro, modelo_ciclo_vital$residuals,
main = "Residuos vs ahorro",
xlab = "ahorro", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p2 <- plot(variables_ciclo_vital$ingreso, modelo_ciclo_vital$residuals,
main = "Residuos vs ingreso",
xlab = "ingreso", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p3 <- plot(variables_ciclo_vital$edad, modelo_ciclo_vital$residuals,
main = "Residuos vs edad",
xlab = "edad", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
Los gráficos de residuos del Modelo de Ciclo de Vida muestran valores atípicos claros, especialmente en relacion al ingresos, donde el modelo tiende a sobreestimar significativamente los valores altos. Estos valores atípicos y las tendencias a la baja sugieren posibles problemas del modelo, como sesgo y varianza de error inconsistente.
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p4 <- plot(variables_ciclo_vital$edad2, modelo_ciclo_vital$residuals,
main = "Residuos vs edad2",
xlab = "edad2", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p5 <- plot(variables_ciclo_vital$nivel_educ, modelo_ciclo_vital$residuals,
main = "Residuos vs nivel_educ",
xlab = "nivel_educ", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p6 <- plot(variables_ciclo_vital$años_educ, modelo_ciclo_vital$residuals,
main = "Residuos vs años_educ",
xlab = "años_educ", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
Los gráficos muestran que los residuos presentan mayor dispersión en edad2 y que en años_educ y nivel_educ, con valores extremos (no atípicos) que alcanzan hasta 100.
Modelo Ciclo Vital sin datos atipicos
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p7 <- plot(modelo_ciclo_vital_sin_datipicos$residuals, main = "Residuos del Modelo Ciclo Vital sin atipicos", ylab = "Residuos", xlab = "Índice", col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p8 <- plot(variables_ciclo_vital_sin_datipicos$ahorro, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs ahorro",
xlab = "ahorro", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p9 <- plot(variables_ciclo_vital_sin_datipicos$ingreso, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs ingreso",
xlab = "ingreso", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p10 <- plot(variables_ciclo_vital_sin_datipicos$edad, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs edad",
xlab = "edad", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
library(ggplot2)
library(gridExtra)
par(mfrow = c(2, 2))
p11 <- plot(variables_ciclo_vital_sin_datipicos$edad2, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs edad2",
xlab = "edad2", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p12 <- plot(variables_ciclo_vital_sin_datipicos$nivel_educ, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs nivel_educ",
xlab = "nivel_educ", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
p13 <- plot(variables_ciclo_vital_sin_datipicos$años_educ, modelo_ciclo_vital_sin_datipicos$residuals,
main = "Residuos vs años_educ",
xlab = "años_educ", ylab = "Residuos",
col = "blue", pch = 16)
abline(h = 0, col = "red", lwd = 2)
A lo largo de todos los niveles de ingreso, se observa una variabilidad residual consistente, sin presencia de valores atípicos genuinos que distorsionen los resultados. La relación lineal establecida entre el ingreso y la variable respuesta parece ser apropiada, aunque los residuos de mayor magnitud - que alcanzan hasta 100,000 unidades, sugieren la existencia de aspectos no capturados completamente por el modelo. Estos residuos significativos, sin ser problemáticos, apuntan hacia posibles oportunidades para enriquecer la capacidad explicativa del modelo. Podrían reflejar efectos no lineales no considerados, interacciones relevantes con otras variables, o incluso la ausencia de algunos factores explicativos importantes.Las demas variables continuan igual debido a que la unica variable a la cual se le sacaron los datos atipicos fue al ingreso.
¿Qué políticas podrían incrementar el ahorro? (Ej.: incentivos fiscales,educación financiera).
El ahorro es un facrtor clave para la estabilidad financiera de los hogares ya que este permite afrontar imprevistos como emergencias médicas, desempleo o reparaciones inesperadas sin caer en deudas, ademas de que sirve como seguridad financiera,cumplimiento de metas, inversion y crecimiento del patrimonio. Sin embargo la alta tasa de informalidad laboral(56%) en Colombia limta la capaciada de la poblacion para generar y mantener habitos de ahorro. Por eso es necesario implementar politicas que fomenten el ahorro y asi poder reducir las barreras que impiden su crecimiento.
Algunas politicas que puedan ayuadar a incrementar los promedios de ahorro serian: 1. Incentivos fiscales como seria la disminucion de la tasa de interes a la cuenta de ahorro(4 x 1000),porque este impuesto se cobra sobre cada retiro o movimiento bancario,esto quiero decir que, las personas pierden el 0,4% de dinero en cada movimiento realizado lo que podria ocacionar un desinteres de las personas,principalmente para quienes tienen bajos ingresos. 2. La educacion financiera a traves de programas en colegios y universidades,lo que ayudaria a los ciudadanos a establecer un habito de ahorro desde temprana edad. 3. Fomentar el uso de cuentas exentas del 4*1000
La informalidad laboral afecta significativamente la capacidad de ahorro de la poblacion,ya que las personas que trabajaan en la informalidad no tiene acceso a seguridad social, es decir, que no cuentan con pensiones ni seguros de desempleo lo que los obliga a vivir del dia a dia dificultando la planeacion financiera a largo plazo.Ademas la inestabilidad de los ingresos de los trabajadores informales les impide crear habitos de ahorro, porque priorizan el consumo inmediato sobre la acumulacion de riquiza. Para mejorar la capicidad de ahorro de las personas en Colombian, es fundamental reducir la informalidad laboral, mejorar la educacion funanciera.
¿Cómo afecta la informalidad laboral (56% en Colombia) estos resultados?
Se puede decir que la informalidad afecta los resultados de los modelos debido a la volatilidad de los ingresos de las personas que están trabajando de manera informal, lo que puede afectar la distribución real,también por la dispersión de los ingresos, ya que el 25% de las personas tienen o registran un ingreso igual o menor a 1.300.000 (Independientemente de la inclusión o exclusión de datos atípicos en los modelos), el cual no llega ni al salario minimo legal vigente en Colombia lo que se puede deducir que etas personas trabajan de manera infomal, miemtras que hay un 25% de personas que reportan un ingreso igual o superior a 289.300.000 y 7.550.000(Excluyendo los datos atipicos).