UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS ECONOMICAS
ESCUELA DE ECONOMIA
ECONOMETRIA
GRUPO TEORICO 3
TEMA DE INVESTIGACION
“ANÁLISIS DE LA FUNCIÓN DEL CONSUMO EN LATINOAMÉRICA Y EL CARIBE PARA EL AÑO 2019 ,CASO DE EL SALVADOR”
ID_GRUPO: 3.1
DOCENTE:
MSF. Carlos Ademir Perez Alas.
Integrantes:_________________________ Carnet: ________Participacion:
Andrea Esmeralda Cortez Herrera. ___CH19009_________100%
Elmer Nahum Martinez Mendez. _____MM21092 ________100%
Jose Manuel Canales Lopez. __________CL12025 _________100%
Marta Abigail Meza Robles. __________ MR21132________100%
CIUDAD UNIVERSITARIA,09 JUNIO DEL 2023
1. Marco Teórico y Referencial.
El término consumo proviene del idioma latín “cosumere” que significa gastar. El consumo es la acción por la cual se utilizan determinados productos, bienes y servicios para satisfacer las necesidades de una población o una entidad . En materia económica el consumo es la fase final del proceso económico, principalmente del proceso productivo, que es el momento en que un bien causa alguna utilidad a la persona consumidora la cual adquiere este bien o servicio para satisfacer sus necesidades.
La macroeconomía divide el consumo en dos:
Consumo privado: Valor del conjunto de todas las compras de bienes y servicios que fueron realizadas por las distintas familias, las instituciones privadas o empresas privadas. Se trata de un cálculo que contabiliza a las remuneraciones recibidas por los asalariados y a la producción de bienes de autoconsumo.
Consumo público: Valor de todos los gastos realizados por el gobierno nacional mediante sus diferentes ministerios y gobernaciones públicas en el desempeño de sus funciones y objetivos.
El consumo nos muestra dos puntos de vista diferentes pero el interés del análisis recae en el consumo de las familias salvadoreñas por lo que el consumo privado nos acerca mas a nuestro objetivo.
El consumo en El Salvador
Los salvadoreños constituimos uno de los pueblos más consumistas del planeta. En 2010, un informe del PNUD ubicó a El Salvador en el tercer lugar a nivel mundial, después de Lesoto y Liberia. Esa clasificación se da a partir de dividir el valor de lo que consume cada país entre su producto interno bruto. El dato no significa que aquí se consume más que en los países ricos, sino que, en relación al PIB, los salvadoreños dedicamos un mayor porcentaje a eso, mientras solo se ahorra un 16% del PIB, debemos en conjunto más del 40% del mismo. Los hábitos de consumo han cambiado actualmente, se dedica más dinero a comer fuera de casa que a la salud, más a la comunicación que a la educación, etc.
Teoría del consumo Keynes
Fue el primer economista en afirmar que el consumo depende fundamentalmente del ingreso y que si bien existen otros determinantes, éstos no poseen relevancia suficiente, por lo tanto, trabajó la función consumo como únicamente dependiente del ingreso real disponible, es decir: C = ƒ (Yd). aunque él sabía que el ingreso no era la única variable que afectaba el consumo.
Ingresos disponibles: Para la mayoría de las personas, el determinante más poderoso de cuánto consumen es la cantidad de ingresos que tienen en su salario para llevar a casa, también conocido como ingreso disponible, que es el ingreso después de impuestos.
Desde este punto de vista los ingresos son afectados por el producto interno bruto (PIB) el cual tiene correlación con los impuestos, pues entre más productivo sea un país mayor será el ingreso que perciba la persona, pero este ingreso está sujeto a una serie de impuestos los cuales se restan para obtener una renta neta(rn), depende tambien el numero de transferencias(tr) que realice algunas pueden aumentar mis ingresos y otras los pueden disminuir, los intereses(i) son un aliado para las personas que obtienen créditos y sus ingresos aumentan pero cuando los intereses suben no tanto y finalmente agregamos el efecto del consumo del consumo en El Salvador(sv), es decir que tanto cambiaría en relación con latinoamérica, tenemos así que:
Yd=(PIB-Im) + tr + i + sv, sabemos que
PIB-Im= Renta Neta (rn)
Yd=rn + tr + i + sv , tenemos una función de consumo
C = ƒ (Yd) , sustituimos y tenemos el consumo en función de las variables
C = ƒ (rn + tr + i + sv)
2. Especificación:
2.1 Planteamiento del Teórico del Fenómeno Económico
El consumo es una variable indispensable para que funcione la economía en general, pues el objetivo final de todos los procesos de producción y ofertas de servicios es que el cliente pueda consumirlos y a través de ellos generar ganancias, desde este punto de vista el consumo no es considerado un problema dado que es algo que todos hacemos comprar y consumir, pero desde el punto de vista de la economía sustentable, el gran problema del consumo radica en que gran parte de la población no produce, pero sí consume, y es lo que actualmente y desde hace años se viene dando en El Salvador, el país no es capaz de producir todo lo que consume incluso se recurre a productos extranjeros para suplir nuestras necesidades lo que significa un porcentaje de pérdida para nuestro país, es por eso que queremos estimar el consumo que es una variable que depende del ingreso como lo ha descrito Keynes, pero ambos concluyen en que no es la única variable pero si es la que más resalta, pero qué pasa con aquellas variables que afectan los ingresos de los salvadoreños, si en cierta manera afectan el ingreso también estaría siendo afectado el consumo, tales como la renta neta, transferencias, tasa de interes y el efecto con respecto a El Salvador.
2.1.1 Variable Endógena y Variables Exógenas.
Variable endógena
Se trata de la variable que se obtiene como resultado a partir de la combinación de una serie de variables. Es la variable explicada o dependiente.
Consumo.
Es la acción de utilizar o gastar un producto, un bien o un servicio para atender necesidades humanas tanto primarias como secundarias. En economía, se considera el consumo como la fase final del proceso productivo, cuando el bien obtenido es capaz de servir de utilidad al consumidor.
Variables exógenas
Estas variables consideradas en el modelo son explicativas o independientes, de las cuales podemos destacar:
Renta Neta.
Se determina restando a la renta obtenida el valor de los costos y gastos necesarios para su producción y conservación de la fuente, de conformidad con la ley, así como las deducciones que la misma establezca.
Transferencias.
Las transferencias corrientes son transacciones entre residentes y no residentes, en las cuales una parte entrega recursos reales o financieros (bienes, servicios, activos financieros u otros activos no producidos) sin recibir ningún valor económico a cambio.
Tasa de interés.
La tasa de interés es la cantidad de dinero que por lo regular representa un porcentaje del crédito o préstamo que se ha requerido y que el deudor deberá pagar a quien le presta. En términos simples; es el precio por el uso del dinero.
El Salvador.
El cambio en el consumo dado que el país es El Salvador.
2.1.2 Relación funcional entre las variables.
Relación entre consumo y renta neta.
Existe una relación directamente proporcional entre las dos variables. Si la renta aumenta junto con ella lo hará el consumo.
Relación entre consumo y transferencias.
Existe una relación directamente proporcional entre las dos variables. Si se reciben más transferencias, se tendrá otra entrada de dinero por lo cual el consumo tiende a la alza.
Relación entre consumo y tasa de interés.
Existe una relación inversa entre las dos variables. Si la tasa de interés se eleva, se consumiría menos, en caso contrario se consumirá más cuando la tasa de interés sea muy baja.
Relación entre consumo y El Salvador.
Existe una relación directamente proporcional entre las dos variables. Si el consumo en El Salvador podría experimentar un cambio tanto positivo o negativo y esto nos dirá si está por encima o debajo comparado a el consumo de latinoamerica.
2.1.3 Hipótesis
2.1.3.1 Hipotesis General
Ho: El Salvador no es el país más consumista de toda latinoamérica en el año 2019.
H1: El Salvador es uno de los países más consumistas de toda latinoamérica en el año 2019.
2.1.3.2 Hipótesis Especificas del Modelo:
Normalidad de los Residuos
Ho: Los residuos de la prueba siguen una distribución normal.
H1: Los residuos de la prueba no siguen una distribución normal.
Multicolinealidad.
Ho: Existe una relación lineal perfecta entre algunas o todas las variables explicativas del modelo (multicolinealidad)
H1: No existe una relación lineal perfecta entre algunas o todas las variables explicativas del modelo (no multicolinealidad).
Colinealidad
Ho: No existe colinealidad en el modelo.
H1: Existe colinealidad en el modelo.
Homocedasticidad
Ho: Existe evidencia que la varianza de los residuos es Homocedastica.
H1: Existe evidencia que la varianza de los residuos es Heterocedastica.
Autocorrelación
H0: “No hay evidencia de Autocorrelación de primer orden, en los residuos del modelo”
H1: “Hay evidencia de Autocorrelación de primer orden, en los residuos del modelo”
2.2 Especificación del modelo matemático y estadístico
2.2.1 Modelo Matemático
Para determinar el modelo, se pretende analizar las variables que influyen en el consumo de El Salvador, por lo tanto, el modelo matemático que utilizaremos será el siguiente:
Cons=βo+β₁rn+β₂tr+β₃i+β₄esa
Donde:
Cons = Consumo
rn = Renta Neta
tr = Transferencias
i = Tasa de interés
eslv = Efecto de consumo en El Salvador
2.2.2 Restricciones de los parámetros
Una de las principales restricciones es que se supone que las variables independientes influyen sobre la variable independiente y puede ser calculada estadísticamente, entonces el estadístico F puede construirse a partir del R2 de la regresión estimada, si tiene una distribución F con K grados de libertad en el numerador y grados de libertad en el denominador, para el caso de nuestro modelo estadístico restringido sería:
Cons=βo+β₁rn+β₂tr+β₃i+βeslv+e
Problemas de sesgo de selección: Si la muestra utilizada para estimar el modelo no es representativa de la población de interés, puede haber problemas de sesgo de selección, lo que puede afectar la validez de los resultados del modelo.
Supuestos sobre la distribución de los errores: El modelo econométrico asume que los errores de la regresión tienen una distribución normal y homocedástica. Si estos supuestos no se cumplen, los resultados del modelo pueden ser sesgados o poco precisos.
2.2.3 Modelo Estadístico
Cons=βo+β₁rnₜ+β₂trₜ+β₃iₜ+β₄eslvₜ+ ε
ε= Error Aleatorio
Cada variable definida, donde los coeficientes a estimar son 0, 1, 3, n. Así mismo el error aleatorio incluye todas aquellas variables omitidas del análisis.
3. Estimación del Modelo
El segundo avance, implica la estimación del modelo propuesto y la revisión de los supuestos del MCRLM.
3.1 Modelo Estimado
3.1.1 Carga de Datos
La base de datos fue creada de acuerdo a los datos proporcionados por la Comisión Económica para América Latina y el Caribe (CEPAL).
library(readxl)
<- read_excel("C:/Users/abyme/OneDrive/Escritorio/1- Base de Datos Consumo 2019.xlsx")
Base_de_Datos_Consumo_2019 head(Base_de_Datos_Consumo_2019)
## # A tibble: 6 × 6
## Paises cons rn tr i eslv
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 El Salvador 26636 20.9 19.7 7 1
## 2 Argentina 532484 28.9 64.1 67 0
## 3 Bolivia 41181 24.7 NA 6 0
## 4 Brasil 1947670 32.4 61.7 43 0
## 5 Chile 298097 20.8 33.8 9 0
## 6 Colombia 344902 19.0 56.6 12 0
3.1.2 Modelo
library(stargazer)
options(scipen = 99999)
<-lm(formula = cons~rn+tr+i+eslv,data =Base_de_Datos_Consumo_2019)
Modelo_Estimadostargazer(Modelo_Estimado,title = "Modelo Estimado del Consumo",type = "html")
Dependent variable: | |
cons | |
rn | 8,741.241 |
(21,304.690) | |
tr | 16,756.690 |
(9,527.515) | |
i | 6,791.063 |
(10,618.130) | |
eslv | 88,460.180 |
(459,003.400) | |
Constant | -622,870.900 |
(449,612.300) | |
Observations | 16 |
R2 | 0.540 |
Adjusted R2 | 0.373 |
Residual Std. Error | 419,793.100 (df = 11) |
F Statistic | 3.233* (df = 4; 11) |
Note: | p<0.1; p<0.05; p<0.01 |
3.1.3 Analisis Exploratorio de Datos Basicos
library(skimr)
skim(Base_de_Datos_Consumo_2019)
Name | Base_de_Datos_Consumo_201… |
Number of rows | 33 |
Number of columns | 6 |
_______________________ | |
Column type frequency: | |
character | 1 |
numeric | 5 |
________________________ | |
Group variables | None |
Variable type: character
skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
---|---|---|---|---|---|---|---|
Paises | 0 | 1 | 5 | 28 | 0 | 33 | 0 |
Variable type: numeric
skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
---|---|---|---|---|---|---|---|---|---|---|
cons | 0 | 1.00 | 166022.08 | 394468.69 | 585.30 | 5044.00 | 26636.00 | 97712.00 | 1947670.00 | ▇▁▁▁▁ |
rn | 2 | 0.94 | 23.00 | 6.78 | 13.01 | 18.47 | 22.76 | 27.45 | 42.22 | ▇▇▆▂▁ |
tr | 17 | 0.48 | 38.09 | 16.80 | 15.76 | 23.83 | 33.61 | 49.46 | 65.37 | ▇▃▁▂▅ |
i | 0 | 1.00 | 13.91 | 12.63 | 0.00 | 8.00 | 11.30 | 13.00 | 67.00 | ▇▁▁▁▁ |
eslv | 0 | 1.00 | 0.03 | 0.17 | 0.00 | 0.00 | 0.00 | 0.00 | 1.00 | ▇▁▁▁▁ |
library(visdat)
vis_dat(Base_de_Datos_Consumo_2019)
vis_miss(Base_de_Datos_Consumo_2019,sort_miss = TRUE)
Segunda Entrega
3.2 Verificación de supuestos del MCRLM.
La validez del método estadístico que se utilizará para el análisis de regresión depende de varios supuestos. Estos se convierten en premisas para el modelo y los datos esencialmente. La calidad de las inferencias estadísticas depende en gran medida de si estos supuestos se cumplen o no. También es importante determinar las situaciones en las que es posible que los supuestos no se cumplan.
3.2.1 Pruebas de Normalidad de los Residuos.
La normalidad es uno de los supuestos de muchas pruebas estadísticas, como la prueba t o la prueba F. En términos generales las pruebas de normalidad comparan las puntuaciones de la muestra con un conjunto de puntuaciones distribuidas normalmente con la misma media y desviación estándar. Para ello se hará uso de las siguientes pruebas formales: Jarque-Bera (JB), Kolmogorov Smirnov (KS) y Shapiro Wilk (SW).
3.2.1.1 Jarque-Bera (JB)
library(tseries)
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
<-jarque.bera.test(Modelo_Estimado$residuals)
Salida_JB Salida_JB
##
## Jarque Bera Test
##
## data: Modelo_Estimado$residuals
## X-squared = 3.9393, df = 2, p-value = 0.1395
3.2.1.1.1 Grafico
library(fastGraph)
<-0.05
alpha_sig<-Salida_JB$statistic
JB<-Salida_JB$parameter
gl<-qchisq(1-alpha_sig,gl,lower.tail = TRUE)
VCshadeDist(JB,ddist = "dchisq",
parm1 = gl,
lower.tail = FALSE,
xmin = 0,
sub=paste("VC:",round(VC,2),"","JB:",round(JB,2)))
3.2.1.2 Kolmogorov Smirnov (KS)
library(nortest)
<-lillie.test(Modelo_Estimado$residuals)
Prueba_KS Prueba_KS
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: Modelo_Estimado$residuals
## D = 0.17376, p-value = 0.2204
Conclusion: En este caso dado que p-value es igual a 0.2204 > 0.05 , No se rechaza la Hipotesis Nula, por lo que los residuos siguen una distriducion normal.
3.2.1.3 Shapiro Wilk (SW)
<-shapiro.test(Modelo_Estimado$residuals)
Salida_SWprint(Salida_SW)
##
## Shapiro-Wilk normality test
##
## data: Modelo_Estimado$residuals
## W = 0.92789, p-value = 0.2256
Conclusion: En este caso dado que p-value es igual a 0.2256 > 0.05 , No se rechaza la Hipotesis Nula, por lo que los residuos siguen una distriducion normal.
<-qnorm(Salida_SW$p.value,lower.tail = FALSE)
Wn_Salidaprint(Wn_Salida)
## [1] 0.7532556
(Calculo de Wn y su pvalue si se llegara a necesitar.)
3.2.2 Prueba de Multicolinealidad.
El término multicolinealidad fue utilizado por primera vez por Ragnar Frisch. Describe una relación perfecta o exacta entre las variables explicativas de regresión. El análisis de regresión lineal asume que no existe una relación exacta perfecta entre las variables explicativas.
library(mctest)
<-model.matrix(Modelo_Estimado)
X_matmctest(mod = Modelo_Estimado)
##
## Call:
## omcdiag(mod = mod, Inter = TRUE, detr = detr, red = red, conf = conf,
## theil = theil, cn = cn)
##
##
## Overall Multicollinearity Diagnostics
##
## MC Results detection
## Determinant |X'X|: 0.3073 0
## Farrar Chi-Square: 15.1443 1
## Red Indicator: 0.4243 0
## Sum of Lambda Inverse: 7.2000 0
## Theil's Method: -0.0712 0
## Condition Number: 11.4803 0
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
Conclusion:
Como K(x)= 11.4803, Es inferior o igual a 20, se considera que la multicolinealidad es leve, por lo que no se considera un problema.
Por lo tanto, aceptamos la Hipotesis Nula propuesta en el modelo.
3.2.2.1 Farrar-Glaubar
3.2.2.1.1 Calculo de matriz R
<-det(R)
determinante_Rprint(determinante_R)
## [1] 0.3072556
3.2.2.1.2 Calculo de Estadistico Xfg
<-ncol(X_mat[,-1])
m<-nrow(X_mat[,-1])
n<--(n-1-(2*m+5)/6)*log(determinante_R)
chi_FGprint(chi_FG)
## [1] 15.1443
3.2.2.1.3 Calculo del Valor Critico
<-m*(m-1)/2
gl<-qchisq(p=0.95,df=gl)
VCprint(VC)
## [1] 12.59159
3.2.2.1.4 REGLA DE DESICION:
Por lo tanto, Xfg > V.C , se concluye que se rechaza la H0 y que existe ecidencia de Colinealidad en los regresores.
3.2.2.2 Calculo de los VIF`s
library(car)
<-vif(Modelo_Estimado)
VIFs_carprint(VIFs_car)
## rn tr i eslv
## 1.446157 2.181637 2.451422 1.120811
3.2.2.2.1 Grafico de VIF`s
library(mctest)
mc.plot(mod = Modelo_Estimado,vif = 2)
3.2.3 Pruebas de Heterocedasticidad.
Corresponde a la situación en la que la varianza del término de error de la ecuación estimada, no es constante. Bajo la presencia de Heterocedasticidad la matriz de Varianza Covarianza, es no escalar,
3.2.3.1 Prueba de White
Criterio de decisión:
Rechazar H0 sí LMW ≥ VC
Rechazar H0 sí Pvalue ≤ α
library(lmtest)
<-bptest(Modelo_Estimado,~I(rn^2)+I(tr^2)+I(i^2)+I(eslv^2)+(rn*tr)+(rn*i)+(rn*eslv),data = Base_de_Datos_Consumo_2019)
Prueba_Whinteprint(Prueba_Whinte)
##
## studentized Breusch-Pagan test
##
## data: Modelo_Estimado
## BP = 15.807, df = 9, p-value = 0.07102
Conclusion:
Dado que Pvalue = 0.07102 > 0.05, por lo tanto No se rechaza la H0, Por lo que existe evidencia que que la varianza de los residuos es Homocedastiaca.
3.2.4 Pruebas de Autocorrelación
Corresponde a la presencia de asociación entre los valores precedentes de las observaciones de una variable o serie temporal. Dicho de otra manera formal, se presenta a través de la situación en la cual, la covarianza entre el i-ésimo y j-ésimo, separados “m” lugares o periodos es distinta de cero:
Cov(ei,ej) ≠ 0
3.2.4.1 Durbin-Watson
Hipótesis de la prueba:
H0: p = 0
H1: p ≠ 0
library(lmtest)
dwtest(Modelo_Estimado,alternative = "two.sided",iterations = 1000)
##
## Durbin-Watson test
##
## data: Modelo_Estimado
## DW = 2.8004, p-value = 0.1551
## alternative hypothesis: true autocorrelation is not 0
Comprobando los resultados optenidos
library(car)
durbinWatsonTest(Modelo_Estimado,simulate = TRUE,reps = 1000)
## lag Autocorrelation D-W Statistic p-value
## 1 -0.4002148 2.800408 0.138
## Alternative hypothesis: rho != 0
Conclusion:
En ambas pruebas, se comprobo que no existe la presencia de Autocorrelacion, por lo tanto No se rechaza la H0, ya que Pvalue > 0.05.
Y tambien deacuerdo tambien al esquema, el DW calculado, cae en la zona de no rechazo de la H0, por lo tanto no existe presencia de autocorrelacion lineal.
3.2.4.2 Breusch-Godfrey
Criterio de decisión:
Rechazar H0 sí LMbg > VC
Alternativamente:
Rechazar H0 sí Pvalue ≤ α
3.2.4.2.1 Calculo de 1° orden
library(lmtest)
bgtest(Modelo_Estimado,order = 1)
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: Modelo_Estimado
## LM test = 2.8779, df = 1, p-value = 0.0898
Conclusion:
Deacuerdo a los datos optenidos se puede concluir que los residuos del modelo, no siguen autocorrelacion de 1° orden, ya que Pvalue> 0.05 y No se rechazara la H0.
3.2.4.2.2 Calculo de 2° orden
library(lmtest)
bgtest(Modelo_Estimado,order=2)
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: Modelo_Estimado
## LM test = 5.3244, df = 2, p-value = 0.06979
Conclusion:
Dado que Pvalue> 0.05, No se rechaza la H0, por lo tanto se concluye que los residuos del modelo, no siguen autocorrelacion de 2° orden.
Tercera Entrega
3.3 Estimadores HAC
Estimación Robusta (uso del estimador HAC)
3.3.1 Modelo Sin Corregir
options(scipen = 99999)
library(lmtest)
coeftest(Modelo_Estimado)
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -622870.9 449612.3 -1.3854 0.1934
## rn 8741.2 21304.7 0.4103 0.6895
## tr 16756.7 9527.5 1.7588 0.1064
## i 6791.1 10618.1 0.6396 0.5355
## eslv 88460.2 459003.4 0.1927 0.8507
3.3.2 Modelo Corregido (usando un estimador HAC)
options(scipen = 99999)
library(lmtest)
library(sandwich)
<-vcovHC(Modelo_Estimado,type = "HC0")
vcov_HACcoeftest(Modelo_Estimado,vcov. = vcov_HAC)
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -622870.9 459198.4 -1.3564 0.20215
## rn 8741.2 22280.4 0.3923 0.70231
## tr 16756.7 6964.7 2.4059 0.03486 *
## i 6791.1 12519.9 0.5424 0.59835
## eslv 88460.2 94701.0 0.9341 0.37030
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
3.3.3 Estimación Robusta: Presentando del Modelo
library(stargazer)
library(sandwich)
<-vcovHC(Modelo_Estimado,type="HC0")
vcov_HAC<-sqrt(diag(vcov_HAC))
robust.se
stargazer(Modelo_Estimado,Modelo_Estimado,
se=list(NULL, robust.se),
column.labels=c("Modelo Original","Modelo Corregido"),
align=TRUE,
type = "html",title = "Modelo de Consumo")
Dependent variable: | ||
cons | ||
Modelo Original | Modelo Corregido | |
(1) | (2) | |
rn | 8,741.241 | 8,741.241 |
(21,304.690) | (22,280.370) | |
tr | 16,756.690 | 16,756.690** |
(9,527.515) | (6,964.710) | |
i | 6,791.063 | 6,791.063 |
(10,618.130) | (12,519.940) | |
eslv | 88,460.180 | 88,460.180 |
(459,003.400) | (94,701.000) | |
Constant | -622,870.900 | -622,870.900 |
(449,612.300) | (459,198.400) | |
Observations | 16 | 16 |
R2 | 0.540 | 0.540 |
Adjusted R2 | 0.373 | 0.373 |
Residual Std. Error (df = 11) | 419,793.100 | 419,793.100 |
F Statistic (df = 4; 11) | 3.233* | 3.233* |
Note: | p<0.1; p<0.05; p<0.01 |
3.4 Pronostico y Simulación
En la data de esta prueba ha sido modificada ya que existen algunos paises que no se obtienen informacion completa, por lo que se eliminaron los paises con poca o nula informacion y se aquedaron aquellos datos que si existe informacion completa.
library(readxl)
<- read_excel("C:/Users/abyme/OneDrive/Escritorio/Modificada Base de Datos Consumo 2019.xlsx") Modificada_Base_de_Datos_Consumo_2019
En este caso se hara el pronostico del consumo que tienen los paises si hay $100,000 de RN, tienen transferencias $25,000, tienen una tasa de i de “$30,000”, y sv de 1.
#Bias Proportion
<-function(pronosticado_1,observado_1){
Umlibrary(DescTools)
mean(pronosticado_1)-mean(observado_1))^2)/MSE(pronosticado_1,observado_1)
((
}#Variance Proportion
<-function(pronosticado_1,observado_1){
Uslibrary(DescTools)
sd(pronosticado_1)-sd(observado_1))^2)/MSE(pronosticado_1,observado_1)
((
}#Covariance Proportion
<-function(pronosticado_1,observado_1){
Uclibrary(DescTools)
2*(1-cor(pronosticado_1,observado_1))*sd(pronosticado_1)*sd(observado_1))/MSE(pronosticado_1,observado_1)}
(#Coeficiente U de Theil (también aparece en la librería "DescTools")
<-function(pronosticado_1,observado_1){
THEIL_Ulibrary(DescTools)
RMSE(pronosticado_1,observado_1)/(sqrt(mean(pronosticado_1^2))+sqrt(mean(observado_1^2)))
}
3.4.1 Script de Simulacion
options(scipen = 999999)
library(dplyr)
library(caret)
library(DescTools)
library(stargazer)
set.seed(50)
<-5000
numero_muestras<- Modificada_Base_de_Datos_Consumo_2019$cons %>%
muestras_1createDataPartition(p = 0.75,
times = numero_muestras,
list = TRUE)
# Listas vacias, que contendran los datos de entrenamiento, los pronosticos para los datos de prueba, y para las estadisticas de cada muestra
<-vector(mode = "list",
Modelos_Entrenamiento_1length = numero_muestras)
<-vector(mode = "list",
Pronostico_Prueba_1length = numero_muestras)
<-vector(mode = "list",
Resultados_Performance_data_entrenamiento_1length = numero_muestras)
<-vector(mode = "list",
Resultados_Performance_1length = numero_muestras)
#Estimación de los modelos lineales para cada muestra, los pronósticos y cálculo de las estadisticas de performance.
for(j in 1:numero_muestras){
<-Modificada_Base_de_Datos_Consumo_2019[muestras_1[[j]], ]
Datos_Entrenamiento_1<-Modificada_Base_de_Datos_Consumo_2019[-muestras_1[[j]], ]
Datos_Prueba_1<-lm(formula=cons~rn+tr+i+eslv,data = Datos_Entrenamiento_1)
Modelos_Entrenamiento_1[[j]]<-Modelos_Entrenamiento_1[[j]] %>% predict(Datos_Prueba_1)
Pronostico_Prueba_1[[j]]
<-data.frame(
Resultados_Performance_data_entrenamiento_1[[j]]R2_1 = R2(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons),
Datos_Entrenamiento_1RMSE = RMSE(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons),
Datos_Entrenamiento_1MAE = MAE(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons),
Datos_Entrenamiento_1MAPE = MAPE(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons)*100,
Datos_Entrenamiento_1THEIL=TheilU(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons,type = 1),
Datos_Entrenamiento_1Um=Um(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons),
Datos_Entrenamiento_1Us=Us(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons),
Datos_Entrenamiento_1Uc=Uc(Modelos_Entrenamiento_1[[j]]$fitted.values,
$cons)
Datos_Entrenamiento_1
)<-data.frame(
Resultados_Performance_1[[j]]R2_3 = R2(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons),
RMSE = RMSE(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons),
MAE = MAE(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons),
MAPE= MAPE(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons)*100,
THEIL=TheilU(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons,
type = 1), # También se puede usar la función que creamos: THEIL_U
Um=Um(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons),
Us=Us(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons),
Uc=Uc(Pronostico_Prueba_1[[j]], Datos_Prueba_1$cons)
)#No olvidar este corchete ;) }
3.4.2 Resultados de Simulacion
<-bind_rows(Resultados_Performance_data_entrenamiento_1)
Resultados_Performance_data_entrenamiento_1<-
Resultados_Performance_data_entrenamiento_1complete.cases(Resultados_Performance_data_entrenamiento_1),]
Resultados_Performance_data_entrenamiento_1[%>%
Resultados_Performance_data_entrenamiento_1stargazer(Modificada_Base_de_Datos_Consumo_2019,title = "Medidas de Performance Datos del Modelo",
type = "html",
digits = 3, summary.stat=c("n","mean","sd","min","p25","p75","max"))
Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
R2_1 | 5,000 | 0.690 | 0.166 | 0.479 | 0.552 | 0.926 | 0.973 |
RMSE | 5,000 | 258,920.500 | 102,861.700 | 95,818.910 | 155,939.400 | 369,820.800 | 392,989.200 |
MAE | 5,000 | 190,247.800 | 66,424.530 | 75,247.360 | 128,515.700 | 246,711.800 | 302,727.600 |
MAPE | 5,000 | 237.816 | 83.468 | 68.176 | 167.166 | 295.251 | 500.028 |
THEIL | 5,000 | 0.238 | 0.089 | 0.071 | 0.117 | 0.306 | 0.349 |
Um | 5,000 | 0.000 | 0.000 | 0 | 0 | 0 | 0 |
Us | 5,000 | 0.108 | 0.063 | 0.008 | 0.021 | 0.161 | 0.198 |
Uc | 5,000 | 0.983 | 0.063 | 0.893 | 0.930 | 1.070 | 1.083 |
Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
bind_rows(Resultados_Performance_1)%>%
stargazer(Modificada_Base_de_Datos_Consumo_2019,title = "Medidas de Performance de Simulacion",
type = "html",
digits = 3, summary.stat=c("n","mean","sd","min","p25","p75","max"))
Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
R2_3 | 5,000 | 0.671 | 0.305 | 0.003 | 0.464 | 0.942 | 1.000 |
RMSE | 5,000 | 732,687.100 | 393,961.600 | 171,042.100 | 353,240.900 | 1,217,759.000 | 1,401,561.000 |
MAE | 5,000 | 491,045.900 | 226,016.700 | 109,290.500 | 273,402.700 | 741,899.700 | 962,898.400 |
MAPE | 5,000 | 398.757 | 322.477 | 33.482 | 196.687 | 460.369 | 1,981.323 |
THEIL | 5,000 | 0.556 | 0.132 | 0.293 | 0.427 | 0.694 | 0.785 |
Um | 5,000 | 0.260 | 0.190 | 0.0002 | 0.126 | 0.348 | 0.938 |
Us | 5,000 | 0.762 | 0.303 | 0.007 | 0.638 | 0.967 | 1.280 |
Uc | 5,000 | 0.224 | 0.288 | 0.0001 | 0.023 | 0.303 | 1.309 |
Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
3.5 Interpretacion de las pruebas de Hipotesis
Hipotesis de los parametros
rn
H0: el rn tienen una relación lineal parcial con la variable consumo
HA: El rn no tienen una relación lineal parcial con la variable consumo
tr
H0: Las tr tienen una relación lineal parcial con la variable consumo
HA: Las tr no tienen una relación lineal parcial con la variable consumo
i
H0: El nivel de i tiene una relación lineal parcial con la variable consumo
HA: El nivel de i no tiene una relación lineal parcial con la variable consumo
eslv
H0: El eslv tiene una relación lineal parcial con la variable consumo
HA: El eslv no tiene una relación lineal parcial con la variable consumo
3.6 Interpretacion de los Intervalos de confianza
confint(Modelo_Estimado, level = 0.95)
## 2.5 % 97.5 %
## (Intercept) -1612460.939 366719.23
## rn -38150.072 55632.56
## tr -4213.234 37726.60
## i -16579.284 30161.41
## eslv -921799.401 1098719.77
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable rn tiene una relación lineal parcial con la variable consumo
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable tr tiene una relación lineal parcial con la variable consumo
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable i tiene una relación lineal parcial con la variable consumo
Con una confianza de 95% se rechaza la hipotesis nula y se dice que hay evidencia que la variable eslv no tiene una relación lineal parcial con la variable consumo
4. BIBLIOGRAFIA
Datos y estadísticas- CEPAL
https://www.cepal.org/es/datos-y-estadisticas
Consumo
https://concepto.de/consumo/#ixzz83OOYyUM7
Por un consumo responsable y sostenible | Noticias UCA
https://noticias.uca.edu.sv/editoriales/por-un-consumo-responsable-y-sostenible
Principales teorías macroeconómicas sobre el consumo (mdp.edu.ar)
http://nulan.mdp.edu.ar/id/eprint/1887/1/01486.pdf
12.1: Demanda agregada en el análisis keynesiano - LibreTexts Español
5. Anexos
View(Base_de_Datos_Consumo_2019)