UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS ECONÓMICAS

ESCUELA DE ECONOMÍA

ECONOMETRÍA


“COMPOSICION DEL GASTO DE LAS FAMILIAS DEL AREA URBANA DE AHUACHAPAN, DURANTE EL AÑO 2019”


TEMA DE INVESTIGACION

INTEGRANTES:

ARIAS MONTERROZA, JUAN JOSE                AM19005

HERNANDEZ ROMERO, ALAN ERNESTO               HR15033

MSF. CARLOS ADEMIR PÉREZ ALAS

GRUPO: 2-5

CIUDAD UNIVERSITARIA, MAYO DE 2021

1. INTRODUCCION

La familia como base de la sociedad es donde se empiezan a formar patrones y costumbres, es el lugar donde se aprende, y continúa reforzándose por años los conocimientos adquiridos. Como entidad, las familias son la unidad de mayor consumo de una sociedad.

Por ello, el consumo de nuestro agente económico: La familia, es nuestro fundamento para iniciar este estudio.

El presente trabajo muestra un análisis estadístico y matemático del comportamiento, tendencia y prioridades de la familia salvadoreña específicamente del municipio de Ahuachapán departamento de Ahuachapán. En esta investigación aplicamos nuestro conocimiento en econometría por medio de la herramienta y el lenguaje de programación de R, un entorno de desarrollo integrado que nos permitirá como estudiantes estimar acciones, predecir acontecimientos y medir el impacto de las variables sobre las decisiones de consumo de nuestro agente en estudio.

Tomamos como base de datos la Encuesta de Hogares de Propósitos Múltiples (EHPM) del año 2019 con una muestra considerable de 200 observaciones y 5 variables, 1 endógena y 5 exógenas con el fin de entender la realidad por medio de supuestos de nuestro modelo econométrico.

También vemos necesario aclarar en nuestro apartado teórico los objetivos con los cuales realizamos esta investigación, las razones o justificaciones y las descripciones de todas las variables y la relación entre ellas para que el lector comprenda el contexto de la información.

Cada verificación cuenta con su cálculo y explicación teórica de la misma, respaldando con gráficos las operaciones que ameritan su representación. A seguir, la bibliografía con la referencia de nuestros datos de estudio.

2.JUSTIFICACION

Nuestro proyecto se enfocará en estudiar las necesidades de consumo de las familias en el occidente de nuestro país, en el municipio de Ahuachapán, y profundizamos sobre la relación de las variables de la Encuesta de Hogares de Propósitos Múltiples para ampliar el estudio de este y evaluar su representatividad.

Es importante retomar un estudio general y poder llevarlo hasta la parte mas especifica de una investigación, nuestro trabajo permitiría mostrar la conexión existente y los cambios entre los factores que alteran una decisión, en este caso una decisión de consumo.

Dejamos de lado el conocimiento empírico de la sociedad y comprobamos las consecuencias existentes de aumentar el tamaño de una familia y su impacto a las necesidades básicas, por ejemplo, esa relación detallada es nuestro propósito de estudio.

Estamos seguros de que muchas familias desconocen sus gastos y la importancia de planificar sus ingresos, este ejercicio estadístico es necesario para ordenar, estimar, proponer y proyectar un orden en nuestro estudio.

3. OBJETIVOS

General:

• Desarrollar un caso practico con datos reales utilizando RStudio como programa estadístico para predecir fenómenos diversos, cuantificar la relación entre sus variables y realizar conclusiones sobre el comportamiento de consumo de las familias en Ahuachapán.

Específicos:

• Estimar un modelo de regresión lineal múltiple con nuestra base de datos identificando en ellas variables con relación y coherencia para formular pronosticos y parametros de importancia.

• Interpretar los resultados de los supuestos de nuestro modelo aplicando nuestros conocimientos estudiados en clase.

4. PLANTEAMIENTO TEORICO

De acuerdo con diversos estudios de estadísticas de ingresos y gastos de hogares, uno de los indicadores más importantes dentro del bienestar del hogar y sobre todo del bienestar económico, son los gastos, los cuales se utilizan para consumir. Es importante conocer este indicador ya que nos ayudara para determinar capacidades como ahorro y dominio de los hogares sobre los recursos. Es decir, el control y la planificación de las familias.

Estableciendo un modelo econométrico, conocemos en cuales son las áreas en las que más se invierte en términos del gasto, las familias pueden conocer como están distribuidos y así tomar decisiones sobre los aspectos que les ayuden a mantener un mejor control económico y, para las empresas es útil ya que al conocer en que gastan las familias su dinero, pueden hacer inversiones en esas áreas para obtener ganancias. Además, al tomar datos reales podemos hacer proyecciones sobre cómo será distribuido el gasto promedio mensual de las familias para nuestra muestra. Siempre, tomando en cuenta que el consumo que se efectúa de los bienes o servicios esenciales de nuestra muestra es el gasto.

Según la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) se puede establecer el Gasto de consumo “como la totalidad monetaria de mercancías comprada y los servicios pagados por los hogares” Como estos factores se pueden medir en unidades monetarias, lo que permite situar los hogares en posiciones relativas y realizar comparaciones entre los distintos niveles de bienestar de las familias lo que es fundamental en el análisis de desigualdad y disparidad en la distribución de recursos de una sociedad.

El gasto en consumo que realizan los hogares es uno de los determinantes del estilo de vida de las familias y de la riqueza que posee un hogar, está bastante relacionado con la cantidad de miembros que lo habiten. Por esta razón, es que el uso de los datos obtenidos de la EHPM 2019 es importante a la hora de evaluar la estructura que presenta la distribución en una sociedad.

Estas estadísticas son utilizadas para diferentes fines, como, por ejemplo:

• Para estudiar que cantidad de la población en el área urbana de Ahuachapán se encuentran en los niveles más bajos o altos de la distribución y medir su dispersión (desigualdad).

• También se utilizan para analizar las características de los grupos de la población correspondientes y de esta forma establecer patrones de consumo.

Las principales fuentes de datos sobre ingresos y gastos en El Salvador son la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) y la Encuesta de Hogares de Propósitos múltiples (EHPM). La EHPM presenta el detalle en diferentes rubros de gastos en alimentos, vestuario, artículos del Hogar, salud, educación y vivienda que las familias asumen mensualmente.

4.1 TEMA

COMPOSICION DEL GASTO DE LAS FAMILIAS DEL AREA URBANA DE AHUACHAPAN, DURANTE EL AÑO 2019.

Estudiantes de Economía de la Universidad de El Salvador desean conocer los principales gastos de las familias en el área urbana del municipio de Ahuachapán, departamento de Ahuachapán y para ello plantean un modelo de regresión lineal múltiple que sea capaz de explicar su planificación, control y prioridades del fenómeno en estudio.

5. ESPECIFICACION

5.1 Definición de la Variable Endógena

  • Gasto Total de los Hogares

Variable cuantitativa continua que representa el valor monetario de los gastos mensuales que deben hacer las familias.

El gasto de los hogares se asume en nuestra investigación como la variable endógena o dependiente y se pretende que este sea explicado a partir de exponer la relación funcional que este presenta con variables exogenas. Es decir que lo que se pretende es determinar en qué medida cada una de estas variables hacen aumentar o bien disminuir el gasto de los hogares.

5.2 Definición de las Variables Exógenas

  • Número de Miembros del Hogar

Variable cuantitativa discreta que expresa el número de personas que habitan de en la misma vivienda. Se considera solamente a las personas que viven permanentemente en la vivienda a la hora de realizar la toma de las datos de la EHPM.

  • Gasto del Hogar en Alimentación

Variable cuantitativa continua que muestra la parte del gasto mensual que las familias dedican al consumo en alimentación. Normalmente en todos los hogares la mayor parte del gasto total en consumo obedece a la compra de alimentos como es de esperar siendo esta quizá la necesidad mas básica para conservar la vida de todo ser.

  • Gasto del Hogar en Artículos y Servicios

Variable cuantitativa continua que registra la cantidad de dinero que gastan las familias en cosas que no generan un beneficio mas que el de recreación. Las familias destinan una cantidad de dinero para adquirir bienes y servicios para disfrutar su tiempo de ocio.

  • Gasto en Educación

Variable cuantitativa continua que nos muestra la cantidad en terminos monetarios del gasto de los hogares que se destina al consumo de bienes y servicios relacionados a la educación. El sistema de educación en El Salvador es gratis, para las personas que envian a sus hijos al sistema educativo publico esto de reduce la carga de gastos que deben realizar, pero no en su totalidad ya que existen costos que el sistema no cubre y es la parte que se registra en esta variable. Para el caso de las personas que envian a sus hijos al sistema educativo privado, esto significa un incremento en sus gasto por lo que la cantidad dedicada a la educación sera mayor que en el caso de los que usan la educación publica.

5.3 Relación funcional entre las variables.

  • Relación entre los gastos de las familias y el número de miembros del hogar

Existe una relación directa entre las dos variables. Una familia con 3 miembros en su hogar tienen un gasto menor que una familia con 4 miembros, ya que la presencia de una persona en un hogar implica que exisiten necesidades que deben de solventarse a través del consumo y por lo cual necesariemanete deben hacer gastos. Por lo tanto un mayor número de miembros en la familia supone un mayor nivel de gastos. Un menor número de miembros en la familia implicaría un menor nivel de gasto.

  • Relación entre los gastos de las familias y el gasto en alimentación

Existe una relación directa entre la variables. El aumento en el gasto destinado a alimentos va a la par de un aumento en el nivel total del gasto, por otra parte una disminución en el gasto en alimentos generará también una disminución en el gasto total en consumo.

  • Relación entre los gastos de las familias y gasto en artículos y servicios

En los tiempos de ocio, las familias generalmente deciden gastar dinero en bienes y servicios para distraerse o pasar un tiempo de recreacion. Este gasto que se realiza aumenta el gasto total de las familias por lo tanto existe una relación directa.

  • Relación entre los gastos de las familias y el gasto en educación

Existe una relación directa entre los gastos y el gasto en educación. Una persona que estudia en el sector privado tiene mas gastos que una persona que estudia en el sistema de educación publico. Por lo tanto al incrementar la cantidad de dinero en educación incrementa el nivel de gasto toal.

5.4 Formulación de hipótesis

  • Hipótesis General del Modelo

El gasto total de los hogares de Ahuachapan durante el 2019 es explicado por el número de miembros del hogar, gasto del hogar en alimentación, gasto del hogar en artículos y servicios y el gasto del hogar en educación.

  • Hipótesis Especificas

Número de miembros del hogar

Hipotesis 1:

El número de miembros del hogar tiene una relacion directamente proporcional a la cantidad gastada por las familias de Ahuachapan durante el 2019.

Hipotesis 2:

Gasto en Alimentación

La cantidad mensual gastada en alimentación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

Gasto en Artículos y Servic

Hipotesis 3:

La cantidad mensual gastada en artículos y servicios por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

Gasto en Eduación

Hipotesis 4:

La cantidad mensual gastada en eduación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

5.4.1 Restricciones de las variables

Miembros de la famimlia (X1) estara restringida y debe ser mayor o igual a 2 personas (X1>=2).

Gasto en alimentación (X2) estara restringida y debe ser mayor a 0 (X2>=0).

Gasto en artículos y servicios (X3) estara restringida y debe ser mayor a 0 (X2>=0).

Gasto en educación (X4) estara restringida y debe ser mayor a 0 (X2>=0).

5.4.2 Especificación del modelo

VARIABLE ENDOGENA Y VARIABLES EXOGENAS Variable Endogena:** Gastos Totales de los Hogares(Mensuales)

Variables Exogenas: Miembros de la Familia, Gastos en Educación, Gastos en Articulos y servicios, Gastos en Alimentacion.

5.5 Especificación del modelo matemático y Estadistico

5.5.1 Especificación del modelo matemático.

Deacuerdo a las relaciones presentadas anteriormente, se muestra el modelo matemático con el cual se pretende obtener las proyecciones de los gastos de los hogares de Ahuachapan, y para describir la relacion entre las variables, por lo tanto la forma de nuestro modelo matematico queda estructurado de la siguiente manera:

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4

Donde:

Y = Gasto total de los Hogares

X1 = Número de Miembros del Hogar utilizados

X2 = Gasto en Alimentación operativos

X3 = Gasto en Artículos y Servicios

X4 = Gasto en Alimentación

Restricciones de los parámetros.

Número de miembros del hogar 0<β1<1

Gasto de los hogares en alimentación 0<β2<1

Gasto de los hogares en articulos y servicios 0<β3<1

Gasto de los hogares en educación 0<β4<1

5.5.2 Especificación del modelo estadístico.

Nuestro modelo matematico no puede realizar una descripcion lo mas parecido a la realidad debido a que suponemos que que el gasto es explicado exclusivamente por las variables exogenas descritas anteriormente.

Por esta razón, debemos introducir un margen de error en el que se incluyan todas las variables que no han sido consideradas en nuestro modelo, pero que pudieran ser parte del mismo para explicar la composición del gasto de las familias.

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 +
ε

Donde, El error incluye todas las variables omitidas dentro del análisis.

5.6 EVIDENCIA EMPIRICA DEL FENOMENO ECONOMICO

A continuacion presentamos los datos con los que se desarrolla la investigación. Nuestra base es un estracto de la base de datos de la Encuesta de Hogares de Propositos Multiples (EHPM), que fue obtenida en el sitiio web de la Dirección General de Estadística y Censos. (DIGESTYC).

Debido a la enorme cantidad de variables que contiene la encuesta solo presentamos la información que corresponde a las variables que estudiamos en esta investigación.

Con el proposito tener un mejor manejo a la hora de usar la información, los nombres de las variables se encuentran etiquetados en la base de datos de la DIGESTYC de la siguiente manera:

gastohog = Gasto total del Hogar

r021a = Número de miembros del Hogar

ghali = Gasto del Hogar en Alimentación

ghu12 = Gasto del Hogar en Artículos y Servicios

gmed = Gasto del Hogar en Educación

#Cargando la base de datos
library(haven)
Base_Corregida <- read_sav("C:/MEGA DOCS/CICLO I - 2021/ECONOMETTRIA/Base Corregida.sav")
Datos<-Base_Corregida[c(2,3,4,5,6)]
#Para mostras las primeras 5 muestras de los datos
head(Datos,n=5)
## # A tibble: 5 x 5
##   gastohog r021a ghali ghu12  gmed
##      <dbl> <dbl> <dbl> <dbl> <dbl>
## 1    110.      5  4.35  13.2  21.6
## 2    101.      3 24.6   15.2   0  
## 3     90.5     2 25.1    8.5  44.9
## 4    158.      2 31.1   93.3   0  
## 5     73.8     6 32.9   20.5  10

Utilizando la libreria dplyr

library(dplyr)
glimpse(Datos)
## Rows: 200
## Columns: 5
## $ gastohog <dbl> 110.12, 101.28, 90.48, 157.97, 73.77, 105.78, 137.47, 96.75, ~
## $ r021a    <dbl> 5, 3, 2, 2, 6, 3, 2, 4, 2, 2, 4, 3, 4, 7, 3, 3, 4, 3, 3, 4, 2~
## $ ghali    <dbl> 4.35, 24.55, 25.08, 31.14, 32.89, 36.76, 44.47, 45.10, 47.11,~
## $ ghu12    <dbl> 13.17, 15.23, 8.50, 93.33, 20.53, 31.42, 17.00, 13.25, 12.13,~
## $ gmed     <dbl> 21.6, 0.0, 44.9, 0.0, 10.0, 0.0, 30.0, 30.4, 0.0, 0.0, 40.2, ~

6 ESTIMACION

6.1 Estimación del modelo

library(stargazer)
modelo<-lm(formula = gastohog~r021a+ghali+ghu12+gmed,data = Datos)
stargazer(modelo,title="Modelo lineal de Gasto de los Hogares",type="html")
Modelo lineal de Gasto de los Hogares
Dependent variable:
gastohog
r021a -5.862
(3.753)
ghali 1.184***
(0.113)
ghu12 1.459***
(0.127)
gmed 1.297***
(0.083)
Constant 54.881***
(18.695)
Observations 200
R2 0.842
Adjusted R2 0.839
Residual Std. Error 87.874 (df = 195)
F Statistic 259.935*** (df = 4; 195)
Note: p<0.1; p<0.05; p<0.01

Con una muestra de 200 observaciones, los resultados muestran que el modelo se ajusta bastante bien a la variable real, es decir, que existe una relacion funcional entre las variables explicativas y la endogena. El coeficiente de determinacion muestra que el 80.8% de las variaciones de el gasto de las familias de Ahuachapan es explicado por el modelo. Sin tomar en cuenta la cantidad de variables.

Tomando en cuenta el numero de nuestras varibles, el coeficiente de determiacion ajustado muestra que el 80.4% de de las variaciones en el gasto de las familias es explicado por nuestro modelo

Por otra parte, odservamos que nuestras variables son significativas para un nivel de confianza del 90%, 95% y 99%. O bien para un nivel de significancia del 0.1%, 0.05% y 0.01%

6.2 Verifiacación de supuestos del MCRLM

6.2.1 Verificación del supuesto de Normalidad

Las hipotesis para la prueba son las siguientes:

Ho: los residuales del modelo siguen una distribucion normal

Ha: los residuales del modelo no siguen una distribucion normal

Regla de desicion:

Rechazar: Ho si 𝐽𝐵 ≥ 𝑉.𝐶

Rechazar: Ho si 𝑝 ≤ 𝛼

Prueba Jarque Bera (JB)

#Calculando el valor critico
VC_JB<-qchisq(p=0.05,df=2,lower.tail = FALSE)
print(VC_JB)
## [1] 5.991465
#Prueba JB usando libreria normtest
library(normtest)
JB<-jb.norm.test(modelo$residuals)
print(JB)
## 
##  Jarque-Bera test for normality
## 
## data:  modelo$residuals
## JB = 339.75, p-value < 0.00000000000000022
#Grafiacando la prueba
library(fastGraph)
shadeDist(xshade = JB$statistic,ddist = "dchisq",parm1 = 2,lower.tail = FALSE,sub=paste("VC:",VC_JB,"JB:",JB$statistic))

Interpretacion:

Como 𝐽𝐵 ≥ 𝑉.𝐶, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.

Alternativamenmte

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000000022 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

Prueba Kolmogorov Smirnov - Lilliefors

Rechazar: Ho si D ≥ 𝑉.𝐶.

Rechazar: Ho si 𝑝 ≤ 𝛼

#Prueba KS
library(nortest)
lillie.test(modelo$residuals)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  modelo$residuals
## D = 0.14589, p-value = 0.0000000000362
#Calculando valor critico
matriz_X<- model.matrix(modelo)
n_ks<-nrow(matriz_X)
VC_KS<-((0.875897)/sqrt(n_ks))
print(VC_KS)
## [1] 0.06193527

Como 0.10676 > 0.06193527, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000003 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

Prueba Shapiro - Wilk

Rechazar Ho si 𝑊𝑁 ≥ 𝑉.𝐶. Rechazar Ho si 𝑝 ≤ 𝛼

#Calculando el Valor Critico
VC_SW<-qnorm(p = 0.95)
print(VC_SW)
## [1] 1.644854
SW<-shapiro.test(modelo$residuals)
print(SW)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.83156, p-value = 0.00000000000005949
#Resultados en forma grafica
library(fastGraph)
shadeDist(xshade = 0.9413,ddist = "dnorm",parm1 = 0,parm2 = 1, lower.tail = FALSE, sub=paste("SW:",SW,"VC:",VC_SW,SW$statistic))

Como 0.83156 < 1.644854, se rechaza la hipotesis Ho.Hay evidencia que los residuales no tienen una distribucion normal.

Alternativamenmte

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000005949 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

6.2.2 Verifiación del supuesto de Multicolinealidad

Atravéz del índice de condición

Cálculo de la matriz X’X

library(stargazer)
matriz_x<-model.matrix(modelo)
matriz_xx<-t(matriz_x)%*%(matriz_x)
stargazer(matriz_xx,type = "html")
(Intercept) r021a ghali ghu12 gmed
(Intercept) 200 823 25,807.630 10,670.800 12,065.290
r021a 823 4,015 111,216.900 43,911.920 59,462.060
ghali 25,807.630 111,216.900 4,220,057.000 1,718,111.000 2,006,743.000
ghu12 10,670.800 43,911.920 1,718,111.000 1,185,274.000 826,406.900
gmed 12,065.290 59,462.060 2,006,743.000 826,406.900 2,163,404.000

Procederemos a normalizar X’X, posteriormente se obtienen sus autovalores.

# Matriz de normalización Sn.
library(stargazer)
Sn<-solve(diag(sqrt(diag(matriz_xx))))
stargazer(Sn,type = "text",title = "Matriz de Normalizacion")
## 
## Matriz de Normalizacion
## ==============================
## 0.071   0     0      0     0  
## 0     0.016   0      0     0  
## 0       0   0.0005   0     0  
## 0       0     0    0.001   0  
## 0       0     0      0   0.001
## ------------------------------
# Normalizamos X'X
XX_norm<-(Sn%*%matriz_xx)%*%Sn
stargazer(XX_norm,type = "text", title = " Matriz X'X Normalizada")
## 
## Matriz X'X Normalizada
## =============================
## 1     0.918 0.888 0.693 0.580
## 0.918   1   0.854 0.637 0.638
## 0.888 0.854   1   0.768 0.664
## 0.693 0.637 0.768   1   0.516
## 0.580 0.638 0.664 0.516   1  
## -----------------------------
# Autovalores de X'X
Lamdas<-eigen(XX_norm)$values
stargazer(Lamdas,type = "text", title = "Autovalores")
## 
## Autovalores
## =============================
## 3.889 0.514 0.412 0.117 0.068
## -----------------------------

A continuación se calcula el indice de condición.

K<-sqrt(max(Lamdas)/min(Lamdas))
print(K)
## [1] 7.546261

Un indice de condición con un valor por debajo de 20, sugiere la presencia de multicolinealidad leve en los regresores del modelo, para nuestro caso el valor de este es de 7.57 con lo cual podemos decir que para nuestro modelo la multicolinealidad no es considerada un problema.

Aplicación de la prueba de Farrar-Glaubar

Normalizamos X, calculamos R y obtenemos su determinante |R|.

# X normalizada
library(stargazer)
Zn<-scale(matriz_x[,-1])
stargazer(head(Zn,n=6),type = "text", title = "Matriz X Normalizada")
## 
## Matriz X Normalizada
## =============================
##   r021a  ghali  ghu12   gmed 
## -----------------------------
## 1 0.498  -1.865 -0.722 -0.456
## 2 -0.627 -1.563 -0.685 -0.710
## 3 -1.190 -1.555 -0.806 -0.182
## 4 -1.190 -1.464 0.719  -0.710
## 5 1.061  -1.438 -0.590 -0.593
## 6 -0.627 -1.380 -0.394 -0.710
## -----------------------------
# Obteniendo R
n.<-nrow(Zn)
R.<-(t(Zn)%*%Zn)*(1/(n.-1))
stargazer(R.,type = "text",digits = 4,title = "Matriz R")
## 
## Matriz R
## =================================
##       r021a  ghali  ghu12   gmed 
## ---------------------------------
## r021a   1    0.2122 0.0001 0.3267
## ghali 0.2122   1    0.4608 0.3980
## ghu12 0.0001 0.4608   1    0.1943
## gmed  0.3267 0.3980 0.1943   1   
## ---------------------------------
# Calculamos |R|
determinante_R.<-det(R.)
stargazer(determinante_R.,type = "text",title = "Determinante de R")
## 
## Determinante de R
## =====
## 0.578
## -----

Obtenemos el estadístico de prueba de Farrar-Glaubar.

# Obtención del estadistico de prueba
m.<-ncol(matriz_x[,-1])
n.<-nrow(matriz_x[,-1])
Chi_FG<--(n.-1-(2*m.+5)/6)*log(determinante_R.)
print(Chi_FG)
## [1] 107.8611

Obtenemos el valor critico.

gl<-m.*(m.-1)/2
Vc<-qchisq(p=0.95,df=gl)
print(Vc)
## [1] 12.59159

Estos resultados nos sugieren que debemos de rechazar la hipótesis nula, y considerar la existencia de evidencias en favor de la presencia de cierto grado de multicolinealidad en los regresores del modelo ya que el estadistico de prueba es mayor al valor critico.

Presentación de los resultados

library(fastGraph)
shadeDist(xshade = Chi_FG, ddist = "dchisq", parm1 = gl, lower.tail = FALSE, sub =paste("VC", Vc, "FG",Chi_FG ),col = c("blue","orange"))

OBTENCION DE LOS FACTORES INFLACIONARIOS DE LA VARIANZA (VIF).

Calculo y Presentación Gráfica para los VIF’s del modelo.

library(mctest)
mc.plot(modelo,vif = 5.1)

Nuestro modelo nos brindo un coeficiente de determinacion ajustado de 0.844 (84.4%), por lo tanto los VIFS permitidos por nuestro modelo es de 5.1 (VIFS= 1/(1-R2))

Los VIFS obtenidos muestran que para el nuermo de miembros del hogar la varianza es 1.146 de la que se esperaria en ausencia de colinealidad. Para el gasto de las familias en alimentacion la varianza es 1.48 de la esperada en ausencia de colinealidad. Para el gasto en articulos y servicios la varianza es 1.289 de la esperada en ausencia de colinealidad. Y para el gasto en educacion la varianza es 1.285 de la esperada en ausencia de colinealidad

6.2.3 Verificación del supuesto de Heterocedasticidad

Hipotesis:

Ho: Hay evidencia de que la varianza de los residuos es Homocedastica

Ha: Hay evidencia de que la varianza de los residuos es Heterocedastica

Criterio de decisión:

Rechazar H0 sí LMW ≥ VC

Rechazar H0 sí Pvalue ≤ α

IMPLEMENTAMOS LA PRUEBA DE WHITE PARA DETECION DE HETEROCEDASTICIDAD EN LOS RESIDUOS.

Data_gastos<-Datos
names(Data_gastos)<-c("Y","X1","X2","X3","X4")

Prueba de White

library(lmtest)
options(scipen = 99999)
prueba_White<-bptest(modelo,~I(X1^2)+I(X2^2)+I(X3^2)+I(X4^2)+X1*X2+X1*X3+X1*X4+X2*X3+X2*X4+X3*X4,data = Data_gastos)
print(prueba_White)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 24.513, df = 14, p-value = 0.03969

Se rechaza la Hiótesis nula ya que hemos obtenido un valor p (0.03969) menor que el nivel de significancia (0.05), esto sugiere que existen evidencias en favor de la presencia de heterocedasticidad en la distribución de los residuos del modelo.

Presentacion gráfica de los resultados

library(fastGraph)
gl<-14
vc<-qchisq(p=0.95,df=gl)
shadeDist(xshade = prueba_White$statistic,ddist = "dchisq",parm1 =gl,lower.tail = FALSE,sub=paste("vc",vc,"W",prueba_White$statistic ))

6.2.4 Verificación del supuesto de Autocorrelación

Hipotesis de las pruebas:

Ho: No hay evidencia de autocorrelacion en los residuos del modelo

Ha: Hay evidencia de autocorrelacion en los residuos del modelo

Prueba Durbin Watson para autocorrelación de primer orden

library(lmtest)
dwtest(modelo,alternative="two.sided",iterations=1000)
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.948, p-value = 0.6663
## alternative hypothesis: true autocorrelation is not 0
Para un nivel de significancia de 5%

Como Pvalue > 0.05. Se puede rechazar la presencia de autocorrelacion de primer orden.

Pruebas de orden superior

Criterio de decisión:

Rechazar H0 si LMBG > V.C

Alternativamente:

Rechazar H0 si pvalue ≤ α

Pruebas de multiplicador de Lagrange de primer orden

library(lmtest)
prueba_ml1<-bgtest(modelo,order = 1)
Prueba_1<-cbind(prueba_ml1$statistic,prueba_ml1$p.value)%>%as.data.frame(row.names = "Prueba Breusch Godfrey - Primer orden")
names(Prueba_1)<-c("BG","P-Value")
stargazer(Prueba_1,title = "Prueba Breusch Godfrey - Primer Orden",type = "html",digits = 6,summary = FALSE)
Prueba Breusch Godfrey - Primer Orden
BG P-Value
Prueba Breusch Godfrey - Primer orden 0.122190 0.726672

Como Pvalue > 0.05 No se rechaza Ho, por lo tanto puede concluirse que los residuos del modelo, no tienen autocorrelación de primer orden.

Pruebas de multiplicador de Lagrange de orden superior

library(lmtest)
prueba_ml2<-bgtest(modelo,order = 2)
Prueba_2<-cbind(prueba_ml2$statistic,prueba_ml2$p.value)%>%as.data.frame(row.names = "Prueba Breusch Godfrey - Orden superior")
names(Prueba_2)<-c("BG","P-Value")
stargazer(Prueba_2,title = "Prueba Breusch Godfrey - Orden superior",type = "html",digits = 6,summary = FALSE)
Prueba Breusch Godfrey - Orden superior
BG P-Value
Prueba Breusch Godfrey - Orden superior 0.466339 0.792019

Como Pvalue > 0.05 No se rechaza Ho, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden 2.

6.3 CORRECCIONES AL MODELO

En las pruebas observamos que los residuales del modelo no seguian una distribucion normal.

En nuestro caso, retomamos el Teorema del Limite Central para no modificar el modelo planteado y porder trabajar con el sin nin que las inferencias que se realicen pierdan validez. Para que la aplicación del teorema de límite central sea correcta, se debe cumplir una serie de condiciones o propiedades que aseguran su validez:

Al trabajar con muestras de tamaño grande, esto asegura que la suma de las medias muestrales sea igual a una distribución normal. Según el teorema de límite central, se considera que una muestra es grande cuando supera un número mayor a 30. Con esto, se afirma que al tener una muestra superior a 30, la distribución de la media muestral tendrá tendencia a una distribución gaussiana. Este enunciado es válido para cualquier tipo de distribución con la que se trabaje.

En nuestro caso, trabajamos con una muestra de 200 observaciones, por lo tanto consideramos que se cumple este supuesto y los residuales del modelo siguen una distribucion normal

Estimadores Consistentes ante Heterocedasticidad y Autocorrelacion.

En la prueba de White que vimos anteriormente podemos notar evidencia de Heterocedasticidad ya que PValue<0.05 Mientras que la prueba Breusch Godfrey no encontramos evidencia de autocorrelacion ya que PValue>0.05

Estimacion Robusta

library(lmtest)
library(sandwich)
#Sin corregir:

coeftest(modelo)
## 
## t test of coefficients:
## 
##              Estimate Std. Error t value             Pr(>|t|)    
## (Intercept) 54.880765  18.695360  2.9355              0.00373 ** 
## r021a       -5.862420   3.753406 -1.5619              0.11993    
## ghali        1.183754   0.113318 10.4463 < 0.0000000000000002 ***
## ghu12        1.459299   0.127103 11.4812 < 0.0000000000000002 ***
## gmed         1.297172   0.083124 15.6052 < 0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ante presencia de heterocedasticidad no podemos confiar en los resultados de esta hipotesis.

#Corregido:
options(scipen = 999999)
library(lmtest)
library(sandwich)

estimacion_omega<-vcovHC(modelo,type = "HC0")
coeftest(modelo,vcov. = estimacion_omega)
## 
## t test of coefficients:
## 
##             Estimate Std. Error t value              Pr(>|t|)    
## (Intercept) 54.88077   15.92573  3.4460             0.0006966 ***
## r021a       -5.86242    3.19028 -1.8376             0.0676452 .  
## ghali        1.18375    0.11112 10.6528 < 0.00000000000000022 ***
## ghu12        1.45930    0.25412  5.7426         0.00000003532 ***
## gmed         1.29717    0.10735 12.0834 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Matriz de varianza no escalar a traves de la libreria Sandwich. Utilizamos HC0 debido a qué lo unico que interesa es corregir la Heterocedasticidad, ya que el modelo no presenta autocorrelación de primer orden ni de segundo orden.

options(scipen = 999999)
library(robustbase)
library(stargazer)
modelo_robust<-lmrob(gastohog~r021a+ghali+ghu12+gmed,data = Datos)
stargazer(modelo, modelo_robust,type = "text",title = "Tabla Comparativa", column.labels = c("Modelo Original", "Modelo Corregido"))
## 
## Tabla Comparativa
## ========================================================================
##                                           Dependent variable:           
##                                -----------------------------------------
##                                                gastohog                 
##                                          OLS                MM-type     
##                                                              linear     
##                                    Modelo Original      Modelo Corregido
##                                          (1)                  (2)       
## ------------------------------------------------------------------------
## r021a                                   -5.862               -0.754     
##                                        (3.753)              (1.970)     
##                                                                         
## ghali                                  1.184***             1.085***    
##                                        (0.113)              (0.067)     
##                                                                         
## ghu12                                  1.459***             1.714***    
##                                        (0.127)              (0.132)     
##                                                                         
## gmed                                   1.297***             1.108***    
##                                        (0.083)              (0.079)     
##                                                                         
## Constant                              54.881***             21.762**    
##                                        (18.695)             (9.721)     
##                                                                         
## ------------------------------------------------------------------------
## Observations                             200                  200       
## R2                                      0.842                0.923      
## Adjusted R2                             0.839                0.922      
## Residual Std. Error (df = 195)          87.874               46.440     
## F Statistic                    259.935*** (df = 4; 195)                 
## ========================================================================
## Note:                                        *p<0.1; **p<0.05; ***p<0.01

Con el nuevo modelo robusto, ahora se puede hacer inferencias con validez, asi como tambien simulaciones y pronosticos.

6.4 PRUEBAS DE HIPOTESIS

Para las pruebas de hipótesis se ha utilizado un 95% de confianza con un nivel de significancia del 0.05 % para 200 observaciones. Con un grado de libertad de 199 (observaciones - 1) y un área de cola inferior de 0.025 (0.05/2), en zona de no rechazo del hipótesis nula, con límite superior de 1.96 y límite inferior de -1.96. Las pruebas se han realizado con la distribucion t-Student

Las hipotesis son las siguientes:

Ho: La variable explicativa tiene una relacion lineal con la variable dependiente

Ha: La variable explicativa no tiene una relacion lineal con la variable dependiente

Para la prueba de hipótesis la regla de decisión es:

Ho: Si el parámetro es igual a cero, se rechaza Ho.

HI: Si el parámetro es diferente de cero, no se rechaza Ho.

Hipotesis 1:

El número de miembros del hogar tiene una relacion directamente proporcional a la cantidad gastada por las familias de Ahuachapan durante el 2019.

library(stargazer)
Hipotesis_1<-t.test(Datos$gastohog, Datos$r021a)
H1<-cbind(Hipotesis_1$statistic)%>%as.data.frame(row.names = "Resultado")
names(H1)<-c("Miembros del Hogar - Gasto Total")
stargazer(H1, title= "Prueba t- Hipotesis 1", type = "html", summary = FALSE, digits = 5)
Prueba t- Hipotesis 1
Miembros del Hogar - Gasto Total
Resultado 21.67591

El resultado de la prueba t arroja un parametro de 21.67591, lo que nos indica que existe una relación positiva entre el número de miembros del hogar y el gasto total de los hogares del casco urbano del municipio de Ahuachapan, durante el 2019. Se rechaza la hipotesis nula, existe una relacion lineal entre las variables.

Hipotesis 2:

La cantidad mensual gastada en alimentación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

library(stargazer)
Hipotesis_2<-t.test(Datos$gastohog, Datos$ghali)
H2<-cbind(Hipotesis_2$statistic)%>%as.data.frame(row.names = "Resultado")
names(H2)<-c("Gasto del Hogar en Alimentacion - Gasto Total")
stargazer(H2, title= "Prueba t- Hipotesis 2", type = "html", summary = FALSE, digits = 5)
Prueba t- Hipotesis 2
Gasto del Hogar en Alimentacion - Gasto Total
Resultado 13.01178

El resultado de la prueba t arroja un parametro de 13.01178, lo que nos indica que existe una relación positiva entre el gasto del hogar en alimentacion y el gasto total de los hogares del casco urbano del municipio de Ahuachapan, durante el 2019. Se rechaza la hipotesis nula, existe una relacion lineal entre las variables.

Hipotesis 3:

La cantidad mensual gastada en artículos y servicios por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

library(stargazer)
Hipotesis_3<-t.test(Datos$gastohog, Datos$ghu12)
H3<-cbind(Hipotesis_3$statistic)%>%as.data.frame(row.names = "Resultado")
names(H3)<-c("Gasto en Articulos y Servicios - Gasto Total")
stargazer(H3, title= "Prueba t- Hipotesis 3", type = "html", summary = FALSE, digits = 5)
Prueba t- Hipotesis 3
Gasto en Articulos y Servicios - Gasto Total
Resultado 17.92539

El resultado de la prueba t arroja un parametro de 17.92539, lo que nos indica que existe una relación positiva entre el gasto en articulos y servicios y el gasto total de los hogares del casco urbano del municipio de Ahuachapan, durante el 2019. Se rechaza la hipotesis nula, existe una relacion lineal entre las variables.

Hipotesis 4:

La cantidad mensual gastada en eduación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

library(stargazer)
Hipotesis_4<-t.test(Datos$gastohog, Datos$gmed)
H4<-cbind(Hipotesis_4$statistic)%>%as.data.frame(row.names = "Resultado")
names(H4)<-c("Gasto en Educación - Gasto Total")
stargazer(H4, title= "Prueba t- Hipotesis 4", type = "html", summary = FALSE, digits = 5)
Prueba t- Hipotesis 4
Gasto en Educación - Gasto Total
Resultado 16.82279

El resultado de la prueba t arroja un parametro de 16.82279, lo que nos indica que existe una relación positiva entre el gasto del hogar en alimentacion y el gasto total de los hogares del casco urbano del municipio de Ahuachapan, durante el 2019. Se rechaza la hipotesis nula, existe una relacion lineal entre las variables.

6.5 ANALISIS DE SIMULACION

Definición funciones para el cálculo de Theil

#Bias Proportion
Um<-function(pronosticado,observado){
  library(DescTools)
  ((mean(pronosticado)-mean(observado))^2)/MSE(pronosticado,observado) 
}
#Variance Proportion
Us<-function(pronosticado,observado){
  library(DescTools)
  ((sd(pronosticado)-sd(observado))^2)/MSE(pronosticado,observado)
}
#Covariance Proportion
Uc<-function(pronosticado,observado){
  library(DescTools)
  (2*(1-cor(pronosticado,observado))*sd(pronosticado)*sd(observado))/MSE(pronosticado,observado)}
#Coeficiente U de Theil (también aparece en la librería "DescTools")
THEIL_U<-function(pronosticado,observado){
   library(DescTools)
  RMSE(pronosticado,observado)/(sqrt(mean(pronosticado^2))+sqrt(mean(observado^2)))
}

Scrip de Simulación

options(scipen = 999999) #No mostrar notación cientifica.
library(robustbase) #Para usar el modelo robusto
library(dplyr) # Para manejo de datos y activar el operador "pipe" %>%
library(caret) # Permite Realizar muestreo sobre los data frame
library(DescTools) # Contiene las funciones para calcular las medidas de performance
library(stargazer) # Para dar formato, y obtener resumen estadistico de las simulaciones
set.seed(100) # Permite fijar la semilla aleatoria, para reproducir los resultados obtenidos en esta clase
numero_de_muestras<-1000 
# Numero de muestras que se optendran del data frame
# Se crea la lista con las 10000 muestras (indica la posición de la fila en cada data frame)
muestras<-Datos$gastohog %>%
  createDataPartition(p = 0.8,
                      times = numero_de_muestras,
                      list = TRUE)
# Listas vacias, que contendran los datos de entrenamiento, los pronosticos para los datos de prueba, y para las estadisticas de cada muestra
Modelos_Entrenamiento<-vector(mode = "list",
                              length = numero_de_muestras)
Pronostico_Prueba<-vector(mode = "list",
                              length = numero_de_muestras)
Resultados_Performance_data_entrenamiento<-vector(mode = "list",
                              length = numero_de_muestras)
Resultados_Performance<-vector(mode = "list",
                              length = numero_de_muestras)
#Estimación de los modelos lineales para cada muestra, los pronósticos y cálculo de las estadisticas de performance.
for(j in 1:numero_de_muestras){
Datos_Entrenamiento<- Datos[muestras[[j]], ]
Datos_Prueba<- Datos[-muestras[[j]], ]
Modelos_Entrenamiento[[j]]<-lmrob(formula = gastohog~.,data=Datos_Entrenamiento)
Pronostico_Prueba[[j]]<-Modelos_Entrenamiento[[j]] %>% predict(Datos_Prueba)
Resultados_Performance_data_entrenamiento[[j]]<-data.frame( 
            R2 = R2(Modelos_Entrenamiento[[j]]$fitted.values,
                    Datos_Entrenamiento$gastohog),
            RMSE = RMSE(Modelos_Entrenamiento[[j]]$fitted.values,
                        Datos_Entrenamiento$gastohog),
            MAE = MAE(Modelos_Entrenamiento[[j]]$fitted.values,
                      Datos_Entrenamiento$gastohog),
            MAPE= MAPE(Modelos_Entrenamiento[[j]]$fitted.values,
                       Datos_Entrenamiento$gastohog)*100,
            THEIL=TheilU(Modelos_Entrenamiento[[j]]$fitted.values,
                         Datos_Entrenamiento$gastohog,type = 1),
            Um=Um(Modelos_Entrenamiento[[j]]$fitted.values,
                         Datos_Entrenamiento$gastohog),
            Us=Us(Modelos_Entrenamiento[[j]]$fitted.values,
                         Datos_Entrenamiento$gastohog),
            Uc=Uc(Modelos_Entrenamiento[[j]]$fitted.values,
                         Datos_Entrenamiento$gastohog)
            )
Resultados_Performance[[j]]<-data.frame( 
            R2 = R2(Pronostico_Prueba[[j]], Datos_Prueba$gastohog),
            RMSE = RMSE(Pronostico_Prueba[[j]], Datos_Prueba$gastohog),
            MAE = MAE(Pronostico_Prueba[[j]], Datos_Prueba$gastohog),
            MAPE= MAPE(Pronostico_Prueba[[j]], Datos_Prueba$gastohog)*100,
            THEIL=TheilU(Pronostico_Prueba[[j]], Datos_Prueba$gastohog,
                         type = 1), # También se puede usar la función que creamos: THEIL_U
            Um=Um(Pronostico_Prueba[[j]], Datos_Prueba$gastohog),
            Us=Us(Pronostico_Prueba[[j]], Datos_Prueba$gastohog),
            Uc=Uc(Pronostico_Prueba[[j]], Datos_Prueba$gastohog)
            )
} 
#Nota: usamos una muestra de 1,000 debido a la capacidad de nuestros equipos de computo.

Resultados de la Simulacion

bind_rows(Resultados_Performance_data_entrenamiento) %>% 
  stargazer(title = "Medidas de Performance Datos del Modelo",
            type = "html",
            digits = 3)
Medidas de Performance Datos del Modelo
Statistic N Mean St. Dev. Min Pctl(25) Pctl(75) Max
R2 1,000 0.838 0.015 0.787 0.829 0.848 0.887
RMSE 1,000 91.477 4.519 75.849 88.578 94.809 101.276
MAE 1,000 56.308 2.158 48.081 54.832 57.833 62.624
MAPE 1,000 16.211 0.585 14.438 15.810 16.592 17.827
THEIL 1,000 0.118 0.006 0.095 0.115 0.122 0.134
Um 1,000 0.066 0.015 0.028 0.054 0.077 0.106
Us 1,000 0.095 0.055 0.005 0.042 0.148 0.211
Uc 1,000 0.844 0.068 0.703 0.782 0.910 0.969
bind_rows(Resultados_Performance) %>% 
  stargazer(title = "Medidas de Performance Simulación",
            type = "html",
            digits = 3)
Medidas de Performance Simulación
Statistic N Mean St. Dev. Min Pctl(25) Pctl(75) Max
R2 1,000 0.835 0.061 0.624 0.800 0.882 0.956
RMSE 1,000 93.390 17.039 48.475 81.179 106.191 140.300
MAE 1,000 59.354 8.499 37.103 53.488 65.107 92.593
MAPE 1,000 16.821 1.663 11.859 15.683 17.936 22.747
THEIL 1,000 0.121 0.022 0.060 0.105 0.136 0.191
Um 1,000 0.072 0.054 0.000 0.025 0.110 0.264
Us 1,000 0.165 0.131 0.00000 0.040 0.258 0.549
Uc 1,000 0.787 0.166 0.282 0.658 0.938 1.025

Con los resultado obtenido podemos afirmar que:

Para el coeficiente de determinacion R2: Con una muestra de 1,000 observaciones para la simulación, el 95.6% de la varianza de la variable endogena (gasto de las familias) es explicado por la variaciones del modelo, como maximo. Como minimo, el 62.4% de la varianza de la varible endogena es explicada por las variaciones del modelo. Y en promedio el 83.5% de la varianza de la variable endogena es explicada por las variaciones del modelo.

Para el Error Promedio que Comete el modelo al Pronosticar (Indicador MAPE): Los resultados muestran que en promedio el modelo se equivoca 16.82% de la veces al realizar pronosticos, el error minimo de prediccion es de 11.56%, mientras que el error maximo esperado a la hora de predecir es de 22.75%.

El coeficiente de sesgo Um: se espera que este coeficiente sea menor a 0.1. Para nuestro caso el coeficiente es de o.072 en promedio, esto indica que el sesgo de los pronosticos en comparacion con los datos reales se mantiene estable a pesar de tener un error porcentual promedio de 16.82%.

Coeficiente de Varianza Us: se espera que sea menor a 0.1. En este caso el coeficiente es de 0.165, esto muestra que la volatilidad real no es tan emulada por la volatilidad generada en el pronostico de nuestro modelo.

Coeficiente de covarianza Uc: se espera que sea igual o mayor a 0.8. En nuestro caso es de 0.787, esto indica que en promedio los pronosticos guardan una alta correlacion con los valores reales, esto debido a que el coeficiente es muy cercano a 0.8

En promedio el modelo presenta una buena capacidad predictiva.

7 PROYECCIONES

library(stargazer)
#Data para la predicción X'm
X_m<-data.frame(r021a= 3, ghali=100, ghu12=50, gmed=70)
# Intervalos de Confianza del 90%
confidense<-c(0.95,0.99)
#Predicción usando predict
predict(object = modelo_robust,
        newdata = X_m,
           interval = "prediction",
           level = confidense,
          se.fit =TRUE)->predicciones
rownames(predicciones$fit)<-as.character(confidense*100)
colnames(predicciones$fit)<-c("GP","GMIN","GMAX")
stargazer(predicciones$fit,
          title = "Pronósticos e intervalos de confianza",
          type = "html")
Pronósticos e intervalos de confianza
GP GMIN GMAX
95 291.259 198.866 383.651
99 291.259 169.396 413.122

Podemos interpretar con el anterior modelo que:

Para un nivel de confianza de 95%:

Una familia que en promedio cuente con 3 integrantes y con gastos de $100 en alimentacion, $50.00 en articulos de hogar y en $70.00 en educacion, para mantener una vida con las condiciones promedio y que se puedan desarrollar deberian de tener un Gasto Promedio de $291.26, como gasto minimo minimo $198.87 y gastando un maximo de $383.65 mensualmente y asi cubrir el gasto total del hogar para su familia.

Para un nivel de confianza del 99%:

Para una familia en promedio con 3 integrantes y con gastos de $100 en alimentacion, $50.00 en articulos de hogar y en $70.00 en educacion, para mantener una vida con las condiciones promedio y que se puedan desarrollar deberian de tener un Gasto Promedio de $291.26, como minimo $169.40 y gastando maximo $413.12 mensualmente y asi cubrir el gasto total del hogar para su familia.

8 CONLUSIONES

Finalizando nuestro modelo de analisis de la composicion del gasto de las familias en el area urbana de ahuachapan tomando como fuente de datos la Encuesta De Hogares de Propositos Multiples, concluimos lo siguiente:

• Modelamos un fenómeno económico y analizamos sus partes detallando la importancia de ellas para nuestro estudio.

• Planteamos la teoría de investigación con el objetivo y fin de análisis del tema que nos diera los suficientes argumentos para llevar a cabo la aplicación del Modelo Clásico de Regresión Lineal múltiple.

• Representamos los valores monetarios de nuestras variables lo que nos permitió situar los hogares de Ahuachapan en posiciones relativas y realizar comparaciones entre los distintos niveles de bienestar de las familias.

• Conocimos cuales son las áreas en las que mas se invierte en términos del gasto y de esta manera podemos simular la distribución en la familia para mejorar y potenciar la toma de decisiones económicas en el hogar.

• Que el gasto de las familias de la zona urbana de Ahuachapan se distribuye en: gastos de alimentacion principalmente, gastos de educacion, gastos en articulos y servicios.

• En el modelo presenta una buena capacidad predictiva, para determinar el gasto de las familias de la zona urbana de Ahuachapan.

• Con las proyecciones realizadas se concluye que en promedio las familias gastarian mensualmente $291.26, tendrian un gasto minimo de $198.87 y un maximo de $383.65, para cubrir el gasto total de los hogares del casco urbano del muncicipio de Ahuachapan.

7 BIBLIOGRAFIA

DIRECCION GENERAL DE ESTADISTICA Y CENSOS. (16 de abril de 2021). DIGESTYC. Obtenido de http://aplicaciones.digestyc.gob.sv/Repositorio_archivos/

MANUAL DE R (12 de marzo de 2021) FREDDY HERNANDEZ. Obtenido de https://fhernanb.github.io/Manual-de-R/

FUSADES-UNICEF. (Diciembre de 2015) UNA MIRADA A LAS FAMILIAS SALVADOREÑAS. Obtenido de https://www.unicef.org/elsalvador/media/1116/file/Familias%20Compressed.pdf