UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS ECONÓMICAS

ESCUELA DE ECONOMÍA

ECONOMETRÍA


“COMPOSICION DEL GASTO DE LAS FAMILIAS DEL AREA URBANA DE AHUACHAPAN, DURANTE EL AÑO 2019”


TEMA DE INVESTIGACION

INTEGRANTES:

ARIAS MONTERROZA, JUAN JOSE                AM19005

HERNANDEZ ROMERO, ALAN ERNESTO               HR15033

ZELAYA RIVAS, SAUL SALOMON                              ZR18011

MSF. CARLOS ADEMIR PÉREZ ALAS

GRUPO: 2-5

CIUDAD UNIVERSITARIA, MAYO DE 2021

1. INTRODUCCION

La familia como base de la sociedad es donde se empiezan a formar patrones y costumbres, es el lugar donde se aprende, y continúa reforzándose por años los conocimientos adquiridos. Como entidad, las familias son la unidad de mayor consumo de una sociedad. Por ello, el consumo de nuestro agente económico: La familia, es nuestro fundamento para iniciar este estudio. El presente trabajo muestra un análisis estadístico y matemático del comportamiento, tendencia y prioridades de la familia salvadoreña específicamente del municipio de Ahuachapán departamento de Ahuachapán. En esta investigación aplicamos nuestro conocimiento en econometría por medio de la herramienta y el lenguaje de programación de R, un entorno de desarrollo integrado que nos permitirá como estudiantes estimar acciones, predecir acontecimientos y medir el impacto de las variables sobre las decisiones de consumo de nuestro agente en estudio. Tomamos como base de datos la Encuesta de Hogares de Propósitos Múltiples (EHPM) del año 2019 con una muestra considerable de 200 observaciones y 5 variables, 1 endógena y 5 exógenas con el fin de entender la realidad por medio de supuestos de nuestro modelo econométrico. También vemos necesario aclarar en nuestro apartado teórico los objetivos con los cuales realizamos esta investigación, las razones o justificaciones y las descripciones de todas las variables y la relación entre ellas para que el lector comprenda el contexto de la información. Cada verificación cuenta con su cálculo y explicación teórica de la misma, respaldando con gráficos las operaciones que ameritan su representación. A seguir, la bibliografía con la referencia de nuestros datos de estudio.

2.JUSTIFICACION

Nuestro proyecto se enfocará en estudiar las necesidades de consumo de las familias en el occidente de nuestro país, en el municipio de Ahuachapán, y profundizamos sobre la relación de las variables de la Encuesta de Hogares de Propósitos Múltiples para ampliar el estudio de este y evaluar su representatividad. Es importante retomar un estudio general y poder llevarlo hasta la parte mas especifica de una investigación, nuestro trabajo permitiría mostrar la conexión existente y los cambios entre los factores que alteran una decisión, en este caso una decisión de consumo. Dejamos de lado el conocimiento empírico de la sociedad y comprobamos las consecuencias existentes de aumentar el tamaño de una familia y su impacto a las necesidades básicas, por ejemplo, esa relación detallada es nuestro propósito de estudio. Estamos seguros de que muchas familias desconocen sus gastos y la importancia de planificar sus ingresos, este ejercicio estadístico es necesario para ordenar, estimar, proponer y proyectar un orden en nuestro estudio

3. OBJETIVOS

General:

• Desarrollar un caso practico con datos reales utilizando RStudio como programa estadístico para predecir fenómenos diversos, cuantificar la relación entre sus variables y realizar conclusiones sobre el comportamiento de consumo de las familias en Ahuachapán.

Específicos:

• Estimar un modelo de regresión lineal múltiple con nuestra base de datos identificando en ellas variables con relación y coherencia para formular pronosticos y parametros de importancia.

• Interpretar los resultados de los supuestos de nuestro modelo aplicando nuestros conocimientos estudiados en clase.

4. PLANTEAMIENTO TEORICO

De acuerdo con diversos estudios de estadísticas de ingresos y gastos de hogares, uno de los indicadores más importantes dentro del bienestar del hogar y sobre todo del bienestar económico, son los gastos, los cuales se utilizan para consumir. Es importante conocer este indicador ya que nos ayudara para determinar capacidades como ahorro y dominio de los hogares sobre los recursos. Es decir, el control y la planificación de las familias.

Estableciendo un modelo econométrico, conocemos en cuales son las áreas en las que más se invierte en términos del gasto, las familias pueden conocer como están distribuidos y así tomar decisiones sobre los aspectos que les ayuden a mantener un mejor control económico y, para las empresas es útil ya que al conocer en que gastan las familias su dinero, pueden hacer inversiones en esas áreas para obtener ganancias. Además, al tomar datos reales podemos hacer proyecciones sobre cómo será distribuido el gasto promedio mensual de las familias para nuestra muestra. Siempre, tomando en cuenta que el consumo que se efectúa de los bienes o servicios esenciales de nuestra muestra es el gasto.

Según la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) se puede establecer el Gasto de consumo “como la totalidad monetaria de mercancías comprada y los servicios pagados por los hogares” Como estos factores se pueden medir en unidades monetarias, lo que permite situar los hogares en posiciones relativas y realizar comparaciones entre los distintos niveles de bienestar de las familias lo que es fundamental en el análisis de desigualdad y disparidad en la distribución de recursos de una sociedad.

El gasto en consumo que realizan los hogares es uno de los determinantes del estilo de vida de las familias y de la riqueza que posee un hogar, está bastante relacionado con la cantidad de miembros que lo habiten. Por esta razón, es que el uso de los datos obtenidos de la EHPM 2019 es importante a la hora de evaluar la estructura que presenta la distribución en una sociedad. Estas estadísticas son utilizadas para diferentes fines, como, por ejemplo:

Estas estadísticas son utilizadas para diferentes fines, como, por ejemplo:

• Para estudiar que cantidad de la población en el área urbana de Ahuachapán se encuentran en los niveles más bajos o altos de la distribución y medir su dispersión (desigualdad).

• También se utilizan para analizar las características de los grupos de la población correspondientes y de esta forma establecer patrones de consumo.

Las principales fuentes de datos sobre ingresos y gastos en El Salvador son la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) y la Encuesta de Hogares de Propósitos múltiples (EHPM). La EHPM presenta el detalle en diferentes rubros de gastos en alimentos, vestuario, artículos del Hogar, salud, educación y vivienda que las familias asumen mensualmente.

4.1 TEMA

COMPOSICION DEL GASTO DE LAS FAMILIAS DEL AREA URBANA DE AHUACHAPAN, DURANTE EL AÑO 2019.

Estudiantes de Economía de la Universidad de El Salvador desean conocer los principales gastos de las familias en el área urbana del municipio de Ahuachapán, departamento de Ahuachapán y para ello plantean un modelo de regresión lineal múltiple que sea capaz de explicar su planificación, control y prioridades del fenómeno en estudio.

5. ESPECIFICACION

5.1 Definición de la Variable Endógena

  • Gasto Total de los Hogares

Variable cuantitativa continua que representa el valor monetario de los gastos mensuales que deben hacer las familias. El gasto de los hogares se asume en nuestra investigación como la variable endógena o dependiente y se pretende que este sea explicado a partir de exponer la relación funcional que este presenta con variables exogenas. Es decir que lo que se pretende es determinar en qué medida cada una de estas variables hacen aumentar o bien disminuir el gasto de los hogares.

5.2 Definición de las Variables Exógenas

  • Número de Miembros del Hogar

Variable cuantitativa discreta que expresa el número de personas que habitan de en la misma vivienda. Se considera solamente a las personas que viven permanentemente en la vivienda a la hora de realizar la toma de las datos de la EHPM.

  • Gasto del Hogar en Alimentación

Variable cuantitativa continua que muestra la parte del gasto mensual que las familias dedican al consumo en alimentación. Normalmente en todos los hogares la mayor parte del gasto total en consumo obedece a la compra de alimentos como es de esperar siendo esta quizá la necesidad mas básica para conservar la vida de todo ser.

  • Gasto del Hogar en Artículos y Servicios

Variable cuantitativa continua que registra la cantidad de dinero que gastan las familias en cosas que no generan un beneficio mas que el de recreación. Las familias destinan una cantidad de dinero para adquirir bienes y servicios para disfrutar su tiempo de ocio.

  • Gasto en Educación

Variable cuantitativa continua que nos muestra la cantidad en terminos monetarios del gasto de los hogares que se destina al consumo de bienes y servicios relacionados a la educación. El sistema de educación en El Salvador es gratis, para las personas que envian a sus hijos al sistema educativo publico esto de reduce la carga de gastos que deben realizar, pero no en su totalidad ya que existen costos que el sistema no cubre y es la parte que se registra en esta variable. Para el caso de las personas que envian a sus hijos al sistema educativo privado, esto significa un incremento en sus gasto por lo que la cantidad dedicada a la educación sera mayor que en el caso de los que usan la educación publica.

5.3 Relación funcional entre las variables.

  • Relación entre los gastos de las familias y el número de miembros del hogar

Existe una relación directa entre las dos variables. Una familia con 3 miembros en su hogar tienen un gasto menor que una familia con 4 miembros, ya que la presencia de una persona en un hogar implica que exisiten necesidades que deben de solventarse a través del consumo y por lo cual necesariemanete deben hacer gastos. Por lo tanto un mayor número de miembros en la familia supone un mayor nivel de gastos. Un menor número de miembros en la familia implicaría un menor nivel de gasto.

  • Relación entre los gastos de las familias y el gasto en alimentación

Existe una relación directa entre la variables. El aumento en el gasto destinado a alimentos va a la par de un aumento en el nivel total del gasto, por otra parte una disminución en el gasto en alimentos generará también una disminución en el gasto total en consumo.

  • Relación entre los gastos de las familias y gasto en artículos y servicios

En los tiempos de ocio, las familias generalmente deciden gastar dinero en bienes y servicios para distraerse o pasar un tiempo de recreacion. Este gasto que se realiza aumenta el gasto total de las familias por lo tanto existe una relación directa.

  • Relación entre los gastos de las familias y el gasto en educación

Existe una relación directa entre los gastos y el gasto en educación. Una persona que estudia en el sector privado tiene mas gastos que una persona que estudia en el sistema de educación publico. Por lo tanto al incrementar la cantidad de dinero en educación incrementa el nivel de gasto toal.

5.4 Formulación de hipótesis

  • Hipótesis General del Modelo

El gasto total de los hogares de Ahuachapan durante el 2019 es explicado por el número de miembros del hogar, gasto del hogar en alimentación, gasto del hogar en artículos y servicios y el gasto del hogar en educación.

  • Hipótesis Especificas

Número de miembros del hogar

Hipotesis 1:

El número de miembros del hogar tiene una relacion directamente proporcional a la cantidad gastada por las familias de Ahuachapan durante el 2019.

Hipotesis 2:

Gasto en Alimentación

La cantidad mensual gastada en alimentación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

Gasto en Artículos y Servic

Hipotesis 3:

La cantidad mensual gastada en artículos y servicios por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

Gasto en Eduación

Hipotesis 4:

La cantidad mensual gastada en eduación por el hogar tiene una relacion directamente proporcional a la cantidad gasto de las familias de Ahuachapan durante el 2019.

5.4.1 Restricciones de las variables

Miembros de la famimlia (X1) estara restringida y debe ser mayor o igual a 2 personas (X1>=2).

Gasto en alimentación (X2) estara restringida y debe ser mayor a 0 (X2>=0).

Gasto en artículos y servicios (X3) estara restringida y debe ser mayor a 0 (X2>=0).

Gasto en educación (X4) estara restringida y debe ser mayor a 0 (X2>=0).

5.4.2 Especificación del modelo

VARIABLE ENDOGENA Y VARIABLES EXOGENAS Variable Endogena:** Gastos Totales de los Hogares(Mensuales)

Variables Exogenas: Miembros de la Familia, Gastos en Educación, Gastos en Articulos y servicios, Gastos en Alimentacion.

5.5 Especificación del modelo matemático y Estadistico

5.5.1 Especificación del modelo matemático.

Deacuerdo a las relaciones presentadas anteriormente, se muestra el modelo matemático con el cual se pretende obtener las proyecciones de los gastos de los hogares de Ahuachapan, y para describir la relacion entre las variables, por lo tanto la forma de nuestro modelo matematico queda estructurado de la siguiente manera:

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4

Donde:

Y = Gasto total de los Hogares

X1 = Número de Miembros del Hogar utilizados

X2 = Gasto en Alimentación operativos

X3 = Gasto en Artículos y Servicios

X4 = Gasto en Alimentación

Restricciones de los parámetros.

Número de miembros del hogar 0<β1<1

Gasto de los hogares en alimentación 0<β2<1

Gasto de los hogares en articulos y servicios 0<β3<1

Gasto de los hogares en educación 0<β4<1

5.5.2 Especificación del modelo estadístico.

Nuestro modelo matematico no puede realizar una descripcion lo mas parecido a la realidad debido a que suponemos que que el gasto es explicado exclusivamente por las variables exogenas descritas anteriormente.

Por esta razón, debemos introducir un margen de error en el que se incluyan todas las variables que no han sido consideradas en nuestro modelo, pero que pudieran ser parte del mismo para explicar la composicion del gasto de las familias.

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 +
ε

Donde, El error incluye todas las variables omitidas dentro del análisis.

5.6 EVIDENCIA EMPIRICA DEL FENOMENO ECONOMICO

A continuacion presentamos los datos con los que se desarrolla la investigación. Nuestra base es un estracto de la base de datos de la Encuesta de Hogares de Propositos Multiples (EHPM), que fue obtenida en el sitiio web de la Dirección General de Estadística y Censos. (DIGESTYC).

Debido a la enorme cantidad de variables que contiene la encuesta solo presentamos la información que corresponde a las variables que estudiamos en esta investigación.

Con el proposito tener un mejor manejo a la hora de usar la información, los nombres de las variables se encuentran etiquetados en la base de datos de la DIGESTYC de la siguiente manera:

gastohog = Gasto total del Hogar

r021a = Número de miembros del Hogar

ghali = Gasto del Hogar en Alimentación

ghu12 = Gasto del Hogar en Artículos y Servicios

gmed = Gasto del Hogar en Educación

#Cargando la base de datos
library(haven)
Base_datos <- read_sav("C:/Users/Logistica4sv/Desktop/ALAN HERNANDEZ/UES 2021/ECONOMETRIA/Trabajo de investigacion/SEGUNDO AVANCE/Prueba 2/Grupo 02 Equipo 2-5.sav")
Datos<-Base_datos[c(2,3,4,5,6)]
#Para mostras las primeras 5 muestras de los datos
head(Datos,n=5)
## # A tibble: 5 x 5
##   gastohog r021a ghali ghu12  gmed
##      <dbl> <dbl> <dbl> <dbl> <dbl>
## 1    110.      5  4.35  13.2  21.6
## 2    101.      3 24.6   15.2   0  
## 3     90.5     2 25.1    8.5  44.9
## 4    158.      2 31.1   93.3   0  
## 5     73.8     6 32.9   20.5  10

Utilizando la libreria dplyr

library(dplyr)
glimpse(Datos)
## Rows: 200
## Columns: 5
## $ gastohog <dbl> 110.12, 101.28, 90.48, 157.97, 73.77, 105.78, 137.47, 96.75, ~
## $ r021a    <dbl> 5, 3, 2, 2, 6, 3, 2, 4, 2, 2, 4, 3, 4, 7, 3, 3, 4, 3, 3, 4, 2~
## $ ghali    <dbl> 4.35, 24.55, 25.08, 31.14, 32.89, 36.76, 44.47, 45.10, 47.11,~
## $ ghu12    <dbl> 13.17, 15.23, 8.50, 93.33, 20.53, 31.42, 17.00, 13.25, 12.13,~
## $ gmed     <dbl> 21.6, 0.0, 44.9, 0.0, 10.0, 0.0, 30.0, 30.4, 0.0, 0.0, 40.2, ~

6 Estimación

6.1 Estimación del modelo

library(stargazer)
modelo<-lm(formula = gastohog~r021a+ghali+ghu12+gmed,data = Datos)
stargazer(modelo,title="Modelo lineal de Gasto de los Hogares",type="html")
Modelo lineal de Gasto de los Hogares
Dependent variable:
gastohog
r021a -5.862
(3.753)
ghali 1.184***
(0.113)
ghu12 1.459***
(0.127)
gmed 1.297***
(0.083)
Constant 54.881***
(18.695)
Observations 200
R2 0.842
Adjusted R2 0.839
Residual Std. Error 87.874 (df = 195)
F Statistic 259.935*** (df = 4; 195)
Note: p<0.1; p<0.05; p<0.01

6.2 Verifiacación de supuestos del MCRLM

6.2.1 Verificación del supuesto de Normalidad

Rechazar: Ho si 𝐽𝐵 ≥ 𝑉.𝐶

Rechazar: Ho si 𝑝 ≤ 𝛼

Prueba Jarque Bera (JB)

#Calculando el valor critico
VC_JB<-qchisq(p=0.05,df=2,lower.tail = FALSE)
print(VC_JB)
## [1] 5.991465
#Prueba JB usando libreria normtest
library(normtest)
JB<-jb.norm.test(modelo$residuals)
print(JB)
## 
##  Jarque-Bera test for normality
## 
## data:  modelo$residuals
## JB = 339.75, p-value < 0.00000000000000022
#Grafiacando la prueba
library(fastGraph)
shadeDist(xshade = JB$statistic,ddist = "dchisq",parm1 = 2,lower.tail = FALSE,sub=paste("VC:",VC_JB,"JB:",JB$statistic))

Para un nivel de significancia de 5%

Como 339.75 > 5.991465, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.

Alternativamenmte

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000000022 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

Prueba Kolmogorov Smirnov - Lilliefors

Rechazar: Ho si D ≥ 𝑉.𝐶.

Rechazar: Ho si 𝑝 ≤ 𝛼

#Prueba KS
library(nortest)
lillie.test(modelo$residuals)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  modelo$residuals
## D = 0.14589, p-value = 0.0000000000362
#Calculando valor critico
matriz_X<- model.matrix(modelo)
n_ks<-nrow(matriz_X)
VC_KS<-((0.875897)/sqrt(n_ks))
print(VC_KS)
## [1] 0.06193527

Como 0.14589 > 0.06193527, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000003 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

Prueba Shapiro - Wilk

Rechazar Ho si 𝑊𝑁 ≥ 𝑉.𝐶. Rechazar Ho si 𝑝 ≤ 𝛼

#Calculando el Valor Critico
VC_SW<-qnorm(p = 0.95)
print(VC_SW)
## [1] 1.644854
SW<-shapiro.test(modelo$residuals)
print(SW)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.83156, p-value = 0.00000000000005949
#Resultados en forma grafica
library(fastGraph)
shadeDist(xshade = 0.9413,ddist = "dnorm",parm1 = 0,parm2 = 1, lower.tail = FALSE, sub=paste("SW:",SW,"VC:",VC_SW,SW$statistic))

Como 0.83156 < 1.644854, se rechaza la hipotesis Ho.Hay evidencia que los residuales no tienen una distribucion normal.

Alternativamenmte

Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000005949 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.

6.2.2 Verifiación del supuesto de Multicolinealidad

Atravéz del índice de condición

Cálculo de la matriz X’X

library(stargazer)
matriz_x<-model.matrix(modelo)
matriz_xx<-t(matriz_x)%*%(matriz_x)
stargazer(matriz_xx,type = "text")
## 
## =============================================================================
##             (Intercept)    r021a        ghali         ghu12         gmed     
## -----------------------------------------------------------------------------
## (Intercept)     200         823      25,807.630    10,670.800    12,065.290  
## r021a           823        4,015     111,216.900   43,911.920    59,462.060  
## ghali       25,807.630  111,216.900 4,220,057.000 1,718,111.000 2,006,743.000
## ghu12       10,670.800  43,911.920  1,718,111.000 1,185,274.000  826,406.900 
## gmed        12,065.290  59,462.060  2,006,743.000  826,406.900  2,163,404.000
## -----------------------------------------------------------------------------

Procederemos a normalizar X’X, posteriormente se obtienen sus autovalores.

# Matriz de normalización Sn.
library(stargazer)
Sn<-solve(diag(sqrt(diag(matriz_xx))))
stargazer(Sn,type = "text",title = "Matriz de Normalizacion")
## 
## Matriz de Normalizacion
## ==============================
## 0.071   0     0      0     0  
## 0     0.016   0      0     0  
## 0       0   0.0005   0     0  
## 0       0     0    0.001   0  
## 0       0     0      0   0.001
## ------------------------------
# Normalizamos X'X
XX_norm<-(Sn%*%matriz_xx)%*%Sn
stargazer(XX_norm,type = "text", title = " Matriz X'X Normalizada")
## 
## Matriz X'X Normalizada
## =============================
## 1     0.918 0.888 0.693 0.580
## 0.918   1   0.854 0.637 0.638
## 0.888 0.854   1   0.768 0.664
## 0.693 0.637 0.768   1   0.516
## 0.580 0.638 0.664 0.516   1  
## -----------------------------
# Autovalores de X'X
Lamdas<-eigen(XX_norm)$values
stargazer(Lamdas,type = "text", title = "Autovalores")
## 
## Autovalores
## =============================
## 3.889 0.514 0.412 0.117 0.068
## -----------------------------

A continuación se calcula el indice de condición.

K<-sqrt(max(Lamdas)/min(Lamdas))
print(K)
## [1] 7.546261

Un indice de condición con un valor por debajo de 20, sugiere la presencia de multicolinealidad leve en los regresores del modelo, para nuestro caso el valor de este es de 7.57 con lo cual podemos decir que para nuestro modelo la multicolinealidad no es considerada un problema.

Aplicación de la prueba de Farrar-Glaubar

Normalizamos X, calculamos R y obtenemos su determinante |R|.

# X normalizada
library(stargazer)
Zn<-scale(matriz_x[,-1])
stargazer(head(Zn,n=6),type = "text", title = "Matriz X Normalizada")
## 
## Matriz X Normalizada
## =============================
##   r021a  ghali  ghu12   gmed 
## -----------------------------
## 1 0.498  -1.865 -0.722 -0.456
## 2 -0.627 -1.563 -0.685 -0.710
## 3 -1.190 -1.555 -0.806 -0.182
## 4 -1.190 -1.464 0.719  -0.710
## 5 1.061  -1.438 -0.590 -0.593
## 6 -0.627 -1.380 -0.394 -0.710
## -----------------------------
# Obteniendo R
n.<-nrow(Zn)
R.<-(t(Zn)%*%Zn)*(1/(n.-1))
stargazer(R.,type = "text",digits = 4,title = "Matriz R")
## 
## Matriz R
## =================================
##       r021a  ghali  ghu12   gmed 
## ---------------------------------
## r021a   1    0.2122 0.0001 0.3267
## ghali 0.2122   1    0.4608 0.3980
## ghu12 0.0001 0.4608   1    0.1943
## gmed  0.3267 0.3980 0.1943   1   
## ---------------------------------
# Calculamos |R|
determinante_R.<-det(R.)
stargazer(determinante_R.,type = "text",title = "Determinante de R")
## 
## Determinante de R
## =====
## 0.578
## -----

Obtenemos el estadístico de prueba de Farrar-Glaubar.

# Obtención del estadistico de prueba
m.<-ncol(matriz_x[,-1])
n.<-nrow(matriz_x[,-1])
Chi_FG<--(n.-1-(2*m.+5)/6)*log(determinante_R.)
print(Chi_FG)
## [1] 107.8611

Obtenemos el valor critico.

gl<-m.*(m.-1)/2
Vc<-qchisq(p=0.95,df=gl)
print(Vc)
## [1] 12.59159

Estos resultados nos sugieren que debemos de rechazar la hipótesis nula, y considerar la existencia de evidencias en favor de la presencia de cierto grado de multicolinealidad en los regresores del modelo ya que el estadistico de prueba es mayor al valor critico.

Presentación de los resultados

library(fastGraph)
shadeDist(xshade = Chi_FG, ddist = "dchisq", parm1 = gl, lower.tail = FALSE, sub =paste("VC", Vc, "FG",Chi_FG ),col = c("blue","orange"))

OBTENCION DE LOS FACTORES INFLACIONARIOS DE LA VARIANZA (VIF).

print(R.)
##             r021a     ghali       ghu12      gmed
## r021a 1.000000000 0.2122299 0.000080211 0.3267441
## ghali 0.212229892 1.0000000 0.460822424 0.3980169
## ghu12 0.000080211 0.4608224 1.000000000 0.1942678
## gmed  0.326744136 0.3980169 0.194267789 1.0000000
# Calculamos la inversa de R
Inversa_R.<-solve(R.)
print(Inversa_R.)
##            r021a      ghali       ghu12        gmed
## r021a  1.1463950 -0.1788415  0.14680259 -0.33191494
## ghali -0.1788415  1.4798230 -0.60155335 -0.41369666
## ghu12  0.1468026 -0.6015534  1.28863578 -0.05887894
## gmed  -0.3319149 -0.4136967 -0.05887894  1.28454778

VIF’s del modelo.

VIFs.<-diag(Inversa_R.)
print(VIFs.)
##    r021a    ghali    ghu12     gmed 
## 1.146395 1.479823 1.288636 1.284548

Presentación Gráfica para los VIF’s del modelo.

library(mctest)
mc.plot(modelo,vif = 1)

6.2.3 Verificación del supuesto de Heterocedasticidad

IMPLEMENTAMOS LA PRUEBA DE WHITE PARA DETECION DE HETEROCEDASTICIDAD EN LOS RESIDUOS.

Data_gastos<-Datos
names(Data_gastos)<-c("Y","X1","X2","X3","X4")

Prueba de White

library(lmtest)
options(scipen = 99999)
prueba_White<-bptest(modelo,~I(X1^2)+I(X2^2)+I(X3^2)+I(X4^2)+X1*X2+X1*X3+X1*X4+X2*X3+X2*X4+X3*X4,data = Data_gastos)
print(prueba_White)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 24.513, df = 14, p-value = 0.03969

Se rechaza la Hiótesis nula ya que hemos obtenido un valor p (0.03969) menor que el nivel de significancia (0.05), esto sugiere que existen evidencias en favor de la presencia de heterocedasticidad en la distribución de los residuos del modelo.

Presentacion gráfica de los resultados

library(fastGraph)
gl<-14
vc<-qchisq(p=0.95,df=gl)
shadeDist(xshade = prueba_White$statistic,ddist = "dchisq",parm1 =gl,lower.tail = FALSE,sub=paste("vc",vc,"W",prueba_White$statistic ))

6.2.4 Verificación del supuesto de Autocorrelación

Prueba Durbin Watson para autocorrelación de primer orden

library(lmtest)
dwtest(modelo,alternative="two.sided",iterations=1000)
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.948, p-value = 0.6663
## alternative hypothesis: true autocorrelation is not 0

Pra un nivel de significancia de 5%

Como Pvalue > 0.05. En ambos casos se puede rechazar la presencia de autocorrelacion de primer orden.

Pruebas de orden superior

Pruebas de multiplicador de Lagrange de primer orden

library(lmtest)
prueba_ml1<-bgtest(modelo,order = 1)
Prueba_1<-cbind(prueba_ml1$statistic,prueba_ml1$p.value)%>%as.data.frame(row.names = "Prueba Breusch Godfrey - Primer orden")
names(Prueba_1)<-c("BG","P-Value")
stargazer(Prueba_1,title = "Prueba Breusch Godfrey - Primer Orden",type = "html",digits = 6,summary = FALSE)
Prueba Breusch Godfrey - Primer Orden
BG P-Value
Prueba Breusch Godfrey - Primer orden 0.122190 0.726672

Como Pvalue > 0.05 No se rechaza Ho, por lo tanto puede concluirse que los residuos del modelo, no tienen autocorrelación de primer orden.

Pruebas de multiplicador de Lagrange de orden superior

library(lmtest)
prueba_ml2<-bgtest(modelo,order = 2)
Prueba_2<-cbind(prueba_ml2$statistic,prueba_ml2$p.value)%>%as.data.frame(row.names = "Prueba Breusch Godfrey - Orden superior")
names(Prueba_2)<-c("BG","P-Value")
stargazer(Prueba_2,title = "Prueba Breusch Godfrey - Orden superior",type = "html",digits = 6,summary = FALSE)
Prueba Breusch Godfrey - Orden superior
BG P-Value
Prueba Breusch Godfrey - Orden superior 0.466339 0.792019

Como Pvalue > 0.05 No se rechaza Ho, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden 2..

7 BIBLIOGRAFIA

DIRECCION GENERAL DE ESTADISTICA Y CENSOS. (16 de abril de 2021). DIGESTYC. Obtenido de http://aplicaciones.digestyc.gob.sv/Repositorio_archivos/