Grupo 3-3 Econometria UES
UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS ECONOMICAS
ESCUELA DE ECONOMIA
TEMA: DETERMINACION SOCIECONOMICA DEL INGRESO EN LOS HOGARES DEL AREA URBANA DEL MUNICIPIO DE SONSONATE EN EL AÑO 2019
MATERIA: ECONOMETRÍA
DOCENTE: CARLOS ADEMIR PÉREZ ALAS
INTEGRANTES:
| APELLIDOS | NOMBRES | CARNET | PARTICIPACIÓN |
|---|---|---|---|
| CRUZ RUIZ | LINDA STEPHANIE | CR19015 | \(100\%\) |
| ESCAMILLA MORALES | CARLOS JONATHAN | EM15025 | \(100\%\) |
| LÓPEZ ALVARADO | SUSANA ASTRID | LA19020 | \(100\%\) |
| PANIAGUA MUÑOZ | FERNANDO ERNESTO | PM18011 | \(100\%\) |
| REYES CASTRO | DAVID ERNESTO | RE17077 | \(100\%\) |
CICLO: I-2021
FECHA: 8 DE JULIO DE 2021
CIUDAD UNIVERSITARIA, SAN SALVADOR, EL SALVADOR, CENTROAMERICA
El presente estudio tiene como objetivo central determinar la relación que tiene el ingreso de los hogares del área urbana del municipio de Sonsonate en el año 2019 con las siguientes variables socioeconómicas: número de miembros del hogar, las remesas que se reciben, el nivel académico del jefe del hogar y el tiempo de trabajo medido en semanas. En esta investigación se desarrolla la fase de especificación, basándose en la teoría económica para formular un planteamiento del problema sólido, se identificó la variable endógena y cuatro regresores. Asimismo, como evidencia empírica, se utilizó la Encuesta de Hogares de Propósitos Múltiples (EHPM) del año 2019 la cual fue fundamental para realizar también el análisis descriptivo de cada variable en el programa RStudio.
Dada la encuesta de hogares de propósitos múltiples necesitamos determinar un modelo el cual estime los ingresos de los hogares de la familia para el propósito de estimar como las familias lo destinaran para su consumo y gasto del hogar dado que se utilizará el nivel académico de la persona jefe del hogar, la cantidad de personas que viven con él, si este recibe remesas, y también el tiempo de trabajo empleado medido en semanas. ¿Cómo afecta el número de miembros del hogar, las remesas que reciben las familias, el nivel académico y el tiempo de trabajo que realizado al ingreso de los hogares de la zona urbana del municipio de Sonsonate durante el año 2019?
Interpretar los resultados obtenidos en el estudio de los determinantes socioeconómicos del ingreso de los hogares de la zona urbana del municipio de Sonsonate en el año 2019.
Analizar los efectos de las variables seleccionadas de nuestra hipótesis haciendo uso de la teoría económica.
Comprender el análisis de los datos obtenidos de manera clara haciendo énfasis en el análisis econométrico de la hipótesis planteada.
La presente investigación tiene como objetivo analizar de manera razonable y lógica-estadística, algunos aspectos para la generalización de una hipótesis de predecir el comportamiento del ingreso en los hogares de las familias de Sonsonate en el año 2019.
Se llevará a cabo un estudio descriptivo y experimental de cómo se estudiará el ingreso en los hogares de las familias de Sonsonate en el año 2019 haciendo uso de la encuesta de hogares de propósitos múltiples, para hacer de manera cuantificada una hipótesis que estimule el análisis econométrico de las variables a definir.
Cabe destacarse que el ingreso familiar resulta ser un indicador económico muy importante y relevante que los estudiosos que elaboran estadísticas sobre los niveles de vida en los diferentes países estudian porque justamente nos permite conocer los estándares de vida que existen en tal o cual lugar geográfico.
El trabajo va dirigido a los pasados, presentes y futuros estudiantes, docentes y cualquier otro investigador o interesado en los estudios econométricos para el uso de futuras investigaciones u ocio del lector.
Se denomina ingreso al incremento de los recursos económicos que presenta una organización, una persona o un sistema contable, y que constituye un aumento del patrimonio neto de los mismos. (Raffino, 2020) La definición de ingreso puede llegar a ser algo general al emplearse como significado técnico en diferentes ámbitos del quehacer económico y administrativo, por ejemplo, el total que una empresa recibe por la venta de sus productos se llama ingreso, al igual que el total de las rentas recibidas por los ciudadanos de una nación.
Dependiendo del sentido específico, puede ser una variable considerada a la hora de medir el desempeño económico y financiero, o bien a la hora de diseñar planes contables y administrativos. El ingreso total de una familia incluye todo el dinero procedente de todas las fuentes percibidos durante todo el año, por los miembros que conforman el hogar.
Los hogares reciben ingresos en dinero o en especie (bienes y servicios) los cuales tiene como origen diversas fuentes, tales como: las remuneraciones por su trabajo o sea salarios, si se encuentran jubiladas pueden percibir ingresos a través de pensiones, indemnizaciones, negocio propio, venta de inmuebles o muebles, donaciones, ayuda de otros hogares, ayuda del Estado, remesas, alquileres, lotería, rifas, herencias, etc.
Según la Dirección General de Estadística y Censos (DIGESTYC), a través de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH), los ingresos pueden tener diferentes definiciones dependiendo de la fuente en las que son generados o la regularidad en que se perciben, según la dentro de las más comunes o importantes pueden estar:
Ingreso total del hogar: Constituye el total de ingresos con los que cuenta cada uno de los miembros del hogar, los cuales pueden ser en dinero o especie, con un periodo establecido u ocasionalmente.
Ingreso corriente del hogar: Son todos los ingresos percibidos (en dinero o especie), con cierta regularidad y con periodicidad establecida, por lo cual no incluye los ingresos momentáneos u ocasionales.
Los niveles o los grados académicos son los niveles de preparación profesional de una persona.
El nivel académico se puede dividir según el nivel de conocimiento y el nivel de experiencia que se obtiene a lo largo de los años y la especialización en universidades u otras instituciones que ofrecen diferentes tipos de formación. Existen tres grandes divisiones: pregrados, grados y posgrados.
Pregrados:
Diplomado: Los diplomados son cursos que tienen una duración generalmente entre 80 y 120 horas. Pueden ser ofrecidos por las universidades, aunque en algunas ocasiones también son impartidos por los gremios o diferentes instituciones públicas y privadas. Este tipo de formación se centra en temas muy específicos, que sirven para complementar o ampliar una determinada área del conocimiento. Generalmente están destinados a egresados de carreras universitarias, aunque no siempre exigen un título para cursarlos.
Técnico: Es semejante al Diplomado, pero te certifica como técnico en un área en particular, pues, un técnico es conocido como aquel que domina una técnica. Se accede a este grado a partir de la educación formal y se enseñan diversas herramientas o procedimientos, ya sean intelectuales o físicas, que le permiten ejecutar la técnica en cuestión. Usualmente, se relacionan con labores mecánicas, ingenieriles o de diseño. Esta formación requiere título de noveno año previamente.
Grados:
Bachillerato: es un programa de estudios con duración de 2 o 3 años, que permite a una persona obtener el título de bachiller, sigue a la educación secundaria, y es requerido para culminar la educación media y así poder continuar sus estudios en instituciones universitarias.
Licenciatura:
Consiste en una serie de cursos especializados dentro de tu carrera. Algunas carreras piden como requisito el título de Bachillerato Universitario, y en otros se puede matricular directamente la licenciatura, sin haber pasado por el bachillerato, ya que dicho programa incluye los cursos de bachillerato, especialmente los técnicos, incorporados en el plan de estudios.
Posgrados:
Maestría: Es una especialidad que se puede cursar previo a obtener un título de bachillerato o Licenciatura en tu carrera. Siempre se enfoca en un tema particular de tu área de estudio.
Especialidad:
Se refiere a programas que te capacitan en un área específica de tu carrera para permitir a los estudiantes enfocar aún más su curso de estudio. Es un programa parecido a la maestría, pero no te da un título de posgrado y puede ser de menor extensión. Una especialización junto con un título puede proyectar a los futuros empleadores o programas de posgrado una idea de lo que estudió, su nivel de conocimiento en un área en particular y qué tipo de habilidades puede adquirir para llevar al lugar de trabajo.
Doctorado:
Es el programa cumbre de la carrera universitaria. El doctorado usualmente lo sacan las personas que quieren dedicarse a la investigación y la docencia universitarias. Es una especialidad larga y que requiere un fuerte trabajo de investigación. Los grados académicos van por nivel de conocimiento, en donde cada vez se hace más específica la formación hacia un área o temática.
Se consideran analfabetas a aquellas personas que no saben leer y escribir. Estas personas representan la tendencia denominada analfabetismo: falta de conocimiento de las letras. (Significados.com, 2018) En el siglo XVIII el analfabetismo fue identificado como un problema social, debido a que esta condición limita el desarrollo económico y social de las personas en una sociedad. A consecuencia de esto se estableció la educación básica en donde se enseña la lectura y la escritura como un principio del Estado nacional.
“La alfabetización se concibe como un proceso gradual de aprendizaje que posibilita la comprensión de la lectura, la expresión escrita y el uso del cálculo matemático básico.” (MINED, 2019) Este proceso proporciona un desarrollo personal, una mejor calidad vida de las personas por medio de la educación, y el reconocimiento del derecho a la educación para los ciudadanos, especialmente de aquellos que no tuvieron la oportunidad de aprender a leer y escribir. En 2018 El Salvador, según datos recientes publicados por la UNESCO, tenía una tasa de alfabetización del 89,01%. Tasa que había aumentado a comparación de los años anteriores cono 2017 y 2016 con un porcentaje de 86,67% y 86,33% respectivamente. Su tasa de alfabetización masculina en el año de 2018 fue del 91,1%, superior a la femenina que fue del 87,23%. Y se posicionaba en el puesto 98° del raking de alfabetización de los países. (datosmacro.com, s.f.) Logros del programa de alfabetización en el periodo 2018-2019 En la gestión 2014-2019 fueron en total 151, 317 personas atendidas, de estas 115,448 fueron certificadas como persona alfabetizada y 4,511 acreditaron segundo o tercer nivel de educación básica. Se declaró 41 municipios libres de alfabetización, sumando en este periodo 165 municipios y cuatro departamentos declarados libres de esta condición. Obteniendo así el “Premio a la Alfabetización 2018”, que fue otorgado por la Fundación Mundial para la Alfabetización y San Salvador se posiciona como la tercera capital declarada libre de analfabetismo en Centroamérica. Las proyecciones continúan para el periodo de 2019-2020 para fortalecer y garantizar la atención a personas pendientes de alfabetizar a nivel nacional y asegurar la continuidad educativa de educación básica de las personas. (MINED, 2019)
La palabra “familia” proviene del termino en latín “familiae”, el significado es: grupo de siervos y esclavos patrimonio del jefe de la gens”. Las Naciones Unidas definen a la familia: “Como una unidad en los estudios demográficos que representa todo un hogar o una parte de éste, una familia estadística o una familia censal generalmente se compone de todos los miembros de un hogar emparentados por consanguinidad, adopción o matrimonio” (Naciones Unidas, 2003) La vida de la familia, se caracteriza tanto por el desarrollo de procesos materiales, que incluyen las relaciones biológicas naturales, económicas y de consumo que aseguran la subsistencia de sus miembros, como por procesos espirituales, que incluyen elementos de carácter psicológico: procesos afectivos, ideas y sentimientos de cada uno de sus miembros (Fernandez, 2012)
Según la revista publicada por (FUSADES, UNICEF, 2015) en El Salvador los tipos de familias son:
Hogar uniparental: Jefe/a de hogar solo/a.
Pareja sin hijos/as: Jefe/a de hogar y conyugue.
Nuclear: Jefe/a de hogar, cónyuge e hijos/as.
Extensa con hijos/as: Jefe/a de hogar, cónyuge, hijos/as, otros familiares y/u otras personas.
Extensa sin hijos/as: Jefe/a de hogar, cónyuge, otros familiares y/u otras personas.
Monoparental: Jefe/a de hogar e hijos/as.
Monoparental extensa con hijos/as: Jefe/a de hogar, hijos/as, otros familiares y/u otras personas.
Monoparental extensa sin hijos/as: Jefe/a de hogar, otros familiares y/u otras personas.
Según datos presentados por (FUSADES, UNICEF, 2015) en su informe sobre las familias salvadoreñas con análisis de 1992 hasta 2012, existió un incremento en las familias del tipo monoparental extensa con hijos, han pasado de ser el 28.4% en 1992 a un 34.9% para el 2012. Existe un incremento del 6.5% en este tipo de familias, por lo que se puede afirmar que en ese periodo de tiempo han incrementado las separaciones familiares y los jefes del hogar deben hacerse cargo de sus hijos y padres. Por otra parte, se ha visto una reducción en las familias del tipo extensa con hijos pasado del 46.1% en 1992 al 39.3% en 2012, pero, a pesar de esta reducción sigue siendo el tipo de familia predominante en el país.
En el contexto del trabajo de investigación, la Dirección Nacional de Estadísticas y Censos (DIGESTYC, 2012), define que para la Encuesta de Hogares de Propósitos Múltiples (EHPM), un hogar será: Una o varias personas unidas por lazos familiares y/o amistosos que viven habitualmente juntos, que tienen una administración presupuestaria de alimentación común y que satisfacen otras necesidades básicas para vivir. A las familias que conviven bajo el mismo techo, sean éstas familiares o no familiares, y no comparten un presupuesto alimenticio en común con relación al hogar principal, deberá considerarse como otro hogar y también se le aplicará la encuesta (dobles hogares, triples hogares, etc.).
El trabajo puede entenderse como la actividad humana remunerada y no remunerada que se lleva a cabo en el mercado. El trabajo es uno de los tres factores de la producción que tienen sus orígenes en la teoría del padre de la economía moderna, Adam Smith, quien en su libro “La Riqueza de las Naciones” planteó que para producir un bien se requiere emplear tres factores productivos, capital, tierra y trabajo.
El trabajo se puede dividir en dos grandes categorías:
Trabajo físico: Se refiere al aporte de actividades manuales o de fuerza de los trabajadores. Así, por ejemplo, tenemos el trabajo de una temporera que recoge las uvas durante la época de vendimia. (Roldán, s.f.)
Trabajo intelectual: Se refiere al esfuerzo mental y aporte de ideas que hacen los trabajadores. Nos referimos, por ejemplo, el trabajo de un diseñador de marca que viene a presentar una idea innovadora a su cliente. (Roldán, s.f.)
En una publicación hecha por (Salazar, 2007), Especialista del Departamento de Investigación Económica y Financiera del Banco Central de Reserva, en la zona urbana para el año 2007, se encontró el 73.1% de la población económicamente activa (PEA) teniendo un incremento de 17.6% respecto al año 1992, esto se debe a que con la adopción del modelo neoliberal en el país, la migración de las personas de la zona rural a la zona urbana ha sido mayor. De esta PEA, para el año 2007 el 73% era Población Ocupada en la zona urbana, y de este porcentaje el 40.1% lo representan las mujeres, mientras que el 59.9% los hombres. Hay un drástico aumento en comparación con 1992 donde solo estaban ocupadas el 28.3% de las mujeres pertenecientes a la PEA.
Para el departamento de Sonsonate, según el informe de la concentración laboral en actividades productivas por departamento (excluyendo al sector agropecuario) presentado por el (Ministerio de economía, 2005) las principales actividades productivas son:
Generación de energía eléctrica mediante el uso de combustibles
Fabricación de fertilizantes
Venta de crustáceos moluscos y otros mariscos
Fabricación de productos derivados de la refinación de petróleo: combustible para vehículos, aviones, gas propano, butano y asfalto Entre otros.
Ilustración 1 Fuente: el informe de la concentración laboral en actividades productivas por departamento (excluyendo al sector agropecuario) presentado por el (Ministerio de economía, 2005) Retomado de: https://n9.cl/fae7r
Dichas actividades productivas están concentradas en su mayoría (60.55%) en el sector comercios. Le sigue la industria con un 20.51 % y el sector servicios con un 18.94%.
En el año 2013, 18% de los hogares en El Salvador recibieron remesas internacionales 3 . Estos hogares comprendieron aproximadamente 1.150.000 personas, en consecuencia, casi uno de cada cinco salvadoreños se beneficia de las remesas.Los hogares receptores de remesas reportaron recibir un promedio de US $ 195 en concepto de estas transferencias del exterior por mes en 2013 (precios corrientes). Como promedio, la remesa constituye un 50% del ingreso mensual total de los hogares beneficiarios.
En la siguiente imagen se puede apreciar la distribucion de remesas que hay por departamento.
Ilustración 2 Fuente: Distrución de las remesas por departamento en El Salvador Retomado de: https://n9.cl/cxmb
La poblacion que recibe más remesas, suelen estar concentrados en zonas rurales, una estimacion nos dice que un 37% de la población salvadoreña recide en esas zonas, pero en el caso de los beneficiarios de remesas esta cifra asciende a 47%. En conclusion la importancia de la remesa, medido en términos de la proporción de la remesa sobre el ingreso total del hogar, es más elevado para los hogares receptores que viven en zonas rurales. Ahora bien si lo vemos desde la perspectiva de genero, el 70% de las personas que individualmente reciben remesas son mujeres, debido a que de todas las personas que viven en hogares receptores de remesas un 55% son mujeres.
Por otra parte enfocado en el sector trabajo, alrededor de la mitad de los receptores de remesas, se encuentran en edad de trabajar y forman parte de la fuerza laboral, es decir se encuentran actualmente trabajando o activamente en la búsqueda de un trabajo. Los receptores de remesas son menos propensos a ser económicamente, Una proporción elevada de receptores de remesas trabajan por su propia cuenta, quizás sugiriendo una falta de acceso a trabajos asalariados entre este segmento. Casi dos terceras partes de los receptores de remesas que ni trabajan ni están en búsqueda de trabajo se dedican a quehaceres domésticos, hecho que puede ser debido a la alta proporción de mujeres dentro de la población receptora de remesas
El ingreso total depende de: el número de personas que habitan el hogar, el monto en remesas recibido, el nivel académico del jefe del hogar, y el tiempo de trabajo que realiza el jefe de hogar.
Esta variable está clasificada como cuantitativa continua, y su medición será unidades de dólares estadounidenses.
El número de personas que hay en un hogar tiene mucho que ver con el tipo de familia que se conforma, puede ser nuclear, extensa, monoparental, etc. Esta variable es explicativa, debido a que, genera un efecto directo con la variable de ingreso total en el hogar, lo que significa que a mayor número de personas en la unidad familiar mayor será el total de los ingresos percibidos por ésta. Para expresar esta variable en forma cuantitativa, se medirá en unidad por persona.
Las remesas constituyen una de las principales fuentes de financiación externa, ya que dichos ingresos ayudan significativamente a reducir la pobreza dentro de los países que la reciben, tal como la ayuda para financiar gran parte del consumo del hogar, sirve también para poder ahorrar o invertir y, a la vez, ayuda para gastos escolares y médicos, teniendo así un enorme impacto dentro de estos. Su medida será en unidades de dólares de los Estados Unidos de America.
Según el nivel académico que posean las familias, así será el nivel o estatus social que posean, debido al salario que se percibirá en el hogar, el cual ira aumentado si los miembros que la conforman tiene mayores conocimientos, ya que las expectativas de trabajo y gama a la que pueden optar será mayor, en cambio las personas que no logran un nivel superior de estudio tienden a realiza trabajos de habilidad y experiencias los cuales no son muy bien remunerados por lo que los coloca en desventaja económica , lo que por ende les trae menor consumo y a no satisfacer sus necesidades básicas. Lo que deja claro que la relación directa: “a mayor nivel académico, mayores ingresos perciben los hogares”
El tiempo de trabajo es la medida que damos cuando una persona emplea su fuerza de trabajo para producir bienes y servicios para el consumo en este caso tiene una relación directa ante el ingreso de las familias es decir a mayor tiempo de trabajo, mayores ingresos en este caso la unidad a utilizar para esta variable será en horas a la semana.
Como supuestos del modelo de regresión lineal múltiple se dice que este es lineal en los parámetros.
\(\hat Y=\beta_0+\beta_1 \cdot X_1+\beta_2 \cdot X_2 + ... +\beta_k \cdot X_k\)
No existe combinaciones lineales entre regresores por lo que se dice no hay multicolinealidad. “Es decir los regresores son independientes entre sí”
Se dice que este es un modelo estático por lo que no incorporaremos variables de series temporales, por lo cual no hay autocorrelación en las perturbaciones
\(V(\beta)=\sigma^2_\epsilon \times I_n\)
Se comprueba que puede existir una distribución normal en los residuos
\(\varepsilon\) ~ \(N[0,\sigma^2]\)
Determinaremos como “\(m\)” el ingreso de los hogares en unidades monetarias en dólares de los Estados Unidos de América. Por lo que se dice \(m≥0\), se dice que es mayor o igual a 0 debido a que no existe un ingreso negativo, y se hará el supuesto que puede que existan familias con ingresos de cero dólares.
Sea “\(\eta_p\)” el numero de personas del hogar en la cual no se contará a la persona jefe del hogar por lo que \(\eta_p≥0\)
Sea “\(\chi_r\)” las remesas que les llegan a los hogares en unidades monetarias en dólares de los Estados Unidos de América, por lo que \(\chi_r≥0\) porque puede que hogares no reciban remesas.
Sea “\(\omega\)” el nivel académico expresado por etiquetas de números naturales en la cual se dice que:
| DESCRIPCIÓN | ETIQUETA |
|---|---|
| \(0\) | Educación inicial |
| \(1\) | Parvularia |
| \(2\) | Básica |
| \(3\) | Media |
| \(4\) | Superior universitario |
| \(5\) | Superior no universitario |
| \(6\) | Educación especial |
| \(7\) | Otros |
| \(8\) | Ninguno |
Sea “\(\lambda\)” el tiempo de trabajo de la persona jefe del hogar en la que se mide por horas a la semana.
En forma lógica se dice que: Existen relaciones positivas entre todos los regresores en el modelo de regresión lineal múltiple para la determinación del ingreso de las familias.
\(m(\eta_p,\chi_r,\omega,\lambda)\)
\(m(+,+,+,+)\)
El modelo queda representado de la siguiente manera
\(m=\beta_0+\beta_1 \eta_p+\beta_2 \chi_r+\beta_3 \omega+\beta_4 \lambda\)
| Ingreso_Total | Miembros_Hogar | Remesas | Nivel_Acd | Tiempo_Trabajo |
|---|---|---|---|---|
| 637.84 | 5 | 150 | 3 | 61 |
| 637.84 | 5 | 150 | 3 | 56 |
| 503.25 | 4 | 0 | 2 | 49 |
| 503.25 | 4 | 0 | 3 | 8 |
| 492.42 | 5 | 0 | 2 | 30 |
| 492.42 | 5 | 0 | 2 | 0 |
| 475.00 | 3 | 0 | 2 | 48 |
| 475.00 | 3 | 0 | 2 | 12 |
| 906.67 | 4 | 0 | 2 | 48 |
| 906.67 | 4 | 0 | 3 | 16 |
Modelo_Ingreso<-lm(formula = Ingreso_Total~Miembros_Hogar+Remesas+Nivel_Acd+Tiempo_Trabajo, data = Ingresos_del_hogar)
library(stargazer)
stargazer(Modelo_Ingreso, title="Modelo de Regresion Lineal Multiple para Ingresos totales del hogar", type="html", digits=5)| Dependent variable: | |
| Ingreso_Total | |
| Miembros_Hogar | 106.53060*** |
| (20.21693) | |
| Remesas | 0.99438*** |
| (0.37400) | |
| Nivel_Acd | 94.09542*** |
| (29.49421) | |
| Tiempo_Trabajo | 2.36152 |
| (2.06073) | |
| Constant | 21.87035 |
| (160.07400) | |
| Observations | 207 |
| R2 | 0.18939 |
| Adjusted R2 | 0.17334 |
| Residual Std. Error | 454.02160 (df = 202) |
| F Statistic | 11.79892*** (df = 4; 202) |
| Note: | p<0.1; p<0.05; p<0.01 |
library(fitdistrplus)
library(stargazer)
verificacion_ajuste<-fitdist(data = as.vector(Modelo_Ingreso$residuals),distr = "norm")## $start.arg
## $start.arg$mean
## [1] -0.00000000000003301224
##
## $start.arg$sd
## [1] 448.5047
##
##
## $fix.arg
## NULL
## Fitting of the distribution ' norm ' by maximum likelihood
## Parameters :
## estimate Std. Error
## mean -0.00000000000003301224 31.17257
## sd 448.50471060011221879904 22.04264
## Loglikelihood: -1557.646 AIC: 3119.291 BIC: 3125.957
## Correlation matrix:
## mean sd
## mean 1 0
## sd 0 1
Valores criticos \(\chi^2\) para \(\alpha=0.01\) , \(\alpha=0.05\), y \(\alpha=0.10\) respectivamente
## [1] 9.21034
## [1] 5.991465
## [1] 4.60517
\(H_0: \varepsilon \sim N(0,\sigma^2)\)
\(H_A: \varepsilon \nsim N(0,\sigma^2)\)
##
## Jarque-Bera test for normality
##
## data: Modelo_Ingreso$residuals
## JB = 151.08, p-value < 0.00000000000000022
hist(Modelo_Ingreso$residuals,main = "Histograma de los residuos",xlab = "Residuos",ylab = "frecuencia") \(H_0: \varepsilon \sim N(0,\sigma^2)\)
\(H_A: \varepsilon \nsim N(0,\sigma^2)\)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: Modelo_Ingreso$residuals
## D = 0.10905, p-value = 0.000002863
hist(Modelo_Ingreso$residuals,main = "Histograma de los residuos",xlab = "Residuos",ylab = "frecuencia") \(H_0: \varepsilon \sim N(0,\sigma^2)\)
\(H_A: \varepsilon \nsim N(0,\sigma^2)\)
##
## Shapiro-Wilk normality test
##
## data: Modelo_Ingreso$residuals
## W = 0.91223, p-value = 0.000000001002
hist(Modelo_Ingreso$residuals,main = "Histograma de los residuos",xlab = "Residuos",ylab = "frecuencia") | (Intercept) | Miembros_Hogar | Remesas | Nivel_Acd | Tiempo_Trabajo |
|---|---|---|---|---|
| 1 | 5 | 150 | 3 | 61 |
| 1 | 5 | 150 | 3 | 56 |
| 1 | 4 | 0 | 2 | 49 |
| 1 | 4 | 0 | 3 | 8 |
| 1 | 5 | 0 | 2 | 30 |
| 1 | 5 | 0 | 2 | 0 |
| 1 | 3 | 0 | 2 | 48 |
| 1 | 3 | 0 | 2 | 12 |
| 1 | 4 | 0 | 2 | 48 |
| 1 | 4 | 0 | 3 | 16 |
| (Intercept) | Miembros_Hogar | Remesas | Nivel_Acd | Tiempo_Trabajo | |
|---|---|---|---|---|---|
| (Intercept) | 207 | 784 | 6415 | 632 | 9237 |
| Miembros_Hogar | 784 | 3476 | 26030 | 2395 | 34880 |
| Remesas | 6415 | 26030 | 1681725 | 19040 | 296720 |
| Nivel_Acd | 632 | 2395 | 19040 | 2170 | 27798 |
| Tiempo_Trabajo | 9237 | 34880 | 296720 | 27798 | 461491 |
\(\kappa (x)= \sqrt {\lambda_{max}\over \lambda_{min}}\)
si \(\kappa (x)<20\) : Multicolinalidad leve
si \(20\leq\kappa (x)<30\) : Multicolinalidad moderada
si \(\kappa (x)\geq30\) : Multicolinalidad severa
Calculo de la matriz de normalizacion \(S_n=\begin{Bmatrix} \frac{1}{\sqrt {X^T \cdot X_{ij}}} & ; i=j\\ 0 & ; i\neq j\end{Bmatrix}\)
| 0.0695048 | 0.0000000 | 0.0000000 | 0.0000000 | 0.000000 |
| 0.0000000 | 0.0169613 | 0.0000000 | 0.0000000 | 0.000000 |
| 0.0000000 | 0.0000000 | 0.0007711 | 0.0000000 | 0.000000 |
| 0.0000000 | 0.0000000 | 0.0000000 | 0.0214669 | 0.000000 |
| 0.0000000 | 0.0000000 | 0.0000000 | 0.0000000 | 0.001472 |
| 1.0000000 | 0.9242533 | 0.3438223 | 0.9429790 | 0.9450704 |
| 0.9242533 | 1.0000000 | 0.3404527 | 0.8720387 | 0.8708733 |
| 0.3438223 | 0.3404527 | 1.0000000 | 0.3151807 | 0.3368121 |
| 0.9429790 | 0.8720387 | 0.3151807 | 1.0000000 | 0.8784197 |
| 0.9450704 | 0.8708733 | 0.3368121 | 0.8784197 | 1.0000000 |
##
## Call:
## eigprop(mod = Modelo_Ingreso)
##
## Eigenvalues CI (Intercept) Miembros_Hogar Remesas Nivel_Acd
## 1 3.8731 1.0000 0.0025 0.0087 0.0116 0.0066
## 2 0.8452 2.1407 0.0006 0.0016 0.9829 0.0024
## 3 0.1321 5.4138 0.0029 0.7830 0.0017 0.0704
## 4 0.1212 5.6535 0.0000 0.0089 0.0035 0.4988
## 5 0.0284 11.6709 0.9940 0.1978 0.0003 0.4218
## Tiempo_Trabajo
## 1 0.0064
## 2 0.0014
## 3 0.1524
## 4 0.3806
## 5 0.4591
##
## ===============================
## Row 3==> Miembros_Hogar, proportion 0.783043 >= 0.50
## Row 2==> Remesas, proportion 0.982870 >= 0.50
\(H_0: R \sim I\) \(\chi^2_{FG}<VC\) o \(p>\alpha\)
\(H_A: R \nsim I\) \(\chi^2_{FG}\geq VC\) o \(p\leq\alpha\)
## $chisq
## [1] 4.183109
##
## $p.value
## [1] 0.6519122
##
## $df
## [1] 6
## [1] 12.59159
## [1] TRUE
## Miembros_Hogar Remesas Nivel_Acd Tiempo_Trabajo
## 1.004577 1.006247 1.014572 1.015769
Se asume que la varianza de los residuos posee una estructura de la forma:
\(\sigma^2_u=\delta_0+\delta_1x_1+\delta_2x_2+...+\delta_kx_k+\alpha_1x_1^2+\alpha_2x_2^2+...+\alpha_kx_k^2+\theta_1x_1x_2+\theta_1x_1x_3+\theta_kC2x_ix_j\)
\(H_0: \delta_1=\delta_2=...=\delta_k=\alpha_1=\alpha_2=...=\alpha_k=\theta_1=\theta_1=\theta_kC2=0\)
Hay evidencia de que la varianza de los residuos es Homocedastica
\(H_1: \delta_1=\delta_2=...=\delta_k=\alpha_1=\alpha_2=...=\alpha_k=\theta_1=\theta_1=\theta_kC2\neq0\)
Hay evidencia de que la varianza de los residuos es Heterocedastica
library(lmtest)
PWhite<-bptest(Modelo_Ingreso,~I(Miembros_Hogar^2)+I(Remesas^2)+I(Nivel_Acd^2)+I(Tiempo_Trabajo^2)+Miembros_Hogar*Remesas+Miembros_Hogar*Nivel_Acd+Miembros_Hogar*Tiempo_Trabajo+Remesas*Nivel_Acd+Remesas*Tiempo_Trabajo+Nivel_Acd*Tiempo_Trabajo,data = Ingresos_del_hogar)
print(PWhite)##
## studentized Breusch-Pagan test
##
## data: Modelo_Ingreso
## BP = 20.547, df = 14, p-value = 0.1138
Supone una estructura del residuo de la forma:
\(u_i=\rho u_{i-1}+v_i\)
\(H_0 : \rho=0\)
No hay evidencia de autocorrelacion de primer orden, en los residuos del modelo
\(H_1 : \rho \neq 0\)
Hay evidencia de autocorrelacion de primer orden, en los residuos del modelo
##
## Durbin-Watson test
##
## data: Modelo_Ingreso
## DW = 1.2442, p-value = 0.0000000303
## alternative hypothesis: true autocorrelation is not 0
## lag Autocorrelation D-W Statistic p-value
## 1 0.3705512 1.244187 0
## Alternative hypothesis: rho != 0
Supone una estructura del residuo de la forma:
\(u_j=\rho_1 u_{i-1}+\rho_2 u_{i-2}+...+\rho_m u_{i-m}+v_i\)
\(H_0 : \rho_1=\rho_2=...=\rho_m=0\)
No hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo
\(H_1 : \rho_1=\rho_2=...=\rho_m \neq 0\)
Hay evidencia de autocorrelacion de orden “m”, en los residuos del modelo
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: Modelo_Ingreso
## LM test = 30.126, df = 1, p-value = 0.00000004049
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: Modelo_Ingreso
## LM test = 31.929, df = 2, p-value = 0.0000001166
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 21.87035 160.07403 0.1366 0.891462
## Miembros_Hogar 106.53060 20.21693 5.2694 0.0000003498 ***
## Remesas 0.99438 0.37400 2.6588 0.008471 **
## Nivel_Acd 94.09542 29.49421 3.1903 0.001648 **
## Tiempo_Trabajo 2.36152 2.06073 1.1460 0.253167
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 21.87035 181.15319 0.1207 0.90403
## Miembros_Hogar 106.53060 22.39564 4.7568 0.000003739 ***
## Remesas 0.99438 0.38673 2.5712 0.01085 *
## Nivel_Acd 94.09542 42.21884 2.2288 0.02693 *
## Tiempo_Trabajo 2.36152 2.29159 1.0305 0.30400
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
library(lmtest)
library(sandwich)
EsOmega<-NeweyWest(Modelo_Ingreso,lag = 2)
coeftest(Modelo_Ingreso,vcov. = EsOmega)##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 21.87035 256.31775 0.0853 0.93209
## Miembros_Hogar 106.53060 38.69389 2.7532 0.00644 **
## Remesas 0.99438 0.56986 1.7449 0.08252 .
## Nivel_Acd 94.09542 39.71988 2.3690 0.01878 *
## Tiempo_Trabajo 2.36152 2.50618 0.9423 0.34718
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
library(stargazer)
stargazer(Modelo_Ingreso, Modelo_Ingreso, type = "html", se=list(NULL,Omega),column.labels = c("NoCorregida","Corregida"))| Dependent variable: | ||
| Ingreso_Total | ||
| NoCorregida | Corregida | |
| (1) | (2) | |
| Miembros_Hogar | 106.531*** | 106.531 |
| (20.217) | (-1,915.360) | |
| Remesas | 0.994*** | 0.994 |
| (0.374) | (-5.690) | |
| Nivel_Acd | 94.095*** | 94.095 |
| (29.494) | (-4,571.214) | |
| Tiempo_Trabajo | 2.362 | 2.362 |
| (2.061) | (-262.622) | |
| Constant | 21.870 | 21.870 |
| (160.074) | (32,816.480) | |
| Observations | 207 | 207 |
| R2 | 0.189 | 0.189 |
| Adjusted R2 | 0.173 | 0.173 |
| Residual Std. Error (df = 202) | 454.022 | 454.022 |
| F Statistic (df = 4; 202) | 11.799*** | 11.799*** |
| Note: | p<0.1; p<0.05; p<0.01 | |
En este caso se hara el pronostico de los ingresos que se tienen en el hogar si hay 3 miembros de la familia, reciben remesas de 250 dolares, tienen un nivel academico de Educación media “3”, y con un tiempo de trabajo de 50 horas a la semana
library(stargazer)
X_m<-data.frame(Miembros_Hogar=3, Remesas=250, Nivel_Acd=3, Tiempo_Trabajo=50)
confidense<-c(0.95,0.99)
predict(object = Modelo_Ingreso,
newdata = X_m,
interval = "prediction",
level = confidense,
se.fit =TRUE)->predicciones
rownames(predicciones$fit)<-as.character(confidense*100)
colnames(predicciones$fit)<-c("Ym","Li","Ls")
stargazer(predicciones$fit,
title = "Pronósticos e intervalos de confianza",
type = "html")| Ym | Li | Ls | |
| 95 | 990.419 | 77.631 | 1,903.207 |
| 99 | 990.419 | -213.369 | 2,194.207 |
library(dplyr) # Para manejo de datos y activar el operador "pipe" %>%
library(caret) # Permite Realizar muestreo sobre los data frame
library(DescTools) # Contiene las funciones para calcular las medidas de performance
library(stargazer) # Para dar formato, y obtener resumen estadistico de las simulaciones
set.seed(50) # Permite fijar la semilla aleatoria, para reproducir los resultados obtenidos en esta clase
numero_de_muestras<-5000 # Numero de muestras que se optendran del data frame
# Se crea la lista con las 1000 muestras (indica la posición de la fila en cada data frame)
muestras<- Ingresos_del_hogar$Ingreso_Total %>% createDataPartition(p = 0.8, times = numero_de_muestras, list = TRUE)
# Listas vacias, que contendran los datos de entrenamiento, los pronosticos para los datos de prueba, y para las estadisticas de cada muestra
Modelos_Entrenamiento<-vector(mode = "list",
length = numero_de_muestras)
Pronostico_Prueba<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance_data_entrenamiento<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance<-vector(mode = "list",
length = numero_de_muestras)
#Estimación de los modelos lineales para cada muestra, los pronósticos y cálculo de las estadisticas de performance.
for(j in 1:numero_de_muestras){
Datos_Entrenamiento<- Ingresos_del_hogar[muestras[[j]], ]
Datos_Prueba<- Ingresos_del_hogar[-muestras[[j]], ]
Modelos_Entrenamiento[[j]]<-lm(formula = Ingreso_Total~.,data=Datos_Entrenamiento)
Pronostico_Prueba[[j]]<-Modelos_Entrenamiento[[j]] %>% predict(Datos_Prueba)
Resultados_Performance_data_entrenamiento[[j]]<-data.frame(
R2 = R2(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total),
RMSE = RMSE(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total),
MAE = MAE(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total),
MAPE= MAPE(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total)*100,
THEIL=TheilU(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total,type = 1),
Um=Um(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total),
Us=Us(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total),
Uc=Uc(Modelos_Entrenamiento[[j]]$fitted.values,
Datos_Entrenamiento$Ingreso_Total)
)
Resultados_Performance[[j]]<-data.frame(
R2 = R2(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total),
RMSE = RMSE(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total),
MAE = MAE(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total),
MAPE= MAPE(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total)*100,
THEIL=TheilU(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total,
type = 1), # También se puede usar la función que creamos: THEIL_U
Um=Um(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total),
Us=Us(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total),
Uc=Uc(Pronostico_Prueba[[j]], Datos_Prueba$Ingreso_Total)
)
}bind_rows(Resultados_Performance_data_entrenamiento) %>%
stargazer(title = "Medidas de Performance Datos del Modelo",
type = "html",
digits = 3)| Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
| R2 | 5,000 | 0.196 | 0.035 | 0.085 | 0.173 | 0.219 | 0.331 |
| RMSE | 5,000 | 446.250 | 16.931 | 371.913 | 435.124 | 459.103 | 482.483 |
| MAE | 5,000 | 329.544 | 10.355 | 286.269 | 323.000 | 336.921 | 359.398 |
| MAPE | 5,000 | 54.005 | 2.383 | 42.480 | 52.552 | 55.677 | 60.238 |
| THEIL | 5,000 | 0.240 | 0.008 | 0.206 | 0.235 | 0.246 | 0.256 |
| Um | 5,000 | 0.000 | 0.000 | 0 | 0 | 0 | 0 |
| Us | 5,000 | 0.391 | 0.039 | 0.271 | 0.365 | 0.415 | 0.552 |
| Uc | 5,000 | 0.615 | 0.039 | 0.454 | 0.591 | 0.641 | 0.735 |
bind_rows(Resultados_Performance) %>%
stargazer(title = "Medidas de Performance Simulación",
type = "html",
digits = 3)| Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
| R2 | 5,000 | 0.177 | 0.126 | 0.00000 | 0.075 | 0.255 | 0.709 |
| RMSE | 5,000 | 460.465 | 68.623 | 266.193 | 408.475 | 509.803 | 691.260 |
| MAE | 5,000 | 339.685 | 36.564 | 234.288 | 314.396 | 363.551 | 489.283 |
| MAPE | 5,000 | 55.520 | 11.071 | 31.204 | 47.409 | 61.821 | 113.317 |
| THEIL | 5,000 | 0.246 | 0.031 | 0.159 | 0.223 | 0.270 | 0.357 |
| Um | 5,000 | 0.013 | 0.017 | 0.000 | 0.001 | 0.017 | 0.170 |
| Us | 5,000 | 0.384 | 0.147 | 0.012 | 0.279 | 0.494 | 0.789 |
| Uc | 5,000 | 0.629 | 0.144 | 0.230 | 0.522 | 0.737 | 1.000 |
\(H_0:\) Los miembros del hogar tienen una relación lineal parcial con la variable Ingresos
\(H_A:\) Los miembros del hogar no tienen una relación lineal parcial con la variable Ingresos
\(H_0:\) Las Remesas tienen una relación lineal parcial con la variable Ingresos
\(H_A:\) Las Remesas no tienen una relación lineal parcial con la variable Ingresos
\(H_0:\) El nivel academico tiene una relación lineal parcial con la variable Ingresos
\(H_A:\) El nivel academico no tiene una relación lineal parcial con la variable Ingresos
\(H_0:\) El tiempo de trabajo tiene una relación lineal parcial con la variable Ingresos
\(H_A:\) El tiempo de trabajo no tiene una relación lineal parcial con la variable Ingresos
| 2.5 % | 97.5 % | |
|---|---|---|
| (Intercept) | -293.7599983 | 337.50069 |
| Miembros_Hogar | 66.6673170 | 146.39388 |
| Remesas | 0.2569374 | 1.73182 |
| Nivel_Acd | 35.9394172 | 152.25143 |
| Tiempo_Trabajo | -1.7017865 | 6.42482 |
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable Miembros del hogar tiene una relación lineal parcial con la variable ingresos
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable Remesas tiene una relación lineal parcial con la variable ingresos
Con una confianza de 95% no se rechaza la hipotesis nula y se dice que hay evidencia que la variable Nivel Academico tiene una relación lineal parcial con la variable ingresos
Con una confianza de 95% se rechaza la hipotesis nula y se dice que hay evidencia que la variable Tiempo de trabajo no tiene una relación lineal parcial con la variable ingresos
CEPAL. (2007). Décima conferencia regional sobre la mujer de América Latina y el Caribe .
DIGESTYC. (2012). Manual del encuestador 2013: Encuesta de hogares de propositos múltiples 2013.
Fernandez, N. E. (2012). Un acercamiento a la familia desde una perspectiva sociológica.
FUSADES, UNICEF. (2015). Una mirada a las familias salvadoreñas: sus tranformaciones y desafios desde la óptica de las politicas sociales con enfoque de la niñez. San Salvador .
Ministerio de economía. (2005). Concentración laboral en actividades productivas por departamento. San Salvador .
Naciones Unidas. (2003). Indicadores de la familia. Nueva York: Asuntos Económicos y Sociales.
Roldán, P. (s.f.). Trabajo. Obtenido de Economipedia: https://economipedia.com/definiciones/trabajo.html
Salazar, R. (2007). Banco Central de Reserva. Obtenido de Estructura del Mercado Laboral en El Salvador: Resultados del VI Censo de Población 2007: https://www.bcr.gob.sv/bcrsite/uploaded/content/category/949040148.pdf