UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS ECONÓMICAS
ESCUELA DE ECONOMÍA
ECONOMETRÍA
TEMA DE INVESTIGACIÓN:
“PRINCIPALES DETERMINANTES DEL DESEMPLEO FEMENINO EN EL SALVADOR EN EL 2020”.
DOCENTE:
MSF. Carlos Ademir Pérez Alas.
Integrantes: Carnet Participación
Rebeca Isabel, Gálvez Gonzáles. Gg19017. 100%
Sofía Lissette, Mancía Chacón. Mc17163. 100%
Jacqueline Patricia , Mónico Rogel. Mr15093. 50%
Diana Carolina, Villatoro Romero. Vr18003. 100%
GRUPO:
Gt 03
CIUDAD UNIVERSITARIA, VIERNES 08 DE JULIO DEL 2022 .
En el Presente trabajo se treta de construir un modelo clásico de regresión lineal múltiple para predecir el nivel de desempleo femenino en El Salvador en el año 2020 con la variable endógena Tasa de desempleo y exógenas edades, nivel educación, salarios y población.
El desempleo femenino es algo observado en los estudios sobre el salvador en el ámbito del desempleo juvenil de la organización internacional del trabajo con este modelo trataremos de pronosticar el nivel que este aumenta en un año y a variable de las escogidas tiene mayor influencia en ello.
Y esta investigación nos hará ver a que se enfrentan las mujeres en el mercado laboral y por que estas no aumentan y no tienen puestos altos en su vida laboral como igual nos hará ver que variables son de mayor importancia a la hora de obtener un empleo o buscar uno si la paga define en la aceptación de ello en el campo femenino y de hecho si se les ofrece menor paga que a un hombre.Desarrollar un modelo econométrico que permita pronosticar las tasas de desempleo femenina en El Salvador por año.
Definir las variables a estudiar que más inciden en el modelo econométrico de nuestro fenómeno económico.
Definir la relación más fuerte de la variable con las tasas de desempleo femenina.
Mostrar los datos obtenidos por otras entidades donde basaremos nuestro modelo econométrico para la verificación de las relaciones.
Demostrar y analizar los resultados obtenidos del modelo como se acerca a la realidad y que se espera para los años siguientes para identificar puntos de modificación en el impulso de la absorción de la mano femenina en el mercado laboral.
Según Roberto Vasquez Burguiillo “la tasa de desempleo” mide el nivel de desocupacón en relación con la población activa. Es decir, es la parte de la población que esta en edad, condiciones y disposición de trabajar (población activa), no tiene puesto de trabajo.(Economipedia.com)
La tasa de desempleo se refiere a las personas en edad laboral que no tienen empleo, que están dispuestas a trabajar, y que han realizado acciones específicas para encontrar empleo. La aplicación homogénea de esta definición da como resultado estimaciones de tasas de desempleo que son más comparables internacionalmente que las estimaciones basadas en las definiciones nacionales de desempleo. Este indicador mide el número de personas desempleadas como porcentaje de la fuerza laboral y se ajusta de acuerdo con la temporalidad. La fuerza laboral se define como el número total de personas desempleadas más aquellas que cuentan con empleo. Los datos se basan en encuestas laborales (LFS, por sus siglas en inglés).(oecd.org)
Es un indicador económico que determina el nivel de falta de empleos en una sociedad, en relación con la población que se encuentra económicamente activa.
Contexto Economico y Laboral Pre-pandemia COVID-19
La pandemia del COBID-19 se recibe en El Salvador en un contexto económico frágil. En los últimos 20 años, el país se ha caracterizado por registrar bajos niveles de crecimiento económico (el promedio observado entre 2002 y 2011 fue de 1.9% y entre 2012 y 2019 de 2.3%). Para el 2019 el país cerró con un crecimiento económico del 2.3%.(Proyecciones CEPAL,Banco Mundial y el FMI).
Una estimación preliminar de los empleos en riesgo desde un enfoque sectorial para EL Salvador se tuvo que un 51,4% del total de empleo estuvo en riesgo alto,es decir,alrededor de 1,500,00 empleos,ubicados en los sectores económicos.
Los empleos de las mujeres se vieron afectados por la alta participación femenina en los sectores de más alto riesgo ante la crisis: hogares como empleadores y comercio, hoteles y rstaurantes (87,7% y 59,3% respectivamente).EDUCACIÓN EN LAS MUJERES
La Política de Equidad e Igualdad de Género del Ministerio de Educación tiene por fin educar al pueblo salvadoreño sin discriminación de género, aplicando principios rectores como la igualdad de derechos, la equidad, la no discriminación, la corresponsabilidad, la laicidad y el desarrollo humano social en todo el accionar del MINED, en coherencia con el marco legal y filosófico adoptado. Con la entrada en vigencia de la Política, se busca erradicar las desigualdades entre mujeres y hombres existentes en el sistema educativo nacional, la cual constituye un instrumento normativo orientador para que los servicios, actuaciones, procesos, estructura, organización y funcionamiento de este ministerio permitan avances sustantivos en la construcción de ciudadanía plena, democrática y favorecedora del desarrollo económico y social del país. El Trabajo no remunerado constituye la fuerza de trabajo invertida para la reproducción de la misma, el cuidado y el bienestar familiar, y por lo general es desempeñando en el ámbito del hogar o espacios vinculados a éste.17 Los datos señalan que las mujeres tienen una amplia participación dentro del TNR, el 69.6% de las mujeres y el 5.8% de los hombres en condición de inactividad se dedican a los quehaceres domésticos y obligaciones familiares ; vale señalar que la razón más importante de inactividad de los hombres es que se encuentran estudiando (44.6%), en tanto que para las mujeres es que se dedican al trabajo del hogar (67.9%). Esta situación impone una desventaja a las mujeres cuando ingresan al mercado de trabajo ya que están menos formadas, lo que consecuentemente repercute en menores ingresos o salarios. Integrar la perspectiva de género en la educación significa hacer visibles las desigualdades de género, sociales y educativas entre mujeres y hombres, en el acceso a la educación. Precisamente, el reto consiste en desmontar o desnaturalizar todas aquellas creencias, prácticas y relaciones asimétricas entre mujeres y hombres, que ocurren en el ámbito educativo y tienden a pasar desapercibidas, por cuanto se asumen como parte de la cotidianidad.
La educación constituye una de las estrategias indispensables para construir la igualdad entre mujeres y hombres en todas las esferas de la vida. La educación puede contribuir a aumentar significativamente las posibilidades y opciones de desarrollo personal de unas y otros y, particularmente, de las mujeres, quienes han estado en desventaja. La educación se considera cada vez, en mayor medida, una de las inversiones más efectivas para alcanzar el desarrollo equitativo y sostenible. La continuidad educativa tiene implicaciones positivas para la calidad de vida de las personas. En El Salvador se ha documentado evidencia que demuestra una relación directa entre el nivel educativo de una persona, la probabilidad de tener un empleo, que este sea en el sector formal, y que se perciban ingresos laborales más altos. Sin embargo, la deserción continúa siendo un obstáculo que las políticas públicas no logran superar consistentemente y que, de manera particular, afecta a estudiantes que transitan de noveno grado a bachillerato o que ya se encuentran en educación media. Esto dificulta que algunos salvadoreños tengan acceso al mercado de trabajo o que lo logren en condiciones que promuevan su desarrollo, pudiendo motivar, incluso, migración irregular. Finalmente, es importante hacer conciencia en la población sobre cómo mantenerse estudiando puede contribuir a su desarrollo, en sus lugares de origen, debido a que una mayor escolaridad incrementa la probabilidad de tener éxito en las oportunidades disponibles en el mercado de trabajo.
La cantidad de empleo disponible
La OIT calcula el impacto de la pandemia del COVID-19 en el segundo trimestre 2020 en una reducción del 10.7% de las horas trabajadas a nivel mundial equivalentes a 305 millones de empleos a tiempo completo (48 horas semanales). En el año 2019, la tasa de desempleo en El Salvador fue de 6.3%, con la pandemia del COVID-19 la cifra aumento significativamente en la cantidad de personas desempleadas.
El Salvador a diferencia del resto de paises de Centroamérica la tasa de desempleo de los hombres es mayor que la tasa de desempleo de las mujeres (7.0% y 5.4% respectivamente). La población mas afectada son las personas más jóvenes, de 196,747 personas desocupadas en el país, alrededor del 40.1% se encontraban en el rango de 15 a 24 años. Los jóvenes registran una tasa de desempleo del 13.4% frente a una tasa de 4.6% para las personas entre 25 y 59 años.El desempleo de las personas jóvenes duplica la tasa de desempleo nacional.
Es importante señalar que la economía salvadoreña genera alrededor de 30,000 empleos al año, pero esto es inferior a los 40,000 empleos que se requieren para proporcionar trabajo a quienes ingresan al mercado laboral año con año.Los más vulnerables
Las mujeres son un grupo particularmente importante, a raiz de la amplia labor que desarrolla en los sectores mas afectados como es el sector servicio o por realizar un trabajo de primera línea para hacer frente a la pandemia. En El Salvador, el 79.5% de las mujeres que trabajan lo hacen el el sector terciario. Las mujeres tienen menor acceso a servicios de protección social y soportan una carga laboral.
Para Darity(1995)
Los efectos del canal productivo pueden ser mayores que los del mercado laboral para los países más pobres y con menos servicios públicos de cuidado. Lo opuesto ocurriría en países más ricos. En esta línea, Erturk y Cagatay sistematizan diversos estudios empíricos sobre feminización laboral y siguiendo a Rubery, identifican tres modalidades de inserción laboral de las mujeres:
Una primera modalidad, de tipo procíclico en la que mano de obra de las mujeres se comporta como un ejército de reserva flexible que se incrementa en crecimiento y disminuye en recesión. Una segunda modalidad, segmentada, en la que existen sectores feminizados y el impacto de las recesiones o los auges de la economía en la composición de la fuerza de trabajo (entrada o salida de mujeres), depende de la composición de los sectores y las ocupaciones que acompañan estos ciclos.
La estructura feminizada “protege” a las mujeres de ser las primeras en salir del mercado en situaciones de recesión. En este sentido, hay un comportamiento contra cíclico. Una tercera modalidad que indica que la mano de obra de las mujeres sustituye la mano de obra masculina en contextos de crisis, cuando los principales perceptores pueden estar en situación de desempleo o subempleo.
Igualmente, el mercado puede inclinarse por cooptar personas con menores expectativas de salario, pero que pueden realizar un trabajo similar, con el fin de ahorrar costos en una situación recesiva.
El aumento de la desigualdad económica es un duro golpe para la lucha contra la desigualdad de género y una amenaza para los derechos de las mujeres. El fortalecimiento económico de las mujeres tiene la capacidad potencial de mejorar la vida de muchas de ellas y de contribuir al crecimiento económico.
La brecha entre ricos y pobres es mayor y continúa aumentando. Esto supone un duro golpe para la lucha contra la desigualdad de género, así como una amenaza para los derechos de las mujeres.En 2015 la brecha aumento que ahora 1% más ricos de la población mundial posee más riqueza que la que comparte el resto de la humanidad.
Recientemente, numerosas personalidades han abogado por una mayor participación de las mujeres en la economía mundial. La evidencia disponible muestra que el fortalecimiento económico de las mujeres es importante para la realización de los derechos de las mujeres.
Actualmente, la mitad de la población activa está compuesta por mujeres y sin embargo tan solo generan el 37% del PIB mundial.
Está claro que una participación más equitativa de las mujeres en la economía contribuiría a un mayor crecimiento económico mundial y al fortalecimiento económico de las mujeres.
Sin embargo, Oxfam ha demostrado que la mayoría de las personas que han beneficiado del crecimiento económico en las últimas décadas han sido quienes ya se encontraban en altas distribuciones de ingresos. La desigualdad de género impide a muchas mujeres percibir un salario digno, y limita sus oportunidades y decisiones económicas. Abordar estas desigualdades y avanzar hacia el fortalecimiento económico de las mujeres sería beneficioso no solo para las mujeres sino también para lograr un estímulo más amplio del desarrollo.
El acceso a un trabajo decente y un salario digno es una vía fundamental para salir de la pobreza y para las mujeres es una manera de hacer frente a la desigualdad de género ya que les permite mejorar su poder en la toma de decisiones. La tasa de empleo actual de las mujeres es en casi todos los casos que la de los hombres. Si bien existe diferencias entre distintas regiones del mundo en general, tasa de participación de las mujeres en el mercado laborar lleva estancada desde principios de los años 90. Las mujeres que participan en el mercado de trabajo formal, invariablemente ganan menos que los hombres por lo tanto la brecha salarial es del 24% y en casi todos los países, los salarios de las mujeres representan entre un 70 y un 90% el salario de los hombres.
Aumentar la representación y el poder de decisión de las mujeres, y hacer que las instituciones gubernamentales funciones con transparencia. Para muchas mujeres, tener acceso a un trabajo decente y a un salario digno puede ser una vía fiable para salir de la pobreza y un pilar para su fortalecimiento en otras áreas.Los programas de ajuste estructural y las reformas orientadas al mercado están fuertemente relacionados con el deterioro de la posición relativa de las mujeres en el mercado laboral.
La tasa de desempleo representa diferencias en cuanto al sexo, ya que es mayor entre las mujeres que entre los hombres. En el conjunto de la población de 25 a 64 años, la diferencia es de 3.6 puntos porcentuales y para la población joven es de 2.6puntos. Las diferencias entre sexos más bajas se observan en la población con educación superior. Por niveles educativos, la reducción de la tasa de desempleo en los últimos años presenta diferencias en cuanto a la magnitud de las variaciones, si bien en términos relativo la mejora de la tasa de desempleo es mayor según aumenta el nivel de formación.
Para Erturk y Cagatay sistematizan diversos estudios empíricos sobre feminizacón laboral
La participación femenina en la fuerza laboral se estima para el año 2020 de 5.5% según la Organización Internacional del Trabajo.
Porque es importante la tasa de desempleo
Es una forma de medición del desempleo, calcula cuántas personas, que están en condiciones de tener un empleo y lo están buscando, continúan desempleadas. Además es un indicador sumamente importante para evaluar el desempeño económico de un país.
La noción de tasa de desempleo, como tradicionalmente se la define, constituye una medida de la distancia del sistema económico considerado del equilibrio de pleno empleo. Tal noción recuerda, la idea de que la economía básicamente depende de los mecanismos de ajuste de mercado entre oferta y demanda.
En materia de empleo, ocurre un interesante fenómeno: El Salvador es el único país en que la tasa de desempleo del hombre supera a la de la mujer. Así la tasa de desempleo ha venido descendiendo desde 1991. Esta relativamente baja tasa de desempleo en las mujeres coexiste con una menor tasa de participación femenina que masculina, lo que puede estar relacionado con algún grado de discriminación en el mercado laboral formal y la denomina “división sexual del trabajo”, ya que la ocupación formal femenina se cemtra en las ramas de comercio, restaurantes y hoteles(42.3%), industria manufactura (21%) y hogares con servicio doméstico (10.5%); asimismo, una alta proporción de mujeres colocadas estadísticamente en la Población económicamente Inactiva (PEI) se dedican a oficios del hogar (54.2%) mientras que la proporción de PEI dedicada a estudiar es menor en el caso femenino (32.2%).
A nivel urbano, la mujer evidencia una mayor tasa de ocupación en el sector informal de la economía, el 59.7% esta en este sector de las mujeres ocupadas, además, los salarios en este sector informal suelen ser menores que en el sector formal.
Planteamiento del fenómeno teórico
Planteamiento del problema
El desempleo femenino es un problema que viene desde hace mucho en la historia salvadoreña al igual y que otros problemas pues la mujer se ve menos envuelta en la vida de empresas se le a renegado a solo ser la ama de casa la que cuida los niños pero eso ha ido cambiando y aun que no estamos en una igualdad de puestos y de oportunidades cada vez hay más mujeres preparadas para una vida laboral en esta investigación nos planteamos el problema de que si estas mujeres preparadas cuentan con un puesto laboral si están activas económicamente o inactivas en su momento y la preparación que estas tienen o cuentan hasta el momento y se desea prever el nivel de desempleo para el año 2020 y por consiguiente con este modelo bree ver le crecimiento anual de este y ver que variables inciden más en el desarrollo laboral de las mujeres y que medidas se podrían tomar.
Tasa de desempleo
Variable cuantitativa discreta que registra la cantidad de personas desempleadas en la región, por la población económicamente activa, es decir por aquellas personas que tienen empleo o lo están buscando activamente.
Para calcular la Tasa de desempleo:
TD = Número de empleados/ Población económicamente activa*100
La forma en la que se obtuvo los datos para la tasa de desempleo fue calcular el número de desempleados como porcentaje del total de la población activa o población económicamente activa que es la suma del número de personas empleadas y del número de personas desempleadas.La información fue obtenida …..
La Población Económicamente Inactiva (PEI).
Es el grupo de personas en edad de trabajar que no participan en el mercado laboral. Es decir, que no realizan ni buscan alguna actividad económica. La PEI está conformada por los estudiantes, jubilados o pensionistas, rentistas, personas dedicadas a los quehaceres del hogar, ancianos, etc. El común denominador es pues el no participar en ninguna actividad generadora de bienes o servicios a los que se les imputa valor agregado.
La Población Económicamente Inactiva está conformada por la parte de la población en edad de trabajar (PET) que no busca trabajo de forma activa y está compuesta por el 37.8% de la población nacional siendo el 76% mujeres (DIGESTYC, 2016). Esta inactividad puede ser por diversos factores como el estudio, enfermedades, jubilaciones, obligaciones familiares, trabajo no remunerado en el hogar, etc. Sin embargo, algunas de estas razones que mantienen en esta categoría a la población son fruto de las relaciones de género de la sociedad salvadoreña, puesto que pueden ser vinculadas al sexo, como por ejemplo, la educación, obligaciones familiares, el quehacer doméstico, el no saber trabajar o recibir capacitaciones son razones de las cuales las mujeres presentan más limitaciones que los hombres ya sea para la inserción como para la estabilidad laboral.
Cabe destacar que la educación es un motivo para las mujeres de no insertarse al mercado laboral; esto es el nivel de preparación sostiene el enfoque de capital humano. La educación brinda a los hombres más oportunidades de acceso al mercado laboral y una permanencia estable; pero no son dependientes de conseguir cierto nivel de estudio para lograr su inserción. Mientras que para las mujeres si su nivel de educación es nulo o bajo su participación en la sociedad gira en torno al cuidado y el quehacer doméstico. (UCA, octubre 2017)
Tipo de actividad
En el trimestre móvil noviembre 2020 - enero 2021, la poblacióneconómicamente inactiva dedicada a oficios del hogar se ubicó en 45.7%. En enero 2020, seguido de la población que se dedicó a estudiar 32.5%. Las mujeres inactivas en su mayoría se dedicaron a oficios del hogar 63.5%, seguido por las que se dedicaron a estudiar 23.2%, en el periodo de 2020. (Boletin,2020)
Rango de Edad
Variable cuantitativa continua que registra el rango de edades medidos en años de la población femenina desempleada.
Nivel de educación
Variable cualitativa ordenables que registra el nivel de educación. Esta viene presesentada asi, donde: Ninguna = 0, Educasión Basica = 1, Educación Media= 2 y Educación Superior= 3
Salario
Variable cuantitativa discreta registra el valor monetario del salario que se han registrado. La información fue obtenida de la página de Dirección General de Estadística y Censos (Digestyc).
Población de Mujeres desempleadas
Variable cuantitativa continua registra la cantidad de mujeres que estuvieron desempleadas en el año 2020. Información en la página del banco mundial.
Tasa de crecimiento
Esta tiene una incidencia directa ya que el crecimiento garantiza la disminución del desempleo.
PIB
El PIB es el mayor balance que registra el crecimiento y el estancamiento en este se refleja la producción y el desempleo si este crece el desempleo se reduce al igual que el anterior. Existe una relación consistente entre el crecimiento de la economía (evolución del PIB) y la variación en la tasa de desempleo: si el producto crece el desempleo disminuye en una proporción similar.
Inversión
Aumento de inversión disminuye el desempleo.
Producción
El aumento de esta genera una disminución directa de la tasa de desempleo como si esta cae incrementa la tasa de desempleo al igual que con los otros regresores.
Relación entre la tasa de desempleo y el rango de edad
Existe una relación indirecta entre la tasa de desempleo y el rango de edades. Si aumenta la tasa de desempleo el rango de edades de mujeres desempleadas se mantiene en sus niveles.
Relación entre la tasa de desempleo y Nivel de educación
El nivel de educación es el nivel de educación más alto. Existe una relación indirecta entre las dos variables. Si el grado de educación es más alto; es decir, las mujeres podrán obtener más oportunidades de empleo en el mercado laboral, la tasa de desempleo decendera. En caso contrario, si el nivel de educación es bajo la tasa de desempleo aumenta.
Relación entre la tasa de desempleo y el Salario
Salario es la remuneración recibida por una persona como pago por su trabajo. Existe una relación directa entre la tasa de desempleo y el Salario. Mientras mayor sea el salario mayor es la tasa de desempleo.
Relación entre la tasa de desempleo y Población de Mujeres desempleadas
Existe una relación directa entre la tasa de desempleo y la Población de Mujeres desempleadas. A medida que aumenta la población desempleada mayor será la tasa de desempleo, asimismo al disminuir la poblacón desempleada la tasa de desempleo seria menor.
Ho: No hay evidencia de una relación lineal entre la Tasa de desempleo y todas sus variables exógenas.
H1: Hay evidencia de una relación lineal entre la Tasa de desempleo y todas sus variables exógenas.
Nivel de Educación.
Ho: La variable Educación no tiene una relación lineal parcial con la variable Tasa de desempleo.
H1: La variable Edcación tiene una relación lineal parcial con la variable Tasa de desempleo.
La Población
Ho: La variable de la Población no tiene una relación lineal parcial con la variable Tasa de desempleo.
H1: La variable de la Población tiene una relación lineal parcial con la variable Tasa de desempleo.
Salario
Ho: La variable Salario no tiene una relación lineal parcial con la variable Tasa de desempleo
H1: La variable Salario tiene una relación lineal parcial con la variable Tasa de desempleo.
Edad
Ho: La variable Edad no tiene una relación lineal parcial con la variable Tasa de desempleo
H1: La variable Edad tiene una relación lineal parcial con la variable Tasa de desempleo.
Para determinar la proyeccion de desempleo enla mujeres de el salvador en el año 2020, su interaccion entre las variables y el resultado de la prediccion, se muestra como emplear un modelo lineal con una base de datos limitada, este modelo permite estimar la relacion lineal entre la tasa de desempleo y la educacion, el sexo, salrio promedio,edad, poblacion para esto se ha tomado el año 2020 para la realizacion.
Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5 X5 + β6X6
Donde:
Y = Tasa de desempleo
X1 = Sexo
X2 = Población
X3 = Nivel de Educación
X4 = Edad
X5 = Salarios
X6 = Error
Por lo tanto:
Y = β0 + β1(Sexo) + β2(Población) + β3(Nivel_de_Educación) + β4(Edad) + β5(Salarios)+ β6(Error)
Esperando que las variable X1, X2, X3, X4 y X5.
Especificación del modelo estadístico.
Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5 X5 + ε
El error incluye todas las variables omitidas dentro del análisisetc.
A continuacion presentamos los datos con los que se desarrolla la investigación. Nuestra base es un estracto de la base de datos de la Encuesta de Hogares de Propositos Multiples (EHPM 2020), que fue obtenida en el sitiio web de la Dirección General de Estadística y Censos. (DIGESTYC).
Debido a la enorme cantidad de variables que contiene la encuesta solo presentamos la información que corresponde a las variables que estudiamos en esta investigación.
Con el proposito tener un mejor manejo a la hora de usar la información, los nombres de las variables se han designado siguiente manera:
td_tasa_de_desempleo = Tasa de Desempleo de Mujeres
a_población = Tasa de Población Económicamente Activa(PEA) y Población Económicamente Inactiva(PEI)
O_sexo = Hace Referncia a las Mujeres Desempleadas
n_educación = Es el nivel de Educación que tiene la Población
c_edad = Es la Edad en que la persona esta activamente o inactivamente trabajando
pm_promedio_salarios = Es el Salario de la Población conforme sus niveles academicos
library(readxl)
Base_de_datos_1 <- read_excel("Base_de_datos_1.xlsx")
options(scipen = 999999)
#Utilizando la libreria dplyr
library(dplyr)
glimpse(Base_de_datos_1)
## Rows: 200
## Columns: 6
## $ td_tasa_de_desempleo <dbl> 0.066, 0.066, 0.066, 0.066, 0.066, 0.066, 0.066, …
## $ `0_sexo` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ a_poblacion <dbl> 0.934, 0.934, 0.934, 0.534, 0.934, 0.534, 0.934, …
## $ pm_promedio_salarios <dbl> 230.78, 230.78, 230.78, 0.00, 304.80, 0.00, 304.8…
## $ n_educacion <dbl> 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 1, 3, 3, 2, 3, 1…
## $ c_edad <dbl> 25, 25, 30, 35, 40, 54, 30, 24, 18, 35, 35, 36, 3…
##Base de datos 200 observaciones
str(Base_de_datos_1)
## tibble [200 × 6] (S3: tbl_df/tbl/data.frame)
## $ td_tasa_de_desempleo: num [1:200] 0.066 0.066 0.066 0.066 0.066 0.066 0.066 0.066 0.066 0.066 ...
## $ 0_sexo : num [1:200] 1 1 1 1 1 1 1 1 1 1 ...
## $ a_poblacion : num [1:200] 0.934 0.934 0.934 0.534 0.934 0.534 0.934 0.934 0.934 0.934 ...
## $ pm_promedio_salarios: num [1:200] 231 231 231 0 305 ...
## $ n_educacion : num [1:200] 1 1 1 1 2 2 2 2 2 2 ...
## $ c_edad : num [1:200] 25 25 30 35 40 54 30 24 18 35 ...
Las 200 observaciones el sexo es solo de las mujeres las cuales fueron el enfoque dirrecto de la investigación la tasa de desempleo es constante puesto que cada una lucha con ella el rango de edad de 16 a 39 y de 40 a 59 y de 60 a más Población economícamente activa con un promedio de salarios y el nivel de educación en un rango de primero a noveno (1°- 9°) que es educación básica y de (10° - 12°) educación media luego educación superior.
#Estimación del Modelo
library(stargazer)
options(scipen = 999999)
modelo_desempleo_mujeres<-lm(formula = td_tasa_de_desempleo~a_poblacion
+pm_promedio_salarios+n_educacion+c_edad,data = Base_de_datos_1)
stargazer(modelo_desempleo_mujeres,title = "Modelo Desempleo en Mujeres"
,type = "html",digits = 8)
Dependent variable: | |
td_tasa_de_desempleo | |
a_poblacion | -0.00000000 |
(0.00000000) | |
pm_promedio_salarios | 0.00000000 |
(0.00000000) | |
n_educacion | 0.00000000 |
(0.00000000) | |
c_edad | 0.00000000 |
(0.00000000) | |
Constant | 0.06600000*** |
(0.00000000) | |
Observations | 200 |
R2 | 0.49929500 |
Adjusted R2 | 0.48902410 |
Residual Std. Error | 0.00000000 (df = 195) |
F Statistic | 48.61272000*** (df = 4; 195) |
Note: | p<0.1; p<0.05; p<0.01 |
Con una muestra de 200 observaciones, los resultados muestran que el modelo se ajusta bastante bien a la variable real, es decir, que existe una relacion funcional entre las variables explicativas y la endogena.
Las hipotesis para la prueba son las siguientes:
Ho: los residuales del modelo siguen una distribucion normal
Ha: los residuales del modelo no siguen una distribucion normal
Regla de desicion:
Rechazar: Ho si 𝐽𝐵 ≥ 𝑉.𝐶
Rechazar: Ho si 𝑝 ≤ 𝛼
Prueba Jarque Bera (JB)
#Prueba JB usando libreria normtest
library(stargazer)
library(normtest)
jb.norm.test(modelo_desempleo_mujeres$residuals)
##
## Jarque-Bera test for normality
##
## data: modelo_desempleo_mujeres$residuals
## JB = 310426, p-value < 0.00000000000000022
Interpretacion:
Como 𝐽𝐵 ≥ 𝑉.𝐶, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.
Alternativamenmte
Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000000022 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.
# Graficando
library(stargazer)
library(fastGraph)
gl<-2
VC<-qchisq(p = 0.95, df=gl)
prueba_JB<-jb.norm.test(modelo_desempleo_mujeres$residuals)
print(prueba_JB)
##
## Jarque-Bera test for normality
##
## data: modelo_desempleo_mujeres$residuals
## JB = 310426, p-value < 0.00000000000000022
Prueba Kolmogorov Smirnov - Lilliefors
library(stargazer)
library(nortest)
lillie.test(modelo_desempleo_mujeres$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelo_desempleo_mujeres$residuals
## D = 0.43389, p-value < 0.00000000000000022
Interpretacion:
Como 𝐽𝐵 ≥ 𝑉.𝐶, se rechaza la hipotesis Ho. Hay evidencia que los residuales no tienen una distribucion normal.
Alternativamenmte
Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.00000000000000022 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.
qqnorm(modelo_desempleo_mujeres$residuals)
qqline(modelo_desempleo_mujeres$residuals)
Histograma de los residuos
#Gráficando la Prueba
hist(modelo_desempleo_mujeres$residuals,main = "Histograma de los residuos",xlab = "R
esiduos",ylab = "frecuencia")
Prueba Shapiro - Wilk
library(stargazer)
shapiro.test(modelo_desempleo_mujeres$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo_desempleo_mujeres$residuals
## W = 0.092217, p-value < 0.00000000000000022
Con un nivel de significancia del 0.05, se rechaza la Hipotesis nula Ho porque 0.000000000022 < 0.05, hay evidencia de que los residuos no tienen distribucion normal.
Prueba Shapiro - Wilk
Rechazar Ho si 𝑊𝑁 ≥ 𝑉.𝐶. Rechazar Ho si 𝑝 ≤ 𝛼
#Calcular matriz X'X
library(stargazer)
X_mat<-model.matrix(modelo_desempleo_mujeres)
stargazer(head(X_mat,n=6),type= "html")
(Intercept) | a_poblacion | pm_promedio_salarios | n_educacion | c_edad | |
1 | 1 | 0.934 | 230.780 | 1 | 25 |
2 | 1 | 0.934 | 230.780 | 1 | 25 |
3 | 1 | 0.934 | 230.780 | 1 | 30 |
4 | 1 | 0.534 | 0 | 1 | 35 |
5 | 1 | 0.934 | 304.800 | 2 | 40 |
6 | 1 | 0.534 | 0 | 2 | 54 |
XX_matrix<-t(X_mat)%*%X_mat
stargazer(XX_matrix,type = "html")
(Intercept) | a_poblacion | pm_promedio_salarios | n_educacion | c_edad | |
(Intercept) | 200 | 156.400 | 39,100.360 | 285 | 6,912 |
a_poblacion | 156.400 | 129.844 | 35,998.960 | 225.390 | 5,436.208 |
pm_promedio_salarios | 39,100.360 | 35,998.960 | 14,080,896.000 | 67,342.140 | 1,387,591.000 |
n_educacion | 285 | 225.390 | 67,342.140 | 501 | 9,932 |
c_edad | 6,912 | 5,436.208 | 1,387,591.000 | 9,932 | 261,512 |
Cálculo de la matriz de normalización
library(stargazer)
options(scipen = 99999)
Sn<-solve(diag(sqrt(diag(XX_matrix))))
stargazer(Sn,type = "html")
0.071 | 0 | 0 | 0 | 0 |
0 | 0.088 | 0 | 0 | 0 |
0 | 0 | 0.0003 | 0 | 0 |
0 | 0 | 0 | 0.045 | 0 |
0 | 0 | 0 | 0 | 0.002 |
Atravéz del índice de condición
Cálculo de la matriz X’X
#X'X Normalizada
library(stargazer)
XX_norm<-(Sn%*%XX_matrix)%*%Sn
stargazer(XX_norm,type = "html",digits = 4)
1 | 0.9705 | 0.7368 | 0.9003 | 0.9557 |
0.9705 | 1 | 0.8419 | 0.8837 | 0.9329 |
0.7368 | 0.8419 | 1 | 0.8018 | 0.7231 |
0.9003 | 0.8837 | 0.8018 | 1 | 0.8677 |
0.9557 | 0.9329 | 0.7231 | 0.8677 | 1 |
#Autovalores de X'X Normalizada
library(stargazer)
#autovalores
lambdas<-eigen(XX_norm,symmetric = TRUE)
stargazer(lambdas$values,type = "html")
4.454 | 0.341 | 0.140 | 0.057 | 0.008 |
K<-sqrt(max(lambdas$values)/min(lambdas$values))
print(K)
## [1] 23.19042
Un indice de condición con un valor por encima de 20, sugiere la presencia de multicolinealidad mediana en los regresores del modelo, para nuestro caso el valor de este es de 23.19 con lo cual podemos decir que para nuestro modelo la multicolinealidad es considerada un problema.
Utilizando la librería “mctest”
library(mctest)
eigprop(mod = modelo_desempleo_mujeres)
##
## Call:
## eigprop(mod = modelo_desempleo_mujeres)
##
## Eigenvalues CI (Intercept) a_poblacion pm_promedio_salarios n_educacion
## 1 4.4537 1.0000 0.0008 0.0008 0.0040 0.0050
## 2 0.3413 3.6125 0.0061 0.0001 0.2253 0.0003
## 3 0.1395 5.6496 0.0010 0.0166 0.0287 0.6183
## 4 0.0572 8.8271 0.0508 0.0639 0.0455 0.0001
## 5 0.0083 23.1904 0.9414 0.9186 0.6964 0.3763
## c_edad
## 1 0.0039
## 2 0.0387
## 3 0.0305
## 4 0.8825
## 5 0.0443
##
## ===============================
## Row 5==> a_poblacion, proportion 0.918618 >= 0.50
## Row 5==> pm_promedio_salarios, proportion 0.696380 >= 0.50
## Row 3==> n_educacion, proportion 0.618289 >= 0.50
## Row 4==> c_edad, proportion 0.882527 >= 0.50
Cálculo de R
Normalizar la matriz X
library(stargazer)
Zn<-scale(X_mat[,-1])
stargazer(head(Zn,n=6),type = "html", title = "Matriz X Normalizada")
a_poblacion | pm_promedio_salarios | n_educacion | c_edad | |
1 | 0.781 | 0.196 | -0.616 | -0.896 |
2 | 0.781 | 0.196 | -0.616 | -0.896 |
3 | 0.781 | 0.196 | -0.616 | -0.428 |
4 | -1.274 | -1.087 | -0.616 | 0.041 |
5 | 0.781 | 0.608 | 0.833 | 0.510 |
6 | -1.274 | -1.087 | 0.833 | 1.823 |
Calcular la matriz R comentario
library(stargazer)
#obteniendo R
n<-nrow(Zn)
R<-(t(Zn)%*%Zn)*(1/(n-1))
stargazer(R,type = "html",digits = 4,title = "Matriz R")
a_poblacion | pm_promedio_salarios | n_educacion | c_edad | |
a_poblacion | 1 | 0.7784 | 0.0942 | 0.0751 |
pm_promedio_salarios | 0.7784 | 1 | 0.4704 | 0.0951 |
n_educacion | 0.0942 | 0.4704 | 1 | 0.0562 |
c_edad | 0.0751 | 0.0951 | 0.0562 | 1 |
#Calculamos R
determinante_R<-det(R)
print(determinante_R)
[1] 0.230787
Prueba de Farrer Glauber comentario
m<-ncol(X_mat[,-1])
n<-nrow(X_mat[,-1])
chi_FG<--(n-1-(2*m+5)/6)*log(determinante_R)
print(chi_FG)
## [1] 288.6088
Obtenemos el valor critico
#Valor critico
gl<-m*(m-1)/2
VC<-qchisq(p = 0.95,df = gl)
print(VC)
## [1] 12.59159
Estos resultados nos sugieren que debemos de rechazar la hipótesis nula, y considerar la existencia de evidencias en favor de la presencia de cierto grado de multicolinealidad en los regresores del modelo ya que el estadistico de prueba es mayor al valor critico.
#Librería Psych
library(psych)
FG_test<-cortest.bartlett(X_mat[,-1])
print(FG_test)
## $chisq
## [1] 288.6088
##
## $p.value
## [1] 0.00000000000000000000000000000000000000000000000000000000002253909
##
## $df
## [1] 6
#Graficando los resultados
library(fastGraph)
shadeDist(xshade = FG_test$chisq, ddist = "dchisq", parm1 = FG_test$df,lower.tail =
FALSE, sub = paste("VC:", VC, "FG:", FG_test$chisq))
Factores Inflacionarios de la Varianza
#Matriz de Correlación de los regresores del modelo
print(R)
## a_poblacion pm_promedio_salarios n_educacion c_edad
## a_poblacion 1.00000000 0.77840107 0.09422410 0.07510371
## pm_promedio_salarios 0.77840107 1.00000000 0.47038412 0.09505894
## n_educacion 0.09422410 0.47038412 1.00000000 0.05623123
## c_edad 0.07510371 0.09505894 0.05623123 1.00000000
inversa_R<-solve(R)
print(inversa_R)
## a_poblacion pm_promedio_salarios n_educacion c_edad
## a_poblacion 3.3432091 -3.14995680 1.16765238 -0.01731440
## pm_promedio_salarios -3.1499568 4.25983711 -1.70287507 -0.07260738
## n_educacion 1.1676524 -1.70287507 1.69216378 -0.02097398
## c_edad -0.0173144 -0.07260738 -0.02097398 1.00938175
#VIF'S para el modelo estimado
VIFs<-diag(inversa_R)
print(VIFs)
## a_poblacion pm_promedio_salarios n_educacion
## 3.343209 4.259837 1.692164
## c_edad
## 1.009382
#Obtención de VIF'S a traves de libreria "car"
library(car)
VIFs_car<-vif(modelo_desempleo_mujeres)
print(VIFs_car)
## a_poblacion pm_promedio_salarios n_educacion
## 3.343209 4.259837 1.692164
## c_edad
## 1.009382
#Obtención de VIF'S a traves de libreria "mctest"
library (mctest)
mc.plot(mod = modelo_desempleo_mujeres,vif = 2)
# 13. Verificación del supuesto de Heterocedasticidad
Hipotesis:
Ho: Hay evidencia de que la varianza de los residuos es Homocedastica
Ha: Hay evidencia de que la varianza de los residuos es Heterocedastica
Criterio de decisión:
Rechazar H0 sí LMW ≥ VC
Rechazar H0 sí Pvalue ≤ α
Prueba White
library(skedastic)
white_lm(modelo_desempleo_mujeres,interactions = FALSE)
## # A tibble: 1 × 5
## statistic p.value parameter method alternative
## <dbl> <dbl> <dbl> <chr> <chr>
## 1 2.72 0.951 8 White's Test greater
No se rechaza la Hiótesis nula ya que hemos obtenido un valor p (0.9505736) mayor que el nivel de significancia (0.05), por lo tanto hay evidencia de que la varianza de los residuos es homocedástica en la distribución de los residuos del modelo.
Prueba de Durbin Watson
library(lmtest)
## Usamos la Libreria lmtest
dwtest(modelo_desempleo_mujeres, alternative = "two.sided", iterations = 1000)
##
## Durbin-Watson test
##
## data: modelo_desempleo_mujeres
## DW = 1.0325, p-value = 0.000000000004602
## alternative hypothesis: true autocorrelation is not 0
Para un nivel de significancia de 5%
Como Pvalue > 0.05. Se puede rechazar la presencia de autocorrelacion de primer orden.
library(car)
## Usamos la libreria car
durbinWatsonTest(modelo_desempleo_mujeres, simulate= TRUE, reps= 1000)
## lag Autocorrelation D-W Statistic p-value
## 1 -0.00875519 1.032504 0.008
## Alternative hypothesis: rho != 0
En ambos casos caen en la zona de no rechazo de la Ho.
Autocorrelacion de primero orden
library(lmtest)
bgtest(modelo_desempleo_mujeres,order=1)
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: modelo_desempleo_mujeres
## LM test = 0.015448, df = 1, p-value = 0.9011
INTERPRETACIÓN: Como P > 0.05 no se rechaza la H0 , por lo tanto puede concluirse que los residuos del modelo no siguen autocorrelación de orden 1.
Autocorrelacion de segundo orden
library(lmtest)
bgtest(modelo_desempleo_mujeres,order=2)
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: modelo_desempleo_mujeres
## LM test = 0.026098, df = 2, p-value = 0.987
INTERPRETACIÓN: Como P > 0.05 no se rechaza la Ho , por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden 2.
Según las pruebas de normalidad realizadas a la presente investigación se refleja en la Prueba de Jarque-Bera por el método del enfoque del P que es menor al 5%, por tanto, se concluye que el modelo no posee una distribución normal.
Sin embargo, se puede asumir que el modelo se acerca o se aproxima a tener una distribución normal en los residuos bajo el Teorema del Limite Central. Este teorema establece que en condiciones muy generales, la suma de “n” variables aleatorias independientes tienen una distribución que se aproxima a la distribución gaussiana. Y como los residuos, en general, se componen de una suma de variables independientes que afectan a la variable explicada se puede aplicar este teorema para concluir que los errores siguen una distribucion normal.
Por tanto, se cumple el supuesto de normalidad.
Bajo la prueba de Farrer Glaubar, el modelo presente no adolece de multicolinealidad entre los regresores ya que el Índice de Condición (que es de 19.28082) es menor a 20, es decir, se ha detectado colinealidad leve. Por tanto, no existe violación del Supuesto de Colinealidad.
Además, el modelo econométrico en estudio ha sido diseñado para hacer proyecciones de ventas semanales a futuro. Por tanto, la presencia de multicolinealidad no impide el desarrollo de dicho modelo.
heterocedastica, es decir, una varianza no constante. Por otro lado, las pruebas de Autocorrelacion de orden 1 y 2, dieron resultados que evidencian la presencia de autocorrelacion de ambos niveles. Por lo tanto, el modelo adolece de Heterocedasticiad y Autocorrelación.utoccorrelacion.
#Modelo Estimado
library(foreign)
modelo_desempleo_mujeres<-lm(formula = td_tasa_de_desempleo~a_poblacion
+pm_promedio_salarios+n_educacion+c_edad,data = Base_de_datos_1)
print(modelo_desempleo_mujeres)
Call: lm(formula = td_tasa_de_desempleo ~ a_poblacion + pm_promedio_salarios + n_educacion + c_edad, data = Base_de_datos_1)
Coefficients: (Intercept) a_poblacion
0.06599999999999986433075 -0.00000000000000006534909
pm_promedio_salarios n_educacion
0.00000000000000000002802 0.00000000000000000635523
c_edad
0.00000000000000000085050
library(lmtest)
coeftest(modelo_desempleo_mujeres)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.065999999999999864330746 0.000000000000000077076778
a_poblacion -0.000000000000000065349087 0.000000000000000092883451
pm_promedio_salarios 0.000000000000000000028024
0.000000000000000000113471 n_educacion 0.000000000000000006355227
0.000000000000000018627926 c_edad 0.000000000000000000850497
0.000000000000000000931479 t value Pr(>|t|)
(Intercept) 856289038039659.6250 <0.0000000000000002 *** a_poblacion
-0.7036 0.4825
pm_promedio_salarios 0.2470 0.8052
n_educacion 0.3412 0.7333
c_edad 0.9131 0.3623
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05
‘.’ 0.1 ’ ’ 1
library(lmtest)
library(sandwich)
estimacion_desempleo<-vcovHC(modelo_desempleo_mujeres,type = "HC0")
coeftest(modelo_desempleo_mujeres,vcov. = estimacion_desempleo)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.065999999999999864330746 0.000000000000000012634777
a_poblacion -0.000000000000000065349087 0.000000000000000064981703
pm_promedio_salarios 0.000000000000000000028024
0.000000000000000000029077 n_educacion 0.000000000000000006355227
0.000000000000000006567608 c_edad 0.000000000000000000850497
0.000000000000000000898343 t value Pr(>|t|)
(Intercept) 5223677644577252.0000 <0.0000000000000002 *** a_poblacion
-1.0057 0.3158
pm_promedio_salarios 0.9638 0.3363
n_educacion 0.9677 0.3344
c_edad 0.9467 0.3449
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05
‘.’ 0.1 ’ ’ 1 # Corrección para Autocorrelación de Primer Orden
estimacion_desempleo<-vcovHC(modelo_desempleo_mujeres,type = "HC1")
coeftest(modelo_desempleo_mujeres, vcov. = estimacion_desempleo)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.065999999999999864330746 0.000000000000000012795736
a_poblacion -0.000000000000000065349087 0.000000000000000065809529
pm_promedio_salarios 0.000000000000000000028024
0.000000000000000000029447 n_educacion 0.000000000000000006355227
0.000000000000000006651275 c_edad 0.000000000000000000850497
0.000000000000000000909788 t value Pr(>|t|)
(Intercept) 5157968391839177.0000 <0.0000000000000002 *** a_poblacion
-0.9930 0.3219
pm_promedio_salarios 0.9517 0.3424
n_educacion 0.9555 0.3405
c_edad 0.9348 0.3510
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05
‘.’ 0.1 ’ ’ 1
robust.se1<-sqrt(diag(estimacion_desempleo))
estimacion_desempleo<-NeweyWest(modelo_desempleo_mujeres,lag = 2)
coeftest(modelo_desempleo_mujeres,vcov. = estimacion_desempleo)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.065999999999999864330746 0.000000000000000012461918
a_poblacion -0.000000000000000065349087 0.000000000000000010878759
pm_promedio_salarios 0.000000000000000000028024
0.000000000000000000009546 n_educacion 0.000000000000000006355227
0.000000000000000002536824 c_edad 0.000000000000000000850497
0.000000000000000000338452 t value Pr(>|t|)
(Intercept) 5296134783390158.0000 < 0.00000000000000022
a_poblacion -6.0070 0.000000009102 pm_promedio_salarios
2.9357 0.003728 ** n_educacion 2.5052 0.013057 *
c_edad 2.5129 0.012784 *
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05
‘.’ 0.1 ’ ’ 1
robust.se2<-sqrt(diag(estimacion_desempleo))
library(robustbase)
library(stargazer)
modelo_desempleo_corregido<-lmrob(td_tasa_de_desempleo~a_poblacion
+pm_promedio_salarios+n_educacion+c_edad,data = Base_de_datos_1)
stargazer(modelo_desempleo_mujeres,modelo_desempleo_mujeres,modelo_desempleo_mujeres, se=list(NULL, robust.se1, robust.se2),
type = "html",
title = "Modelo de Regresion Lineal",
column.labels = c("Modelo Original", "Modelo Corregido", "Modelo Corregido de Autocorrelacion 2") )
Dependent variable: | |||
td_tasa_de_desempleo | |||
Modelo Original | Modelo Corregido | Modelo Corregido de Autocorrelacion 2 | |
(1) | (2) | (3) | |
a_poblacion | -0.000 | -0.000 | -0.000*** |
(0.000) | (0.000) | (0.000) | |
pm_promedio_salarios | 0.000 | 0.000 | 0.000*** |
(0.000) | (0.000) | (0.000) | |
n_educacion | 0.000 | 0.000 | 0.000** |
(0.000) | (0.000) | (0.000) | |
c_edad | 0.000 | 0.000 | 0.000** |
(0.000) | (0.000) | (0.000) | |
Constant | 0.066*** | 0.066*** | 0.066*** |
(0.000) | (0.000) | (0.000) | |
Observations | 200 | 200 | 200 |
R2 | 0.499 | 0.499 | 0.499 |
Adjusted R2 | 0.489 | 0.489 | 0.489 |
Residual Std. Error (df = 195) | 0.000 | 0.000 | 0.000 |
F Statistic (df = 4; 195) | 48.613*** | 48.613*** | 48.613*** |
Note: | p<0.1; p<0.05; p<0.01 |
Con el nuevo modelo robusto, ahora se puede hacer inferencias con validez, asi como tambien simulaciones y pronosticos.
Estimacion del modelo.
coeftest(modelo_desempleo_corregido)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.0660000000000000724975635 0.0000000000000000000000000
a_poblacion -0.0000000000000000324854584 0.0000000000000000000000000
pm_promedio_salarios 0.0000000000000000000098935
0.0000000000000000000000000 n_educacion -0.0000000000000000013346733
0.0000000000000000000000000 c_edad -0.0000000000000000008502607
0.0000000000000000000000000 t value Pr(>|t|)
(Intercept) Inf < 0.00000000000000022 a_poblacion -Inf
< 0.00000000000000022 pm_promedio_salarios Inf <
0.00000000000000022 n_educacion -Inf <
0.00000000000000022 c_edad -Inf < 0.00000000000000022
*** — Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’
0.05 ‘.’ 0.1 ’ ’ 1
Planteamiento de las Hipótesis H0 : β = β = β = β = β = 0 H1 : β ≠ β ≠ β = β = β ≠ 0
H0 : No hay evidencia de una relación lineal entre la Tasa de desempleo y todas sus variables exógenas.
H1 : Hay evidencia de una relación lineal entre la Tasa de desempleo y todas sus variables exógenas.
Condición de Rechazo
Se rechaza la Hipótesis Nula si: F>Fα,k-1,n-k
F_Anova<-summary(modelo_desempleo_mujeres)$fstatistic[1]
gl_num<-summary(modelo_desempleo_mujeres)$fstatistic[2]
gl_den<-summary(modelo_desempleo_mujeres)$fstatistic[3]
print(F_Anova)
value 48.61272
Condición de Rechazo.
Se rechaza la Hipótesis Nula si: F>Fα,k-1,n-k.
F_VC<-qf(0.95,gl_num,gl_den,lower.tail = TRUE)
print(F_VC)
[1] 2.417963
library(fastGraph)
shadeDist(xshade = F_Anova,ddist = "df",parm1 = gl_num,parm2 = gl_den,lower.tail = FALSE,sub=paste("VC:",F_VC," ","F:",F_Anova))
El Estadístico F es mayor al Valor Critico. Por tanto: Se debe rechazar H0
Hay evidencia de una relación lineal entre la Tasa de desempleo y todas sus variables exógenas.H0: β = 0 H1: β ≠ 0
Condición de Rechazo
Se rechaza la Hipótesis Nula si: |t |>tα/2,n-k
options(scipen = 999999)
library(fastGraph)
summary_modelo<- summary(modelo_desempleo_mujeres)$coefficients
t_stadistics<-summary_modelo[,"t value"]
etiquetas<- names(t_stadistics)
print(t_stadistics)
(Intercept) a_poblacion pm_promedio_salarios
856289038039659.5000000 -0.7035601 0.2469740 n_educacion c_edad 0.3411666 0.9130602
#Grados de libertad n-k y nivel de significancia del 5%
model.matrix(modelo_desempleo_mujeres)-> matrizX
nt<- nrow(matrizX)
kt<- ncol(matrizX)
gl_t1<-(nt-kt)
#Buscamos el Valor Critico: t,α/2,n-k, donde α=0.05, n-k=208
VCt1<- qt(p = 1-(0.05/2),df = gl_t1)
print(VCt1)
[1] 1.972204
for (j in 2)
{tc1<-t_stadistics[j]
t_VC1<-shadeDist(xshade = c(-tc1,tc1),ddist = "dt",parm1 = gl_t1, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t:",t_stadistics[j],
"Variable:",etiquetas[j],"Valor Critico:",VCt1))}
El Estadístico t es menor al Valor Crítico. Por tanto: Se debe rechazar H1.
Existe evidencia empírica que rechaza la H1 , por lo tanto, no existe relación lineal parcial de la variable nivel de educación con la variable tasa de desempleo.for (j in 3)
{tc1<-t_stadistics[j]
t_VC1<- shadeDist(xshade = c(-tc1,tc1),ddist = "dt",parm1 = gl_t1, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t:",t_stadistics[j],"Variable:",etiquetas[j],"Valor Critico:", VCt1))}
El Estadístico t es menor al Valor Crítico. Por tanto: Se debe rechazar H1.
Existe evidencia empírica que rechaza la H1, por lo tanto, existe relación lineal parcial de la variable poblacion con la variable tasa de desempleo.for (j in 4)
{tc1<-t_stadistics[j]
t_VC1<- shadeDist(xshade = c(-tc1,tc1),ddist = "dt",parm1 = gl_t1, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t:",t_stadistics[j],"Variable:",etiquetas[j],"Valor Critico:", VCt1))}
El Estadístico t es menor al Valor Crítico. Por tanto: Se debe rechazar H1.
Existe evidencia empírica que rechaza la H1, por lo tanto, existe relación lineal parcial de la variable salario con la variable tasa de desempleo.for (j in 5)
{tc1<-t_stadistics[j]
t_VC1<- shadeDist(xshade = c(-tc1,tc1),ddist = "dt",parm1 = gl_t1, parm2 = NULL, lower.tail = TRUE, sub=paste("Estadistico t:",t_stadistics[j],"Variable:",etiquetas[j],"Valor Critico:", VCt1))}
El Estadístico t es menor al Valor Crítico. Por tanto: Se debe rechazar H1.
Existe evidencia empírica que rechaza la H1, por lo tanto, existe relación lineal parcial de la variable edad con la variable tasa de desempleo.library(lmtest)
library(stargazer)
library(equatiomatic)
library(mlbench)
modelo_desempleo_mujeres<-lm(formula = td_tasa_de_desempleo~a_poblacion
+pm_promedio_salarios+n_educacion+c_edad,data = Base_de_datos_1)
extract_eq(modelo_desempleo_mujeres,wrap = TRUE)
\[ \begin{aligned} \operatorname{td\_tasa\_de\_desempleo} &= \alpha + \beta_{1}(\operatorname{a\_poblacion}) + \beta_{2}(\operatorname{pm\_promedio\_salarios}) + \beta_{3}(\operatorname{n\_educacion})\ + \\ &\quad \beta_{4}(\operatorname{c\_edad}) + \epsilon \end{aligned} \]
coeftest(modelo_desempleo_mujeres)
t test of coefficients:
Estimate Std. Error
(Intercept) 0.065999999999999864330746 0.000000000000000077076778
a_poblacion -0.000000000000000065349087 0.000000000000000092883451
pm_promedio_salarios 0.000000000000000000028024
0.000000000000000000113471 n_educacion 0.000000000000000006355227
0.000000000000000018627926 c_edad 0.000000000000000000850497
0.000000000000000000931479 t value Pr(>|t|)
(Intercept) 856289038039659.6250 <0.0000000000000002 *** a_poblacion
-0.7036 0.4825
pm_promedio_salarios 0.2470 0.8052
n_educacion 0.3412 0.7333
c_edad 0.9131 0.3623
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05
‘.’ 0.1 ’ ’ 1
td_tasa_de_desempleo = α + β1(a_poblacion) + β2(pm_promedio_salarios) + β3(n_educacion) + β4(c_edad) + ϵ
library(stargazer)
library(kableExtra)
X_M<-data.frame(a_poblacion=0.93,
pm_promedio_salarios=300,n_educacion=10,
c_edad=25)
#nivel de confianza
confidense<-c(0.95,0.99)
predict(object = modelo_desempleo_mujeres,
newdata = X_M,
interval = "prediction",
level = confidense,
se.fit =TRUE)->predicciones
rownames(predicciones$fit)<-as.character(confidense*100)
colnames(predicciones$fit)<-c("Ym","Li","Ls")
library(forecast)
library(kableExtra)
X_M<-data.frame(a_poblacion=2, pm_promedio_salarios=304.80,n_educacion=6,c_edad=25)
#nivel de confianza
confidense<-c(0.95,0.99)
pronosticos<-forecast(object = modelo_desempleo_mujeres,
level = confidense,
newdata = X_M,ts = FALSE)
kable(pronosticos,
caption = "Pronóstico e intervalos de confianza:",
digits = 5,format = "html")
Point Forecast | Lo 95 | Hi 95 | Lo 99 | Hi 99 |
---|---|---|---|---|
0.066 | 0.066 | 0.066 | 0.066 | 0.066 |
#proporción de sesgo
Um<-function(pronosticado,observado){
library(DescTools)
((mean(pronosticado)-mean(observado))^2)/MSE(pronosticado,observado)
}
#proporción de varianza
Us<-function(pronosticado,observado){
library(DescTools)
((sd(pronosticado)-sd(observado))^2)/MSE(pronosticado,observado)
}
#proporción de Covarianza
Uc<-function(pronosticado,observado){
library(DescTools)
(2*(1-cor(pronosticado,observado))*sd(pronosticado)*sd(observado))/MSE(pronosticado,observado)}
#Coeficiente U de Theil
library(DescTools)
THEIL_U<-function(pronosticado,observado){
library(DescTools)
RMSE(pronosticado,observado)/(sqrt(mean(pronosticado^2))
+sqrt(mean(observado^2)))
}
#DataFrame
DataFrame1 <- Base_de_datos_1
#formula del Modelo
Formula1 <- as.formula(td_tasa_de_desempleo~a_poblacion
+pm_promedio_salarios+n_educacion+c_edad)
#semilla
set.seed(50)
#Data de entretenimiento
DEntrenam <- 0.8
#Muestras
numero_de_muestras <-5000
options(scipen = 999999) #No mostrar notación cientifica.
library(robustbase) #Para usar el modelo robusto
library(dplyr) # Para manejo de datos y activar el operador "pipe" %>%
library(caret) # Permite Realizar muestreo sobre los data frame
library(DescTools) # Contiene las funciones para calcular las medidas de performance
library(stargazer) # Para dar formato, y obtener resumen estadistico de las simulaciones
muestra<-DataFrame1$pm_promedio_salarios %>% createDataPartition(p=DEntrenam,
times = numero_de_muestras,
list = TRUE)
# Listas vacias, que contendran los datos de entrenamiento, los pronosticos para los datos de prueba, y para las estadisticas de cada muestra
Modelos_Entrenamientos<-vector(mode = "list",
length = numero_de_muestras)
Pronostico_Prueba<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance_data_entrenamiento<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance<-vector(mode = "list",
length = numero_de_muestras)
Debido a que la tasa de desempleo no se puede pronosticar ya que en nuestro modelo la tasa ya esta dada, no cambiara en el año 2020, que fue elegido para el estudio, la tasa de desempleo para todo el territorio salvadoreño fue de 0.066% es por eso que no podemos realizar dicho scrip de simulación, ya que la tasa no cambiara para el mismo año, y la base de datos que fue tomada por la Encuesta de Hogares de Propositos multiples (EHPM) para el año 2020.
es por esto que en nuestro modelo no se puede realizar esta prueba para la variable tasa de desempleo.Finalizando nuestro modelo de analisis de la Tasa de Desempleo en el año 2020 tomando como fuente de datos la Encuesta De Hogares de Propositos Multiples, concluimos lo siguiente:
• Modelamos un fenómeno económico y analizamos sus partes detallando la importancia de ellas para nuestro estudio.
• Planteamos la teoría de investigación con el objetivo y fin de análisis del tema que nos diera los suficientes argumentos para llevar a cabo la aplicación del Modelo Clásico de Regresión Lineal múltiple.
• En el modelo presenta una buena capacidad predictiva, para determinar las otras variables ya que la tasa de desempleo ya esta dada para todo el año 2020.
• La tasa de Desempleo tiene influencia en : la educación ya que dependiendo el grado del nivel academico asi podran insertarse al mercado laboral, tambien la edad ya que ahora es mas facil que una persona joven pueda desempeñarse en areas pesadas, dependiendo del nivel academico asi sera su salario, ya que dependiendo de sus conocimientos podra obtar a una mejor posición laboral .
•La tasa de desempleo es un indicador que nos permite determinar el nivel de desempleo en la sociedad, dónde podemos decir que la tasa de desempleo femenina durante la pandemia se vio mayormente afectada, sin embargo hay otros indicadores que inciden por ejemplo el nivel de educación en las mujeres es bajo.
http://www.digestyc.gob.sv/index.php/temas/des/ehpm.html
https://ormusa.org/wp-content/uploads/2019/10/Mujer_mercado_laboral_2011.pdf
UCA, octubre 2017
Boletin,2020
https://economipedia.com/definiciones/tasa-de-desempleo-paro.html
https://datos.bancomundial.org/indicator/SL.UEM.TOTL.ZS?locations=SV
https://celade.cepal.org/redatam/pryesp/sisppi/webhelp/tasa_de_desempleo.htm