Análisis de los factores socioeconómicos y políticos que afectan la tasa de desempleo en Latinoamérica en 2022
UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE ECONOMÍA ECONOMETRÍA I CICLO I-2024 GT03
TEMA A INVESTIGAR: “Análisis de los factores socioeconómicos y políticos que afectan la tasa de desempleo en Latinoamérica en 2022.”
INTEGRANTES:
| Nombre | Cárne | Participación |
|---|---|---|
| Edwin Fabricio Aguirre Sarmieno | AS19011 | 100% |
| José Ricardo Vides Hernández | VH22011 | 0% |
| Gabriel Arturo Sánchez Henríquez | SH22002 | 100% |
| Luz Virginia Pérez Ramírez | PR18044 | 100% |
DOCENTE: Carlos Ademir Pérez Alas
Ciudad Universitaria, San Salvador, 13 de junio del 2024
Introduccion
Entre el gran número de problemas de corte social y económico que afligen a las sociedades latinoamericanas, pocos son más llamativos que el desempleo puesto que, si bien más escandalosos, dramas como la violencia se han vuelto tristemente habituales en estas latitudes. No así el desempleo en tanto que la moneda de cambio corriente son las precarias condiciones laborales, el trabajo informal, salarios paupérrimos, etcétera, pero no directamente la desocupación.
Este fenómeno, en principio, macroeconómico, impacta fuerte y negativamente en las personas que lo padecen, ya que el salario que reciben por su trabajo representa para la enorme mayoría de la población su única fuente de ingresos y el único medio por el que pueden adquirir su sustento por lo que verse privados de él al no encontrar trabajo representa un serio obstáculo para lograr proveerse de los insumos necesarios para solventar sus necesidades básicas. Situación que se vuelve más calamitosa cuando el desempleo alcanza al cabeza de familia del que dependen sus hijos, padres u otras personas, por lo que una condición individual acaba por amenazar con reducir a la indigencia a todo un grupo familiar.
El drama humano que genera el desempleo da paso a una justa indignación por parte de quienes lo padecen, así como del resto de la sociedad que se solidariza con aquellos con los que, circunstancialmente, podrían acabar compartiendo suerte. Por lo que no es de sorprender que los gobiernos sigan atentamente la evolución de la tasa de desocupación y se congratulen cuando esta baja o pretendan restarle importancia cuando aumenta algunos puntos porcentuales.
Sin embargo, es a los trabajadores a los que más les interesa que la tasa de desempleo tienda a cero por lo que les resulta muy provechoso el conocer cuáles son los factores que inciden en el crecimiento del mismo, tanto para tomar ellos las medidas pertinentes dentro de sus capacidades, como para exigir a los gobiernos o patronos ejecutar políticas que conduzcan a una disminución de los niveles del desempleo. Por esa razón la presente investigación pretende estudiar si existe relación entre ciertas variables socioeconómicas y la tasa de desempleo.
Objetivos
Objetivo General
Analizar los principales factores que inciden en la tasa de desempleo en Latinoamérica.
Objetivos específicos
Determinar si el crecimiento económico, medido en la variación del PIB, influye de alguna manera en la tasa de desempleo en los países de Latinoamérica.
Evaluar la incidencia que tienen las políticas de educación, medidas a través del gasto en educación, en la tasa de desempleo en los países latinoamericanos.
Justificación
Importancia
El propósito de toda investigación es la aprehensión del conocimiento que se presenta en forma de datos y resultados obtenidos y esa captación de información permite abordar los fenómenos de la realidad conociendo sus causas primeras, en ese sentido, al pretender establecer relaciones entre la tasa de desempleo con otras estadísticas y variables se busca ir más allá de una mera descripción del fenómeno, determinando cuáles son las causas que lo provocan y en qué medida incide cada una de estas en aquel. Este estudio no limita su análisis a la coyuntura nacional o centroamericana, sino que lo extiende a toda la región aspirando a encontrar semejanzas en la explicación de un mismo fenómeno a realidades que a primera vista parecen muy diferentes.
Utilidad
El conocer algo implica dominarlo y es que al comprender los aspectos que influyen en ciertos fenómenos es posible cambiar estos manipulando aquellos. En el caso que a esta investigación ocupa, al determinar qué variables de corte socioeconómico influye en la tasa de desempleo Latinoamérica se abre la puerta para elaborar propuestas para influir en estas y al ejecutarlas contribuir a disminuir las tasas de desempleo en la región.
1. Marco teórico
Pocos términos tienen mayor predicamento a nivel social que el “desempleo” el cual protagoniza movimientos y protestas multitudinarias, ocupa portadas de los diarios y telenoticieros y sonroja a los funcionarios públicos que afirman trabajar de forma infatigable para contenerlo.
Como ocurre con la mayoría de vocablos extraídos de la ciencia económica el significado exacto del mismo ha ido mutando con el tiempo dando lugar a diferentes acepciones del mismo que a la postre ha llevado a la elaboración de toda una pléyade de teorías que pretenden retratarlo y reducirlo hasta sus primeras causas.
Si se atiende a su etimología “desempleo”, es la conjunción del prefijo “des” que significa “privación, falta, alejamiento” y de la conjugación del verbo “emplear” que provine del francés “employer” que a su vez deriva del latín “implicare” que puede entenderse como “enlazar, implicar” por lo vendría a significar la implicación de una persona en la ejecución de una actividad y el vínculo que de ello surge entre el implicado, el objeto de la actividad y el implicador, de ahí, el termino sería siendo sinónimo de “contratar”. De lo anterior se sigue que el desempleo vendría a ser “la falta de implicación” en alguna actividad, entendiéndose “actividad” como “actividad productiva”.
Aunque el vocablo “desempleo” encuentre sus raíces en el latín fue un término prácticamente inutilizado hasta bien entrado el Siglo XIX cuando surgieron instituciones que pretendían abordar el fenómeno de la desocupación de una mirada “científica”.
En el mundo Occidental el empleo (y como contrapartida el desempleo) ha ido evolucionando conforme fueron cambiando los sistemas de producción. Así, durante la antigüedad clásica las labores de producción más penosas eran desempeñadas por esclavos que forzosamente cargaban con buena parte del peso de la economía, mientras que el resto de la población, es decir, los ciudadanos libres, dedicaban su tiempo al ocio o al ejercicio de actividades liberales Naturalmente, siempre existieron personas, tanto ciudadanos libres como esclavos, que se veían reducidas a la extrema indigencia (recuérdese que el estado natural del hombre es la pobreza) o que por motivos coyunturales se encontraban desocupados por lo que los gobiernos ejecutaban políticas “humanitarias” para mejorar su condición, como era el caso durante el alto imperio Romano en que se repartía trigo entre los más necesitados. Nótese que políticas como estas no abordan el fenómeno del desempleo sino de forma accidental puesto que buscan mitigar la extrema pobreza y como subproducto beneficiaban a los desocupados, los cuales, su situación los había reducido a la precariedad.
Con todo, el desempleo fue un fenómeno reducido dentro de la antigüedad clásica cuyo sistema esclavista eventualmente se vio superado por los requerimientos de los nuevos medios de producción que, junto con la división del trabajo, necesitaron de más manos productivas por lo que los ciudadanos libres rápidamente fueron empleados con lo que se fue desvaneciendo la diferencia real con los esclavos que cada vez se volvieron más escasos hasta su práctica desaparición durante el sistema feudal (aunque execrablemente sería retomada siglos después)
Durante la Edad Media el sistema feudal permitió una distribución mucho más equitativa del trabajo en tanto que, tras la caída del Imperio Romano las pesadas regulaciones que en materia laboral regían durante el bajo imperio desaparecieron dejando un hueco jurídico que propició una flexibilización en la materia laboral que facilitó la incursión de la mujer en el mercado laboral ocupándose de forma mayoritaria, pero no exclusiva, de la producción de textiles elaboración del pan, en la enfermería y la obstetricia. Se tienen registros mujeres que trabajaban como albañiles o taberneras.
En este periodo el desempleo se evaluó desde el punto de vista ético, sin embargo, al no comprender las causas primeras del desempleo se erró en el juicio moral que recayó sobre el mismo: erróneamente los medievales consideraron que la desocupación continua respondía únicamente a la decisión voluntaria del desocupado y, al ser el trabajo un medio civilizante por el cual se alcanza la virtud, el desempleado habitualmente acababa en el mismo saco de los vagabundos, viciosos y perdidos.
En realidad, el error de los medievales consistió en suponer que todo el desempleo posee una misma naturaleza, cuando el desempleo producto de la propia voluntad de las personas solo es una de las distintas clases de desempleo que hay según su naturaleza. El desempleo voluntario que universalizaban los medievales es la desocupación resultante de la propia arbitrariedad y voluntad de los trabajadores que libremente escogen no ofrecer sus servicios en la actividad productiva en determinadas condiciones.
No es por ventura el único tipo de desempleo que existe y es que también puede ocurrir que las personas se encuentren desocupadas no porque no quieran trabajar, sino porque a pesar de sus esfuerzos no logran encontrar alguien que los contrate. A esta clase de desempleo de se llama “involuntario”.
Los economistas keynesianos afirman que existe una tercera clase de desempleo al que le asignan el cognomen de “friccional” puesto que es una clase de desocupación meramente coyuntural que consiste en el lapsus en el que un trabajador deja su trabajo actual y encuentra uno nuevo.
Sin embargo, esta tercera clase de desempleo es ofensiva a la lógica puesto que el dejar un trabajo solo puede responder a la propia voluntad del trabajador, sea porque quiere buscar uno mejor, se muda, desea descansar un tiempo, etcétera, con lo cual sería voluntario o bien por motivos contrarios a la voluntad del mismo, sea enfermedad o invalidez, despidos, etcétera, por lo que sería involuntario. No existe una alternativa distinta, como bien explicaría el gran filósofo Henry Hazlitt en su libro “Los errores de la nueva economía…”, el cual vale la pena citar in extenso
“He aquí una clasificación que preocuparía a cualquier lógico. El desempleo debe ser voluntario o involuntario. Seguramente estas dos categorías agotan las posibilidades. No hay lugar para una tercera categoría. El desempleo «friccional» debe ser voluntario o involuntario. En la práctica, es probable que se componga de un poco de cada. El desempleo «friccional» puede ser involuntario por enfermedad, discapacidad, quiebra de una firma, cese inesperado del trabajo estacional o despido. El desempleo «friccional» puede ser voluntario porque una familia se ha trasladado a otro lugar, porque un hombre ha renunciado a un antiguo empleo con la esperanza de conseguir otro mejor, porque cree que puede conseguir un salario mayor del que le ofrecen o porque se toma unas vacaciones entre un empleo y otro. El desempleo es el resultado de una decisión, buena o mala, del desempleado. «Fricción», aunque es un término tradicional, quizá no sea la metáfora más afortunada para describirlo” (2007 [1959], 15-16).
De tal suerte, solo existiendo según su naturaleza el desempleo voluntario y el involuntario es posible estudiar las causas de cada uno.
Vale la pena preguntarse, sin embargo, ¿por qué existe el desempleo? ¿Qué hace una persona esté acostada en un sofá en vez de trabajando en una fábrica? ¿Por qué una persona que busca desesperadamente ocupación no encuentra quién la emplee?
Para responderlo vale la pena avanzar en el concepto de desempleo:
Siguiendo nuevamente a Hazlitt se tiene que el desempleo es “el estado económico en el que la cantidad de mano de obra ofrecida supera la cantidad de mano de obra demandada” (Hazlitt 2007 [1959], 20).
Esta acepción, eminente económica, incorpora a la explicación del desempleo el componente de la demanda, puesto que, si el trabajador ofrece su fuerza laboral es quien oferta un producto a un empleador que lo demanda.
Y es que mientras el empleador no quiera contratar a alguien esa persona será desempleada a menos que ella misma se convierta en su propio jefe.
De la misma forma en que si la gente no demanda dulces al vendedor de golosinas se le acumularán estar sin darles uso, de la misma forma se acumulará la mano de obra ociosa si los empleadores no la demandan para ponerla a trabajar.
Esto da pie a otra serie de preguntas ¿Qué factores influyen en los empleadores para contratar más o menos empleados? ¿Será que es porque tienen a todos empleados que necesitan? ¿Buscarán trabajadores más calificados? ¿El gobierno pondrá obstáculos a la contratación? Preguntas que buscan ser resueltas en esta investigación y que también han sido abordadas por insignes economistas que han abordado los distintos factores que inciden en la inflación, desde elementos técnicos o coyunturales como la inflación hasta aspectos estructurales como un desempleo requerido por el sistema
Entrando en materia, en 1926 el economista neoclásico Irving Fischer identificó una fuerte relación entre el desempleo y la inflación en tanto que esta ejercía una gran influencia en los resultados de aquel puesto que en un contexto de inflación alta y creciente los costos de los empresarios crecen con un retraso respecto a sus ingresos lo que da paso a un periodo de beneficios extraordinarios en el cual los empresarios aumentan la demanda de trabajo mientras los precios siguen aumentando.
Hablando de salarios nominales y reales, es sabido que este respecto generó gran división entre los economistas neoclásicos y keynesianos al discutir si el desempleo vendría influido por el salario real o bien por el nominal.
Para los neoclásicos el salario real y nominal van siempre de la mano por lo que un aumento en el uno viene acompañado de un aumento en el otro y viceversa por lo que en una condición de equilibrio al ser provocado un cambio en el salario por una variación en los precios el nivel de empleo se mantendría constante puesto que el salario real, que es el que importa a los trabajadores, se mantiene. De igual modo, ante una disminución, debido a un componente exógeno, del salario nominal, que viene junto a una disminución del salario real, se produce un incremento en la demanda de trabajo que a la postre termina disminuyendo el desempleo
Por su parte, para la teoría general de Keynes ante una situación en la que de forma exógena se reduce el salario nominal podría producirse una depresión en la demanda de trabajo (puesto que genera una caída en el consumo de bienes que según Keynes determinaría la demanda de trabajo) la cual, dependiendo del punto en el que el empleo se encuentre en la curva de trabajo podría ocasionar un aumento en los salarios reales, aunque de forma nominal estos se hayan reducido.
Un intento de conciliar ambas teorías vendría de la mano de Milton Friedman en tanto que aduce que ciertamente los salarios reales pueden ir en el corto plazo en un sentido distinto al salario nominal pero que al final del día lo que vendría a determinar el nivel de empleo no sería en sí mismo el salario real sino las expectativas futuras del mismo las cuales, influidas por la estructura específica del mercado tenderían a una “tasa de desempleo natural”, esto inspirado en Phillips.
Las disquisiciones sobre el salario real y nominal en la determinación del nivel del desempleo abundan por lo que este trabajo preferirá centrarse en otras variables que puedan explicar el nivel de empleo, una de ellas el crecimiento del PIB sobre la cual no puede dejar de mencionarse al economista estadounidense Arthur Okun el cual defendió la existencia de una fuerte relación entre el PIB y la tasa de desempleo, enunciando la célebre “Ley de Okun” que afirma que, para Estados Unidos al menos, por cada aumento del uno por ciento en la tasa de desempleo el Producto Interno Bruto se alejaba un dos por ciento a la baja de su PIB potencial, en este caso se buscará estudiar la relación inversa de ¿cómo se ve afectada la tasa de crecimiento ante un aumento del PIB?
No es posible dejar de mencionar a los clásicos como Smith y, sobre todo, Ricardo que, tomando como hilo conductor la teoría del valor-trabajo asumía que el desempleo sería producto de cambios en las tecnologías y medios de producción, así como de la acumulación temporal de capital, aunque sostenía que el propio mercado proporcionaba los mecanismos de ajuste necesarios para eliminar ese desempleo meramente circunstancial.
Finalmente, el que llevaría la teoría del valor-trabajo a sus conclusiones lógicas, es decir, el alemán Karl Marx entendía que el sistema de producción capitalista por definición requería mantener de forma permanente un “ejército industrial de reserva” del cual echar mano cuando se pretenda entablar esfuerzos para aumentar los sueldos, puesto que al tener toda una masa dispuesta a entrar a trabajar en cualquier momento y por un sueldo reducido se garantiza que los salarios continúen bajos.
Mises dijo alguna vez que no existía política económica alguna, por más descabellada que fuera, que no hubiera sido defendida por un economista, de forma análoga las posibles causas del desempleo propuestas con sus respectivas variables explicativas son de lo más variadas y extensas por lo que en la presente investigación para Latinoamérica se trabajará con unas variables explicativas concretas a saber: crecimiento del PIB, población económicamente activa, nivel de educación y gasto público.
Se plantean las diversas relaciones que existe entre la tasa de desempleo por cada variable explicativa que hemos adoptado.
Tasa de desempleo - Tasa de crecimiento
si se evidencia un mayor crecimiento económico tiende a estar relacionado con una mayor creación de empleo, si la economía crece las empresas tienden a crear nuevas estructuras para expandirse y contratar mas trabajadores lo cual puede coincide a reducir la tasa de desempleo.por tanto,una alta tasa de desempleo tiende a estar asociada con un crecimiento económico más bajo, mientras que una baja tasa de desempleo tiende a estar asociada con un crecimiento económico más alto.
Tasa de desempleo - Gasto público
El gasto público en educación y capacitación puede mejorar las habilidades de la fuerza laboral, lo que a su vez puede reducir la tasa de desempleo al hacer que los trabajadores sean más calificados y adaptables a las demandas cambiantes del mercado laboral. Asimismo, si se emplean programas sociales puede ayudar a mejorar la tasa de desempleo. sin embargo, el gasto público también puede influir en la tasa de desempleo a través de políticas fiscales y regulaciones laborales.
Tasa de desempleo - Población Economicamente Activa
La tasa de desempleo y la Población Economicamente Activa están estrechamente relacionadas y se utilizan en conjunto para evaluar la dinámica del mercado laboral y la disponibilidad de empleo en una economía. Sin embargo cuando existen cambios en en la Población Economicamente Activa esos cambios pueden afectar la tasa de desempleo.si la Población Economicamente Activa aumenta debido a un aumento en la población en edad de trabajar o a una mayor participación labora, la tasa de desempleo podría aumentar incluso si el número de personas desempleadas permanece constante. Del mismo modo, si la Población Economicamente Activa disminuye, la tasa de desempleo podría caer incluso si el número de desempleados se mantiene igual.
Tasa de desempleo - Nivel de educación
Mayor nivel de calificación aumenta las habilidades y productividad de trabajadores, lo que puede generar un ascenso con mayor falicilidad para colocarse a mejores oportunidades laborales, por ser más cotizados por las empresas por su capacidad de mejores habilidades y cualidades y su alto aporte que puede generar en las empresas.
2. Especificación del modelo
Esta segunda sección del trabajo se desenvuelve en 4 partes importantes para la comprensión y formulación correcta del fenómono económico que se pretende estudiar, en este sentido se aborda el planteamiento teórico del fenómeno, la especificación del modelo matemático y estadístico, así también la evidencia empírica del fenómeno económico para poder llevar a cabo inferencias estadísticas de la manera más adecuada posible.
2.1 Plantemiento teórico del fenómeno económico
Planteamiento del problema
Siendo que el desempleo es un fenómeno que aflige tanto a los gobiernos como al pueblo llano se han elaborado tasas de medición del mismo para hacer un diagnóstico fidedigno de la situación, pero es necesario realizar de forma conjunta un análisis integral que explique los fenómenos descritos.
Por lo que se presenta el siguente problema:
“Análisis de los factores socioeconómicos y políticos que afectan la tasa de desempleo en Latinoamérica 2022”
Como se ha desarrollado con anterioridad, tradicionalmente se ha considerado al desempleo como producto de una oferta que supera a la demanda de trabajo y las explicaciones del por qué de esta desiguladad han venido dadas tanto desde el lado de la oferta como el de la demanda.
Desde el flanco de la oferta se ha argumentado que, en Latinoamérica al menos, las capacidades y requerimientos que el mundo capitalista demanda no se corresponde con lo que los obreros y trabajadores están actualmente en condiciones de ofrecer, por lo que se aduce el bajo nivel de la mano de obra como responsable del desempleo.
Por el lado de la demanda Keynes afirmaba que lo que determina la cantidad de mano de obra demandada no depende de fenómenos propios del mercado de trabajo sino que encontraba sus orígenes en el mercado de bienes, ya que la cantidad d trabajadores que las empresas están dispuestas a contratar vendría definido por la cantidad de bienes y servicios que esperan vender.Es decir, que los empresarios solo emplearían más o menos trabajadores en función de las “expectativas” futuras que tienen sobre la demanda de bienes. Por este motivo los keynesianos rechazan el planteamiento neoclásico que sostiene que basta con desplazar el punto de equilibrio en el mercado de trabajo (por lo general, hacia un salario más bajo) para resolver el desempleo.
Es verdad que planteamientos marxistas, siguiendo en realidad un análisis neoclásico, sugieren que el desempleo es una constante estructural del capitalismo puesto que ese ejército de mano de obra desocupada resta poder de negociación a los sindicatos y asociaciones de trabajadores lo que asegura unos salarios paupérrimos que agudizan la explotación de los trabajadores en manos de los “malvados” capitalistas.
La solución que proponen tanto los marxistas como keynesianos pasa por el Estados, si bien en grados muy dispares por lo que vale la pena analizar si efectivamente el aparato estatal a través del gasto público es capaz de estimular la creación de empleo junto con la economía.
2.1.2 Variable endógena y variables exógenas
- Variable endógena
Nombre:Tasa de desempleo (Tdesmp)
Definicion: En general, se considera a la población desempleada, es decir, tanto a las personas cesantes que son desocupados que han tenido un trabajo previamente como a las que buscan trabajo por primera vez. Se refiere al desempleo abierto y de cobertura urbana a menos que se indique que es desempleo oculto y/o de cobertura nacional. En el caso de la cobertura urbana esta puede referirse al total de las zonas urbanas, según la definición del país correspondiente, o a un conjunto de ciudades o zonas metropolitanas.
Funcion: El indicador se calculara como: TD = (PD/PEA) x 100, donde TD = tasa de desocupación, PD = población desocupada que busca trabajo activamente, y PEA = población económicamente activa. Por lo tanto se considera que esta variable sera cuantitativa.
- Variables exógenas
Nombre:: Tasa de crecimiento economico (Creci)
Definicion: La tasa de crecimiento del producto interno bruto mide la variación porcentual del PIB a precios de mercado del año 2018, entre dos años.
Funcion: Entonces se define como una variable cuantitava que representa al porcentaje de variacion que presenta el PIB y que se interpreta como el crecimiento de la produccion de una pais.
Nombre:: Gasto público (Gpub)
Definicion:El gasto público es todo pago no recuperable y no pagadero realizado por el gobierno. Puede ser con contraprestación, sin ella y para fines corrientes o de capital.
Los gastos totales del resultado financiero del gobierno central corresponden a la suma de los gastos corrientes, de capital y concesión de préstamos.
El gasto corriente se refiere a los gastos regulares y recurrentes, como el pago de salarios y el mantenimiento de edificios y equipos. El gasto de capital se refiere a los gastos destinados a la construcción o adquisición de activos a largo plazo, como carreteras, puentes o equipos. Su unidad de medida es Millones de US dólares o bien Millones de moneda nacional, sin embargo, normalmente se presenta la variable en términos del PIB (%), como en este caso. En este caso, el variable gasto publico del gobierno central se han excluido concesiones de prestamos (por falta de datos) y el pago de intereses en el gasto corriente.
Funcion:Se calcula mediante el cociente entre el Gasto público total y el PIB a precios corrientes. El resultado se multiplica por 100. GT% = GT/PIB*100, donde GT% = Gasto público total como porcentaje del PIB, GT = Gasto público total y PIB = Producto Interno Bruto en un determinado año.
Nombre:: Población Economicamente Activa (PEA)
Definicion:La población economicamente activa comprende a personas de 15 años o más que satisfacen la definición de la Organización Internacional del Trabajo: todas las personas que aportan trabajo para la producción de bienes y servicios durante un período específico. Incluye tanto a las personas con empleo como a las personas desempleadas. Si bien las prácticas nacionales varían en el tratamiento de grupos como las fuerzas armadas o los trabajadores estacionales o a tiempo parcial, en general, la población activa incluye a las fuerzas armadas, a los desempleados, a los que buscan su primer trabajo, pero excluye a quienes se dedican al cuidado del hogar y a otros trabajadores y cuidadores no remunerados.
Funcion:Se calculara como la sumatoria de la poblacion ocupada mas la poblacion desocupada que en conjunto conforman a la poblacion economicamente activa.
Nombre:: Nivel de Educación (Edu)
Definicion: El nivel educativo de una persona está determinado por una serie ordenada de programas educativos agrupados en relación a una gradación de las experiencias de aprendizaje, conocimiento,habilidades y competencias que imparte cada uno de estos programas.
El grado promedio de escolaridad nos permite conocer el nivel de educación de una población determinada. Para obtenerlo, Se debe escoger un conjunto de personas, sumar los años aprobados desde primero de primaria hasta el último año que cursó cada integrante; posteriormente, se divide entre el número de individuos que componen dicha población y el resultado son los años que en promedio ha estudiado el grupo.
Funcion: Este indicador se calcula, promedio de escolaridad = suma de los años aprobados desde el primero de priúltimo grado alcanzado / total de la población de quince años y más.
2.1.3 Relación funcional entre las variables
Se espera que las variables tengan esta relación con la variable endógena:
\[Y=f((-)creci,(-)Gpub,(+)PEA,(-)Edu\] Como se esperan dichas relaciones entre las variables exógenas con la endógena (es lo que se espera, dado lo visto empiricamente y teóricamnete entre las 2 variables), pero como aún no se han realizado las correspondientes pruebas, se plantean las siguientes hipotesis entre la relación de las variables exógenas con la endogena:
Hipótesis Generales
Ho: No Existe una relación lineal entre los factores socioeconómicos y políticos seleccionados y la tasa de desempleo en Latinoamérica en 2022.
H1: Existe una relación lineal entre los factores socioeconómicos y políticos seleccionados y la tasa de desempleo en Latinoamérica en 2022.
Hipótesis especificas
• Crecimiento Económico:
Ho: Hay una relación lineal inversa entre el crecimiento económico y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal inversa entre el crecimiento económico y la tasa de desempleo en Latinoamérica en 2022.
• Nivel de estudio
Ho: Hay una relación lineal inversa entre los años de estudio y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal inversa entre los años de estudio y la tasa de desempleo en Latinoamérica en 2022.
• Población ecónomicamente activa
Ho: Hay una relación lineal directa entre la población en edad de trabajar y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal directa entre la población ecónomicamente activa y la tasa de desempleo en Latinoamérica en 2022.
• Gasto Público:
Ho: Hay una relación linea inversa entre el gasto público y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay una relación lineal inversa entre el gasto público y la tasa de desempleo en Latinoamérica en 2022.
Supuestos del modelo:
Supuesto1: El modelo es lineal en los parámetros, por tanto, la variable endógena es explicada por las variables exógenas, lo que se expresa como: \[Y=\beta_0+\beta_1 X_1+\beta_2 X_2+\beta_3 X_3+\beta_4 X_4\]
Supuesto2: Los grados de libertad son positivos \(gl=n-k≥0\).
Supuesto3: No existe una relación lineal entre las variables explicativas del modelo, por tanto, se dice que no hay una multicolinealidad.
Supuesto4: Los parámetros del modelo () son constantes.
Supuesto5: - El promedio del error no afectará a los resultados \(\bar\varepsilon=0\).
Supuesto6: La varianza de este error debe de ser un valor conocido, fijo y finito \(Var(\varepsilon)=(\bar\sigma^2) <0\).
2.2 Especificación del modelo matemático
A partir de la comprensión del planteamiento teórico del fenómeno del problema se determina que la tasa de desempleo está en función de la tasa de crecimiento, gasto publico en educacion, poblacion economicamente activa, nivel de educación de manera que se representa como:
\[Tdesemp= f(Creci, Gpub, PEA, Edu)\]
Dónde se tiene que:
| Variables | Descripción |
|---|---|
| Creci | Tasa de crecimiento economico |
| Gpub | Gasto publico en eduación |
| PEA | Población economicamente activa |
| Edu | Nivel de educación |
Tomará forma lineal de la siguiente manera:
\[Y=\beta_0+\beta_1 X_1+\beta_2 X_2+\beta_3 X_3+\beta_4 X_4\]
Partiendo de la relacion general planteada:
\[Y=f((-)creci,(-)Gpub,(+)PEA,(-)Edu\] Se espera que todas las variables tengan una relacion inversamente proporcial a la tasa de desempleo, a excepción de la PEA, por lo que se espera que un aumento en el valor del resto de variables tenga una reduccion en la tasa de desempleo.
Donde entonces se espera que los parametros sean:
\[ \beta_0>0, \beta_1<0, \beta_2<0, \beta_3>0, \beta_4<0\] Por ello se estaría determinando como: \[Tdesemp=\beta_0 - \beta_1*Creci - \beta_2*Gpub + \beta_3*PEA - \beta_4*Edu\]
2.2.1 Restricciones de los parámetros
Dada la temática de investigación “Análisis de los factores socioeconómicos y políticos que afectan la tasa de desempleo en Latinoamérica en 2022.”, se utiliza el enfoque del valor para la selección de variables y su estructuración dentro del modelo matemático que asume linealidad en los parámetros y en las variables, por tanto, se estima que existe una relación inversa entre los regresores en el modelo de regresión lineal múltiple para determinar los factores que explican la tasa de desempleo, de tal manera que: \[Tdesemp=f((-)creci,(-)Gpub,(+)PEA,(-)Edu\]
- Identificaremos como “Tdesemp” a la tasa de desempleo, referido se refiere a las personas en edad laboral que no tienen empleo, que están dispuestas a trabajar, y que han realizado acciones específicas para encontrar empleo.
Por lo que se dice que “Tdesemp” ≥ 0, dado a que no existe un nivel de Tasa de desempleo negativo debido a que es una tasa, osea la población economicamente activa entre la población desocupada, y puede ser igual a 0 en el caso excepcional que la economia se encuentre en pleno empleo.
- Sea “Creci” tasa de crecimiento, que hace referencia al incremento en la producción de bienes y servicios en una economía de un periodo a otro en este caso referido a un año base, generalmente expresado porcentaje en millones de dolares.
Se asume que “Creci” puede ser < 0 o > 0 dado que es una varacion del PIB, por lo que si en el PIB del año a observar es menor que el PIB del año anterior la variacion puede resultar negativa, caso contrario el PIB del año actual es mayor que el PIB del año anterior la tasa de crecimiento sera positiva.
- Sea “Gpub” el nivel de gasto publico se refiere al desembolso en los distintos niveles de enseñanza, desde el preescolar hasta el terciario, incluidos los servicios auxiliares y la investigación y desarrollo relacionados con la educación.
Por lo que “Gpub” ≥ 0 dado que se espera que el gobierno siempre tenga un gasto para educación debido a que debe mantener como minimo las escuelas publicas, y en un caso extraordinario donde el gobierno no posea presupuesto o fondos puede llegar a tener un gasto de 0 en educacion.
- Se determina la “PEA” como las personas que tienen una ocupación o que sin tenerla la están buscando activamente. Está compuesta por la población ocupada más la población desocupada.
Población desocupada: Se refiere a personas que, no teniendo ocupación, están buscando activamente trabajo. Corresponde a Desocupación Abierta. Este concepto no incluye otras formas de precariedad laboral (también relevadas por la EPH) tales como personas que realizan trabajos transitorios mientras buscan activamente una ocupación, aquéllas que trabajan jornadas involuntariamente por debajo de lo normal, a los desocupados que han suspendido la búsqueda por falta de oportunidades visibles de empleo, a los ocupados en puestos por debajo de la remuneración vital mínima o en puestos por debajo de la calificación, etcétera.
Población Ocupada: se refiere a los ocupados que trabajan al menos de 40 horas semanales por causas involuntarias y desean trabajar más horas.
Por lo que “PEA” > 0 porque siempre habrá personas involucradas en la actividad economica.
- “Edu” es el nivel educativo de una persona que se define como una serie ordenada de programas educativos agrupados en relación a una gradación de las experiencias de aprendizaje, el conocimiento, las habilidades y las competencias impartidas por cada uno de estos programas. Como por ejemplo en El Salvador el nivel educativo comprende: Kinder, 3 niveles de basica, Bachillerato, Educación superior referidos a tecnicos, Universidad, Maestrias, Doctorados.
Por lo que “Edu” ≥ 0 por lo que a se refiere la variable esta nunca podra ser menor que 0 debido a que se espera que las personas como minimo tengan un grado de escolaridad de 0.
2.3 Especificación del modelo estadístico
Partiendo del modelo matematico, podemos hacer la especificacion del modelo estadistico, de tal manera:
\[Tdesemp=\beta_0-\beta_1*Creci-\beta_2*Gpub+\beta_3*PEA-\beta_4*Edu+\varepsilon\] Dónde se tiene que:
| Variables | Descripción |
|---|---|
| Creci | Tasa de crecimiento economico |
| Gpub | Gasto publico en eduación |
| PEA | Población economicamente activa |
| Edu | Nivel de educación |
𝛽0 es el intercepto.
𝛽1,𝛽2,𝛽3,𝛽4 son los coeficientes que representan las relaciones esperadas entre cada variable y la tasa de desempleo. Dado que se espera que las variables tengan una relación directa o inversa, y esto se ve reflejado en los signos de los coeficientes.
𝜖 es el término de error, que representa la variabilidad no explicada por las variables en el modelo. Esto incluye cualquier factor no observado o aleatorio que pueda afectar la tasa de desempleo y que no está capturado por las variables explícitas en el modelo.
Ahora sí se ven representadas todas las variables exógenas que no se tomaron en cuenta, por lo que es importante recordar lo que se espera de este error en el modelo presentado:
El promedio del error no debería afectar los resultados. \[\bar\varepsilon=0\]
La varianza de este error debe de ser un valor conocido, fijo y finito. \[Var(\varepsilon)=(\bar\sigma^2) <0\]
2.4 Evidencia empírica del fenómeno económico
Luego de la especificación del modelo matemático y estadístico surge el interés de recopilar la información relevante para el desarrollo del modelo econométrico y en este caso se hace necesario el uso de datos de corte transversal, es decir, que estén centrados en un mismo punto o período de tiempo, de lo cual hemos establecido el año 2022, considerando la posibilidad de poder recopilar la mayor cantidad de datos, ya que para el año 2022 hay datos que no se encuentran.
Dichos datos han sido obtenidos a través de la plataforma del Banco Mundial,CEPAL y Statista, la cuales son paginas confiables que recopilan información brindada por los países del mundo y a partir de ello se pueden visualizar los siguientes datos que en totalidad son para 20 paises latinoamericanos, pero se muestran únicamente los primeros 6:
library(readxl)
datos_modelo_Tdesemp <-read_excel("C:/Users/SANCHEZ/Desktop/GABRIEL2021/Universidad/Ciclo V/Econometria/Base.xlsx")
head(datos_modelo_Tdesemp, n=6)## # A tibble: 6 × 5
## Creci Edu Gpub PEA Tdesemp
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 4.96 11.2 21.2 21511126 6.8
## 2 3.02 8.1 27.7 108750811 9.3
## 3 2.44 10.9 25.0 9629968 7.9
## 4 7.26 9.33 21.6 25770913 11.2
## 5 4.55 9.33 19.1 2542517 12.2
## 6 2.95 10.3 20.8 8813437 3.8
3. Estimacion
En este apartado se estima el modelo sobre la base de datos observados, los cuales, por medio de una inferencia estadística se conocerá que tan idóneo resulta el modelo para explicar la tasa de desempleo a partir de las variables exógenas.
3.1 Estimacion del modelo
\[Tdesemp=\beta_0-\beta_1*Creci-\beta_2*Gpub+\beta_3*PEA-\beta_4*Edu+\varepsilon\]
modelo_Tdesemp<-lm(Tdesemp ~ PEA + Edu + Gpub + Creci, data = datos_modelo_Tdesemp)
library(stargazer)
options(scipen = 9999)
stargazer(modelo_Tdesemp, title = "Modelo de tasa de desempleo en Latinoamerica, 2022", type = "html", digits = 8)| Dependent variable: | |
| Tdesemp | |
| PEA | -0.00000001 |
| (0.00000005) | |
| Edu | -0.27282760 |
| (0.68126120) | |
| Gpub | 0.40948600 |
| (0.50104520) | |
| Creci | 0.81270590 |
| (0.58830910) | |
| Constant | -2.79701100 |
| (9.37799000) | |
| Observations | 13 |
| R2 | 0.22421310 |
| Adjusted R2 | -0.16368030 |
| Residual Std. Error | 3.21874700 (df = 8) |
| F Statistic | 0.57802760 (df = 4; 8) |
| Note: | p<0.1; p<0.05; p<0.01 |
El modelo estimado posee un ajuste bajo, tan solo del 22% según el coeficiente de determinación, por lo que, es solo ese el porcentaje de la varianza que explicado por el conjunto de regresores del modelo.
El motivo de esto puede ser causado por una nula correlación entre la variables explicativas y la variable dependientes o que hay datos demasiado extremos o se tienen datos ruidosos.
3.2 Verificación de supuestos del MCRLM
Esto es importante antes de cualquier conclusión estadística del modelo, pues es necesario verificar, analizar y realizar una crítica más a fondo del modelo, en ese sentido se necesita de las pruebas de normalidad de los residuos, aclarando desde ya que no todos los supuestos se pueden llegar a cumplir.
3.2.1 Pruebas de Normalidad
Prueba de Jarque Bera (JB)
La prueba Jarque Bera, utiliza un estadístico en prueba que involucra la curtosis y la asimetría
Regla de decisión:
| Rechazar Ho si | No rechazar Ho si |
|---|---|
| JB ≥ V.C. | JB < V.C. |
| p-value ≤ \(\alpha\) | p-value > \(\alpha\) |
##
## Jarque Bera Test
##
## data: modelo_Tdesemp$residuals
## X-squared = 1.0592, df = 2, p-value = 0.5888
Grafica de la prueba de normalidad de Jarque Bera
library(fastGraph) # Carga el paquete 'fastGraph', que proporciona funciones para la visualización rápida de gráficos.
alpha_sig <- 0.05 # Define el nivel de significancia alpha como 0.05.
JB <- prueba_JB$statistic # Extrae la estadística de prueba de la prueba de Jarque-Bera y la guarda en la variable 'JB'.
gl <- prueba_JB$parameter # Extrae los grados de libertad de la prueba de Jarque-Bera y los guarda en la variable 'gl'.
VC <- qchisq(1-alpha_sig, gl, lower.tail = TRUE) # Calcula el valor crítico para la distribución chi-cuadrado con los grados de libertad y el nivel de significancia especificados, y lo guarda en la variable 'VC'.
shadeDist(xshade = JB,
ddist = "dchisq",
parm1 = gl,
lower.tail = FALSE,
sub = paste("VC:", round(VC, 2), " ", "JB:", round(JB, 2)),
main = "Prueba de Jarque Bera",
xtic = c(JB, VC)) # Genera un gráfico de la distribución chi-cuadrado con sombreado para resaltar el área crítica. Muestra la estadística de prueba 'JB', el valor crítico 'VC' y el título del gráfico como "Prueba de Jarque Bera".Interpretación: Se puede concluir que hay evidencia para no rechazar la hipotesis nula ya que el valor crítico de 5.99 es mayor al estadístico de JB de 1.06, además analizando el p-value se puede observar que es mayor que el nivel de significancia, por lo tanto los residuos tienen una distribucion normal.
Prueba de Kolmogorov Smirnov (KS)
Es una prueba general para verificar si una variable sigue una determinada distribución de probabilidad , de tal forma que permite verificar la hipótesis de normalidad.
Regla de decisión:
| Rechazar Ho si | No rechazar Ho si |
|---|---|
| D ≥ V.C. | D < V.C. |
| p-value ≤ \(\alpha\) | p-value > \(\alpha\) |
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelo_Tdesemp$residuals
## D = 0.1729, p-value = 0.3575
Interpretacion: Ya que el p-value es mayor al nivel de significancia,se puede decir que hay evidencia para no rechazar la hipótesis nula y determinar que los residuos del modelo siguen una distribución normal.
Prueba de Shapiro Wilk (SW)
La prueba esta diseñada específicamente para realizar el contraste de normalidad para una variable.
Esta es una prueba de normalidad, a diferencia de la prueba KS, que puede ser usada para verificar otras distribuciones.
Regla de decisión:
| Rechazar Ho si | No rechazar Ho si |
|---|---|
| Wn ≥ V.C. | Wn < V.C. |
| p-value ≤ \(\alpha\) | p-value > \(\alpha\) |
##
## Shapiro-Wilk normality test
##
## data: modelo_Tdesemp$residuals
## W = 0.93007, p-value = 0.3415
# Cálculo del estadístico Wn (W normalizado)
Wn_salida <- qnorm(salida_SW$p.value, lower.tail = FALSE)
print(Wn_salida) ## [1] 0.4083663
Grafica de la prueba de normalidad Shapiro-Wilk
library(fastGraph)
VC_SW <- 1.644854
shadeDist(xshade = VC_SW,
ddist = "dnorm",
parm1 = 0,
lower.tail = FALSE,
sub = paste("Wn:", round(Wn_salida, 2), "Vc:", (VC_SW)),
main = "Prueba de Shapiro Wilk (SW)",# Genera un gráfico de la distribución normal estándar con sombreado en el área crítica para la prueba de Shapiro-Wilk.
xtic = c(Wn_salida, VC_SW)) # Se especifican los parámetros para el sombreado, el texto de la leyenda, los colores, el título y las marcas en el eje x.Interpretacion: Según la regla de decisión se puede decir que hay evidencia para no rechazar la hipótesis nula,entonces los residuos tienen una distribución normal, ya que, el Wn es menor al valor crítico, a la vez que el p-value resulta ser mayor que el nivel de significancia.
3.2.2 Pruebas de multicolinealidad
Indice de condición
El número de condición mide la sensibilidad de las estimaciones mínimo cuadráticas ante pequeños cambios en los datos.
Interpretación:
| κ(x) ≤ 20 | Multicolinealidad leve |
| 20 < κ(x) < 30 | Multicolinealidad moderada |
| κ(x) ≥30 | Multicolinealidad severa |
##
## Call:
## omcdiag(mod = mod, Inter = TRUE, detr = detr, red = red, conf = conf,
## theil = theil, cn = cn)
##
##
## Overall Multicollinearity Diagnostics
##
## MC Results detection
## Determinant |X'X|: 0.2084 0
## Farrar Chi-Square: 15.4204 1
## Red Indicator: 0.3947 0
## Sum of Lambda Inverse: 10.5249 0
## Theil's Method: 1.6648 1
## Condition Number: 33.0080 1
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
Interpretacion: Como el indice de condicion calculado que es de 33.0080 es ≥ 30,el modelo presenta multicolinealidad severa.
Prueba de Farrar-Glaubar
Esta prueba identifica si a nivel poblacional, los regresores del modelo presentan independencia estadistica (son ortogonales), a través de la matriz de correlación muestral R, y se verifica si a nivel poblacional dicha matriz de correlación corresponde a una matriz identidad
Regla de decision
Si no se rechaza \(H_0\), no hay evidencia de multicolinealidad, caso contrario, si se rechazara \(H_0\) hay evidencia de multicolinealidad en los regresores del mdoelo.
| Se rechaza \(H_0\) | No se rechaza \(H_0\) |
|---|---|
| \(X_{FG}^{2}\) ≥ V.C | \(X_{FG}^{2}\) ≤ V.C |
| p-value ≤ \(\alpha\) | p-value ≥ \(\alpha\) |
##
## Call:
## mctest::omcdiag(mod = modelo_Tdesemp)
##
##
## Overall Multicollinearity Diagnostics
##
## MC Results detection
## Determinant |X'X|: 0.2084 0
## Farrar Chi-Square: 15.4204 1
## Red Indicator: 0.3947 0
## Sum of Lambda Inverse: 10.5249 0
## Theil's Method: 1.6648 1
## Condition Number: 33.0080 1
##
## 1 --> COLLINEARITY is detected by the test
## 0 --> COLLINEARITY is not detected by the test
Valor critico
X_mat<-model.matrix(modelo_Tdesemp)
m<-ncol(X_mat[,-1])
gl<-m*(m-1)/2
VC<-qchisq(p = 0.95,df = gl)
print(VC)## [1] 12.59159
Regla de decision: Como \(X_{FG}^{2}\) < V.C, en este caso seria \(X_{FG}^{2}\) = 15.42 y el V.C = 12.59 se rechaza \(H_0\), por lo tanto hay evidencia de colinealidad en los regresores.
Factores Inflacionarios de la Varianza (FIV)
Los denominados, variance inflation factor (VIF), por sus siglas en inglés, determinan el tamaño relativo de la varianza del j-ésimo parámetro estimado, respecto a la varianza esperada del estimador en ausencia de colinealidad.
Mediante la diagonal principal de la inversa de la matriz de Correlación, se pueden obtener matricialmente los VIF:
\[VIF_{j=1,2,...,k-1} = \text{diag}(R^{-1})\]
## PEA Edu Gpub Creci
## 2.618754 1.767735 3.982844 2.155571
Interpretacion:Se puede concluir, dado un umbral de 2 que las variables explicativas PEA, Gpub, Creci afectan a la varianza del modelo, por lo tanto dichas variables explicativas presentan un problema de multicolinealidad y poseen un nivel leve de correlacion pero es aceptable.
3.2.3 Prueba de Heterocedasticidad
Prueba de White
Regla de decision
Si no se rechaza \(H_0\), hay evidencia de que la varianza de los residuos es Homocedástica, caso contrario, si se rechazara \(H_0\) hay evidencia de que la varianza de los residuos es Heterocedástica.
| Se rechaza \(H_0\) | No se rechaza \(H_0\) |
|---|---|
| \(LM_W\) ≥ V.C | \(LM_W\) < V.C |
| p-value ≤ \(\alpha\) | p-value > \(\alpha\) |
Funciones para generar las regresiones auxiliares para la prueba de White
# Fórmula para ser usada con bptest del package lmtest) Con términos de interacción.
form_compl_interaccion <- function(variables) {
terminos_cuadraticos <- paste(paste0("I(", variables, "^2)"), collapse = " + ")
interaccion <- combn(variables, 2, FUN = function(x) paste(x, collapse = "*"), simplify = TRUE)
terminos_interaccion <- paste(interaccion, collapse = " + ")
cadena_formula <- paste(terminos_cuadraticos, terminos_interaccion, sep = " + ")
objeto_formula <- as.formula(paste("~", cadena_formula))
return(objeto_formula)
}library(lmtest)
variables_explicativas<-c("PEA","Creci","Edu","Gpub")
form_aux<-form_compl_interaccion(variables_explicativas)
pb_white<-bptest(modelo_Tdesemp, form_aux,data = datos_modelo_Tdesemp)
print(pb_white)##
## studentized Breusch-Pagan test
##
## data: modelo_Tdesemp
## BP = 13, df = 12, p-value = 0.369
pb <- pb_white$statistic
gl <- pb_white$parameter
VC<-qchisq(p = 0.95,df = gl)
library(fastGraph) # Se carga la librería 'fastGraph', que proporciona funciones para generar gráficos rápidos y eficientes.
shadeDist(xshade = pb,
ddist = "dchisq",
parm1 = gl,
lower.tail = FALSE,
sub = paste("VC:", round(VC, digits = 3), "PW:", round(pb, digits = 3)),
main = "Prueba de white",
xtic = c(pb, VC))Interpretacion: Como el p-value es mayor al nivel de significancia no se rechaza la \(H_0\), por lo tanto hay evidencia de que la varianza de los residuos es homocedastica y que a su vez al no haber presencia de Heterocedasticiadad la matriz de Varianza Covarianza es escalar.
3.2.4 Prueba de Autocorrelacion
Prueba de Durbin - Watson
Regla de decision
Si no se rechaza \(H_0\), no hay evidencia de autocorrelación de primer orden, en los residuos del modelo, caso contrario, si se rechazara \(H_0\) hay evidencia de autocorrelación de primer orden, en los residuos del modelo.
Extremos teoricos
| p=1 | p=0 | p=-1 |
| 0 | 2 | 4 |
Debido a que la distribución, del estadístico DW, no es estándar ( Es necesario usar las tablas del estadístico DW), al usar la tabla se conocera la zona de rechazo de la hipotesis, la zona de no rechazo y en este caso hay una zona que es no concluyente, sin embargo si el resultado de la prueba es cercano a 2 se podria asumir que cae en zona de no rechazo.
| Se rechaza \(H_0\) | No se rechaza \(H_0\) |
|---|---|
| p-value ≤ \(\alpha\) | p-value ≥ \(\alpha\) |
##
## Durbin-Watson test
##
## data: modelo_Tdesemp
## DW = 1.4493, p-value = 0.3652
## alternative hypothesis: true autocorrelation is not 0
Interpretacion: Como el p-value es mayor que el nivel de significancia no se rechaza la \(H_0\), por lo tanto no hay evidencia de autocorrelacion de primer orden en los residuos del modelo.
Prueba del Multiplicador de Lagrange [Breusch-Godfrey]
Regla de decision
Si no se rechaza \(H_0\), no hay evidencia de autocorrelación de orden “m”, en los residuos del modelo, caso contrario, si se rechazara \(H_0\) Hay evidencia de autocorrelación de orden “m”, en los residuos del modelo.
| Se rechaza \(H_0\) | No se rechaza \(H_0\) |
|---|---|
| \(LM_{BG}\) > V.C | \(LM_{BG}\) ≤ V.C |
| p-value ≤ \(\alpha\) | p-value > \(\alpha\) |
Prueba de autocorrelacion LM de primer orden
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: modelo_Tdesemp
## LM test = 1.5443, df = 1, p-value = 0.214
Intepretacion:Como p-value es mayor al nivel de significancia, no se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no tienen autocorrelación de orden “1”.
Prueba de autocorrelacion LM de segundo orden
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: modelo_Tdesemp
## LM test = 1.6758, df = 2, p-value = 0.4326
Intepretacion:Como p-value es mayor al nivel de significancia no se rechaza la H0, por lo tanto puede concluirse que los residuos del modelo, no presentan autocorrelación de orden “2”
3.3 Correciones al modelo estimado
Aunque nuestro modelo propuesto sobre la tasa de desempleo en Latinoamerica para el año 2022, no poseea ningun problema de Heterocedasticidad o Autocorrelacion, o sea que la matriz de Varianza-Covarianza es escalar, de igual forma para generar un modelo robusto, se hara la correcion con el estimado HAC, para que el modelo se vuelva mas robusto y explique de mejor forma la variable endogena.
Modelo sin corregir
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.797011135187 9.377989710555 -0.2983 0.7731
## PEA -0.000000014833 0.000000049273 -0.3010 0.7711
## Edu -0.272827603774 0.681261161540 -0.4005 0.6993
## Gpub 0.409485962888 0.501045182272 0.8173 0.4374
## Creci 0.812705903097 0.588309103189 1.3814 0.2045
Modelo Corregido (Usando un estimado HAC)
library(lmtest)
library(sandwich)
vcov_HAC <- vcovHC(modelo_Tdesemp, type = "HC0")
coeftest(modelo_Tdesemp, vcov. = vcov_HAC)##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.797011135187 6.384718102383 -0.4381 0.67292
## PEA -0.000000014833 0.000000026470 -0.5604 0.59057
## Edu -0.272827603774 0.304420975341 -0.8962 0.39630
## Gpub 0.409485962888 0.310827781789 1.3174 0.22418
## Creci 0.812705903097 0.343937081621 2.3629 0.04575 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Estimacion Robusta del Modelo
library(robustbase)
library(stargazer)
modelo_robust_Tdesemp<-lmrob(Tdesemp ~ PEA + Edu + Gpub + Creci, data = datos_modelo_Tdesemp)
coeftest(modelo_robust_Tdesemp)##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5.192062277321 6.519206930108 -0.7964 0.44877
## PEA -0.000000014269 0.000000022380 -0.6376 0.54157
## Edu -0.363999388313 0.301336571987 -1.2079 0.26156
## Gpub 0.531247603926 0.337315446862 1.5749 0.15392
## Creci 0.914953842165 0.343062023670 2.6670 0.02849 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Comparacion de los modelos
options(scipen = 99999)
library(stargazer)
robust.se <- sqrt(diag(vcovHC(modelo_Tdesemp, type = "HC1")))
stargazer(modelo_Tdesemp, modelo_Tdesemp, modelo_robust_Tdesemp,
se = list(NULL, robust.se, NULL),
type = "html",
title = "Comparacion de modelos",
column.labels = c("Original", "Corregido", "Robusto"),
model.names = FALSE,
dep.var.labels = "Modelo",
dep.var.caption = "Variable dependiente: Tasa de Desempleo",
model.numbers = FALSE)| Variable dependiente: Tasa de Desempleo | |||
| Modelo | |||
| Original | Corregido | Robusto | |
| PEA | -0.000 | -0.000 | -0.000 |
| (0.00000) | (0.00000) | (0.00000) | |
| Edu | -0.273 | -0.273 | -0.364 |
| (0.681) | (0.388) | (0.301) | |
| Gpub | 0.409 | 0.409 | 0.531 |
| (0.501) | (0.396) | (0.337) | |
| Creci | 0.813 | 0.813* | 0.915** |
| (0.588) | (0.438) | (0.343) | |
| Constant | -2.797 | -2.797 | -5.192 |
| (9.378) | (8.139) | (6.519) | |
| Observations | 13 | 13 | 13 |
| R2 | 0.224 | 0.224 | 0.309 |
| Adjusted R2 | -0.164 | -0.164 | -0.036 |
| Residual Std. Error (df = 8) | 3.219 | 3.219 | 2.579 |
| F Statistic (df = 4; 8) | 0.578 | 0.578 | |
| Note: | p<0.1; p<0.05; p<0.01 | ||
3.4 Prueba de hipotesis del modelo
En este apartado se conoce la relación existente entre las variables explicativas y la variable explicada de forma individual, para ello se considera el enfoque de intervalos de confianza que determina las hipótesis teóricas del modelo.
Hipótesis específicas
• Crecimiento Económico:
Ho: Hay una relación lineal inversa entre el crecimiento económico y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal inversa entre el crecimiento económico y la tasa de desempleo en Latinoamérica en 2022.
## 2.5 % 97.5 %
## Creci 0.1238514 1.706056
Hay evidencia de existe una relación lineal directa entre la tasa de desempleo y el crecimiento economico, por lo que, se rechaza la hipótesis nula.
• Nivel de estudio
Ho: Hay una relación lineal inversa entre los años de estudio y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal inversa entre los años de estudio y la tasa de desempleo en Latinoamérica en 2022.
## 2.5 % 97.5 %
## Edu -1.058883 0.330884
Hay evidencia no de existe una relación lineal inversa ni directa entre la tasa de desempleo y el nivel de estudio, por lo que, se rechaza la hipótesis nula.
• Población ecónomicamente activa
Ho: Hay una relación lineal directa entre la población en edad de trabajar y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay relación lineal directa entre la población ecónomicamente activa y la tasa de desempleo en Latinoamérica en 2022.
## 2.5 % 97.5 %
## PEA -0.00000006587719 0.00000003733957
Hay evidencia no de existe una relación lineal inversa ni directa entre la tasa de desempleo y la poblacion economicamente activa, por lo que, se rechaza la hipótesis nula.
• Gasto Público:
Ho: Hay una relación linea inversa entre el gasto público y la tasa de desempleo en Latinoamérica en 2022.
H1: No hay una relación lineal inversa entre el gasto público y la tasa de desempleo en Latinoamérica en 2022.
## 2.5 % 97.5 %
## Gpub -0.2466032 1.309098
Hay evidencia no de existe una relación lineal inversa ni directa entre la tasa de desempleo y el nivel de estudio, por lo que, se rechaza la hipótesis nula.
3.5 Simulación
En este apartado se utiliza la librería DescTools como recurso para la descripción de datos.
Previamente a realizar la simulación deben definirse las funciones para el cálculo de Theil y su descomposición.
#Bias Proportion
Um<-function(pronosticado,observado){
library(DescTools)
((mean(pronosticado)-mean(observado))^2)/MSE(pronosticado,observado)
}
#Variance Proportion
Us<-function(pronosticado,observado){
library(DescTools)
((sd(pronosticado)-sd(observado))^2)/MSE(pronosticado,observado)
}
#Covariance Proportion
Uc<-function(pronosticado,observado){
library(DescTools)
(2*(1-cor(pronosticado,observado))*sd(pronosticado)*sd(observado))/MSE(pronosticado,observado)}
#Coeficiente U de Theil (también aparece en la librería "DescTools")
THEIL_U<-function(pronosticado,observado){
library(DescTools)
RMSE(pronosticado,observado)/(sqrt(mean(pronosticado^2))+sqrt(mean(observado^2)))
}data <- datos_modelo_Tdesemp
equation <- as.formula("Tdesemp ~ PEA + Edu + Gpub + Creci")
endogena <- data$TdesempElaboración del Script de simulación
Se realiza una partición de los datos para medir el poder predictivo del modelo planteado con el propósito de obtener proyecciones para valores reales de la variable explicada (Tasa de Desempleo, Tdesemp) a partir de información de variables explicativas que no fueron incluidas en el modelo.
#Script de Simulación
options(scipen = 999999)
library(dplyr)
library(caret)
library(DescTools)
library(stargazer)
set.seed(50)
numero_de_muestras<-200
proporcion_entrenamiento<-0.75
# Creación de las muestras, aquí usamos la variable endógena que definimos con anterioridad
muestras<- endogena %>%
createDataPartition(p = proporcion_entrenamiento,
times = numero_de_muestras,
list = TRUE)
#Listas vacias para la simulación
Modelos_Entrenamiento<-vector(mode = "list",
length = numero_de_muestras)
Pronostico_Prueba<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance_data_entrenamiento<-vector(mode = "list",
length = numero_de_muestras)
Resultados_Performance<-vector(mode = "list",
length = numero_de_muestras)
# Estimar los modelos de cada muestra y sus medidas de desempeño predictivo
for(j in 1:numero_de_muestras){
Datos_Entrenamiento<- data[muestras[[j]], ]
Datos_Prueba<- data[-muestras[[j]], ]
Modelos_Entrenamiento[[j]]<-lm(formula = equation,data=Datos_Entrenamiento)
Pronostico_Prueba[[j]]<-Modelos_Entrenamiento[[j]] %>% predict(Datos_Prueba)
Fe<-Modelos_Entrenamiento[[j]]$fitted.values
Ye<-Datos_Entrenamiento$Tdesemp
Resultados_Performance_data_entrenamiento[[j]]<-data.frame(
R2 = R2(Fe,Ye),
RMSE = RMSE(Fe,Ye),
MAE = MAE(Fe,Ye),
MAPE= MAPE(Fe,Ye)*100,
THEIL=TheilU(Fe,Ye,type = 1),
Um=Um(Fe,Ye),
Us=Us(Fe,Ye),
Uc=Uc(Fe,Ye)
)
Fp<-Pronostico_Prueba[[j]]
Yp<-Datos_Prueba$Tdesemp
Resultados_Performance[[j]]<-data.frame(
R2 = R2(Fp,Yp ),
RMSE = RMSE(Fp, Yp),
MAE = MAE(Fp,Yp),
MAPE= MAPE(Fp,Yp)*100,
THEIL=TheilU(Fp,Yp,type = 1),
Um=Um(Fp,Yp),
Us=Us(Fp,Yp),
Uc=Uc(Fp,Yp)
)
}3.5.1 Resultado y lectura de simulación
Desempeño con los datos de entrenamiento.
library(dplyr)
bind_rows(Resultados_Performance_data_entrenamiento) %>%
stargazer(title= "Medidas de Performance Datos del Modelo",
type = "html",
digits = 3,
summary.stat = c("n","mean","sd","min","p25","p75","max"))| Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
| R2 | 200 | 0.244 | 0.085 | 0.173 | 0.209 | 0.214 | 0.401 |
| RMSE | 200 | 2.450 | 0.165 | 2.159 | 2.442 | 2.574 | 2.586 |
| MAE | 200 | 1.952 | 0.235 | 1.515 | 2.040 | 2.063 | 2.128 |
| MAPE | 200 | 32.724 | 5.348 | 22.845 | 34.125 | 35.794 | 36.765 |
| THEIL | 200 | 0.165 | 0.012 | 0.144 | 0.164 | 0.175 | 0.175 |
| Um | 200 | 0.000 | 0.000 | 0 | 0 | 0 | 0 |
| Us | 200 | 0.380 | 0.075 | 0.245 | 0.401 | 0.407 | 0.451 |
| Uc | 200 | 0.711 | 0.075 | 0.640 | 0.684 | 0.690 | 0.846 |
Interpretación de los datos del modelo: Se tiene en promedio que el 24.4% de la varianza de la variable tasa de desempleo se explica por los regresores del modelo esperando un mínimo del 17.3% de la varianza explicada hasta un máximo del 40.1% explicada al primer cuartil al 20.9% y al tercer cuartil al 21.4%.
El error promedio esperado del modelo es de 1.952 puntos porcentuales de la tasa de desempleo con el error mínimo de 1.515 con un máximo de 2.128.Esperado el error promedio al primer cuartil al 2.04 puntos porcentual y al tercer 2.063
Por su parte, el error porcentual promedio esperado del modelo es del 32.724% mientras que el error mínimo esperado es del 22.84% con un máximo esperado del 36.765%.
La distancia entre sus medias y entre sus volatilidades es 0.380 > 0.2, por lo tanto, los pronósticos no son aceptables.
El valor medio de correlación entre el valor real y el pronosticado es de 71.1%, con un valor mínimo de 64% y un máximo de 84.6% mientras que, el primer cuartil de las réplicas tiene un valor inferior a 68.4% y para el tercer cuartil de las réplicas posee un valor inferior al 69%.
bind_rows(Resultados_Performance) %>%
stargazer(title = "Medidas de Performance Simulación",
type = "html",
summary.stat = c("n", "mean", "sd", "min", "p25", "p75", "max"),
digits = 3)| Statistic | N | Mean | St. Dev. | Min | Pctl(25) | Pctl(75) | Max |
| RMSE | 200 | 4.078 | 2.131 | 1.945 | 2.007 | 6.370 | 6.370 |
| MAE | 200 | 4.078 | 2.131 | 1.945 | 2.007 | 6.370 | 6.370 |
| MAPE | 200 | 123.018 | 76.378 | 45.611 | 45.611 | 212.347 | 212.347 |
| THEIL | 200 | 0.345 | 0.153 | 0.186 | 0.186 | 0.515 | 0.515 |
| Um | 200 | 1.000 | 0.000 | 1 | 1 | 1 | 1 |
Interpretación de los datos de simulación:
Se tiene que el error real promedio es de 4.078 puntos porcentuales de la tasa de desempleo por lo que la diferencia máxima esperada de esta variable seria de 2.126 puntos porcentuales de la tasa de deempleo en caso no haberse realizado la simulación.
El error promedio es de 123.018%
El valor medio de correlación entre el valor real y el pronosticado es del 100%, con un valor mínimo de 100% y un máximo de 100%
4. Proyecciones y análisis de resultado
El enfoque de intervalos de confianza nos permite conocer y comprender que tan explicativa es una variable endogena sobre la variable exogena, para ello tomaremos en cuenta la evaluación de la hipótesis definida de forma general del modelo:
Prueba de hipótesis
- La j-ésima variable explicativa no tiene una relación lineal parcial con la variable independiente (Tdesemp)
\[\ H_0: \beta_j = 0\]
- La j-ésima variable explicativa tiene una relación lineal parcial con la variable independiente (Tdesemp)
\[\ H_1: \beta_j \not=0\]
Para j=0,1,2,3…, es decir, para todos los parámetros estimados del modelo de forma individual.
Para un nivel de significancia de 0.05 se tiene lo siguiente:
## 2.5 % 97.5 %
## (Intercept) -20.22538041640047 9.84125586175868
## PEA -0.00000006587719 0.00000003733957
## Edu -1.05888276940409 0.33088399277860
## Gpub -0.24660321140522 1.30909841925671
## Creci 0.12385139695134 1.70605628737956
Interpretación:
Con un nivel de confianza del 0.95, se concluye que, en el 95% de las ocasiones en que se estime la ecuación, no existiria un efecto de la PEA sobre la Tasa de Desempleo, por tanto, no existe una relación lineal parcial y no se rechaza la hipósetis nula, puesto que la variable explicativa “PEA” no es estadísticamente significativa en términos de la variable endógena “Tdesemp”.
Con un nivel de confianza del 0.95, se concluye que, en el 95% de las ocasiones en que se estime la ecuación, no existiria un efecto de el Nivel de Educacción sobre la Tasa de Desempleo, por tanto, no existe una relación lineal parcial y no se rechaza la hipósetis nula, puesto que la variable explicativa “Edu” no es estadísticamente significativa en términos de la variable endógena “Tdesemp”.
Con un nivel de confianza del 0.95, se concluye que, en el 95% de las ocasiones en que se estime la ecuación, no existiria un efecto del Gasto Publico sobre la Tasa de Desempleo, por tanto, no existe una relación lineal parcial y no se rechaza la hipósetis nula, puesto que la variable explicativa “Gpub” no es estadísticamente significativa en términos de la variable endógena “Tdesemp”.
Con un nivel de confianza del 0.95, se concluye que, en el 95% de las ocasiones en que se estime la ecuación, se esperaría que exista un efecto válido o significativo de la Tasa de Crecimiento sobre la Tasa de Desempleo, por tanto, existe una relación lineal parcial y se rechaza la hipósetis nula, puesto que la variable explicativa “Creci” es estadísticamente significativa en términos de la variable endógena “Tdesemp”.
Anexos
| Name | datos_modelo_Tdesemp |
| Number of rows | 13 |
| Number of columns | 5 |
| _______________________ | |
| Column type frequency: | |
| numeric | 5 |
| ________________________ | |
| Group variables | None |
Variable type: numeric
| skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
|---|---|---|---|---|---|---|---|---|---|---|
| Creci | 0 | 1 | 4.47 | 2.32 | 2.44 | 2.95 | 4.00 | 4.86 | 10.81 | ▇▅▁▁▁ |
| Edu | 0 | 1 | 9.12 | 1.81 | 5.70 | 8.10 | 9.33 | 10.30 | 11.60 | ▂▁▁▇▃ |
| Gpub | 0 | 1 | 21.45 | 3.70 | 14.37 | 19.10 | 21.20 | 23.49 | 27.69 | ▂▅▇▃▃ |
| PEA | 0 | 1 | 21207613.38 | 30516366.07 | 2049663.00 | 4564937.00 | 8813437.00 | 21511126.00 | 108750811.00 | ▇▁▁▁▁ |
| Tdesemp | 0 | 1 | 6.82 | 2.98 | 3.00 | 4.40 | 6.80 | 8.20 | 12.20 | ▇▃▇▂▃ |
El nombre del archivo de excel en el que se compilaron los datos que se utilizaron en el presente trabajo lleva por nombre “Base”
Bibliografía
Banco Mundial. (2023). Tasa de participación en la fuerza laboral, total (% de la población total mayor de 15 años) - Argentina, Bolivia, Brasil, Chile, Colombia, Costa Rica, Cuba, Ecuador, El Salvador, Guatemala, Honduras, México, Nicaragua, Panamá, Paraguay, Perú, República Dominicana, Uruguay, Venezuela, fromhttps://datos.bancomundial.org/indicador/SL.TLF.TOTL.IN?end=2023&locations=AR-BO-BR-CL-CO-CR-CU-EC-SV-GT-HN-MX-NI-PA-PY-PE-DO-UY-VE&start=2022
Google Classroom. (n.d.). Detalles de la clase,fromhttps://classroom.google.com/c/NjY2NDI0NzUyODEz/m/NjcwODk4MDI1NDQx/details
Comisión Económica para América Latina y el Caribe (CEPAL). (n.d.). Indicadores sociales y económicos,fromhttps://statistics.cepal.org/portal/cepalstat/dashboard.html?indicator_id=127&area_id=634&lang=es
Instituto Nacional para la Evaluación de la Educación (INEE). (n.d.). Glosario de términos: Nivel educativo,fromhttps://inee.org/es/eie-glossary/nivel-educativo#:~=Glosario%20de%20terminos%20Nivel%20educativo%20El%20nivel%20educativo,competencias%20que%20imparte%20cada%20uno%20de%20estos%20programas
Instituto Nacional de Estadística y Geografía (INEGI). (n.d.). Escolaridad,fromhttps://www.cuentame.inegi.org.mx/poblacion/escolaridad.aspx#:~=Para%20obtenerlo%2C%20debes%20escoger%20un%20conjunto%20de%20personas%2C,a%C3%B1os%20que%20en%20promedio%20ha%20estudiado%20el%20grupo
La Estrella de Panamá. (2020). Promedio de escolaridad del panameño es de 11.6 años,fromhttps://www.laestrella.com.pa/panama/nacional/promedio-escolaridad-panameno-11-6-OELE490952#:~=es%20la%20educaci%C3%B3n.-,El%20director%20del%20Instituto%20Nacional%20de%20Estad%C3%ADstica%20y%20Censo%20(Inec,Panam%C3%A1%20es%20de%2011%2C6
Nuestra Voz a Colores. (n.d.). Educación de niños y niñas en Guatemala,fromhttp://nuestravozacolores.org/educacion-de-ninos-y-ninas-en-guatemala/#:~=El%20nivel%20de%20escolaridad%20en,mayoritariamente%20ind%C3%ADgenas%20(1.3%20A%C3%B1os