LA EVOLUCIÓN DEL SALARIO DE LAS MUJERES EN LOS ÚLTIMOS 50 AÑOS

Resumen

El presente estudio trata sobre la evolución del salario de las mujeres en los ultimos 50 años concluyendo en la presencia de una relación negativa de esta evolución tanto con la tasa de paro presente como un nivel menor de estudios a la par que una relación positiva al salario medio de los hombres.

Introducción

Sobre los datos

El salario medio de las mujeres ha estado siempre por debajo del de los hombres, igualmente la tasa de paro femenina siempre ha sido superior a la masculina, ademas de que los hombres suelen ocupar puestos de mayor nivel de estudios, por ello en este informe se estudiará si existe relación entre el salario medio de las mujeres y el resto de indicadores socioeconomicos mencionados llegando a conclusiones sobre el porqué de esta realidad.

Objetivos del estudio

El objetivo del estudio es analizar de forma estadistica la evolución del salario de las mujeres encontrando su relación con otras variables socioeconomicas con el objeto de encontrar patrones, similitudes, diferencias y llegar a elaborar un modelo matematico para estos datos que nos lleguen a permitir elaborar predicciones del salario medio de las mujeres en años venideros, demostrandose asi la relación entre las variables.

Material y Métodos

Información disponible

Contamos con las siguientes variables:

  • Una serie temporal con el salario medio de las mujeres, esta es una variable continua que será explicada por las demás.

  • Una serie temporal con el salario medio de los hombres, al igual que la anterior, esta variable continua será usada para explicar el salario de las mujeres mostrando pues una correlación entre ambas.

  • La tasa de paro anual,una serie con las tasas de paro medias anuales, continua.

  • El tipo de educación predominante en cada año. Esta sería una variable categorica, y la emplearemos para ver las diferencias salariales que implican unos estudios superiores o inferiores.

  • Por último, el año del que proceden los datos anteriores.

Análisis estadístico

En primer lugar, se realizará un análisis descriptivo, en el que se resumirá la información a traves del uso de gráficos y tablas. Seguidamente se tratará de llegar a un modelo matematico que relacione el salario medio de las mujeres con el resto de variables. Para ello se emplean modelos de regresión que serán explicados más adelante.

Resultados

Análisis descriptivo

Porcen.paro Salario.hombres Tipo Salario.Mujeres
Min. : 8.759 Min. : 989.2 estudios primarios :10 Min. : 317.9
1st Qu.:15.451 1st Qu.:1445.5 estudios secundaria :28 1st Qu.: 773.8
Median :19.080 Median :1601.7 fp grado superior o universitario:10 Median :1061.8
Mean :19.388 Mean :1571.2 NA Mean :1034.0
3rd Qu.:22.004 3rd Qu.:1780.7 NA 3rd Qu.:1218.7
Max. :29.318 Max. :2278.9 NA Max. :1955.4

A la vista de este primer gráfico podemos afirmar que el salario de las mujeres no sigue una tendencia sino que mas bien tiene un comportamiento aleatorio.El salario mas bajo que han tenido las mujeres ha sido de 317.93 euros y el salario más alto que han tenido ha sido de 1955,436 euros. Vemos que durante este periodo el tipo de estudios predominantes han sido los medios, durante 28 años

Poniendo en comparación el salario medio de los hombres con el salario medio de las mujeres podemos ver como practicamente durante la escala temporal que abarcan nuestros datos, el salario de los hombres ha estado por encima del salario de las mujeres salvo en algunas ocasiones como 2006 en los que estuvo ligeramente por encima.

En el paro , al igual que en el salario medio de las mujeres no se observan tendencias a simple vista , pero podemos decir que la tasa que oscila en este espacio de tiempo nunca ha superado el 30% ni ha bajado del 8%.

Paro % Salario Hombre Salario Mujer Año
Paro % 1.0000000 0.2071482 0.1605748 -0.0062186
Salario Hombre 0.2071482 1.0000000 0.3552452 -0.1024167
Salario Mujer 0.1605748 0.3552452 1.0000000 0.0543576
Año -0.0062186 -0.1024167 0.0543576 1.0000000

No podemos observar grandes correlaciones entre las variables, la mayor correlación la presenta el salario medio de los hombres con el de las mujeres con un 0,355 por lo que no podriamos afirmar a priori que el salario medio de los hombres y las mujeres crezca o decrezca de igual forma en ambos sexos.

Vamos a ver ahora la relación existente entre el tipo de estudios y el resto de variables:

Tipo Media Sal.Mujer
estudios primarios 497.5577
estudios secundaria 1067.2847
fp grado superior o universitario 1477.3426
Tipo Media Sal.Hombre
estudios primarios 1595.148
estudios secundaria 1604.666
fp grado superior o universitario 1453.634

Podemos ver una clara relación entre el tipos de estudios mas altos y un aumento del sueldo medio de tanto las mujeres como los hombres, llegando a duplicarse esta media en el paso de estudios primarios a estudios secundarios.

Tipo Tasa Paro med
estudios primarios 19.56280
estudios secundaria 19.11059
fp grado superior o universitario 19.99122

En cuanto al paro, no hay una relación directa entre la tasa de paro y los tipos de estudios predominantes observandose como la media de la tasa de paro varia en un porcentaje infimo entre los distintos tipos de estudios.

Modelo de Regresión

Un modelo de regresión es un modelo matemático que busca determinar la relación entre una variable dependiente con respecto a otras variables llamadas explicativas o independientes. El modelo de regresión se usa con el fin de determinar si existe o no relación entre la variable dependiente y el resto de otras variables explicativas. Hemos sometido nuestro modelo inicial a un proceso de selección paso a paso en el que se comprueba que variables deben estar o no en el modelo para obtener mejores resultados.

Modelo Inicial: \[ Salario.Mujeres = Porcen.paro*Tipo + Salario.hombres*Tipo + anyo*Tipo \]

Modelo final: \[ Salario.Mujeres = Tipo + Salario.Hombres + Tipo*Salario.hombres \]

El coeficiente de determinación es la proporción de la varianza total del Salario de las mujeres explicada por el modelo y refleja la bondad del ajuste del modelo. Su valor oscila entre 0 y 1, considerandose los valores mas cercanos a 1 como mejores, en nuestro caso tenemos un coeficiente de determinación del 0,99 por lo que podemos afirmar que el modelo explica muy bien la varianza del salario de las mujeres.

R2 Rajust SSres SStot
0.9926131 0.9917337 49599.84 6714563

Para validar el modelo se han de cumplir una serie de hipótesis:

En primer lugar la normalidad de los residuos es decir que los residuos sigan una distribución normal, esto se comprueba a traves del contraste de hipotesis proporcionado por el test de Shapiro-Wilk. Valores mayores a 0,5 en el p-valor implican una aceptacion de la hipotesis nula de normalidad.


    Shapiro-Wilk normality test

data:  modelostep$residuals
W = 0.96942, p-value = 0.2405

En segundo lugar se estudia la homocedasticidad de los residuos, esto es que se comporten de forma aleatoria en los distintos grupos, observamos que el p-valor tiene un valor de 0,2433 por lo que podemos afirmar que los resiudos son homocedasticos.


    studentized Breusch-Pagan test

data:  modelostep
BP = 6.7074, df = 5, p-value = 0.2433

Comprobamos si el modelo tiene valores atípicos es decir, valores que excepcionalmente diferentes al resto. Con el test de Outliers obtenemos el resultado de que ninguna observación es atípica.


No Studentized residuals with Bonferonni p < 0.05
Largest |rstudent|:
    rstudent unadjusted p-value Bonferonni p
50 -1.991016           0.046479           NA

A continuación se estudia si hay autocorrelación, esto es si hay correlacion entre los residuos del modelo. Esta autocorrelación se estudia a traves de los gráficos ACF y PACF:

A la vista de los graficos, nuestro modelo admite una representación autorregresiva y de medias moviles (ARMA), es decir que las futuras observaciones dependen tanto de las observaciones anteriores como de los errores cometidos por el modelo al calcular las observaciones anteriores, por lo que este modelo seria invalido y necesitariamos encontrar otro modelo que nos permita indicarle la presencia de esta autocorrleación.

Series Temporales

Para encontrar un modelo fiel al ajuste y que presente una autocorrelación usamos una técnica estadistica llamada Mínimos Cuadrados Generalizados. El modelo que finalmente encontramos:

\[ Salario.Mujeres = Porcen.paro+Tipo + Salario.hombres+ Salario.hombres* Tipo + ARMA(2,2) \]

Pese a que este modelo parece bueno en un principio, continua teniendo valores fuera de los limites del acf y pacf por lo que procedemos a realizar un modelo ARIMA que siendo similar al ARMA permite incluir un elemento cíclico o estacional.

Podemos ver en el gráfico que en esta ocasión no se presentan valores fuera de los limites por lo que nos quedaremos con este modelo para realizar predicciones.

Finalmente, en el gráfico podemos observar tres casos de predicciones segun unas situaciones prototipicas que pueden darse, en concreto hemos preparado una situacion positiva, con bajo paro, salarios masculinos altos y nivel de estudios universitarios, una neutral con estas variables pero con unos valores intermedios y por último una situación negativa.

Conclusiones

Podemos destacar una serie de afirmaciones:

-El salario medio de las mujeres es directamente proporcional al de los hombres, viendose como al aumentar este, aumenta tambien el de las mujeres.

-El paro afecta de forma inversamente proporcional al total del salario medio de las mujeres, al aumentar la tasa obtendremos un menor salario medio.

-La presencia de un nivel de estudios superior incrementa ampliamente el salario medio de ambos sexos, llegaº ndo a duplicarse en el caso de la presencia de unos estudios primarios a unos secundarios.

Estas tres afirmaciones se ven reflejadas en la predicción obtenida, al igual que comparandolas con la informacion estraida a priori del analisis descriptivo

Referencias

Jose Manuel Ortuño Lorente

2018-06-04