LA EVOLUCIÓN DEL SALARIO DE LAS MUJERES EN LOS ÚLTIMOS 50 AÑOS
Resumen
El presente estudio trata sobre la evolución del salario de las mujeres en los ultimos 50 años concluyendo en la presencia de una relación negativa de esta evolución tanto con la tasa de paro presente como un nivel menor de estudios a la par que una relación positiva al salario medio de los hombres.
Introducción
Sobre los datos
El salario medio de las mujeres ha estado siempre por debajo del de los hombres, igualmente la tasa de paro femenina siempre ha sido superior a la masculina, ademas de que los hombres suelen ocupar puestos de mayor nivel de estudios, por ello en este informe se estudiará si existe relación entre el salario medio de las mujeres y el resto de indicadores socioeconomicos mencionados llegando a conclusiones sobre el porqué de esta realidad.
Objetivos del estudio
El objetivo del estudio es analizar de forma estadistica la evolución del salario de las mujeres encontrando su relación con otras variables socioeconomicas con el objeto de encontrar patrones, similitudes, diferencias y llegar a elaborar un modelo matematico para estos datos que nos lleguen a permitir elaborar predicciones del salario medio de las mujeres en años venideros, demostrandose asi la relación entre las variables.
Material y Métodos
Información disponible
Contamos con las siguientes variables:
Una serie temporal con el salario medio de las mujeres, esta es una variable continua que será explicada por las demás.
Una serie temporal con el salario medio de los hombres, al igual que la anterior, esta variable continua será usada para explicar el salario de las mujeres mostrando pues una correlación entre ambas.
La tasa de paro anual,una serie con las tasas de paro medias anuales, continua.
El tipo de educación predominante en cada año. Esta sería una variable categorica, y la emplearemos para ver las diferencias salariales que implican unos estudios superiores o inferiores.
Por último, el año del que proceden los datos anteriores.
Análisis estadístico
En primer lugar, se realizará un análisis descriptivo, en el que se resumirá la información a traves del uso de gráficos y tablas. Seguidamente se tratará de llegar a un modelo matematico que relacione el salario medio de las mujeres con el resto de variables. Para ello se emplean modelos de regresión que serán explicados más adelante.
Resultados
Análisis descriptivo
| Porcen.paro | Salario.hombres | Tipo | Salario.Mujeres | |
|---|---|---|---|---|
| Min. : 8.759 | Min. : 989.2 | estudios primarios :10 | Min. : 317.9 | |
| 1st Qu.:15.451 | 1st Qu.:1445.5 | estudios secundaria :28 | 1st Qu.: 773.8 | |
| Median :19.080 | Median :1601.7 | fp grado superior o universitario:10 | Median :1061.8 | |
| Mean :19.388 | Mean :1571.2 | NA | Mean :1034.0 | |
| 3rd Qu.:22.004 | 3rd Qu.:1780.7 | NA | 3rd Qu.:1218.7 | |
| Max. :29.318 | Max. :2278.9 | NA | Max. :1955.4 |
A la vista de este primer gráfico podemos afirmar que el salario de las mujeres no sigue una tendencia sino que mas bien tiene un comportamiento aleatorio.El salario mas bajo que han tenido las mujeres ha sido de 317.93 euros y el salario más alto que han tenido ha sido de 1955,436 euros. Vemos que durante este periodo el tipo de estudios predominantes han sido los medios, durante 28 años
Poniendo en comparación el salario medio de los hombres con el salario medio de las mujeres podemos ver como practicamente durante la escala temporal que abarcan nuestros datos, el salario de los hombres ha estado por encima del salario de las mujeres salvo en algunas ocasiones como 2006 en los que estuvo ligeramente por encima.
En el paro , al igual que en el salario medio de las mujeres no se observan tendencias a simple vista , pero podemos decir que la tasa que oscila en este espacio de tiempo nunca ha superado el 30% ni ha bajado del 8%.
| Paro % | Salario Hombre | Salario Mujer | Año | |
|---|---|---|---|---|
| Paro % | 1.0000000 | 0.2071482 | 0.1605748 | -0.0062186 |
| Salario Hombre | 0.2071482 | 1.0000000 | 0.3552452 | -0.1024167 |
| Salario Mujer | 0.1605748 | 0.3552452 | 1.0000000 | 0.0543576 |
| Año | -0.0062186 | -0.1024167 | 0.0543576 | 1.0000000 |
No podemos observar grandes correlaciones entre las variables, la mayor correlación la presenta el salario medio de los hombres con el de las mujeres con un 0,355 por lo que no podriamos afirmar a priori que el salario medio de los hombres y las mujeres crezca o decrezca de igual forma en ambos sexos.
Vamos a ver ahora la relación existente entre el tipo de estudios y el resto de variables:
| Tipo | Media Sal.Mujer |
|---|---|
| estudios primarios | 497.5577 |
| estudios secundaria | 1067.2847 |
| fp grado superior o universitario | 1477.3426 |
| Tipo | Media Sal.Hombre |
|---|---|
| estudios primarios | 1595.148 |
| estudios secundaria | 1604.666 |
| fp grado superior o universitario | 1453.634 |
Podemos ver una clara relación entre el tipos de estudios mas altos y un aumento del sueldo medio de tanto las mujeres como los hombres, llegando a duplicarse esta media en el paso de estudios primarios a estudios secundarios.
| Tipo | Tasa Paro med |
|---|---|
| estudios primarios | 19.56280 |
| estudios secundaria | 19.11059 |
| fp grado superior o universitario | 19.99122 |
En cuanto al paro, no hay una relación directa entre la tasa de paro y los tipos de estudios predominantes observandose como la media de la tasa de paro varia en un porcentaje infimo entre los distintos tipos de estudios.
Modelo de Regresión
Un modelo de regresión es un modelo matemático que busca determinar la relación entre una variable dependiente con respecto a otras variables llamadas explicativas o independientes. El modelo de regresión se usa con el fin de determinar si existe o no relación entre la variable dependiente y el resto de otras variables explicativas. Hemos sometido nuestro modelo inicial a un proceso de selección paso a paso en el que se comprueba que variables deben estar o no en el modelo para obtener mejores resultados.
Modelo Inicial: \[ Salario.Mujeres = Porcen.paro*Tipo + Salario.hombres*Tipo + anyo*Tipo \]
Modelo final: \[ Salario.Mujeres = Tipo + Salario.Hombres + Tipo*Salario.hombres \]
El coeficiente de determinación es la proporción de la varianza total del Salario de las mujeres explicada por el modelo y refleja la bondad del ajuste del modelo. Su valor oscila entre 0 y 1, considerandose los valores mas cercanos a 1 como mejores, en nuestro caso tenemos un coeficiente de determinación del 0,99 por lo que podemos afirmar que el modelo explica muy bien la varianza del salario de las mujeres.
| R2 | Rajust | SSres | SStot |
|---|---|---|---|
| 0.9926131 | 0.9917337 | 49599.84 | 6714563 |
Para validar el modelo se han de cumplir una serie de hipótesis:
En primer lugar la normalidad de los residuos es decir que los residuos sigan una distribución normal, esto se comprueba a traves del contraste de hipotesis proporcionado por el test de Shapiro-Wilk. Valores mayores a 0,5 en el p-valor implican una aceptacion de la hipotesis nula de normalidad.
Shapiro-Wilk normality test
data: modelostep$residuals
W = 0.96942, p-value = 0.2405
En segundo lugar se estudia la homocedasticidad de los residuos, esto es que se comporten de forma aleatoria en los distintos grupos, observamos que el p-valor tiene un valor de 0,2433 por lo que podemos afirmar que los resiudos son homocedasticos.
studentized Breusch-Pagan test
data: modelostep
BP = 6.7074, df = 5, p-value = 0.2433
Comprobamos si el modelo tiene valores atípicos es decir, valores que excepcionalmente diferentes al resto. Con el test de Outliers obtenemos el resultado de que ninguna observación es atípica.
No Studentized residuals with Bonferonni p < 0.05
Largest |rstudent|:
rstudent unadjusted p-value Bonferonni p
50 -1.991016 0.046479 NA
A continuación se estudia si hay autocorrelación, esto es si hay correlacion entre los residuos del modelo. Esta autocorrelación se estudia a traves de los gráficos ACF y PACF:
A la vista de los graficos, nuestro modelo admite una representación autorregresiva y de medias moviles (ARMA), es decir que las futuras observaciones dependen tanto de las observaciones anteriores como de los errores cometidos por el modelo al calcular las observaciones anteriores, por lo que este modelo seria invalido y necesitariamos encontrar otro modelo que nos permita indicarle la presencia de esta autocorrleación.
Series Temporales
Para encontrar un modelo fiel al ajuste y que presente una autocorrelación usamos una técnica estadistica llamada Mínimos Cuadrados Generalizados. El modelo que finalmente encontramos:
\[ Salario.Mujeres = Porcen.paro+Tipo + Salario.hombres+ Salario.hombres* Tipo + ARMA(2,2) \]
Pese a que este modelo parece bueno en un principio, continua teniendo valores fuera de los limites del acf y pacf por lo que procedemos a realizar un modelo ARIMA que siendo similar al ARMA permite incluir un elemento cíclico o estacional.
Podemos ver en el gráfico que en esta ocasión no se presentan valores fuera de los limites por lo que nos quedaremos con este modelo para realizar predicciones.
Finalmente, en el gráfico podemos observar tres casos de predicciones segun unas situaciones prototipicas que pueden darse, en concreto hemos preparado una situacion positiva, con bajo paro, salarios masculinos altos y nivel de estudios universitarios, una neutral con estas variables pero con unos valores intermedios y por último una situación negativa.
Conclusiones
Podemos destacar una serie de afirmaciones:
-El salario medio de las mujeres es directamente proporcional al de los hombres, viendose como al aumentar este, aumenta tambien el de las mujeres.
-El paro afecta de forma inversamente proporcional al total del salario medio de las mujeres, al aumentar la tasa obtendremos un menor salario medio.
-La presencia de un nivel de estudios superior incrementa ampliamente el salario medio de ambos sexos, llegaº ndo a duplicarse en el caso de la presencia de unos estudios primarios a unos secundarios.
Estas tres afirmaciones se ven reflejadas en la predicción obtenida, al igual que comparandolas con la informacion estraida a priori del analisis descriptivo
Referencias
Greene, William H. (2000). Econometric Analysis, Fourth ed., New York, NY: Macmillan.
Asteriou, Dimitros; Hall, Stephen G. (2011). “ARIMA Models and the Box-Jenkins Methodology”.