INTRODUCCION

para emepezar en el presente taller se realizará un análisis econométrico que tiene como objetivo aplicar y profundizar en el uso de análisis de varianza Anova para evaluar algunas diferencias que se puedan encontrar entre estos conjuntos de datos, para lo cual serán necesarias herramientas de programación y análisis de datos para explorar y intentar entender el comportamiento de las variables estudiadas.

Nuestro análisis comenzará con la visualización de los datos a través de algunos gráficos descriptivos como lo son los BoxPlot Los que nos permite observar la dispersión de los datos, posteriormente se realizará un análisis anova el cual nos puede ayudar a comprobar la hipótesis de igualdad de medidas entre los grupos lo cual incluye la interpretación de P valor y el valor de F para determinar su significancia estadística dependiendo de las variables observadas al igual que es necesario realizar un análisis de los residuos y gráficos Q-Q para ver si este modelo cumple con supuesto de homicedasticidad normalidad e independencia, éstos también nos permiten evaluar la distribución y dispersión de los errores del modelo lo cual es esencial para asegurar la fiabilidad de los resultados, centrándonos no solamente en la obtención de los datos sino también enfatizando en la interpretación económica de los hallazgos lo que nos permite traer conclusiones significativas sobre los fenómenos económicos en estudio.

Ejercicio 1

Relaciones sexuales entre jóvenes universitarios, en 3 carreras diferentes. El departamento de Psicología de una Universidad de Colombia ha realizado un estudio sobre hábitos, preferencias y satisfacción sexual en estudiantes universitarios. Hemos utilizado los datos que recogieron en sus encuestas y queremos conocer si existen diferencias entre la frecuencia mensual de relaciones sexuales de estudiantes universitarios pertenecientes a tres titulaciones universitarias diferentes:

Economía: 11 14 7 15 11 13 11 16 10 15 18 12 9 9 10 10 15 10 14 10 10 12 14 12 15 7 13 6 10 15 20 10 13 10 6 14 8 10 8 11

Administración: 13 10 12 7 5 10 10 16 9 7 7 2 6 9 9 8 8 10 3 6 5 2 9 3 4 5 10 8 5 9 10 8 13 10 0 2 1 1 0 4

Contaduría: 6 7 3 5 9 6 1 6 0 2 5 6 11 6 7 0 5 7 5 4 7 4 2 8 9 6 1 4 7 7 8 9 7 5 1 6 9 4 7 6

economia<- c( 11, 14, 7, 15, 11, 13, 11, 16, 10, 15, 18, 12, 9, 9, 10, 10, 15, 10, 14, 10, 10, 12, 14, 12, 15, 7, 13, 6, 10, 15,
20, 10, 13, 10, 6, 14, 8, 10, 8, 11)
administracion<- c(13, 10, 12, 7, 5, 10, 10, 16, 9, 7, 7, 2, 6, 9, 9, 8, 8, 10, 3, 6, 5, 2, 9, 3, 4, 5, 10, 8, 5, 9, 10, 8, 13, 10, 0, 2,
1, 1, 0, 4)
contaduria<- c(6, 7, 3, 5, 9, 6, 1, 6, 0, 2, 5, 6, 11, 6, 7, 0, 5, 7, 5, 4, 7, 4, 2, 8, 9, 6, 1, 4, 7, 7, 8, 9, 7, 5, 1, 6, 9, 4, 7, 6)
relaciones<- data.frame(frecuencia= c(economia,administracion,contaduria),
carrera=(c(rep(c("Economia", "Administracion", "Contaduria"), each =40))))
attach(relaciones)
head(relaciones)
##   frecuencia  carrera
## 1         11 Economia
## 2         14 Economia
## 3          7 Economia
## 4         15 Economia
## 5         11 Economia
## 6         13 Economia
# Crear un data frame con los datos
relaciones <- data.frame(
  frecuencia = c(economia, administracion, contaduria),
  carrera = rep(c("Economia", "Administracion", "Contaduria"), each = 40)
)

# Crear el boxplot con colores personalizados
boxplot(frecuencia ~ carrera, col = c("#76EE00", "#EE7621", "#00FFFF"),
        ylab = "Número de frecuencia que los estudiantes tienen relaciones",
        data = relaciones)

En el diagrama de Box plot en el cual se analizó la frecuencia de la relaciones sexuales entre estudiantes de la carrera de economía Administracion y Contaduria se observó que cada grupo muestra un rango intercuartilico(IQR), que en el rango entre el primer cuartil (Q1) y el tercer cuartil (Q3) donde se encuentra al 50% central es donde se encuentra la mediana de la frecuencia de la relaciones sexuales para cada carrera, para lo cual se observa lo siguiente: Economía: la mediana de esta se encuentra aproximadamente en el centro lo que sugiere que tiene una distribución relativamente simétrica esta siendo más alta en comparación a Administracion y contaduria lo que nos indica que los estudiantes de economía presentan una mayor dispersión en su comportamiento sexual con frecuencias que pueden ser altas o bajas, por ende esta variable cuenta con una mayor variabilidad de actividad sexual Administracion: la caja de este grupo es un poco más estrecha por ende su rango intercuartilico ha de ser menor ésta se encuentra ligeramente asimétrica hacia los valores más bajo lo que nos indica que los estudiantes de administracion reportan frecuencias de relaciones sexuales bajas, lo que nos indica que los estudiantes de esta carrera, tienen una menor dispersión por ende no tienen con tanta frecuencia relaciones sexuales Contaduria: esta caja también es relativamente pequeña y su mediana está más próxima al borde inferior nos muestra una asimetría hacia los valores más bajos lo que nos sugiere que muchos estudiantes de Contaduria presentan poca frecuencia de relaciones sexuales al igual se evidencia que la frecuencia de los estudiantes de esta carrera es homogénea

tapply(frecuencia, carrera, mean)
## Administracion     Contaduria       Economia 
##           6.90           5.45          11.60

Economía: Los estudiantes de esta carrera presentan la media más alta en cuanto a la frecuencia de relaciones sexuales con una media de 11.60 Administración: La media en este grupo es menor que en Economía pero superior a la de Contaduría. Esto indica que, en promedio, los estudiantes de Administración tienen una frecuencia de relaciones sexuales de 6.90 Contaduría: Este presenta la media más baja en comparación con Economía y Administración,ya que es de 5.45

anova = aov( lm(frecuencia ~ carrera) )
options(scipen=999)
summary(anova)
##              Df Sum Sq Mean Sq F value            Pr(>F)    
## carrera       2  826.9   413.4   38.98 0.000000000000107 ***
## Residuals   117 1241.1    10.6                              
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Al realizar el análisis anova se buscó identificar si existen diferencias notorias entre la frecuencia de relaciones sexuales entre los estudiantes de las carreras de Economía Administracion y Contaduria, para empezar, el valor P obtenido en el test anova es extremadamente bajo ya que es de 0.000000000000107 lo cual permite que se pueda rechazar la hipótesis nula que se plantea que las medias de la frecuencias relaciones sexuales entre las tres carreras son iguales, este valor de P tan pequeño nos indica que al menos una de las medias de las carreras es significativamente diferente a las demás, lo cual se evidenció en el Box Plot anterior ya que se sabe que Economia presenta un rango más amplio en términos de relaciones sexuales y Administracion y Contaduria muestra una frecuencia de relaciones sexuales menores, estoy indicándonos que en la frecuencia en la que los estudiantes tienen relaciones sexuales influye su carrera, además, el valor F obtenido es alto lo cual señala que la variabilidad de algunas de las frecuencias de las relaciones sexuales entre los distintos grupos (carreras) es considerablemente mayor que la variabilidad observada dentro de cada uno de los grupos, sugiriéndonos que la carrera estudiantil tiene un impacto significativo en el comportamiento sexual de los estudiantes

diferencias = TukeyHSD(anova)
diferencias
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lm(frecuencia ~ carrera))
## 
## $carrera
##                            diff       lwr       upr     p adj
## Contaduria-Administracion -1.45 -3.178861 0.2788605 0.1189269
## Economia-Administracion    4.70  2.971139 6.4288605 0.0000000
## Economia-Contaduria        6.15  4.421139 7.8788605 0.0000000

Se encontró una diferencia en las medias de -1.45, esto indicándonos que el promedio de Contaduria es menor que el de Administracion en 1.45 U En este caso el intervalo de confianza incluye el valor cero, esto sugiriéndonos que esta diferencia no es estadísticamente significativa El P valor ajustado es mayor a 0.05, por lo cual esto nos indica que no se puede rechazar la hipótesis nula de igualdad de medias entre estos dos grupos

# Gráfico de residuos con línea central en cero
plot(anova$residuals, main = "Gráfico de Residuos", ylab = "Residuos", xlab = "Índice")
abline(h = 0, col = "red", lwd = 2)  # Línea en el centro (en y = 0) de color rojo y más gruesa

En este gráfico de residuos del modelo Anova se puede analizar que este modelo anova podría ser adecuado, ya que este cuenta con recibos ajustados cercanos a cero la cual es la línea roja que se encuentra en este gráfico, así también, se evidencia la homogeneidad de la varianza ya que en este gráfico los residuos no tienden ni expandirse ni a contraerse a lo largo del índice de observaciones lo cual sugiere que no tiene problemas de hetero drasticidad, sin embargo existen algunos puntos que se alejan más de la línea central lo cual podría indicar que cuenta con una ligera variabilidad, al igual los residuos son independientes, y cuentan con valores a típicos que son algunos puntos que están más alejados de la línea central los que están alrededor de 20 como los que se encuentran alrededor de -20, pero al igual el modelo puede explicar por completo estas variables ya que los valores típicos son muy pocosy no parecen comprometer la validez del análisis general

# Histograma con color personalizado
hist(anova$residuals, col = "skyblue", border = "navy", main = "Histograma de Residuos", xlab = "Residuos")

el histograma de residuos muestra una distribución aproximadamente simétrica en torno a cero, lo que sugiere que el modelo estadístico ajustado está haciendo un buen trabajo al capturar las diferencias en las frecuencias de relaciones sexuales entre las tres carreras. Esto es importante porque una distribución simétrica de los residuos sugiere que no hay sesgo sistemático en los datos. Por otra parte, la mayoría de los residuos se agrupan alrededor del valor de cero, lo que indica que la mayor parte de las diferencias entre las predicciones del modelo y los valores observados no son muy grandes. En otras palabras, el modelo parece estar prediciendo bastante bien la frecuencia de relaciones sexuales para la mayoría de los estudiantes en las tres carreras, se puede observar que hay algunos residuos alejados de cero, pero no parecen ser demasiados, lo que indica que no existen muchos valores atípicos.

# Gráfico Q-Q con color personalizado para los puntos y la línea
qqnorm(anova$residuals, col = "darkgreen", main = "Gráfico Q-Q de Residuos")
qqline(anova$residuals, col = "red", lwd = 2)  # Línea de referencia en color rojo y más gruesa

En este gráfico de probabilidad normal (Q-Q) se comparan los cuantiles de los residuos de una distribución normal, en base a esto podemos analizar que los puntos representan los residuos y como están distribuidos, además estos estan distribuidos en una linea recta cercana a la diagonal lo cual nos indica que estos residuos son básicamente normales. Por otra parte, los puntos que están desviados o alejados de la línea representan una breve desviación de la normalidad de los residuos especialmente en la cola de la distribución.ademas se puede analizar que aunque los residuos sigan una tendencia a la normalidad, hay una serie de desviaciones que no tiene un gran impacto en estás muestras pequeñas.

shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.98473, p-value = 0.1945

Se aplicó la prueba de Shapiro-Wilk a los residuos del modelo ANOVA. Los resultados mostraron un valor de p de 0.1945, lo cual es mayor al nivel de significancia de 0.05, indicando que no se puede rechazar la hipótesis de normalidad. Esto sugiere que los residuos del modelo siguen una distribución normal, cumpliendo así el supuesto de normalidad del ANOVA. Dado que se cumple el supuesto de normalidad, el modelo ANOVA utilizado es apropiado para estos datos. En caso de que los residuos no hubieran seguido una distribución normal, se habría considerado una prueba no paramétrica, como la prueba de Kruskal-Wallis, para comparar las medianas de los grupos sin suponer normalidad en los datos. Mediante la prueba de comparación múltiple de tukey los análisis comparan las diferencias entre las medias de varias carreras como economía, contaduría y administración que cuentan con un intervalo de confianza del 95%, debido a estos resultados podemos afirmar que no hay diferencias significativas entre contaduría y administración, Pero por otra parte, podemos decir que si existe una diferencia significativa entre economia y administración y entre economía y contaduría, lo cual sugiere que la carrera de economía cuenta con una media significativamente distinta en relación con las otras 2.

DECISIONES A TOMAR DE POLITICA PUBLICA PARA LA UNIVERSIDAD

Algunas de las políticas públicas que se podrían ejecutar teniendo en cuenta los resultados obtenidos de los análisis gráficos y estadísticos sobre las diferencias entre las relaciones sexuales entre los programas de economía, administración y contaduría la decisión más acorde a esta problemática es la aplicación de políticas que podrían tomarse para abordar las diferencias en el ámbito sexual de los distintos estudiantes.

Políticas de intervención y charlas específicas por el programa académico: Está política debe ejecutarse de manera categórica dado qué economía muestra unas diferencias significativas en comparación a los otros 2 programas, es posible que los estudiantes de esta carrera tengan una serie de características o necesidades sexuales que requieran un apoyo o trato distinto por parte de la entidad encargada de tratar dicha falencia.

Política de evaluación y seguimiento: Mediante los resultados obtenidos, de los seguimientos y evaluaciones realizados a los estudiantes con una gran intensidad de instinto sexual, se desarrollaran programas que realicen seguimientos y chequeos para analizar los avances obtenidos y de este modo ajustar las politicas que vayan de acuerdo a las necesidades de los estudiantes.

Ejercicio 2

Diferencias entre los salario según el tipo de ubicación

Nos gustaría saber si el salario varía en alguna de las 3 provincias de la Comunidad Valenciana. Para ello, se realizó un estudio con 50 personas por provincia a las que se preguntó su salario en euros por semana.

Valencia 299 313 300 321 308 312 300 310 281 308 309 300 303 303 311 308 291 298 276 290 310 308 295 310 286 295 289 293 291 297 297 287 297 302 298 301 313 290 306 313 294 308 295 303 316 299 313 296 290 299

Castellón: 252 248 232 229 256 233 240 237 248 232 230 246 236 250 238 243 245 241 235 249 238 231 230 239 261 243 242 245 249 258 245 236 244 242 229 246 244 244 255 247 236 252 237 259 248 237 236 252 236 239

Alicante: 272 268 285 274 278 287 297 275 269 281 270 284 282 281 280 286 265 283 281 272 269 286 268 288 284 282 304 280 283 281 281 286 287 288 278 272 268 287 269 272 270 271 291 265 280 280 275 294 269 277

valencia<- c(299,313,300,321,308,312,300,310,281,308,309,300,303,303,311,308,291,298,276,290,310,308,295,310,286,295,289,293,291,297,297,287,297,302,298,301,313,290,306,313,294,308,295,303,316,299,313,296,290,299)
castellon<- c(252,248,232,229,256,233,240,237,248,232,230,246,236,250,238,243,245,241,235,249,238,231,230,239,261,243,242,245,249,258,245,236,244,242,229,246,244,244,255,247,236,252,237,259,248,237,236,252,236,239)
alicante<- c(272,268,285,274,278,287,297,275,269,281,270,284,282,281,280,286,265,283,281,272,269,286,268,288,284,282,304,280,283,281,281,286,287,288,278,272,268,287,269,272,270,271,291,265,280,280,275,294,269,277)
salario<- data.frame(frecuencia= c(valencia,castellon,alicante),
provincia=(c(rep(c("valencia", "castellon", "alicante"), each =50))))
attach(salario)
## The following object is masked from relaciones:
## 
##     frecuencia
head(salario)
##   frecuencia provincia
## 1        299  valencia
## 2        313  valencia
## 3        300  valencia
## 4        321  valencia
## 5        308  valencia
## 6        312  valencia
boxplot(frecuencia ~ provincia, col = c("blue", "green", "orange"), ylab = "Diferencias entre los salarios segun el tipo de ubicacion",data = salario)

La caja principal muestra el rango intercuartílico (IQR), que es el rango entre el primer cuartil (Q1) y el tercer cuartil (Q3). Este es el rango en el que se encuentran los salarios del 50% central de la muestra, la línea del centro representa la mediana del salario para cada provincia. La posición de esta línea dentro de la caja indica si la distribución es simétrica, y esto nos indica que por provincia la mediana esta: en Alicante, la mediana es un poco más cercana al borde superior de la caja, lo que sugiere una ligera asimetría hacia salarios más bajos y Castellón, la mediana se encuentra casi en el centro de la caja, indicando una distribución más simétrica y para finalizar en Valencia, la mediana está cerca del borde inferior de la caja, sugiriendo que la mayoría de los salarios están concentrados en valores altos dentro de la muestra de esta provincia. Basándonos en esto podemos decir que: Alicante: Tiene un rango salarial menor comparado con las otras provincias, con una mediana cercana a 280. La caja es relativamente estrecha, indicando poca variabilidad en los salarios en esta provincia. Esto sugiere que los salarios en Alicante son más homogéneos. Castellón: Presenta el rango más amplio, con salarios que van aproximadamente desde 240 hasta casi 300. La dispersión en los salarios es considerablemente alta, lo que podría deberse a diferencias en las ocupaciones o niveles de experiencia en esta provincia. Valencia: Muestra los salarios más altos en promedio, con una mediana cercana a 300 y un rango intercuartílico estrecho, lo que indica poca dispersión en los salarios. Esto sugiere Que Valencia podría tener un mercado laboral más consolidado o con menor desigualdad salarial entre los empleados. Además Alicante y Valencia muestran menos variabilidad en los salarios, lo cual podría reflejar una estructura laboral más uniforme o una menor desigualdad en esas provincias y Castellón comparado con las otras dos provincias presenta una mayor variabilidad salarial, lo que puede indicar la presencia de empleos con distintos niveles de especialización o sectores económicos con gran diversidad de salarios, Valencia parece tener los salarios más altos de las tres provincias, lo cual podría deberse a una mayor demanda laboral la presencia de sectores económicos con salarios más elevados.

tapply(frecuencia, provincia, mean)
##  alicante castellon  valencia 
##    279.10    242.40    300.64

Valencia muestra la media salarial más alta entre las tres provincias, ya que cuenta con una media salarial de 300.64. lo cual esto sugiere que el mercado laboral en Valencia es más fuerte y posiblemente más competitivo. Es probable que haya una mayor demanda laboral y una presencia significativa de sectores económicos con salarios elevados, como tecnología, finanzas y salud y un factor diferencial que es la educacion.

Alicante cuenta con una media salarial menor en comparacion a valencia ya que es de 279.10. Aunque no tan alta como en Valencia, los salarios en Alicante son relativamente homogéneos, lo que podría reflejar una estructura laboral más estable y menos desigualdad en comparación con Castellón. en cambio o en comparacion con valencia y alicante, Castellón presenta la media salarial más baja de las tres provincias. Esto indica una posible falta de sectores de alto salario y una mayor variabilidad en las ocupaciones y niveles de experiencia. La dispersión salarial sugiere que puede haber una mezcla de empleos de baja y alta especialización

anova = aov( lm(frecuencia ~ provincia) )
summary(anova)
##              Df Sum Sq Mean Sq F value              Pr(>F)    
## provincia     2  86713   43356     558 <0.0000000000000002 ***
## Residuals   147  11422      78                                
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para empezar el P-valor es de 0.0000000000000002 y esto nos indica sé que el P-valor es extremadamente bajo, es decir, se rechaza la hipótesis nula que plantea que las medias salariales entre las provincias son iguales, lo cual Esto significa que al menos una de las medias de las provincias es significativamente diferente de las demás. Además el elevado valor del F valué el cual es de 558 también nos indica que la variabilidad salarial entre las diferentes provincias es considerablemente mayor que la variabilidad observada dentro de cada provincia. Esto sugiere que el factor “Provincia” tiene un impacto fuerte y significativo sobre las diferencias en los salarios.

diferencias = TukeyHSD(anova)
diferencias
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lm(frecuencia ~ provincia))
## 
## $provincia
##                      diff       lwr       upr p adj
## castellon-alicante -36.70 -40.87415 -32.52585     0
## valencia-alicante   21.54  17.36585  25.71415     0
## valencia-castellon  58.24  54.06585  62.41415     0

COMPARACION Castellón y alicante: La comparación entre Castellón y Alicante muestra una diferencia en las medias de -36.70 unidades. Este valor negativo indica que el promedio del grupo de Castellón es menor que el de Alicante en 36.70 unidades. El p-valor ajustado es 0, lo que nos permite rechazar la hipótesis nula de que no hay diferencia en las medias entre estas dos provincias. Esto significa que la diferencia observada es altamente significativa, es decir, la probabilidad de que esta diferencia haya ocurrido por azar es prácticamente nula. Valencia y alicante: entre Valencia y Alicante, la diferencia en las medias es de 21.54 unidades. Este valor positivo indica que el promedio del grupo de Valencia es mayor que el de Alicante en 21.54 unidades. Al igual que en la comparación anterior, el p-valor ajustado es 0. Este valor de p extremadamente bajo nos permite rechazar la hipótesis nula y confirmar que la diferencia entre las medias de Valencia y Alicante es estadísticamente significativa. Valencia y Castellón: La diferencia en las medias entre Valencia y Castellón es de 58.24 unidades, siendo Valencia la provincia con el promedio más alto. El p-valor ajustado, una vez más, es 0, indicando una diferencia significativa. Esta comparación muestra que Valencia tiene una media mucha mayor en comparación con Castellón, consolidando la posición de Valencia como la provincia con la media más alta entre las tres.

# Gráfico de residuos con línea central en cero
plot(anova$residuals, main = "Gráfico de Residuos", ylab = "Residuos", xlab = "Índice")
abline(h = 0, col = "red", lwd = 2)  # Línea en el centro (en y = 0) de color rojo y más gruesa

Eje Y (Residuos): Los residuos varían entre aproximadamente -20 y 20. Eje X (Índice u Observación): Representa las observaciones del conjunto de datos. Línea Roja Horizontal (y = 0): Indica la línea de cero residuo, que es el punto de referencia para evaluar la dispersión de los residuos alrededor de esta línea. Los puntos de residuos están dispersos alrededor de la línea de cero y no parece haber un patrón claro de como estan ubicados los puntos, lo cual es un buen indicio de que el modelo puede estar capturando bien la relación entre las variables y basado en la evaluación del gráfico de residuos, el modelo parece ser apropiado para los datos. La distribución aleatoria de los residuos alrededor de la línea de cero sugiere que el modelo no tiene grandes deficiencias en la captura de la variabilidad de los datos.

# Histograma de residuos con colores personalizados
hist(anova$residuals, col = "orange", border = "brown", main = "Histograma de Residuos", xlab = "Residuos")

El histograma muestra una forma aproximadamente simétrica y de campana, lo cual sugiere que los residuos siguen una distribución normal y la mayoría de los residuos se agrupan alrededor del centro, con menos residuos a medida que se alejan de cero, lo que es característico de una distribución normal.

# Gráfico Q-Q de residuos con colores personalizados
qqnorm(anova$residuals, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(anova$residuals, col = "darkorange", lwd = 2)  # Línea de referencia en color naranja oscuro y más gruesa

En el gráfico Q-Q de residuos proporcionado, los puntos rosados representan los residuos y la línea verde representa la distribución normal teórica y observamos que los puntos se alinean bastante bien a lo largo de la línea verde, aunque hay algunas desviaciones en los extremos. Además el alineamiento general de los puntos con la línea verde en el gráfico Q-Q de residuos nos indica que los residuos siguen aproximadamente una distribución normal, lo cual se puede interpretar como un buen indicativo para la validez del modelo ANOVA en términos de normalidad de los residuos, lo cual respalda la validez del modelo ANOVA en términos de normalidad

shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.99194, p-value = 0.5574

La alternativa no Paramétrica en caso de que los supuestos de normalidad e independencia no se cumplieran, el test de Kruskal-Wallis sería una alternativa adecuada y este nos dice que el criterio de normalidad se cumple para los residuos, ya que, el P-value es de 0.5574 y nos señala que está siendo este mayor a 0.05 y que según esta prueba, los residuos se pueden considerar como distribuidos normalmente.

DESICIONES A PARTIR DE LOS RESULTADOS OBTENIDOS

Teniendo en cuenta los resultados obtenidos de los análisis gráficos y estadísticos sobre las diferencias salariales entre las provincias de Valencia, Alicante y Castellón la decisión más acorde a esta problemática es la aplicación de políticas que podrían tomarse para abordar las diferencias en salarios y mejorar la situación laboral en estas provincias. Políticas para la inversión en Sectores de Alto Crecimiento: esta aplicación de políticas se puede lograr mediante programas sectoriales de crecimiento económico como el implementado por Colombia en el cual consistía en lograr la evolución de la economía colombiana la cual logro cambios importantes en su estructura, potenciando sectores que brindaban bajos salarios. En el contexto de valencia promover las políticas de inversión en sectores que ya están ofreciendo salarios altos en Valencia, como por ejemplo tecnología, salud, y servicios financieros, para mantener y aumentar el crecimiento económico. Políticas de Iniciativas de Innovación y Emprendimiento: Crear incentivos para pequeños emprendedores y empresas innovadoras, fomentando o haciendo atractivo un entorno que traiga a profesionales que estén altamente calificados y mantenga a Castellón y Alicate competitivas en el mercado global, y además de esto generando mejores salarios que ayuden a disminuir las disparidades con las diferencias de salarios entre las provincias. Mejorar las Habilidades de la Fuerza Laboral: Desarrollar programas de capacitación y educación continuada para mejorar las habilidades de la fuerza laboral en la provincia con los salarios más bajos impulsando así su economía y su fuerza laboral. infraestructura: Para aumentar la inversión es necesario mejorar la infraestructura y brindar el acceso a los recursos, en primera parte que la provincias mediante la infraestructura se hagan más atractiva implicaría que de las provincias con salarios más bajos se verían en un mejoramiento de la fomentación de nuevas inversiones, es crucial realizar mejoras significativas en la infraestructura local. Esto incluye desarrollar y modernizar los sistemas de transporte, como carreteras, ferrocarriles y transporte público, para mejorar la conectividad y facilitar el desplazamiento de personas y mercancías. Además, invertir en tecnología avanzada y en infraestructuras digitales, como redes de alta velocidad y cobertura de internet, es esencial para atraer empresas tecnológicas y de otros sectores innovadores. Estas mejoras no solo harán que las provincias sean más accesible y atractiva para las empresas existentes y también para los inversores, sino que también mejorarán la calidad de vida de las personas, creando un entorno propicio para el crecimiento económico y la creación de empleos bien remunerados, es decir con mejores salarios. La reducción de la desigualdad: la promoción del trabajo decente para todas las mujeres y todos los hombres son objetivos fundamentales de la Agenda 2030 para el Desarrollo Sostenible adoptada por las Naciones Unidas en 2015, esta políticas aplicada por las naciones unidas son esenciales también para los salarios de las personas, ya que muchas veces la desigualad de salarios entre hombres y mujeres se ven reflejados en índices, los cuales muchas veces muestran que un país o ciudad presenta bajos salarios, pero muchas veces estas mediciones mentirosas se deben a la cantidad de mujeres trabajando en dichos países o ciudades, las cuales no le brindan un salario justo en comparación con los hombres, promover la igualdad en los salarios beneficiara este índice y no solo este índice sino también al crecimiento sostenido de la economía

CONCLUSION

Para concluir, los análisis realizados en el taller muestran que existen diferencias significativas en ambos estudios. En el primer ejercicio, se hallaron diferencias en la frecuencia de relaciones sexuales entre estudiantes de distintas carreras, con resultados significativos en los grupos de Economía y las otras dos carreras, lo cual puede sugerir que factores académicos o sociales propios de cada carrera influyen en este comportamiento. En el segundo ejercicio, se observaron variaciones salariales entre las provincias, reflejando diferencias económicas regionales en la Comunidad Valenciana.

Estos hallazgos pueden servir para implementar políticas adecuadas en los contextos de educación superior y mercado laboral. En el caso de la universidad, sería beneficioso considerar programas de apoyo y educación adaptados a las características de cada carrera, mientras que en el ámbito de salarios, se podrían revisar y ajustar políticas que promuevan la equidad regional. Los resultados del taller, en conjunto, destacan la utilidad del análisis de varianza para identificar diferencias relevantes que pueden influir en el diseño de políticas efectivas y basadas en evidencia.