Punto 1
La hoja de Datos BD-inmuebles.xlsx contiene datos hipotéticos de las operaciones de venta y alquiles de inmuebles en la comunidad catalana. Para sintetizar estos datos, siga los siguientes pasos:
#a)
library(readxl)
#BD_Inmuebles <- read_excel("C:/Users/Yuquu/Desktop/Maestria/Metodos_Cuantitativos/BD-Inmuebles.xls",
BD_Inmuebles <- read_excel("C:/Users/Yuquu/Desktop/Maestria/Metodos_Cuantitativos/BD-Inmuebles.xls",
col_types = c("numeric", "date", "text", "text", "text", "numeric", "numeric", "date", "text"))
BD_Inmuebles$`Fecha Alta`<- as.Date(BD_Inmuebles$`Fecha Alta`)
BD_Inmuebles$`Fecha Venta`<- as.Date(BD_Inmuebles$`Fecha Venta`)
View(BD_Inmuebles)
str(BD_Inmuebles)
## tibble [3,337 × 9] (S3: tbl_df/tbl/data.frame)
## $ Referencia : num [1:3337] 1 2 3 4 5 6 7 8 9 10 ...
## $ Fecha Alta : Date[1:3337], format: "2004-01-01" "2004-01-01" ...
## $ Tipo : chr [1:3337] "Parking" "Local" "Oficina" "Parking" ...
## $ Operación : chr [1:3337] "Alquiler" "Venta" "Alquiler" "Alquiler" ...
## $ Provincia : chr [1:3337] "Lleida" "Girona" "Girona" "Girona" ...
## $ Superficie : num [1:3337] 291 199 82 285 152 131 69 235 108 299 ...
## $ Precio Venta: num [1:3337] 2133903 1945424 712416 1815450 1138024 ...
## $ Fecha Venta : Date[1:3337], format: "2004-06-19" "2004-04-19" ...
## $ Vendedor : chr [1:3337] "Carmen" "Pedro" "Joaquín" "Jesús" ...
#b)
BD_Inmuebles_tipo<- table(BD_Inmuebles$Tipo)
Porcentaje_Tipo<-(BD_Inmuebles_tipo/ sum(BD_Inmuebles_tipo)) * 100
Porcentaje_Tipo<-round(Porcentaje_Tipo,1)
y_min <-0
y_max <- 18
barplot_tipo<-barplot(Porcentaje_Tipo,
main = "Porcentaje de Transacciones por Tipo de Propiedad",
xlab = "Tipo de Propiedad",
ylab = "Porcentaje",
col = "#6495ED",
ylim= c(y_min, y_max))
x_coords <- barplot_tipo
x_coords_centered <- x_coords
text(x = x_coords_centered ,
y = Porcentaje_Tipo,
labels = paste(Porcentaje_Tipo, "%"),
pos = 3, cex = 1.2)
#c)
tabla_cruzada <- table(BD_Inmuebles$Tipo, BD_Inmuebles$Provincia)
porcentaje_ciudades <- prop.table(tabla_cruzada, margin = 2) * 100
mi_paleta <- colorRampPalette(c("grey", "darkblue","red", "pink", "brown", "orange", "purple"))
barplot(porcentaje_ciudades, beside = TRUE,
main = "Porcentaje de Transacciones por Tipo de Propiedad en Ciudades",
xlab = "Tipo de Propiedad",
ylab = "Porcentaje",
col = mi_paleta(nrow(porcentaje_ciudades)),
legend.text = rownames(porcentaje_ciudades),
args.legend = list(x = "topright", bty = "o", horiz= TRUE, cex= 0.7),
ylim = c(0,20))
#d)
transacciones_fuera_barcelona <- subset(BD_Inmuebles, Provincia != "Barcelona")
ventas_por_vendedor <- tapply(transacciones_fuera_barcelona$`Precio Venta`, transacciones_fuera_barcelona$Vendedor, sum)
ventas_ordenadas <- sort(ventas_por_vendedor, decreasing = TRUE)
options(scipen = 999)
par(mar = c(7, 10, 4, 4) + 0.5)
barplot(ventas_ordenadas,
main = "Ranking de Vendedores por Ventas (Fuera de Barcelona)",
xlab = "Vendedor",
col = "#6495ED",
las =2,
cex.axis = 0.7)
mtext("Ventas ($)", side = 2, line = 4, cex = 1.0)
#e)
colnames(BD_Inmuebles)[colnames(BD_Inmuebles) == "Operaci\xc3\xb3n"] <- "Operacion"
View(BD_Inmuebles)
Precio_Alquiler<- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Alquiler")
par(mar = c(6, 7, 4, 5) + 0.5)
plot(Precio_Alquiler$Superficie, Precio_Alquiler$`Precio Venta`,
xlab = "Superficie (m\u00B2)",
ylab = "",
main = "Relaci\xc3\xb3n Superficie y Precio de Transacci\xc3\xb3n (Lleida)",
pch = 19, col = "#6495ED", las=2)
mtext("Precio Alquiler($)", side = 2, line = 5, cex = 1.0)
#f)
casas_alquiler_lleida <- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Alquiler")
casas_venta_lleida <- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Venta")
par(mfrow = c(1, 2))
par(plt = c(0.3, 0.9, 0.3, 0.9))
plot(casas_alquiler_lleida$Superficie, casas_alquiler_lleida$`Precio Venta`,
xlab = "Superficie (m\u00B2)", ylab = "Precio de Transaccion (Alquiler)",
main = "",
pch = 19, col = "#6495ED")
plot(casas_venta_lleida$Superficie, casas_venta_lleida$`Precio Venta`,
xlab = "Superficie (m\u00B2)", ylab = "Precio de Transaccion (Venta)",
main = "",
pch = 19, col = "#99FF99")
title("Relaci\xc3\xb3n entre Superficie y Precio (Casas en Lleida)", outer = TRUE, line = -1.5)
Punto 2
Con el fin de encontrar si hay diferencia entre los salarios de profesores para hombres y mujeres, se procede inicialmente a realizar un analisis exploratorio de los datos de la base de datos “Salarios”.
##
## Resumen de la base de datos:
## rank discipline yrs.since.phd yrs.service
## Length:397 Length:397 Min. : 1.00 Min. : 0.00
## Class :character Class :character 1st Qu.:12.00 1st Qu.: 7.00
## Mode :character Mode :character Median :21.00 Median :16.00
## Mean :22.31 Mean :17.61
## 3rd Qu.:32.00 3rd Qu.:27.00
## Max. :56.00 Max. :60.00
## sex salary
## Length:397 Min. : 57800
## Class :character 1st Qu.: 91000
## Mode :character Median :107300
## Mean :113706
## 3rd Qu.:134185
## Max. :231545
##
## Estructura de la base de datos:
## 'data.frame': 397 obs. of 6 variables:
## $ rank : chr "Prof" "Prof" "AsstProf" "Prof" ...
## $ discipline : chr "B" "B" "B" "B" ...
## $ yrs.since.phd: int 19 20 4 45 40 6 30 45 21 18 ...
## $ yrs.service : int 18 16 3 39 41 6 23 45 20 18 ...
## $ sex : chr "Male" "Male" "Male" "Male" ...
## $ salary : int 139750 173200 79750 115000 141500 97000 175000 147765 119250 129000 ...
##
## Indicadores descriptivos Hombres:
## rank discipline yrs.since.phd yrs.service
## Length:358 Length:358 Min. : 1.00 Min. : 0.00
## Class :character Class :character 1st Qu.:12.00 1st Qu.: 7.00
## Mode :character Mode :character Median :22.00 Median :18.00
## Mean :22.95 Mean :18.27
## 3rd Qu.:33.00 3rd Qu.:27.00
## Max. :56.00 Max. :60.00
## sex salary
## Length:358 Min. : 57800
## Class :character 1st Qu.: 92000
## Mode :character Median :108043
## Mean :115090
## 3rd Qu.:134864
## Max. :231545
##
## Indicadores descriptivos Mujeres:
## rank discipline yrs.since.phd yrs.service
## Length:39 Length:39 Min. : 2.00 Min. : 0.00
## Class :character Class :character 1st Qu.:10.00 1st Qu.: 4.00
## Mode :character Mode :character Median :17.00 Median :10.00
## Mean :16.51 Mean :11.56
## 3rd Qu.:23.50 3rd Qu.:17.50
## Max. :39.00 Max. :36.00
## sex salary
## Length:39 Min. : 62884
## Class :character 1st Qu.: 77250
## Mode :character Median :103750
## Mean :101002
## 3rd Qu.:117003
## Max. :161101
Al analizar el gráfico de cajas, se evidencia una diferencia
salarial entre hombres y mujeres. Sin embargo, se observa que la
dispersión de datos en la categoría de hombres es amplia, sugiriendo que
la dispersión salarial puede atribuirse a otros factores, como años de
servicio, años de doctorado, rango del cargo o disciplina, y no
necesariamente al género. Por lo tanto, este informe abordará la
evaluación de todas estas variables.
Dado que la cantidad de hombres y mujeres es diferente, se examinará
la participación de ambos grupos según la disciplina y el rango mediante
un gráfico de barras apiladas.
Al examinar la participación de hombres y mujeres según la
disciplina y el rango, se confirma la existencia de diferencias en la
participación de las tres categorías: profesor titular, profesor
asociado y profesor asistente en cada disciplina. Además, se observa la
predominancia de hombres en ambas disciplinas en el rango de profesor
titular (Prof).
Ahora, analicemos el comportamiento salarial en función de las
disciplinas y el rango para hombres y mujeres.
En el análisis del gráfico de cajas, se destaca que la
disciplina B presenta los salarios más elevados en comparación con la
disciplina A. Además, en ambas disciplinas, los profesor@s titulares (Prof)
son quienes perciben salarios más altos. Hasta este punto, parece que,
en la disciplina B, los profesores titulares son los mejor remunerados,
y en esta categoría, los hombres tienen una mayor representación (64%)
en comparación con las mujeres (48%).
Es relevante señalar que en casi todos los rangos y disciplinas, las cajas de hombres y mujeres presentan traslapes, indicando que no hay diferencias significativas. Sin embargo, se observa una marcada diferencia salarial en la disciplina A en la categoría AssocProf, donde la caja de las mujeres se encuentra por debajo de la de los hombres.
En términos generales, en ambas disciplinas y en cada rango, las cajas de los hombres muestran una mayor dispersión, indicando una mayor variabilidad salarial. Por otro lado, las cajas de las mujeres son más compactas, sugiriendo una menor variabilidad salarial.
Es notable que, en la disciplina A para las mujeres, no se presenta una variación salarial significativa entre las categorías AssocProf y AsstProf, debido a que las cajas están casi alineadas. Esto no contrasta con las cajas de los hombres, donde si se aprecia la descendencia de las cajas en estas categorias.
Para comprender mejor estos patrones, se explorarán los años
transcurridos desde la obtención del título de doctorado y años de
servicio en ambas disciplinas y rangos, tanto para hombres como para
mujeres, a través de un gráfico de cajas.
Como se puede observar en el gráfico anterior, en ambas
disciplinas, en el caso de los hombres, las cajas muestran un patrón
descendente por rango, indicando que los profesores titulares son
quienes tienen más años de servicio y años de doctorado. Sin embargo, al
observar este comportamiento en las mujeres, se nota que en la categoría
A, en los años de servicio para los rangos de Prof y AssocProf, las
cajas se traslapan, sugiriendo que la cantidad de años de servicio para
estos dos rangos es muy similar. Esto podría llevar a pensar que,
independientemente de los años de servicio, el rango de Prof genera los
salarios más altos. No obstante, como se observó en el diagrama anterior
(Grafico 3), en la categoría A para las mujeres, en los rangos AssocProf
y AsstProf, las cajas se traslapan, lo que contradice esta teoria en
esta disciplina y rangos.
De acuerdo a lo anterior, parece que para las profesoras no se sigue el mismo patrón que los hombres, ya que en este caso, se cumple la jerarquía de los rangos. En la categoria AssocProf disciplina A es donde se presenta la diferencia salarial más notoria entre hombres y mujeres. Al validar la influencia de los años de servicio y doctorado en grafico 4, se evidencia que las mujeres tienen una tendencia a tener más años de servicio y doctorado en comparación con los hombres, y sin embargo, las mujeres tienen salarios más bajos.
Con lo anteriormente mencionado se concluye
que:
- El salario de los profesores se ve significativamente influenciado por el rango y la disciplina a la que pertenecen. Es notable que los profesores con el título de Profesor@s (Prof) y aquellos que trabajan en la disciplina B son quienes tienen los salarios más altos.
- En el caso de los hombres, se observa que la jerarquía salarial se cumple de acuerdo al rango, así como a los años de servicio y doctorado en ambas categorías. Sin embargo, este patrón no se replica en el caso de las mujeres. En la disciplina A, en los rangos AssocProf y AsstProf, las mujeres tienen salarios equivalentes. Además, los años de servicio para los rangos Prof y AssocProf son prácticamente los mismos para las mujeres.
- Se observan diferencias salariales atribuibles al género entre hombres y mujeres en la disciplina A, categoría AssocProf. A pesar de que tanto mujeres como hombres presentan una tendencia casi similar en términos de años de servicio y doctorado, las profesoras ganan menos que los profesores hombres.
- Se sugiere revisar los salarios de las mujeres en los diferentes rangos, especialmente en AssocProf y AsstProf de la disciplina A. Además, se recomienda igualar las condiciones salariales para las mujeres en la disciplina A en el rango AssocProf en comparación con las condiciones salariales de los hombres.