Punto 1

La hoja de Datos BD-inmuebles.xlsx contiene datos hipotéticos de las operaciones de venta y alquiles de inmuebles en la comunidad catalana. Para sintetizar estos datos, siga los siguientes pasos:

  1. Lea la hoja de datos en R y asigne el formato adecuado a cada variable.
#a)

library(readxl)
#BD_Inmuebles <- read_excel("C:/Users/Yuquu/Desktop/Maestria/Metodos_Cuantitativos/BD-Inmuebles.xls",
BD_Inmuebles <- read_excel("C:/Users/Yuquu/Desktop/Maestria/Metodos_Cuantitativos/BD-Inmuebles.xls", 
              col_types = c("numeric", "date", "text", "text", "text", "numeric", "numeric", "date", "text"))

BD_Inmuebles$`Fecha Alta`<- as.Date(BD_Inmuebles$`Fecha Alta`)
BD_Inmuebles$`Fecha Venta`<- as.Date(BD_Inmuebles$`Fecha Venta`)
View(BD_Inmuebles)

str(BD_Inmuebles)
## tibble [3,337 × 9] (S3: tbl_df/tbl/data.frame)
##  $ Referencia  : num [1:3337] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Fecha Alta  : Date[1:3337], format: "2004-01-01" "2004-01-01" ...
##  $ Tipo        : chr [1:3337] "Parking" "Local" "Oficina" "Parking" ...
##  $ Operación   : chr [1:3337] "Alquiler" "Venta" "Alquiler" "Alquiler" ...
##  $ Provincia   : chr [1:3337] "Lleida" "Girona" "Girona" "Girona" ...
##  $ Superficie  : num [1:3337] 291 199 82 285 152 131 69 235 108 299 ...
##  $ Precio Venta: num [1:3337] 2133903 1945424 712416 1815450 1138024 ...
##  $ Fecha Venta : Date[1:3337], format: "2004-06-19" "2004-04-19" ...
##  $ Vendedor    : chr [1:3337] "Carmen" "Pedro" "Joaquín" "Jesús" ...
  1. Utilice las funciones table y posteriormente barplot para representar gráficamente el % de transacciones realizadas para cada tipo de propiedad.
#b)

BD_Inmuebles_tipo<- table(BD_Inmuebles$Tipo)
Porcentaje_Tipo<-(BD_Inmuebles_tipo/ sum(BD_Inmuebles_tipo)) * 100
Porcentaje_Tipo<-round(Porcentaje_Tipo,1)

y_min <-0
y_max <- 18

barplot_tipo<-barplot(Porcentaje_Tipo, 
                    main = "Porcentaje de Transacciones por Tipo de Propiedad",
                    xlab = "Tipo de Propiedad",
                    ylab = "Porcentaje",
                    col = "#6495ED",
                    ylim= c(y_min, y_max))

x_coords <- barplot_tipo
x_coords_centered <- x_coords

text(x = x_coords_centered , 
     y = Porcentaje_Tipo, 
     labels = paste(Porcentaje_Tipo, "%"), 
     pos = 3, cex = 1.2)

  1. Ahora utilice las funciones table para calcular el % de transacciones realizadas por cada tipo de propiedad al interior de cada ciudad. Luego represente esta tabla en un barplot para visualizar si está distribución es similar/diferente entre las ciudades (sug. Revise la utilidad del argumento beside – consulte la ayuda de barplot)
#c)

tabla_cruzada <- table(BD_Inmuebles$Tipo, BD_Inmuebles$Provincia)

porcentaje_ciudades <- prop.table(tabla_cruzada, margin = 2) * 100

mi_paleta <- colorRampPalette(c("grey", "darkblue","red", "pink", "brown", "orange", "purple"))


barplot(porcentaje_ciudades, beside = TRUE,
        main = "Porcentaje de Transacciones por Tipo de Propiedad en Ciudades",
        xlab = "Tipo de Propiedad",
        ylab = "Porcentaje",
        col = mi_paleta(nrow(porcentaje_ciudades)),
        legend.text = rownames(porcentaje_ciudades),
        args.legend = list(x = "topright", bty = "o", horiz= TRUE, cex= 0.7),
        ylim = c(0,20)) 

  1. Interesados en generar un ranking de los vendedores segun su nivel de ventas (suma de las transacciones gestionadas  suma del precio de venta) por fuera de la ciudad de Barcelona, se le solicita filtrar de la hoja de datos las transacciones de la ciudad de Barcelona y, sobre la hoja de datos filtrada, consolidar el total de ventas por vendedor.Presentar esta información en una grafico de barras ordenadas descendentemente. (sug: revise la utilidad de la funciones tapply y sort)
#d)

transacciones_fuera_barcelona <- subset(BD_Inmuebles, Provincia != "Barcelona")

ventas_por_vendedor <- tapply(transacciones_fuera_barcelona$`Precio Venta`, transacciones_fuera_barcelona$Vendedor, sum)

ventas_ordenadas <- sort(ventas_por_vendedor, decreasing = TRUE)


options(scipen = 999)
par(mar = c(7, 10, 4, 4) + 0.5)

barplot(ventas_ordenadas, 
        main = "Ranking de Vendedores por Ventas (Fuera de Barcelona)",
        xlab = "Vendedor",
        col = "#6495ED",
        las =2,  
        cex.axis = 0.7)
mtext("Ventas ($)", side = 2, line = 4, cex = 1.0)  

  1. Únicamente para los casas de alquiler de la provincia Lleida, genere un grafico de dispersión que muestre la relación entre X: La superficie de la casa y Y: El precio de la Transaccion.
#e)

colnames(BD_Inmuebles)[colnames(BD_Inmuebles) == "Operaci\xc3\xb3n"] <- "Operacion"

View(BD_Inmuebles)

Precio_Alquiler<- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Alquiler")

par(mar = c(6, 7, 4, 5) + 0.5)

plot(Precio_Alquiler$Superficie, Precio_Alquiler$`Precio Venta`,
     xlab = "Superficie (m\u00B2)",
     ylab = "",
     main = "Relaci\xc3\xb3n Superficie y Precio de Transacci\xc3\xb3n (Lleida)",
     pch = 19, col = "#6495ED", las=2)

mtext("Precio Alquiler($)", side = 2, line = 5, cex = 1.0)

  1. Repita el grafico anterior, separando las transacciones de venta y alquiler.
#f)

casas_alquiler_lleida <- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Alquiler")
casas_venta_lleida <- subset(BD_Inmuebles, Tipo == "Casa" & Provincia == "Lleida" & Operacion == "Venta")

par(mfrow = c(1, 2))

par(plt = c(0.3, 0.9, 0.3, 0.9))


plot(casas_alquiler_lleida$Superficie, casas_alquiler_lleida$`Precio Venta`,
     xlab = "Superficie (m\u00B2)", ylab = "Precio de Transaccion (Alquiler)",
     main = "",
     pch = 19, col = "#6495ED")

plot(casas_venta_lleida$Superficie, casas_venta_lleida$`Precio Venta`,
     xlab = "Superficie (m\u00B2)", ylab = "Precio de Transaccion (Venta)",
     main = "",
     pch = 19, col = "#99FF99")



title("Relaci\xc3\xb3n entre Superficie y Precio (Casas en Lleida)", outer = TRUE, line = -1.5)

Punto 2

Con el fin de encontrar si hay diferencia entre los salarios de profesores para hombres y mujeres, se procede inicialmente a realizar un analisis exploratorio de los datos de la base de datos “Salarios”.

## 
## Resumen de la base de datos:
##      rank            discipline        yrs.since.phd    yrs.service   
##  Length:397         Length:397         Min.   : 1.00   Min.   : 0.00  
##  Class :character   Class :character   1st Qu.:12.00   1st Qu.: 7.00  
##  Mode  :character   Mode  :character   Median :21.00   Median :16.00  
##                                        Mean   :22.31   Mean   :17.61  
##                                        3rd Qu.:32.00   3rd Qu.:27.00  
##                                        Max.   :56.00   Max.   :60.00  
##      sex                salary      
##  Length:397         Min.   : 57800  
##  Class :character   1st Qu.: 91000  
##  Mode  :character   Median :107300  
##                     Mean   :113706  
##                     3rd Qu.:134185  
##                     Max.   :231545
## 
## Estructura de la base de datos:
## 'data.frame':    397 obs. of  6 variables:
##  $ rank         : chr  "Prof" "Prof" "AsstProf" "Prof" ...
##  $ discipline   : chr  "B" "B" "B" "B" ...
##  $ yrs.since.phd: int  19 20 4 45 40 6 30 45 21 18 ...
##  $ yrs.service  : int  18 16 3 39 41 6 23 45 20 18 ...
##  $ sex          : chr  "Male" "Male" "Male" "Male" ...
##  $ salary       : int  139750 173200 79750 115000 141500 97000 175000 147765 119250 129000 ...
## 
## Indicadores descriptivos Hombres:
##      rank            discipline        yrs.since.phd    yrs.service   
##  Length:358         Length:358         Min.   : 1.00   Min.   : 0.00  
##  Class :character   Class :character   1st Qu.:12.00   1st Qu.: 7.00  
##  Mode  :character   Mode  :character   Median :22.00   Median :18.00  
##                                        Mean   :22.95   Mean   :18.27  
##                                        3rd Qu.:33.00   3rd Qu.:27.00  
##                                        Max.   :56.00   Max.   :60.00  
##      sex                salary      
##  Length:358         Min.   : 57800  
##  Class :character   1st Qu.: 92000  
##  Mode  :character   Median :108043  
##                     Mean   :115090  
##                     3rd Qu.:134864  
##                     Max.   :231545
## 
## Indicadores descriptivos Mujeres:
##      rank            discipline        yrs.since.phd    yrs.service   
##  Length:39          Length:39          Min.   : 2.00   Min.   : 0.00  
##  Class :character   Class :character   1st Qu.:10.00   1st Qu.: 4.00  
##  Mode  :character   Mode  :character   Median :17.00   Median :10.00  
##                                        Mean   :16.51   Mean   :11.56  
##                                        3rd Qu.:23.50   3rd Qu.:17.50  
##                                        Max.   :39.00   Max.   :36.00  
##      sex                salary      
##  Length:39          Min.   : 62884  
##  Class :character   1st Qu.: 77250  
##  Mode  :character   Median :103750  
##                     Mean   :101002  
##                     3rd Qu.:117003  
##                     Max.   :161101






Al analizar el gráfico de cajas, se evidencia una diferencia salarial entre hombres y mujeres. Sin embargo, se observa que la dispersión de datos en la categoría de hombres es amplia, sugiriendo que la dispersión salarial puede atribuirse a otros factores, como años de servicio, años de doctorado, rango del cargo o disciplina, y no necesariamente al género. Por lo tanto, este informe abordará la evaluación de todas estas variables.

Dado que la cantidad de hombres y mujeres es diferente, se examinará la participación de ambos grupos según la disciplina y el rango mediante un gráfico de barras apiladas.




Al examinar la participación de hombres y mujeres según la disciplina y el rango, se confirma la existencia de diferencias en la participación de las tres categorías: profesor titular, profesor asociado y profesor asistente en cada disciplina. Además, se observa la predominancia de hombres en ambas disciplinas en el rango de profesor titular (Prof).

Ahora, analicemos el comportamiento salarial en función de las disciplinas y el rango para hombres y mujeres.




En el análisis del gráfico de cajas, se destaca que la disciplina B presenta los salarios más elevados en comparación con la disciplina A. Además, en ambas disciplinas, los titulares (Prof) son quienes perciben salarios más altos. Hasta este punto, parece que, en la disciplina B, los profesores titulares son los mejor remunerados, y en esta categoría, los hombres tienen una mayor representación (64%) en comparación con las mujeres (48%).

Es relevante señalar que en casi todos los rangos y disciplinas, las cajas de hombres y mujeres presentan traslapes, indicando que no hay diferencias significativas. Sin embargo, se observa una marcada diferencia salarial en la disciplina A en la categoría AssocProf, donde la caja de las mujeres se encuentra por debajo de la de los hombres.

En términos generales, en ambas disciplinas y en cada rango, las cajas de los hombres muestran una mayor dispersión, indicando una mayor variabilidad salarial. Por otro lado, las cajas de las mujeres son más compactas, sugiriendo una menor variabilidad salarial.

Es notable que, en la disciplina A para las mujeres, no se presenta una variación salarial significativa entre las categorías AssocProf y AsstProf, debido a que las cajas están casi alineadas. Esto no contrasta con las cajas de los hombres, donde si se aprecia la descendencia de las cajas en estas categorias.

Para comprender mejor estos patrones, se explorarán los años transcurridos desde la obtención del título de doctorado y años de servicio en ambas disciplinas y rangos, tanto para hombres como para mujeres, a través de un gráfico de cajas.




Como se puede observar en el gráfico anterior, en ambas disciplinas, en el caso de los hombres, las cajas muestran un patrón descendente por rango, indicando que los profesores titulares son quienes tienen más años de servicio y años de doctorado. Sin embargo, al observar este comportamiento en las mujeres, se nota que en la categoría A, en los años de servicio para los rangos de Prof y AssocProf, las cajas se traslapan, sugiriendo que la cantidad de años de servicio para estos dos rangos es muy similar. Esto podría llevar a pensar que, independientemente de los años de servicio, el rango de Prof genera los salarios más altos. No obstante, como se observó en el diagrama anterior (Grafico 3), en la categoría A para las mujeres, en los rangos AssocProf y AsstProf, las cajas se traslapan, lo que contradice esta teoria en esta disciplina y rangos.

De acuerdo a lo anterior, parece que para las profesoras no se sigue el mismo patrón que los hombres, ya que en este caso, se cumple la jerarquía de los rangos. En la categoria AssocProf disciplina A es donde se presenta la diferencia salarial más notoria entre hombres y mujeres. Al validar la influencia de los años de servicio y doctorado en grafico 4, se evidencia que las mujeres tienen una tendencia a tener más años de servicio y doctorado en comparación con los hombres, y sin embargo, las mujeres tienen salarios más bajos.



Con lo anteriormente mencionado se concluye que:

- El salario de los profesores se ve significativamente influenciado por el rango y la disciplina a la que pertenecen. Es notable que los profesores con el título de (Prof) y aquellos que trabajan en la disciplina B son quienes tienen los salarios más altos.

- En el caso de los hombres, se observa que la jerarquía salarial se cumple de acuerdo al rango, así como a los años de servicio y doctorado en ambas categorías. Sin embargo, este patrón no se replica en el caso de las mujeres. En la disciplina A, en los rangos AssocProf y AsstProf, las mujeres tienen salarios equivalentes. Además, los años de servicio para los rangos Prof y AssocProf son prácticamente los mismos para las mujeres.

- Se observan diferencias salariales atribuibles al género entre hombres y mujeres en la disciplina A, categoría AssocProf. A pesar de que tanto mujeres como hombres presentan una tendencia casi similar en términos de años de servicio y doctorado, las profesoras ganan menos que los profesores hombres.

- Se sugiere revisar los salarios de las mujeres en los diferentes rangos, especialmente en AssocProf y AsstProf de la disciplina A. Además, se recomienda igualar las condiciones salariales para las mujeres en la disciplina A en el rango AssocProf en comparación con las condiciones salariales de los hombres.