Tabla de datos de jobs in data e importacion de ggplot:
jobs_in_data <- read.csv("jobs_in_data.csv")
print(jobs_in_data)
library(ggplot2)
Gráfica 1:
ggplot(jobs_in_data, aes(job_category, salary/1000)) +
geom_boxplot() +
ggtitle("Data Science: Salary distribution by job category") +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

Preguntas sobre la gráfica 1:
A. ¿Cuál es la categoría de trabajo donde el salario es más uniforme?
Explique por qué. Respuesta: El puesto de trabajo con el salario más
uniforme es Cloud and Database. Esto se debe a que es el espacio de
trabajo con la menor diferencia en distancia en las velas. Analizando
esta información, sabemos que es el puesto de trabajo con menor
diferencia en la paga laboral de todas las opciones.
B. ¿Cuál es la categoría de trabajo donde el salario varía más?
Explique por qué. Respuesta: El salario que varía más con la paga de su
salario es Machine Learning and AI. A simple vista, la respuesta es Data
Science and Research, pero el cuerpo de la vela es más ancho en el
primer empleo mencionado, indicando que sus precios de apertura y cierre
es incluso mayor la diferencia.
C. ¿Cuál es la categoría de trabajo en donde se gana más salario en
promedio? Explique por qué. Respuesta: En promedio, el trabajo mejor
pagado es Machine Learning and AI. Esto se puede ver en la gráfica al
ser la vela que está más alto ubicada en relación a los demás. Una
posible explicación a esto se la demanda en el sector de inteligencias
artificiales en la tecnología actual.
D. ¿Cuál es la categoría de trabajo en donde se gana menos salario en
promedio? Explique por qué. Respuesta: Por su parte, la categoría donde
se gana menos en el promedio del salario es en Data Quality and
Operations. Se puede observar con la misma lógica que la pregunta
pasada, al ser la vela con una menor ubicación en la escala se puede
deducir. Una posible explicación es que las operaciones de este trabajo
en los últimos años han sido muy soportadas por herramientas de
inteligencia artificial.
Gráfica 2:
ggplot(jobs_in_data, aes(job_category, fill = work_setting)) +
geom_bar() +
ggtitle("Data Science: Count by job category") +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

Preguntas de la gráfica 2:
A. ¿Cuál es la categoría de trabajo donde existe mayor cantidad de
puestos y es mejor pagado? Explique por qué. Respuesta: El trabajo que
tiene una mayor oferta de trabajo es Data Science and Research, mientras
que el mejor pagado es Machine Learning and AI. Sin embargo, como se
está preguntando por el puesto que combine ambas características, se
tomará Data Science and Research. De hecho, es el trabajo que tiene el
mejor y el peor puesto de trabajo según el salario. Por lo tanto, su
rango de salarios es bastante amplio. Una explicación a esto es la alta
demanda ya sea con fines tecnológicos, científicos y de investigación.
Las discrepancias en el rango de sus salarios se deben a los mismos
sectores que los requieren, según el presupuesto requerido es la paga
dada.
B. ¿Cuál es la categoría de trabajo donde existe un buen salario pero
hay pocos puestos disponibles? Explique por qué. Respuesta: Este trabajo
sería Cloud and Database. De hecho, en la gráfica de conteo de salarios,
la muestra visual es casi nula. Se sabe que la cantidad total es de
cinco personas. Además, su promedio de salario es uno de los más altos y
más comprimidos, por lo que se puede observar que tienen una igualdad
distinguida. Seguidamente, una de las razones de esto puede ser la
demanda de compañías de profesionales especializados en este campo. No
obstante, como son sistemas montados en servidores, el mantenimiento
puede ser dado por una misma persona.
C. ¿Cuál es la categoría de trabajo peor pagado y con menor cantidad
de puestos disponibles? Explique por qué. Respuesta: Este trabajo sería
Data Quality and Operations. Se ve que es uno de los trabajos con menor
conteo y también es uno de los trabajos peores pagados. Una razón a esto
puede ser la baja demanda de estos profesionales y el reemplazo de este
campo por el mantenimiento automático por inteligencia artificial.
D. ¿Cuál es la categoría de trabajo con mayor cantidad de puestos
pero salarios bajos? Explique por qué. Respuesta: Este sería el trabajo
de Data Engineering. Es uno de los trabajos con más demanda pero de los
peores pagados. Una posible explicación a esto es su alta demanda y gran
cantidad de personas aspirantes, logra satisfacer los puestos laborales,
pero no ofrece una competitividad salarial ideal.
Gráfica 3:
ggplot(jobs_in_data, aes(experience_level, salary/1000)) +
geom_violin() +
ggtitle("Salaries by experience level")

Preguntas de la gráfica 3:
A. En promedio, ¿cuál es el nivel de experiencia con los peores
salarios? Explique por qué. Respuesta: Los peores salarios son para el
nivel Entry-level. La explicación a esto es que son los miembros más
nuevos de la compañía, por lo que su experiencia es mínima, lo que les
da menor carga de trabajo y responsabilidad, lo que origina el menor
salario.
B. En promedio, ¿cuál es el nivel de experiencia con los mejores
salarios? Explique por qué. Respuesta: Sería el nivel executive. Es el
que tiene el salario mejor repartido, ya que aunque hay personas con
salarios bajos, también tiene un promedio bastante alto y una población
considerable de personas con altos salarios.
C. ¿Cuál es el nivel de experiencia que tiene el salario más alto?
Explique por qué. Respuesta: Este nivel sería Mid-Level, aunque la
población que lo tiene es extremadamente reducida. Una razón a este
fenómeno puede ser que hayan encontrado un excelente puesto de trabajo
que no se abre de manera muy recurrente.
D. ¿Cuál es el nivel de experiencia que tiene un rango de salarios
más amplio? Explique por qué. Respuesta: Este sería el Mid-Level. Así
como tiene el salario más alto, también tiene una cantidad considerable
de personas que tienen salarios reducidos. Una razón a este fenómeno es
la cantidad y variabilidad de puestos de trabajos tan grandes que
hay.
Gráfica 4:
ggplot(jobs_in_data, aes(experience_level, fill = as.factor(work_year))) +
geom_bar() +
facet_wrap(~work_setting, ncol = 3) +
labs(fill = "Work Year") +
ggtitle("Experience level: Count by working setting and year") +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust=1))

Preguntas de la gráfica 4:
A. ¿Cuál es el año donde más se crearon trabajos remotos para
personas con nivel senior? Explique por qué. Respuesta: El año donde se
crearon más trabajos remotos para seniors fue en el 2023. Esto según los
datos proporcionados por el dataset, además de ser corroborados en la
gráfica al tener un margen de más del doble que el año más próximo, el
2022.
B. ¿Qué nivel de experiencia tenía más posibilidad de obtener un
puesto remoto en el 2023? Explique por qué. Respuesta: El nivel de
experiencia con más posibilidades de obtener un puesto remoto en 2023
fue el nivel senior. En proporción a la cantidad de empleos abiertos por
año, es definitivamente el que más cantidad tiene, incluso llegando a
superar por más del doble al segundo lugar que es el mid-level. Una
posible explicación a este fenómeno es la salida de la pandemia, donde
las empresas se dieron cuenta de que no había necesidad de seguir
estando presencialmente, lo que aumentó la oferta remota. Además,
gracias a la misma pandemia, se abrieron una gran cantidad de puestos
laborales que lograron alcanzar el estatus de senior para ese
entonces.
C. ¿Para cuál nivel de experiencia se crearon, a través de los años,
una mayor proporción de trabajos? Explique por qué. Respuesta: La mayor
demanda siempre se ha visto para el nivel senior, en especial a partir
del 2022. Una posible razón a esto es que las empresas buscan
desarrolladores confiables que produzcan código y solventen problemas
sin necesidad de cometer errores de principiantes.
D. ¿Cuál fue el año en el que solo se ofrecieron trabajos
presenciales para ejecutivos? Explique por qué. Respuesta: Fue un poco
en el 2022 y en el 2023. Una posible respuesta a esto fue la salida de
la pandemia del COVID-19, generando un regreso a la presencialidad para
los trabajadores de las empresas.
