# Análisis de datos empleados
# Este análisis incluye 100 observaciones de empleados, con variables como salario, experiencia y desempeño.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
datos <- read.csv("datos_negocios_var_1_empleados.csv")
# Ver primeras filas
head(datos)
## Departamento Salario Años_Experiencia Evaluacion_Desempeno
## 1 Finanzas 5705.38 21 4.3
## 2 Operaciones 2614.29 30 5.0
## 3 Finanzas 2514.12 4 4.2
## 4 Operaciones 5798.92 30 4.6
## 5 Operaciones 5424.49 20 3.4
## 6 Finanzas 2919.68 13 3.7
# Resumen estadístico correcto
summary(datos)
## Departamento Salario Años_Experiencia Evaluacion_Desempeno
## Length:100 Min. :2171 Min. : 1.00 Min. :3.000
## Class :character 1st Qu.:3344 1st Qu.: 8.00 1st Qu.:3.500
## Mode :character Median :4840 Median :15.00 Median :3.900
## Mean :4835 Mean :14.64 Mean :3.951
## 3rd Qu.:6085 3rd Qu.:21.00 3rd Qu.:4.525
## Max. :7904 Max. :30.00 Max. :5.000
# Gráfico
ggplot(datos, aes(x = Departamento, y = Salario, fill = Departamento)) +
geom_boxplot() +
labs(title = "Distribución de Ingresos por Departamento",
x = "Departamento",
y = "Salario") +
theme_minimal()

# Crear variable categórica de salario
datos$NivelSalario <- ifelse(datos$Salario > 5000, "Alto", "Bajo")
# Gráfico
library(ggplot2)
ggplot(datos, aes(x = Departamento, fill = NivelSalario)) +
geom_bar(position = "dodge") +
labs(title = "Distribución de Empleados por Departamento según Nivel Salarial",
x = "Departamento",
y = "Frecuencia",
fill = "Nivel salarial") +
scale_fill_manual(values = c("lightblue", "coral")) +
theme_minimal()
