# Análisis de datos empleados 

# Este análisis incluye 100 observaciones de empleados, con variables como salario, experiencia y desempeño.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

datos <- read.csv("datos_negocios_var_1_empleados.csv")

# Ver primeras filas
head(datos)
##   Departamento Salario Años_Experiencia Evaluacion_Desempeno
## 1     Finanzas 5705.38               21                  4.3
## 2  Operaciones 2614.29               30                  5.0
## 3     Finanzas 2514.12                4                  4.2
## 4  Operaciones 5798.92               30                  4.6
## 5  Operaciones 5424.49               20                  3.4
## 6     Finanzas 2919.68               13                  3.7
# Resumen estadístico correcto
summary(datos)
##  Departamento          Salario     Años_Experiencia Evaluacion_Desempeno
##  Length:100         Min.   :2171   Min.   : 1.00    Min.   :3.000       
##  Class :character   1st Qu.:3344   1st Qu.: 8.00    1st Qu.:3.500       
##  Mode  :character   Median :4840   Median :15.00    Median :3.900       
##                     Mean   :4835   Mean   :14.64    Mean   :3.951       
##                     3rd Qu.:6085   3rd Qu.:21.00    3rd Qu.:4.525       
##                     Max.   :7904   Max.   :30.00    Max.   :5.000
# Gráfico
ggplot(datos, aes(x = Departamento, y = Salario, fill = Departamento)) +
  geom_boxplot() +
  labs(title = "Distribución de Ingresos por Departamento",
       x = "Departamento",
       y = "Salario") +
  theme_minimal()

# Crear variable categórica de salario
datos$NivelSalario <- ifelse(datos$Salario > 5000, "Alto", "Bajo")

# Gráfico
library(ggplot2)

ggplot(datos, aes(x = Departamento, fill = NivelSalario)) +
  geom_bar(position = "dodge") +
  labs(title = "Distribución de Empleados por Departamento según Nivel Salarial",
       x = "Departamento",
       y = "Frecuencia",
       fill = "Nivel salarial") +
  scale_fill_manual(values = c("lightblue", "coral")) +
  theme_minimal()