La base de datos de Psicología Organizacional reúne 100 participantes y 11 variables relacionadas con edad, sexo, nivel educativo, sector y antigüedad laboral, así como con factores psicosociales como satisfacción, estrés, clima laboral, reconocimiento y rotación. La información está completa, sin valores faltantes, lo que garantiza la calidad del análisis. Este estudio busca comprender los patrones y relaciones entre estas dimensiones para aportar a la mejora del bienestar de los trabajadores y la gestión organizacional.
Edad – Datos demográficos básicos para caracterizar a los trabajadores.
Sexo – Masculino / Femenino.
Nivel educativo – Tecnológico, Universitario, Postgrado, etc.
Sector laboral – Servicios, Manufactura, Salud, etc.
Antigüedad laboral – Años trabajados en la organización actual.
Satisfacción laboral – Escala numérica (1-10).
Nivel de estrés – Escala numérica (1-10).
Ha recibido capacitación – Sí / No.
Percepción del clima laboral – Escala numérica (1-10).
Reconocimiento laboral – Sí / No.
Intención de rotación – Baja, Media o Alta (probabilidad de renunciar).
library(readxl)
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.95 loaded
library(ggpubr)
data <- read_excel("Base_Psicologia_Organizacional.xlsx", sheet = "Sheet1")
dim(data)
## [1] 100 11
Luego de visualizar la base de datos, se observa que consta de 100 observaciones con 11 variables. Además, no se encontraron valores faltantes (NA). A continuación se presenta un resumen de las variables numéricas, donde se destacan medidas como mínimo, máximo, media y mediana.
library(Amelia)
## Loading required package: Rcpp
## ##
## ## Amelia II: Multiple Imputation
## ## (Version 1.8.3, built: 2024-11-07)
## ## Copyright (C) 2005-2025 James Honaker, Gary King and Matthew Blackwell
## ## Refer to http://gking.harvard.edu/amelia/ for more information
## ##
# Convertir a data frame clásico
data_df <- as.data.frame(data)
# Visualizar los NA
missmap(data_df)
De la figura anterior se puede afirmar que la base de datos no presenta valores faltantes, dado que el 100% de las observaciones están completas y el 0% corresponde a datos vacíos. Esto garantiza la integridad de la información y permite realizar los análisis posteriores sin necesidad de aplicar técnicas de imputación.
summary(data)
## edad sexo nivel_educativo sector_laboral
## Min. :22.00 Length:100 Length:100 Length:100
## 1st Qu.:33.00 Class :character Class :character Class :character
## Median :42.00 Mode :character Mode :character Mode :character
## Mean :41.45
## 3rd Qu.:49.25
## Max. :60.00
## antiguedad_laboral satisfaccion_laboral nivel_estrés
## Min. : 1.0 Min. : 1.00 Min. : 1.00
## 1st Qu.: 9.0 1st Qu.: 3.00 1st Qu.: 3.00
## Median :16.0 Median : 5.50 Median : 6.00
## Mean :15.9 Mean : 5.73 Mean : 5.75
## 3rd Qu.:23.0 3rd Qu.: 8.00 3rd Qu.: 8.00
## Max. :30.0 Max. :10.00 Max. :10.00
## ha_recibido_capacitacion percepcion_clima_laboral reconocimiento_laboral
## Length:100 Min. : 1.00 Length:100
## Class :character 1st Qu.: 3.00 Class :character
## Mode :character Median : 5.00 Mode :character
## Mean : 5.54
## 3rd Qu.: 8.00
## Max. :10.00
## intencion_rotacion
## Length:100
## Class :character
## Mode :character
##
##
##
La muestra está compuesta por 100 participantes con edades entre 22 y 60 años (media de 41.5 y mediana de 42), y una antigüedad laboral que oscila entre 1 y 30 años (media de 15.9 y mediana de 16). En las variables psicosociales se observa que la satisfacción laboral y el nivel de estrés presentan valores de 1 a 10, con medias alrededor de 5.7, lo que refleja percepciones moderadas. El clima y el reconocimiento laboral muestran resultados similares, con medias cercanas a 5.5. Finalmente, las variables categóricas como sexo, nivel educativo, sector laboral, capacitación recibida e intención de rotación complementan la caracterización de la población analizada.
ggplot(data, aes(x = edad)) +
geom_histogram(binwidth = 5, fill = "purple", color = "black") +
theme_minimal() +
ggtitle("Distribución de Edad")
El histograma muestra la distribución de edades en la base de datos, con un rango que va aproximadamente de los 20 a los 60 años. Se observa una mayor concentración de participantes en los grupos de edad entre los 40 y 45 años, así como entre los 35 y 40 y 45 y 50 años, lo que refleja que la mayor parte de la muestra corresponde a adultos en edad laboral media. En contraste, los grupos más jóvenes (menores de 25 años) y los mayores de 55 presentan una menor representación dentro de la muestra.
library(dplyr)
library(knitr)
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
gender_counts <- data %>%
count(sexo)
kable(gender_counts, format = "html") %>%
kable_styling("striped", full_width = FALSE)
| sexo | n |
|---|---|
| Femenino | 51 |
| Masculino | 41 |
| Otro | 8 |
library(ggplot2)
ggplot(data, aes(x = sexo, fill = sexo)) +
geom_bar(color = "black", alpha = 0.7) +
geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
scale_fill_manual(values = c("skyblue", "lightcoral", "plum")) +
labs(title = "Distribución de la muestra por Sexo",
x = "Sexo",
y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none",
plot.title = element_text(hjust = 0.5, size = 14, face = "bold"))
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
El gráfico muestra la distribución de la muestra por sexo: 51 participantes se identifican como femenino (51%), 41 como masculino (41%) y 8 en la categoría “otro” (8%). Se observa un predominio del grupo femenino, aunque la proporción entre hombres y mujeres es relativamente equilibrada, lo que permite realizar comparaciones entre ambos. El grupo “otro”, aunque representa una menor proporción, resulta importante para un análisis inclusivo; sin embargo, debido a su tamaño reducido, se recomienda cautela al momento de interpretar diferencias estadísticas.
ggplot(data, aes(x = sexo, y = nivel_estrés, fill = sexo)) +
geom_boxplot() +
theme_minimal() +
labs(title = "Nivel de Estrés por Sexo",
x = "Sexo",
y = "Nivel de Estrés")
El gráfico de cajas muestra la distribución del nivel de estrés según el sexo de los participantes en la base de datos. Se observan diferencias en la mediana, la dispersión y los valores atípicos entre los grupos.
Femenino: Presenta una mediana de nivel de estrés alta en comparación con los otros grupos. La distribución es relativamente amplia, lo que indica una mayor dispersión de los niveles de estrés en este grupo. También se observan valores extremos (outliers).
Masculino: Tiene la mediana más baja entre los tres grupos. La dispersión también es amplia, lo que sugiere una gran variabilidad en los niveles de estrés dentro del grupo masculino.
Otro: Este grupo presenta la mediana más alta, incluso mayor que la del grupo femenino. La distribución es menos dispersa que en los otros dos grupos, aunque también presenta un valor atípico por debajo del rango inferior.
En general, se observan diferencias claras en la centralidad (mediana) y la variabilidad del nivel de estrés según el sexo, lo que puede indicar la presencia de factores diferenciales que afectan el estrés en función del sexo o la identidad de género.
ggplot(data, aes(x = satisfaccion_laboral, y = nivel_estrés)) +
geom_point(color = "blue") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal() +
labs(title = "Relación entre Satisfacción Laboral y Nivel de Estrés",
x = "Satisfacción Laboral",
y = "Nivel de Estrés")
## `geom_smooth()` using formula = 'y ~ x'
El gráfico de dispersión representa la relación entre la Satisfacción Laboral y el Nivel de Estrés. Cada punto azul corresponde a una observación individual con distintos niveles en ambas variables.
La línea de tendencia en rojo muestra una leve pendiente positiva, lo que sugiere una relación directa muy débil entre la satisfacción laboral y el nivel de estrés. Es decir, a medida que la satisfacción laboral aumenta, el nivel de estrés tiende a aumentar ligeramente, aunque esta relación es muy tenue.
La amplia dispersión de los datos indica que no existe un patrón claro o consistente entre ambas variables. Esto sugiere que otros factores, además de la satisfacción laboral, podrían estar influyendo de manera importante en el nivel de estrés de las personas.