contexto

La base de datos recopila información sobre edad, sexo, nivel educativo y variables psicosociales como participación en organizaciones, percepción de discriminación, confianza social, tolerancia, apoyo a causas y uso de redes en protestas. El análisis busca identificar patrones en la participación ciudadana y actitudes frente a la convivencia y la diversidad.

##variables incuidas

Edad (18 a 64 años)

Sexo (Masculino, femenino, otro)

Nivel educativo (secundaria, universitario, tecnico, postgrado)

Participiacion en organizaciones (sí, No)

Percepcion de la discriminación (1 a 10)

nivel de confianza social (1 a 10)

toleracia diferencias (1 a 10)

Apoyo causas sociales (sí, No)

Frecuencia activismo (Frecuente, nunca, ocacional)

Uso de redes protesta (Sí, No)

Satisfaccion convivencia (1 a 10)

library(readxl)
library(ggplot2)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.95 loaded
library(ggpubr)
library(ggpubr)
data <- read_excel("Base_Psicologia_Social.xlsx", sheet = "Sheet1")
dim(data)
## [1] 100  11

Luego de visualizar la base datos, se observa que consta de 100 observaciones con 11 variables. Además, se revela que la base de datos no cuenta con valores NA. A continuación un resumen de las variables númericas.

library(Amelia)
## Loading required package: Rcpp
## ## 
## ## Amelia II: Multiple Imputation
## ## (Version 1.8.3, built: 2024-11-07)
## ## Copyright (C) 2005-2025 James Honaker, Gary King and Matthew Blackwell
## ## Refer to http://gking.harvard.edu/amelia/ for more information
## ##
# Convertir a data frame clásico
data_df <- as.data.frame(data)

# Visualizar los NA
missmap(data_df)

De la figura anterior podemos afirmar que la base de datos no se encuentra con valores faltantes,consta de 100% completos y 0% vacios

summary(data)
##       edad           sexo           nivel_educativo    participa_organizaciones
##  Min.   :18.00   Length:100         Length:100         Length:100              
##  1st Qu.:28.00   Class :character   Class :character   Class :character        
##  Median :45.00   Mode  :character   Mode  :character   Mode  :character        
##  Mean   :42.22                                                                 
##  3rd Qu.:53.25                                                                 
##  Max.   :65.00                                                                 
##  percepcion_discriminacion nivel_confianza_social tolerancia_diferencias
##  Min.   : 1.00             Min.   : 1.00          Min.   : 1.0          
##  1st Qu.: 4.00             1st Qu.: 3.00          1st Qu.: 3.0          
##  Median : 7.00             Median : 5.00          Median : 5.0          
##  Mean   : 6.23             Mean   : 4.96          Mean   : 5.5          
##  3rd Qu.: 9.00             3rd Qu.: 7.00          3rd Qu.: 8.0          
##  Max.   :10.00             Max.   :10.00          Max.   :10.0          
##  apoyo_causas_sociales frecuencia_activismo uso_redes_protesta
##  Length:100            Length:100           Length:100        
##  Class :character      Class :character     Class :character  
##  Mode  :character      Mode  :character     Mode  :character  
##                                                               
##                                                               
##                                                               
##  satisfaccion_convivencia
##  Min.   : 1.00           
##  1st Qu.: 3.75           
##  Median : 6.00           
##  Mean   : 5.78           
##  3rd Qu.: 8.00           
##  Max.   :10.00

La muestra analizada incluye personas con edades entre 18 y 65 años, con una media de 42.22 años y una mediana de 45 años, lo que refleja una distribución amplia y relativamente equilibrada en cuanto a la edad.

En las variables psicosociales, la percepción de discriminación presenta valores entre 1 y 10, con una media de 6.23 y una mediana de 7, lo que indica una tendencia hacia niveles altos de percepción. El nivel de confianza social muestra mayor dispersión, con un promedio de 4.96 y una mediana de 5, reflejando posiciones intermedias, pero con participantes que reportan tanto niveles muy bajos como muy altos.

Respecto a la tolerancia a las diferencias, los valores oscilan también entre 1 y 10, con una media de 5.5 y una mediana de 5, lo que sugiere actitudes moderadas hacia la diversidad. En cuanto a la satisfacción con la convivencia, los resultados se ubican entre 1 y 10, con una media de 5.78 y una mediana de 6, evidenciando percepciones mayoritariamente medias y positivas, aunque no muy elevadas.

Estos resultados permiten plantear un análisis más profundo sobre las relaciones entre percepción de discriminación, confianza social, tolerancia y satisfacción con la convivencia, con el fin de identificar patrones en las dinámicas psicosociales de la muestra.

Analisis univariado

ggplot(data, aes(x = edad)) + 
  geom_histogram(binwidth = 5, fill = "pink", color = "purple") + 
  theme_minimal() +
  ggtitle("Distribución de edad")

El histograma muestra la distribución de edades en la base de datos, con un rango que va aproximadamente de los 18 a los 65 años. Se observa una mayor concentración de individuos en los grupos de edad entre los 18 a los 25 años, así como entre los 45 a los 55 años, lo que indica posibles picos en la frecuencia de participantes en estas edades

Distribucion de la muestra por sexo

library(knitr)

sexo_counts <- data %>%
  count(sexo)

kable(sexo_counts, format = "simple")
sexo n
Femenino 40
Masculino 51
Otro 9
library(ggplot2)

ggplot(data, aes(x = sexo, fill = sexo)) + 
  geom_bar(color = "black", alpha = 0.7) +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
  scale_fill_manual(values = c("skyblue", "lightcoral", "plum")) +
  labs(title = "Distribución de la muestra por sexo", 
       x = "sexo", 
       y = "Frecuencia") +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(hjust = 0.5, size = 14, face = "bold"))
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

La muestra está compuesta por Masculino ≈ 51%, Femenino ≈ 40% y No binario ≈ 9%.

Se observa equilibrio entre hombres y mujeres, lo que facilita comparaciones entre estos dos grupos.

El grupo No binario es menor pero relevante para un análisis inclusivo; conviene reportar intervalos de confianza o evitar sobre-interpretar diferencias para este subgrupo por su menor tamaño.

Analisis Bivariados

ggplot(data, aes(x = sexo, y = `percepcion_discriminacion`, fill = sexo)) +
  geom_boxplot() +
  theme_minimal() +
  ggtitle("Percepcion de la discriminación")

El gráfico de cajas muestra la distribución de la percepción de la discriminación según el género de los participantes. Se observan diferencias tanto en la mediana como en la dispersión de los valores entre los grupos.

Femenino: Presenta una mediana alta de percepción de discriminación, con una distribución amplia que sugiere variabilidad en las respuestas dentro del grupo.

Masculino: También muestra una mediana elevada, similar al grupo femenino, pero con una mayor dispersión, indicando una mayor variabilidad en la percepción de discriminación.

Otro (No binario): Tiene una mediana más baja en comparación con los otros dos grupos, y una distribución más concentrada. Esto puede deberse a un tamaño de muestra más reducido, lo que limita la variabilidad observada.

En general, se evidencian diferencias en la centralidad y dispersión de la percepción de discriminación entre los distintos géneros, lo que podría estar relacionado con experiencias diferenciadas o contextos específicos de discriminación vividos por cada grupo.

Relacion entre edad y nivel_confianza_social

ggplot(data, aes(x = `nivel_confianza_social`, y = `edad`)) + 
  geom_point(color = "blue") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  theme_minimal() +
  ggtitle("Relación entre nivel_confianza_social y edad")
## `geom_smooth()` using formula = 'y ~ x'

El gráfico de dispersión representa la relación entre el nivel de confianza social y la edad de los participantes. Los puntos azules muestran una distribución amplia, sin un patrón fuertemente definido, lo que indica una considerable variabilidad en los datos.

La línea de tendencia en rojo muestra una pendiente levemente positiva, lo que sugiere una relación débil pero directa entre ambas variables: a medida que aumenta el nivel de confianza social, la edad tiende a incrementarse ligeramente. Sin embargo, debido a la alta dispersión, esta relación no es fuerte ni concluyente.

En general, los resultados sugieren que la edad podría estar levemente asociada al nivel de confianza social.