library(readxl)
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(corrplot)
## corrplot 0.95 loaded
library(ggpubr)
data <- read_excel("Base_Psicologia_Clinica.xlsx", sheet = "Sheet1")
La base de datos contiene las características psicológicas de un grupo de pacientes, lo cual es relevante porque el análisis de estas variables puede influir en la manera de brindarles apoyo en el futuro.
colnames(data)
## [1] "edad" "sexo"
## [3] "nivel_educativo" "diagnostico_psicologico"
## [5] "nivel_depresion" "nivel_ansiedad"
## [7] "ha_asistido_terapia" "frecuencia_terapia"
## [9] "medicacion_psiquiatrica" "satisfaccion_con_terapia"
## [11] "apoyo_familiar"
dim(data)
## [1] 100 11
En primer lugar se visualiza que las dimensiones de la base de datos cargada constan de 100 observaciones con 11 variables (100 filas x 11 columnas)
str(data)
## tibble [100 × 11] (S3: tbl_df/tbl/data.frame)
## $ edad : num [1:100] 29 35 38 34 61 65 35 43 32 53 ...
## $ sexo : chr [1:100] "Masculino" "Femenino" "Femenino" "Otro" ...
## $ nivel_educativo : chr [1:100] "Postgrado" "Universitario" "Postgrado" "Secundaria" ...
## $ diagnostico_psicologico : chr [1:100] "Ansiedad" "Ansiedad" "TOC" "TOC" ...
## $ nivel_depresion : num [1:100] 4 6 5 1 5 1 4 4 9 4 ...
## $ nivel_ansiedad : num [1:100] 9 6 5 7 10 1 10 9 4 3 ...
## $ ha_asistido_terapia : chr [1:100] "Sí" "Sí" "Sí" "Sí" ...
## $ frecuencia_terapia : chr [1:100] "Semanal" "Nunca" "Mensual" "Quincenal" ...
## $ medicacion_psiquiatrica : chr [1:100] "No" "No" "No" "No" ...
## $ satisfaccion_con_terapia: num [1:100] 10 9 8 4 3 9 3 5 5 4 ...
## $ apoyo_familiar : chr [1:100] "Medio" "Medio" "Medio" "Medio" ...
Podemos observar que 7 variables son categóricas y 4 son numéricas.
summary(data)
## edad sexo nivel_educativo diagnostico_psicologico
## Min. :18.00 Length:100 Length:100 Length:100
## 1st Qu.:28.75 Class :character Class :character Class :character
## Median :39.50 Mode :character Mode :character Mode :character
## Mean :40.76
## 3rd Qu.:54.00
## Max. :65.00
## nivel_depresion nivel_ansiedad ha_asistido_terapia frecuencia_terapia
## Min. : 1.00 Min. : 1.00 Length:100 Length:100
## 1st Qu.: 3.00 1st Qu.: 4.00 Class :character Class :character
## Median : 5.00 Median : 6.50 Mode :character Mode :character
## Mean : 5.44 Mean : 6.17
## 3rd Qu.: 8.00 3rd Qu.: 8.00
## Max. :10.00 Max. :10.00
## medicacion_psiquiatrica satisfaccion_con_terapia apoyo_familiar
## Length:100 Min. : 1.00 Length:100
## Class :character 1st Qu.: 3.00 Class :character
## Mode :character Median : 5.50 Mode :character
## Mean : 5.38
## 3rd Qu.: 8.00
## Max. :10.00
La muestra analizada presenta un rango de edad entre 18 y 65 años, con una media de 40.76 años y una mediana de 39.5 años, lo que indica que el grupo está compuesto principalmente por adultos jóvenes y de mediana edad.
Las variables de sexo, nivel educativo, diagnóstico psicológico, asistencia a terapia, frecuencia de asistencia, medicación psiquiátrica y apoyo familiar corresponden a datos categóricos, por lo que su análisis debe enfocarse en la distribución de frecuencias y proporciones, con el fin de identificar tendencias en el perfil psicológico y social de los participantes.
En cuanto a las variables numéricas, el nivel de depresión oscila entre 1 y 10, con una media de 5.44 y una mediana de 5, lo que refleja una tendencia hacia niveles intermedios de sintomatología depresiva, con presencia de casos tanto leves como severos. El nivel de ansiedad se encuentra en un rango similar (1 a 10), con una media de 6.17 y una mediana de 6.5, lo cual indica una tendencia ligeramente superior a la de la depresión, evidenciando que la ansiedad podría ser un factor más prevalente en la muestra.
Respecto a la satisfacción con la terapia, los valores van de 1 a 10, con una media de 5.38 y una mediana de 5.5, lo que sugiere un nivel de satisfacción moderado, donde aproximadamente la mitad de los participantes evalúa su experiencia entre 3 y 8 puntos.
En términos generales, los resultados reflejan un perfil diverso en cuanto a características psicológicas y experiencias terapéuticas. Se recomienda profundizar en el análisis de asociaciones entre variables categóricas (como diagnóstico psicológico, asistencia a terapia o apoyo familiar) y cuantitativas (niveles de depresión, ansiedad y satisfacción con la terapia), con el fin de identificar patrones relevantes que puedan orientar estrategias de intervención clínica más personalizadas.
ggplot(data, aes(x = edad)) +
geom_histogram(binwidth = 5, fill = "skyblue", color = "black") +
theme_minimal() +
ggtitle("Distribución de Edad")
La muestra presenta una distribución de edades amplia, que abarca desde los 18 hasta los 65 años, lo que refleja la participación de individuos tanto jóvenes como adultos mayores. Se observa una mayor concentración en los rangos de 20 a 30 años y de 55 a 60 años, donde el número de participantes alcanza sus valores más altos.
En contraste, el intervalo de 50 a 55 años muestra la menor representación, indicando un descenso notable en ese grupo. Entre los 30 y 45 años la distribución se mantiene relativamente estable, con frecuencias intermedias, aunque sin alcanzar los picos observados en los extremos mencionados.
En términos generales, la distribución no sigue un patrón uniforme: existen fluctuaciones marcadas con varios picos y descensos, lo que sugiere que la muestra combina distintos perfiles etarios, destacándose principalmente los adultos jóvenes y los mayores de 55 años, mientras que la presencia de individuos en edades medias es menos consistente.
##Descripción de variables categóricas mediante tablas
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
gender_counts <- data %>%
count(sexo)
kable(gender_counts, format = "html") %>%
kable_styling("striped", full_width = FALSE)
| sexo | n |
|---|---|
| Femenino | 38 |
| Masculino | 45 |
| Otro | 17 |
library(ggplot2)
ggplot(data, aes(x = sexo, fill = sexo)) +
geom_bar(color = "black", alpha = 0.7) +
geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) +
scale_fill_manual(values = c("skyblue", "lightcoral", "plum")) +
labs(title = "Distribución de la muestra por Género",
x = "sexo",
y = "Frecuencia") +
theme_minimal() +
theme(legend.position = "none",
plot.title = element_text(hjust = 0.5, size = 14, face = "bold"))
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
La distribución por género muestra que la mayor proporción de la muestra corresponde al grupo masculino, con 45 participantes, seguido de cerca por el grupo femenino con 38 individuos. Esto indica una participación relativamente equilibrada entre hombres y mujeres, aunque con una ligera predominancia masculina.
Por otro lado, el grupo clasificado como “Otro” cuenta con 17 participantes, representando una minoría dentro de la muestra total. Aun así, su presencia evidencia diversidad en la composición del estudio y refleja la inclusión de identidades de género no binarias o diferentes a las categorías tradicionales.
En general, la muestra se caracteriza por una representación balanceada entre géneros, con una diferencia moderada a favor del masculino, y una menor aunque significativa participación del grupo “Otro”, lo que enriquece la heterogeneidad de la población analizada.
library(Amelia)
## Loading required package: Rcpp
## ##
## ## Amelia II: Multiple Imputation
## ## (Version 1.8.3, built: 2024-11-07)
## ## Copyright (C) 2005-2025 James Honaker, Gary King and Matthew Blackwell
## ## Refer to http://gking.harvard.edu/amelia/ for more information
## ##
# Convertir a data frame clásico
data_df <- as.data.frame(data)
# Visualizar los NA
missmap(data_df)
A partir de la figura anterior se observa que la base de datos no presenta valores faltantes, ya que cuenta con un 100% de datos completos y un 0% de valores vacíos.
ggplot(data, aes(y = edad)) +
geom_boxplot(fill = "skyblue") +
theme_minimal() +
ggtitle("Edad") +
ylab("") +
xlab("")
El diagrama de caja muestra que la distribución de las edades se extiende aproximadamente desde los 18 hasta los 65 años. El rango intercuartílico se ubica entre los 30 y 55 años, concentrando a la mayoría de los participantes. La mediana se sitúa cerca de los 40 años, lo que refleja un equilibrio entre adultos jóvenes y de mediana edad.
En relación con los valores atípicos, no se observa la presencia de ninguno fuera de los límites del diagrama. Esto indica que los datos son consistentes y no existen registros que se alejen de manera significativa del comportamiento general del grupo.
En términos generales, la distribución de edades resulta homogénea dentro del rango esperado y no presenta valores atípicos que pudieran distorsionar el análisis estadístico.
ggplot(data, aes(y = nivel_depresion)) +
geom_boxplot(fill = "skyblue") +
theme_minimal() +
ggtitle("Nivel de depresion") +
ylab("") +
xlab("")
El diagrama de caja muestra que los niveles de depresión reportados en la muestra se encuentran distribuidos principalmente entre 3 y 8 puntos, que corresponden al rango intercuartílico. La mediana se ubica en 5, lo que indica que la mitad de los participantes presenta niveles de depresión iguales o inferiores a este valor, mientras que la otra mitad se concentra en valores superiores.
No hay valores atípicos
Los valores mínimos y máximos se extienden desde 1 hasta 10, abarcando todo el rango posible de la escala empleada. No se observan valores atípicos, lo que sugiere que las respuestas de los participantes son consistentes y se mantienen dentro de un patrón esperado.
En general, la distribución refleja una tendencia central moderada, con una dispersión equilibrada y sin registros anómalos que puedan distorsionar el análisis de los niveles de depresión en el grupo evaluado.
ggplot(data, aes(y = nivel_ansiedad)) +
geom_boxplot(fill = "skyblue") +
theme_minimal() +
ggtitle("Nivel de ansiedad") +
ylab("") +
xlab("")
El diagrama de caja indica que los niveles de ansiedad en la muestra se distribuyen principalmente entre 5 y 9 puntos, rango donde se concentra la mayor parte de los participantes (rango intercuartílico). La mediana se sitúa en torno a 7, lo que refleja que la mitad de los individuos presenta niveles de ansiedad iguales o inferiores a este valor, mientras que la otra mitad reporta niveles superiores.
Los valores mínimos y máximos se ubican entre 1 y 10, abarcando toda la escala utilizada para la medición. No se observan valores atípicos, lo que evidencia que las respuestas son consistentes y no existen registros que se aparten de forma significativa del comportamiento general del grupo.
En conjunto, la distribución muestra una tendencia hacia niveles relativamente altos de ansiedad en la muestra, acompañada de una dispersión equilibrada y sin presencia de valores atípicos que puedan sesgar el análisis.
ggplot(data, aes(y = satisfaccion_con_terapia)) +
geom_boxplot(fill = "skyblue") +
theme_minimal() +
ggtitle("Satisfaccion con terapia") +
ylab("") +
xlab("")
El diagrama de caja muestra que los niveles de satisfacción con la terapia se distribuyen principalmente entre 3 y 8 puntos, que corresponden al rango intercuartílico. La mediana se ubica ligeramente por encima de 5, lo que refleja que al menos la mitad de los participantes reporta un nivel de satisfacción medio o superior.
No hay valores atípicos
Los valores mínimos y máximos se extienden desde 1 hasta 10, abarcando todo el rango de la escala empleada. No se identifican valores atípicos, lo que indica que las respuestas son consistentes y no existen registros que se aparten de manera significativa del comportamiento general del grupo.
En general, la distribución sugiere una tendencia hacia niveles de satisfacción intermedios a altos, con una dispersión amplia que evidencia diversidad en la percepción de los participantes respecto a la efectividad de la terapia.