#Ejercicio_1

datos <- read.csv("Dataset expresión genes.csv", header = TRUE, sep = ",")
boxplot(AQ_GPD2 ~ dm, 
        data = datos, 
        col = c("#66C2A5", "#FC8D62"), 
        main = "Expresión del gen AQ_GPD2 según diabetes",
        xlab = "Presencia de diabetes (dm)",
        ylab = "Nivel de expresión (AQ_GPD2)",
        outline = TRUE)

“Se observa que en el gráfico de cajas y bigotes en el eje Y, se tiene el nivel de expresion de AQ_GPD2, es la actividad que tiene ese gen en cada grupo, además cada caja tiene un valor de dispersión en el grupo (no), tienen una mayor expresión del gen AQ_GPD2 en promedio. Las personas con diabetes (si) muestran una expresión más baja. Esto sugiere que podría haber una relación negativa entre la presencia de diabetes y la expresión de este gen. Es decir, la diabetes podría estar asociada con una disminución en la actividad del AQ_GPD2, aunque para confirmar esto se necesitaría análisis estadístico adicional”

#Ejercicio_2

plot(datos$AQ_IRS1, datos$AQ_JAK1,
     xlab = "Expresión del gen AQ_IRS1",
     ylab = "Expresión del gen AQ_JAK1",
     main = "Correlación entre AQ_IRS1 y AQ_JAK1",
     pch = 19,             # tipo de punto
     col = ifelse(datos$sexo == "mujer", "deeppink", "steelblue"))
modelo <- lm(AQ_JAK1 ~ AQ_IRS1, data = datos)
abline(modelo, col = "black", lwd = 2)
modelo <- lm(AQ_JAK1 ~ AQ_IRS1, data = datos)
abline(modelo, col = "black", lwd = 2)

cor(datos$AQ_IRS1, datos$AQ_JAK1, method = "pearson", use = "complete.obs")
## [1] 0.6852777

“Discusion_grafico_de_dispersion El valor r = 0.68 indica una correlación positiva moderada a fuerte. Es decir, a medida que aumenta la expresión de AQ_IRS1, también tiende a aumentar la expresión de AQ_JAK1. La correlación obtenida entre AQ_IRS1 y AQ_JAK1 fue positiva (r = 0.68), lo que indica una coexpresión moderada a fuerte entre ambos genes. Este patrón sugiere que, a medida que se incrementa la expresión de IRS1 un mediador de la señalización insulínica— también aumenta la expresión de JAK1, componente clave de las vías de citocinas inflamatorias. Biológicamente, esta relación puede reflejar un acoplamiento entre los mecanismos metabólicos y las respuestas inmunitarias. En el gráfico de dispersión, se observa que tanto hombres como mujeres siguen una tendencia similar, aunque podría existir una ligera variación en los niveles de expresión según el sexo. En conjunto, los resultados sugieren que IRS1 y JAK1 podrían estar regulados de manera coordinada en contextos donde convergen procesos metabólicos e inflamatorios.”

#Ejercicio_3

library(pheatmap)
genes <- c("AQ_IL6", "AQ_TNF", "AQ_TLR4", "AQ_STAT3", "AQ_IFNG")
datos[genes] <- lapply(datos[genes], function(x) as.numeric(as.character(x)))
expr_matrix <- as.matrix(datos[, genes])
expr_matrix <- scale(expr_matrix)
cat("Filas en expr_matrix:", nrow(expr_matrix), "\n")
## Filas en expr_matrix: 65
cat("Filas en datos:", nrow(datos), "\n")
## Filas en datos: 65
anotacion <- data.frame(
  Sexo = as.factor(datos$sexo),
  HTA = as.factor(datos$hta)
)
rownames(anotacion) <- rownames(expr_matrix) <- paste0("Paciente" ,  seq_len(nrow(expr_matrix)))
pheatmap(
  expr_matrix,
  color = colorRampPalette(c("blue", "white", "red"))(100),
  annotation_row = anotacion,
  cluster_rows = TRUE,
  cluster_cols = TRUE,
  main = "Patrón multigénico de expresión (IL6, TNF, TLR4, STAT3, IFNG)"
)

“¿Qué genes presentan patrones similares? En el mapa de calor se observó que AQ_IL6 y AQ_TNF presentan patrones de expresión similares, ambos con zonas coincidentes de alta expresión (colores rojos) en un mismo grupo de pacientes. Esto sugiere una coexpresión positiva, posiblemente regulada por vías inflamatorias comunes como NF-κB y JAK/STAT, que controlan la liberación de citocinas proinflamatorias. Asimismo, AQ_TLR4 y AQ_STAT3 mostraron una tendencia paralela, aunque con menor intensidad, indicando que podrían estar involucrados en la activación de la respuesta inmune innata y en procesos de señalización intracelular frente a estímulos inflamatorios.”

“¿Se observan grupos definidos de pacientes? Sí. La distribución por filas (pacientes) en el heatmap revela dos agrupamientos principales Un primer grupo con expresión elevada en la mayoría de los genes (zona rojiza), que podría corresponder a pacientes con mayor respuesta inflamatoria o presencia de hipertensión (HTA). Un segundo grupo con baja expresión simultánea (zonas azuladas), lo que indicaría un perfil inmunológico más regulado o individuos sin procesos inflamatorios activos. La anotación lateral por sexo o HTA refuerza estas diferencias, mostrando que los patrones de alta expresión se concentran más en pacientes con HTA o de sexo masculino, mientras que las mujeres o los pacientes sin HTA tienden a agruparse en zonas de menor expresión.”

“¿Qué hipótesis podrías plantear sobre la coexpresión observada? La coexpresión de IL6, TNF y STAT3 podría indicar la activación de un eje inflamatorio coordinado, donde IL6 y TNF inducen la fosforilación de STAT3, amplificando la respuesta inmunitaria. Esta relación sugiere que los genes podrían participar de manera sinérgica en procesos inflamatorios sistémicos o cardiovasculares asociados a HTA. Por otro lado, la expresión más variable de IFNG podría reflejar una respuesta inmunomoduladora diferenciada, dependiente del tipo celular o del sexo, donde su activación no siempre coincide con los marcadores inflamatorios clásicos.”