rm(list = ls())
“PARTE A _ Exploracion y preparacion”
#Carga_de_datos
datos <- read.csv("Dataset expresión genes.csv", header = TRUE, sep = ",")
library(readxl)
datos <- read.csv("Dataset expresión genes.csv")
head(datos)
## X id edad sexo exfumador hta dm alergia cardiopatia ETE neumopatia
## 1 1 1 55.73169 mujer si si no si si si si
## 2 2 2 48.71732 varon no si no no no no si
## 3 3 3 63.60575 mujer no no no no no no si
## 4 4 4 55.27447 mujer si no no no no no no
## 5 5 5 74.13552 varon si no si no si no si
## 6 6 6 78.16290 mujer no si no no no no no
## hepatopatia colelitiasis utolitiasis ITU renal neuropatia corticoides tos
## 1 no no no si si si si no
## 2 no no no no no si antiemesis no
## 3 no no no no no no si no
## 4 no no no no no no antiemesis no
## 5 no no no no no no antiemesis no
## 6 no si no si no si no no
## disnea expect secrecion dolor_garg escalofrios fiebre diarrea nauseas vomitos
## 1 si no si no no no no no no
## 2 no no si no no no no no no
## 3 no no no no no si si no no
## 4 no no no no no no no no no
## 5 no si no no no no si no no
## 6 no no no no no no no no no
## cefalea mareo cansancio anosmia disgueusia dolor_hueso dolor_abdo perd_ape
## 1 no no si no no si no no
## 2 no no no no no no no no
## 3 no si si no si si si si
## 4 si no no no no no no no
## 5 no no si no no si no no
## 6 si si no no no no no si
## glucosa leucocitos linfocitos neutrofilos score_dieta chol hdl hierro
## 1 88 7.400 1.10 5.30 4 244 69 60
## 2 98 5.690 0.90 4.20 6 226 86 207
## 3 92 18.935 3.30 14.50 8 212 65 140
## 4 103 9.460 2.70 6.20 9 190 35 59
## 5 139 4.180 1.45 2.05 11 137 36 49
## 6 106 4.510 1.30 2.80 6 143 28 36
## igA igE igG igN ldl pcr transferrina trigliceridos
## 1 194.0000 8.00000 756.0000 111.0000 255 10.20 290 129
## 2 264.0000 94.60340 631.0000 26.0000 178 0.50 316 56
## 3 424.0000 35.00000 930.0000 76.0000 283 18.55 155 255
## 4 206.0000 18.00000 509.0000 62.0000 199 0.70 253 428
## 5 387.0000 11.00000 910.0000 81.0000 181 0.60 349 155
## 6 170.0447 53.07141 944.2505 111.1208 187 8.10 271 213
## cpk calidad_fisica calidad_mental tumor extension trat AQ_ADIPOQ
## 1 71.70969 40.42765 52.92580 CCR metastasico tratA 4.114e-10
## 2 130.00000 52.82225 50.88728 CCR metastasico tratB 3.130e-10
## 3 24.50000 14.93744 49.10694 CM metastasico tratA 0.000e+00
## 4 51.00000 36.07207 61.94158 CCR localizado tratA 1.248e-09
## 5 53.00000 49.89475 54.09426 CM metastasico tratB 0.000e+00
## 6 45.00000 52.64374 23.16611 CM metastasico tratB 0.000e+00
## AQ_ALOX5 AQ_ARG1 AQ_BMP2 AQ_CCL2 AQ_CCL5 AQ_CCR5 AQ_CD274
## 1 2.443e-05 5.979e-07 2.174e-09 1.717e-08 0.00005863 1.004e-06 4.441e-07
## 2 1.621e-05 5.198e-07 2.995e-09 3.996e-09 0.00003230 7.479e-07 8.357e-08
## 3 5.168e-05 1.010e-05 1.545e-07 5.013e-08 0.00085606 8.430e-06 2.834e-06
## 4 5.410e-05 2.006e-06 9.122e-09 1.237e-07 0.00041951 3.662e-06 9.112e-07
## 5 1.261e-05 8.680e-07 6.008e-09 3.402e-09 0.00022700 4.221e-06 8.632e-07
## 6 1.665e-05 1.299e-05 2.858e-08 1.673e-08 0.00015281 1.573e-06 5.422e-07
## AQ_CD36 AQ_CHKA AQ_CPT1A AQ_CSF2 AQ_CXCR1 AQ_FASN AQ_FOXO3
## 1 5.616e-06 9.936e-08 1.082e-06 4.114e-10 4.739e-06 2.884e-07 0.00004622
## 2 4.283e-06 9.813e-08 1.250e-06 1.682e-09 3.008e-06 2.518e-07 0.00002470
## 3 6.670e-05 7.636e-07 1.195e-05 0.000e+00 8.887e-05 4.277e-06 0.00024841
## 4 1.721e-05 0.000e+00 4.726e-06 7.853e-09 9.079e-06 2.563e-06 0.00035943
## 5 8.436e-06 2.609e-07 3.963e-06 1.499e-08 4.862e-06 7.134e-07 0.00012576
## 6 1.790e-05 4.269e-07 2.688e-06 0.000e+00 9.244e-06 1.403e-06 0.00009826
## AQ_FOXP3 AQ_G6PD AQ_GPD2 AQ_GPX1 AQ_IFNG AQ_IL10 AQ_IL1B
## 1 1.101e-07 9.874e-06 0.000e+00 0.00006258 0.000e+00 8.750e-09 2.414e-06
## 2 5.808e-08 4.496e-06 4.969e-07 0.00002545 3.554e-09 4.510e-09 1.639e-06
## 3 1.387e-06 4.367e-05 4.886e-06 0.00014781 8.644e-07 6.254e-08 2.077e-05
## 4 8.414e-07 2.989e-05 1.247e-06 0.00014760 1.072e-07 2.285e-08 4.645e-06
## 5 1.124e-07 1.077e-05 4.510e-07 0.00005193 1.841e-07 1.883e-08 3.129e-06
## 6 2.522e-07 1.488e-05 1.192e-06 0.00007646 1.204e-07 1.282e-08 8.477e-06
## AQ_IL6 AQ_IRS1 AQ_JAK1 AQ_JAK3 AQ_LDHA AQ_LIF AQ_MAPK1
## 1 7.658e-09 3.845e-08 0.00001136 3.173e-06 5.482e-06 5.734e-09 5.863e-06
## 2 1.634e-09 6.475e-08 0.00001246 1.668e-06 6.688e-06 3.161e-09 2.049e-06
## 3 5.383e-08 1.398e-07 0.00012148 5.262e-05 3.159e-05 0.000e+00 5.995e-05
## 4 1.248e-09 9.758e-08 0.00007567 4.556e-06 1.266e-05 1.413e-08 2.505e-05
## 5 1.410e-08 5.010e-08 0.00002698 7.545e-06 7.178e-06 7.145e-09 9.393e-06
## 6 2.564e-09 7.020e-08 0.00003090 1.368e-05 1.490e-05 0.000e+00 0.000e+00
## AQ_NFE2L2 AQ_NFKB1 AQ_NLRP3 AQ_NOS2 AQ_NOX5 AQ_PDCD1 AQ_PPARG
## 1 5.132e-06 2.577e-06 1.106e-06 4.114e-10 4.114e-10 9.512e-08 1.178e-08
## 2 2.698e-06 5.056e-07 1.030e-06 3.130e-10 3.130e-10 3.194e-08 1.060e-08
## 3 3.467e-05 2.500e-05 4.253e-06 0.000e+00 0.000e+00 1.645e-06 4.047e-08
## 4 1.704e-05 6.133e-06 2.766e-06 1.248e-09 1.248e-09 1.139e-06 0.000e+00
## 5 1.313e-05 2.283e-06 1.429e-06 1.089e-09 0.000e+00 2.807e-07 1.456e-08
## 6 1.420e-05 1.607e-05 2.161e-06 0.000e+00 7.165e-09 1.487e-07 1.363e-08
## AQ_PTAFR AQ_PTGS2 AQ_SLC2A4 AQ_SOD1 AQ_SREBF1 AQ_STAT3 AQ_TGFB1
## 1 1.190e-05 2.095e-06 1.929e-07 4.016e-06 1.631e-06 3.890e-06 0.00005262
## 2 1.190e-05 9.112e-07 8.051e-08 1.310e-06 9.571e-07 1.099e-06 0.00002229
## 3 6.661e-05 7.411e-06 2.245e-07 1.896e-05 6.624e-06 2.932e-05 0.00038151
## 4 1.522e-05 2.512e-06 3.137e-07 1.021e-05 2.977e-06 7.635e-06 0.00024499
## 5 1.649e-05 2.093e-06 7.353e-08 8.320e-06 1.102e-06 5.240e-06 0.00003898
## 6 2.889e-05 2.448e-06 1.972e-07 0.000e+00 4.002e-06 2.237e-05 0.00012047
## AQ_TLR3 AQ_TLR4 AQ_TNF
## 1 2.093e-08 2.713e-06 1.304e-06
## 2 5.072e-09 2.622e-06 2.441e-07
## 3 2.786e-07 2.881e-05 1.929e-05
## 4 1.248e-09 1.185e-05 4.496e-06
## 5 7.010e-08 4.373e-06 4.060e-06
## 6 6.876e-08 9.354e-06 2.148e-06
#revision_de_data
names(datos)
## [1] "X" "id" "edad" "sexo"
## [5] "exfumador" "hta" "dm" "alergia"
## [9] "cardiopatia" "ETE" "neumopatia" "hepatopatia"
## [13] "colelitiasis" "utolitiasis" "ITU" "renal"
## [17] "neuropatia" "corticoides" "tos" "disnea"
## [21] "expect" "secrecion" "dolor_garg" "escalofrios"
## [25] "fiebre" "diarrea" "nauseas" "vomitos"
## [29] "cefalea" "mareo" "cansancio" "anosmia"
## [33] "disgueusia" "dolor_hueso" "dolor_abdo" "perd_ape"
## [37] "glucosa" "leucocitos" "linfocitos" "neutrofilos"
## [41] "score_dieta" "chol" "hdl" "hierro"
## [45] "igA" "igE" "igG" "igN"
## [49] "ldl" "pcr" "transferrina" "trigliceridos"
## [53] "cpk" "calidad_fisica" "calidad_mental" "tumor"
## [57] "extension" "trat" "AQ_ADIPOQ" "AQ_ALOX5"
## [61] "AQ_ARG1" "AQ_BMP2" "AQ_CCL2" "AQ_CCL5"
## [65] "AQ_CCR5" "AQ_CD274" "AQ_CD36" "AQ_CHKA"
## [69] "AQ_CPT1A" "AQ_CSF2" "AQ_CXCR1" "AQ_FASN"
## [73] "AQ_FOXO3" "AQ_FOXP3" "AQ_G6PD" "AQ_GPD2"
## [77] "AQ_GPX1" "AQ_IFNG" "AQ_IL10" "AQ_IL1B"
## [81] "AQ_IL6" "AQ_IRS1" "AQ_JAK1" "AQ_JAK3"
## [85] "AQ_LDHA" "AQ_LIF" "AQ_MAPK1" "AQ_NFE2L2"
## [89] "AQ_NFKB1" "AQ_NLRP3" "AQ_NOS2" "AQ_NOX5"
## [93] "AQ_PDCD1" "AQ_PPARG" "AQ_PTAFR" "AQ_PTGS2"
## [97] "AQ_SLC2A4" "AQ_SOD1" "AQ_SREBF1" "AQ_STAT3"
## [101] "AQ_TGFB1" "AQ_TLR3" "AQ_TLR4" "AQ_TNF"
summary(datos)
## X id edad sexo
## Min. : 1.00 Min. : 1.00 Min. :30.35 Length:65
## 1st Qu.:18.00 1st Qu.:18.00 1st Qu.:57.62 Class :character
## Median :35.00 Median :35.00 Median :66.49 Mode :character
## Mean :34.51 Mean :34.51 Mean :65.46
## 3rd Qu.:51.00 3rd Qu.:51.00 3rd Qu.:75.09
## Max. :67.00 Max. :67.00 Max. :94.06
## exfumador hta dm alergia
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## cardiopatia ETE neumopatia hepatopatia
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## colelitiasis utolitiasis ITU renal
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## neuropatia corticoides tos disnea
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## expect secrecion dolor_garg escalofrios
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## fiebre diarrea nauseas vomitos
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## cefalea mareo cansancio anosmia
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## disgueusia dolor_hueso dolor_abdo perd_ape
## Length:65 Length:65 Length:65 Length:65
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## glucosa leucocitos linfocitos neutrofilos
## Min. : 76.0 Min. : 1.345 Min. :0.350 Min. : 0.800
## 1st Qu.: 91.0 1st Qu.: 4.385 1st Qu.:1.100 1st Qu.: 2.350
## Median :105.0 Median : 5.690 Median :1.400 Median : 3.650
## Mean :108.9 Mean : 6.500 Mean :1.465 Mean : 4.256
## 3rd Qu.:114.0 3rd Qu.: 7.525 3rd Qu.:1.800 3rd Qu.: 5.200
## Max. :208.0 Max. :23.400 Max. :3.300 Max. :19.600
## score_dieta chol hdl hierro
## Min. : 2.000 Min. :101.0 Min. : 22.00 Min. : 19.00
## 1st Qu.: 7.000 1st Qu.:146.0 1st Qu.: 37.00 1st Qu.: 53.00
## Median : 9.000 Median :178.0 Median : 48.00 Median : 67.00
## Mean : 8.323 Mean :176.8 Mean : 49.17 Mean : 72.36
## 3rd Qu.:10.000 3rd Qu.:195.0 3rd Qu.: 57.00 3rd Qu.: 84.00
## Max. :12.000 Max. :263.0 Max. :108.00 Max. :207.00
## igA igE igG igN
## Min. : 34.0 Min. : 2.00 Min. : 252.0 Min. : 26.00
## 1st Qu.:153.0 1st Qu.: 13.00 1st Qu.: 711.9 1st Qu.: 62.00
## Median :190.8 Median : 59.59 Median : 854.9 Median : 79.00
## Mean :210.5 Mean : 66.20 Mean : 868.9 Mean : 87.73
## 3rd Qu.:255.1 3rd Qu.: 94.60 3rd Qu.: 938.9 3rd Qu.: 96.00
## Max. :495.0 Max. :366.00 Max. :1828.0 Max. :290.00
## ldl pcr transferrina trigliceridos
## Min. :124.0 Min. : 0.10 Min. :131.0 Min. : 43.0
## 1st Qu.:170.9 1st Qu.: 1.10 1st Qu.:231.0 1st Qu.: 90.0
## Median :195.0 Median : 4.80 Median :253.0 Median :129.0
## Mean :205.2 Mean : 12.22 Mean :255.6 Mean :145.5
## 3rd Qu.:220.0 3rd Qu.: 11.00 3rd Qu.:274.0 3rd Qu.:173.0
## Max. :484.0 Max. :194.20 Max. :378.0 Max. :469.0
## cpk calidad_fisica calidad_mental tumor
## Min. : 15.00 Min. :14.94 Min. :22.75 Length:65
## 1st Qu.: 37.00 1st Qu.:32.23 1st Qu.:46.57 Class :character
## Median : 57.00 Median :39.43 Median :50.89 Mode :character
## Mean : 68.99 Mean :38.99 Mean :48.62
## 3rd Qu.: 91.00 3rd Qu.:49.89 3rd Qu.:56.82
## Max. :197.00 Max. :58.05 Max. :66.76
## extension trat AQ_ADIPOQ AQ_ALOX5
## Length:65 Length:65 Min. :0.00000 Min. :0.000e+00
## Class :character Class :character 1st Qu.:0.00000 1st Qu.:1.987e-05
## Mode :character Mode :character Median :0.00000 Median :4.428e-05
## Mean :0.01538 Mean :6.958e-05
## 3rd Qu.:0.00000 3rd Qu.:1.100e-04
## Max. :1.00000 Max. :2.573e-04
## AQ_ARG1 AQ_BMP2 AQ_CCL2
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:8.099e-07 1st Qu.:1.365e-08 1st Qu.:1.381e-08
## Median :2.116e-06 Median :2.936e-08 Median :3.829e-08
## Mean :4.051e-06 Mean :5.385e-08 Mean :1.185e-07
## 3rd Qu.:5.037e-06 3rd Qu.:7.544e-08 3rd Qu.:1.284e-07
## Max. :2.657e-05 Max. :2.902e-07 Max. :1.303e-06
## AQ_CCL5 AQ_CCR5 AQ_CD274
## Min. :0.0000000 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:0.0001168 1st Qu.:3.201e-06 1st Qu.:5.795e-07
## Median :0.0002944 Median :5.585e-06 Median :1.307e-06
## Mean :0.0005178 Mean :9.236e-06 Mean :1.930e-06
## 3rd Qu.:0.0007839 3rd Qu.:1.206e-05 3rd Qu.:2.849e-06
## Max. :0.0024790 Max. :4.677e-05 Max. :1.012e-05
## AQ_CD36 AQ_CHKA AQ_CPT1A
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:9.511e-06 1st Qu.:1.499e-07 1st Qu.:2.688e-06
## Median :2.284e-05 Median :4.550e-07 Median :5.168e-06
## Mean :2.868e-05 Mean :7.393e-07 Mean :9.178e-06
## 3rd Qu.:4.474e-05 3rd Qu.:1.105e-06 3rd Qu.:1.323e-05
## Max. :8.596e-05 Max. :3.703e-06 Max. :3.898e-05
## AQ_CSF2 AQ_CXCR1 AQ_FASN
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:4.883e-10 1st Qu.:4.703e-06 1st Qu.:1.065e-06
## Median :1.499e-08 Median :9.432e-06 Median :3.039e-06
## Mean :2.965e-08 Mean :1.832e-05 Mean :4.137e-06
## 3rd Qu.:3.840e-08 3rd Qu.:2.404e-05 3rd Qu.:5.387e-06
## Max. :1.543e-07 Max. :8.887e-05 Max. :1.685e-05
## AQ_FOXO3 AQ_FOXP3 AQ_G6PD
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:7.279e-05 1st Qu.:3.306e-07 1st Qu.:1.681e-05
## Median :1.258e-04 Median :1.047e-06 Median :3.525e-05
## Mean :1.822e-04 Mean :1.639e-06 Mean :4.274e-05
## 3rd Qu.:2.552e-04 3rd Qu.:1.897e-06 3rd Qu.:5.995e-05
## Max. :7.050e-04 Max. :1.504e-05 Max. :1.759e-04
## AQ_GPD2 AQ_GPX1 AQ_IFNG
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:4.969e-07 1st Qu.:5.104e-05 1st Qu.:4.492e-08
## Median :1.706e-06 Median :7.844e-05 Median :2.153e-07
## Mean :2.531e-06 Mean :9.614e-05 Mean :3.374e-07
## 3rd Qu.:4.140e-06 3rd Qu.:1.401e-04 3rd Qu.:4.211e-07
## Max. :1.563e-05 Max. :2.836e-04 Max. :1.855e-06
## AQ_IL10 AQ_IL1B AQ_IL6
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:9.934e-09 1st Qu.:3.217e-06 1st Qu.:1.744e-09
## Median :4.052e-08 Median :8.477e-06 Median :1.200e-08
## Mean :9.988e-08 Mean :1.358e-05 Mean :3.067e-08
## 3rd Qu.:1.021e-07 3rd Qu.:1.939e-05 3rd Qu.:3.408e-08
## Max. :1.233e-06 Max. :8.704e-05 Max. :3.061e-07
## AQ_IRS1 AQ_JAK1 AQ_JAK3
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:5.753e-08 1st Qu.:3.977e-05 1st Qu.:6.108e-06
## Median :9.505e-08 Median :7.981e-05 Median :1.898e-05
## Mean :1.328e-07 Mean :1.117e-04 Mean :2.981e-05
## 3rd Qu.:1.877e-07 3rd Qu.:1.596e-04 3rd Qu.:3.938e-05
## Max. :5.487e-07 Max. :4.581e-04 Max. :2.503e-04
## AQ_LDHA AQ_LIF AQ_MAPK1
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:1.266e-05 1st Qu.:1.423e-09 1st Qu.:8.631e-06
## Median :2.536e-05 Median :8.366e-09 Median :1.977e-05
## Mean :3.035e-05 Mean :2.182e-08 Mean :2.760e-05
## 3rd Qu.:4.428e-05 3rd Qu.:2.235e-08 3rd Qu.:4.114e-05
## Max. :8.948e-05 Max. :1.531e-07 Max. :1.100e-04
## AQ_NFE2L2 AQ_NFKB1 AQ_NLRP3
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:6.425e-06 1st Qu.:2.915e-06 1st Qu.:1.800e-06
## Median :2.352e-05 Median :1.353e-05 Median :5.013e-06
## Mean :3.090e-05 Mean :1.576e-05 Mean :6.757e-06
## 3rd Qu.:4.180e-05 3rd Qu.:2.513e-05 3rd Qu.:9.657e-06
## Max. :1.008e-04 Max. :5.448e-05 Max. :2.814e-05
## AQ_NOS2 AQ_NOX5 AQ_PDCD1 AQ_PPARG
## Min. :0.000e+00 Min. :0.00000 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:0.000e+00 1st Qu.:0.00000 1st Qu.:4.073e-07 1st Qu.:1.456e-08
## Median :7.045e-10 Median :0.00000 Median :8.844e-07 Median :5.469e-08
## Mean :3.118e-09 Mean :0.01538 Mean :1.694e-06 Mean :1.429e-07
## 3rd Qu.:2.827e-09 3rd Qu.:0.00000 3rd Qu.:1.651e-06 3rd Qu.:1.911e-07
## Max. :2.258e-08 Max. :1.00000 Max. :1.209e-05 Max. :1.115e-06
## AQ_PTAFR AQ_PTGS2 AQ_SLC2A4
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:1.594e-05 1st Qu.:2.093e-06 1st Qu.:7.946e-08
## Median :3.280e-05 Median :2.834e-06 Median :1.438e-07
## Mean :4.573e-05 Mean :4.857e-06 Mean :1.936e-07
## 3rd Qu.:6.716e-05 3rd Qu.:7.218e-06 3rd Qu.:2.441e-07
## Max. :1.501e-04 Max. :2.633e-05 Max. :1.432e-06
## AQ_SOD1 AQ_SREBF1 AQ_STAT3
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:7.001e-06 1st Qu.:2.927e-06 1st Qu.:9.751e-06
## Median :1.563e-05 Median :6.505e-06 Median :2.840e-05
## Mean :2.058e-05 Mean :8.676e-06 Mean :3.802e-05
## 3rd Qu.:2.386e-05 3rd Qu.:1.428e-05 3rd Qu.:4.876e-05
## Max. :8.115e-05 Max. :3.157e-05 Max. :2.000e-04
## AQ_TGFB1 AQ_TLR3 AQ_TLR4
## Min. :0.000e+00 Min. :0.000e+00 Min. :0.000e+00
## 1st Qu.:9.901e-05 1st Qu.:4.106e-08 1st Qu.:5.644e-06
## Median :1.896e-04 Median :2.333e-07 Median :1.333e-05
## Mean :2.738e-04 Mean :4.426e-07 Mean :1.886e-05
## 3rd Qu.:3.815e-04 3rd Qu.:4.701e-07 3rd Qu.:2.881e-05
## Max. :1.296e-03 Max. :3.253e-06 Max. :8.054e-05
## AQ_TNF
## Min. :0.000e+00
## 1st Qu.:2.683e-06
## Median :6.582e-06
## Mean :1.104e-05
## 3rd Qu.:1.611e-05
## Max. :6.215e-05
colSums(is.na(datos))
## X id edad sexo exfumador
## 0 0 0 0 0
## hta dm alergia cardiopatia ETE
## 0 0 0 0 0
## neumopatia hepatopatia colelitiasis utolitiasis ITU
## 0 0 0 0 0
## renal neuropatia corticoides tos disnea
## 0 0 0 0 0
## expect secrecion dolor_garg escalofrios fiebre
## 0 0 0 0 0
## diarrea nauseas vomitos cefalea mareo
## 0 0 0 0 0
## cansancio anosmia disgueusia dolor_hueso dolor_abdo
## 0 0 0 0 0
## perd_ape glucosa leucocitos linfocitos neutrofilos
## 0 0 0 0 0
## score_dieta chol hdl hierro igA
## 0 0 0 0 0
## igE igG igN ldl pcr
## 0 0 0 0 0
## transferrina trigliceridos cpk calidad_fisica calidad_mental
## 0 0 0 0 0
## tumor extension trat AQ_ADIPOQ AQ_ALOX5
## 0 0 0 0 0
## AQ_ARG1 AQ_BMP2 AQ_CCL2 AQ_CCL5 AQ_CCR5
## 0 0 0 0 0
## AQ_CD274 AQ_CD36 AQ_CHKA AQ_CPT1A AQ_CSF2
## 0 0 0 0 0
## AQ_CXCR1 AQ_FASN AQ_FOXO3 AQ_FOXP3 AQ_G6PD
## 0 0 0 0 0
## AQ_GPD2 AQ_GPX1 AQ_IFNG AQ_IL10 AQ_IL1B
## 0 0 0 0 0
## AQ_IL6 AQ_IRS1 AQ_JAK1 AQ_JAK3 AQ_LDHA
## 0 0 0 0 0
## AQ_LIF AQ_MAPK1 AQ_NFE2L2 AQ_NFKB1 AQ_NLRP3
## 0 0 0 0 0
## AQ_NOS2 AQ_NOX5 AQ_PDCD1 AQ_PPARG AQ_PTAFR
## 0 0 0 0 0
## AQ_PTGS2 AQ_SLC2A4 AQ_SOD1 AQ_SREBF1 AQ_STAT3
## 0 0 0 0 0
## AQ_TGFB1 AQ_TLR3 AQ_TLR4 AQ_TNF
## 0 0 0 0
datos <- na.omit(datos)
#Convertir_variables_categóricas_como_“hta, sexo, exfumador”_en_factores.
datos$sexo <- as.factor(datos$sexo)
datos$hta <- as.factor(datos$hta)
datos$exfumador <- as.factor(datos$exfumador)
“Parte B _ Graficos basicos”
library(ggplot2)
#Grafico_de_barras
ggplot(datos, aes(x = sexo, fill = sexo)) +
geom_bar() +
labs(title = "Distribución por sexo", x = "Sexo", y = "Número de pacientes")
“El gráfico de barras mostró la proporción de pacientes según el sexo
biológico. Se observó una distribución relativamente homogénea entre
hombres y mujeres, lo que indica que la muestra estuvo balanceada y no
presenta sesgos marcados por esta variable. Este equilibrio permitió
comparar la expresión génica y las condiciones clínicas sin que el sexo
se constituyera como un factor de confusión principal.
Desde un punto biológico significa que mantener una representación equitativa por sexo es relevante, ya que existen diferencias hormonales y metabólicas que pueden influir en la respuesta inflamatoria, la expresión de genes inmunorreguladores y la susceptibilidad a enfermedades cardiovasculares como la hipertensión arterial (HTA).”
#Graficos_pastel
df_pie <- as.data.frame(table(datos$dm))
ggplot(df_pie, aes(x = "", y = Freq, fill = Var1)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
labs(title = "Proporción de pacientes con diabetes")
“El gráfico de pastel evidenció la proporción de individuos diagnosticados con diabetes mellitus frente a aquellos sin la enfermedad. La fracción correspondiente a pacientes diabéticos representó un subconjunto relevante del total, lo cual sugiere una posible coexistencia de comorbilidades metabólicas dentro de la cohorte analizada.
La presencia de DM constituye un factor biológico clave en estudios transcriptómicos, ya que la hiperglucemia crónica genera alteraciones en la expresión de genes asociados al estrés oxidativo, inflamación sistémica y disfunción endotelial. Por tanto, la proporción observada refuerza la necesidad de considerar la diabetes como variable clínica de impacto al interpretar los perfiles de expresión génica en los pacientes estudiados.”
#Boxplot
ggplot(datos, aes(x = exfumador, y = AQ_IL6, fill = exfumador)) +
geom_boxplot() +
labs(title = "Expresión de IL6 según exfumador", x = "Exfumador", y = "Expresión IL6")
“El diagrama de caja comparó la expresión del gen AQ_IL6 entre pacientes exfumadores (“sí”) y no exfumadores (“no”). Se observó una tendencia hacia una mayor expresión de IL6 en el grupo exfumador, con una dispersión más amplia de los valores. Este patrón sugiere que el antecedente de exposición al tabaco podría haber inducido una activación persistente de rutas proinflamatorias, incluso tras el cese del hábito.
El gen IL6 codifica para una citoquina clave en la inflamación sistémica, cuya sobreexpresión se ha asociado a procesos de daño endotelial, resistencia a la insulina y remodelación vascular. Biológicamente, estos resultados apoyan la hipótesis de que el tabaquismo deja una huella inflamatoria a nivel transcriptómico que puede contribuir a la patogénesis de enfermedades cardiovasculares y metabólicas.”
#Dispersion_con_linea_de_tendencia
ggplot(datos, aes(x = AQ_TLR4, y = AQ_TNF)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Relación entre TLR4 y TNF", x = "AQ_TLR4", y = "AQ_TNF")
## `geom_smooth()` using formula = 'y ~ x'
“El gráfico de dispersión con línea de tendencia mostró una correlación positiva entre los niveles de expresión de los genes AQ_TLR4 y AQ_TNF. Este resultado es coherente con la función biológica conocida de ambos genes dentro de las rutas de señalización inflamatoria mediadas por el factor nuclear κB (NF-κB).
El aumento simultáneo de la expresión de TLR4 y TNF sugiere que ambos participan de manera coordinada en la activación de la respuesta inmunitaria innata frente a estímulos proinflamatorios. En términos fisiopatológicos, esta correlación apoya el modelo en el que la activación de TLR4 en células inmunes o endoteliales estimula la liberación de TNF-α, promoviendo la inflamación vascular y el incremento de la presión arterial observada en cuadros hipertensivos.
La pendiente positiva de la línea de tendencia refuerza esta relación biológica, indicando que la expresión de TLR4 podría modular directamente la de TNF, lo que convierte a ambos genes en posibles marcadores de actividad inflamatoria en el contexto clínico analizado.”
“Parte C _ Mapas complejos” #Heatmap_Jerarquico
library(pheatmap)
genes <- datos[, c("AQ_IL6","AQ_TNF","AQ_TLR4","AQ_STAT3","AQ_TGFB1","AQ_IFNG")]
rownames(genes) <- datos$id
anotaciones <- data.frame(
sexo = factor(datos$sexo),
hta = factor(datos$hta)
)
rownames(anotaciones) <- datos$id
pheatmap(
scale(genes),
annotation_row = anotaciones,
main = "Heatmap jerárquico de genes inflamatorios"
)
“El mapa de calor mostró los patrones de expresión de seis genes clave
involucrados en la respuesta inflamatoria: AQ_IL6, AQ_TNF, AQ_TLR4,
AQ_STAT3, AQ_TGFB1 y AQ_IFNG. Los valores fueron estandarizados mediante
scale() para permitir la comparación relativa entre pacientes. El
agrupamiento jerárquico permitió distinguir subgrupos de individuos con
perfiles transcriptómicos similares.
Se observó que ciertos pacientes presentaron niveles coordinadamente elevados de IL6, TNF y TLR4, genes relacionados con la activación del eje proinflamatorio y la señalización mediada por receptores tipo Toll. En contraste, otros grupos mostraron una expresión atenuada de STAT3 y TGFB1, genes con funciones reguladoras e inmunomoduladoras. La coincidencia entre estos patrones y las anotaciones clínicas (sexo y presencia de HTA) sugiere una posible asociación entre la hipertensión arterial y una sobreexpresión coordinada de genes proinflamatorios, lo cual es consistente con la literatura que relaciona el estrés oxidativo y la inflamación crónica con el desarrollo de hipertensión.
Además en el heatmap evidenció que los pacientes hipertensos tendieron a agruparse en clústeres con mayor expresión de IL6, TNF y TLR4, mientras que los no hipertensos mostraron una expresión más baja y homogénea. Esto indica la existencia de perfiles transcripcionales diferenciados según el estado clínico, lo que respalda la hipótesis de un componente inmunoinflamatorio en la fisiopatología de la HTA.”
#Volcano_plot
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
datos$hta <- tolower(as.character(datos$hta)) # ahora "si" / "no"
datos$hta <- factor(datos$hta, levels = c("no","si"))
#Selección de genes
genes <- datos %>% select(starts_with("AQ_"))
gene_names <- colnames(genes)
#Dividir grupos ("si" y "no" )
grupo_Si <- datos %>% filter(hta == "si")
grupo_No <- datos %>% filter(hta == "no")
#Calculo de log2FC y p-value por gen y uso de (small pseudocount para evitar division por 0)
epsilon <- 1e-6
genes_Si <- grupo_Si[, gene_names]
genes_No <- grupo_No[, gene_names]
log2FC_vec <- sapply(gene_names, function(gene) {
mean_si <- mean(genes_Si[[gene]], na.rm = TRUE)
mean_no <- mean(genes_No[[gene]], na.rm = TRUE)
log2((mean_si + epsilon) / (mean_no + epsilon))
})
pval_vec <- sapply(gene_names, function(gene) {
x <- na.omit(grupo_Si[[gene]])
y <- na.omit(grupo_No[[gene]])
if(length(x) < 2 || length(y) < 2) return(NA)
t.test(x, y)$p.value
})
resultados <- data.frame(
gen = gene_names,
log2FC = log2FC_vec,
pvalue = pval_vec,
negLogP = -log10(pval_vec)
)
#Clasificacion de significancia (umbral p < 0.05 y |log2FC| > 1)
resultados <- resultados %>%
mutate(
significativo = case_when(
!is.na(pvalue) & pvalue < 0.05 & log2FC > 1 ~ "Sobreexpresado",
!is.na(pvalue) & pvalue < 0.05 & log2FC < -1 ~ "Reprimido",
TRUE ~ "No significativo"
)
)
#Primeras filas
head(resultados)
## gen log2FC pvalue negLogP significativo
## AQ_ADIPOQ AQ_ADIPOQ -14.643853801 0.3236361 0.48994304 No significativo
## AQ_ALOX5 AQ_ALOX5 0.078546554 0.8211087 0.08559934 No significativo
## AQ_ARG1 AQ_ARG1 0.182617631 0.6546783 0.18397208 No significativo
## AQ_BMP2 AQ_BMP2 0.002963636 0.8937587 0.04877971 No significativo
## AQ_CCL2 AQ_CCL2 -0.004224262 0.9549000 0.02004210 No significativo
## AQ_CCL5 AQ_CCL5 -0.327992113 0.3991723 0.39883956 No significativo
#Tabla con los 5 genes más significativos por p-valor
top5_p <- resultados %>% arrange(pvalue) %>% slice_head(n = 5)
write.csv(top5_p, "top5_genes_por_pvalue.csv", row.names = FALSE)
resultados <- resultados %>% filter(!is.na(pvalue))
#Volcano plot
ggplot(resultados, aes(x = log2FC, y = negLogP, color = significativo)) +
geom_point(size = 2, alpha = 0.8) +
geom_text(
data = subset(resultados, pvalue < 0.01 & abs(log2FC) > 2),
aes(label = gen),
vjust = -1, size = 3, show.legend = FALSE
) +
labs(
title = "Volcano plot: HTA (si vs no)",
x = "log2(Fold Change)",
y = "-log10(p-valor)",
color = "Clasificación"
) +
theme_minimal(base_size = 13)
ggsave("Volcano_HTA.png", width = 8, height = 6, dpi = 300)
“El volcano plot representó la magnitud del cambio de expresión (log₂FC) frente a la significancia estadística (–log₁₀ p-valor) para todos los genes de la matriz transcriptómica. Los genes ubicados en los extremos del gráfico, tanto en el cuadrante superior derecho como en el izquierdo, correspondieron a aquellos con mayor diferencia de expresión entre los grupos hipertensos y no hipertensos.
Se identificó que los genes sobreexpresados (marcados de rojo) en el grupo HTA, asociados a rutas inflamatorias y estrés oxidativo, como IL6, TNF, NFKB1 y TLR4. Estas moléculas actúan como mediadores proinflamatorios que promueven la activación de macrófagos, la producción de citocinas y la disfunción endotelial, mecanismos implicados en la elevación crónica de la presión arterial. En cambio, los genes reprimidos (azul), entre ellos FOXO3 y PPARG, se relacionan con la homeostasis metabólica y la regulación antioxidante, indicando una posible pérdida de funciones protectoras en pacientes hipertensos.
Los genes no significativos (gris) se distribuyeron en torno al eje central (log₂FC ≈ 0), reflejando una expresión estable entre los grupos. En conjunto, el gráfico permitió visualizar de forma clara los candidatos génicos con posible relevancia biológica en la HTA y constituye un punto de partida para posteriores análisis funcionales o validaciones experimentales.”