rm(list = ls())

“PARTE A _ Exploracion y preparacion”

#Carga_de_datos

datos <- read.csv("Dataset expresión genes.csv", header = TRUE, sep = ",")
library(readxl)
datos <- read.csv("Dataset expresión genes.csv")
head(datos)
##   X id     edad  sexo exfumador hta dm alergia cardiopatia ETE neumopatia
## 1 1  1 55.73169 mujer        si  si no      si          si  si         si
## 2 2  2 48.71732 varon        no  si no      no          no  no         si
## 3 3  3 63.60575 mujer        no  no no      no          no  no         si
## 4 4  4 55.27447 mujer        si  no no      no          no  no         no
## 5 5  5 74.13552 varon        si  no si      no          si  no         si
## 6 6  6 78.16290 mujer        no  si no      no          no  no         no
##   hepatopatia colelitiasis utolitiasis ITU renal neuropatia corticoides tos
## 1          no           no          no  si    si         si          si  no
## 2          no           no          no  no    no         si  antiemesis  no
## 3          no           no          no  no    no         no          si  no
## 4          no           no          no  no    no         no  antiemesis  no
## 5          no           no          no  no    no         no  antiemesis  no
## 6          no           si          no  si    no         si          no  no
##   disnea expect secrecion dolor_garg escalofrios fiebre diarrea nauseas vomitos
## 1     si     no        si         no          no     no      no      no      no
## 2     no     no        si         no          no     no      no      no      no
## 3     no     no        no         no          no     si      si      no      no
## 4     no     no        no         no          no     no      no      no      no
## 5     no     si        no         no          no     no      si      no      no
## 6     no     no        no         no          no     no      no      no      no
##   cefalea mareo cansancio anosmia disgueusia dolor_hueso dolor_abdo perd_ape
## 1      no    no        si      no         no          si         no       no
## 2      no    no        no      no         no          no         no       no
## 3      no    si        si      no         si          si         si       si
## 4      si    no        no      no         no          no         no       no
## 5      no    no        si      no         no          si         no       no
## 6      si    si        no      no         no          no         no       si
##   glucosa leucocitos linfocitos neutrofilos score_dieta chol hdl hierro
## 1      88      7.400       1.10        5.30           4  244  69     60
## 2      98      5.690       0.90        4.20           6  226  86    207
## 3      92     18.935       3.30       14.50           8  212  65    140
## 4     103      9.460       2.70        6.20           9  190  35     59
## 5     139      4.180       1.45        2.05          11  137  36     49
## 6     106      4.510       1.30        2.80           6  143  28     36
##        igA      igE      igG      igN ldl   pcr transferrina trigliceridos
## 1 194.0000  8.00000 756.0000 111.0000 255 10.20          290           129
## 2 264.0000 94.60340 631.0000  26.0000 178  0.50          316            56
## 3 424.0000 35.00000 930.0000  76.0000 283 18.55          155           255
## 4 206.0000 18.00000 509.0000  62.0000 199  0.70          253           428
## 5 387.0000 11.00000 910.0000  81.0000 181  0.60          349           155
## 6 170.0447 53.07141 944.2505 111.1208 187  8.10          271           213
##         cpk calidad_fisica calidad_mental tumor   extension  trat AQ_ADIPOQ
## 1  71.70969       40.42765       52.92580   CCR metastasico tratA 4.114e-10
## 2 130.00000       52.82225       50.88728   CCR metastasico tratB 3.130e-10
## 3  24.50000       14.93744       49.10694    CM metastasico tratA 0.000e+00
## 4  51.00000       36.07207       61.94158   CCR  localizado tratA 1.248e-09
## 5  53.00000       49.89475       54.09426    CM metastasico tratB 0.000e+00
## 6  45.00000       52.64374       23.16611    CM metastasico tratB 0.000e+00
##    AQ_ALOX5   AQ_ARG1   AQ_BMP2   AQ_CCL2    AQ_CCL5   AQ_CCR5  AQ_CD274
## 1 2.443e-05 5.979e-07 2.174e-09 1.717e-08 0.00005863 1.004e-06 4.441e-07
## 2 1.621e-05 5.198e-07 2.995e-09 3.996e-09 0.00003230 7.479e-07 8.357e-08
## 3 5.168e-05 1.010e-05 1.545e-07 5.013e-08 0.00085606 8.430e-06 2.834e-06
## 4 5.410e-05 2.006e-06 9.122e-09 1.237e-07 0.00041951 3.662e-06 9.112e-07
## 5 1.261e-05 8.680e-07 6.008e-09 3.402e-09 0.00022700 4.221e-06 8.632e-07
## 6 1.665e-05 1.299e-05 2.858e-08 1.673e-08 0.00015281 1.573e-06 5.422e-07
##     AQ_CD36   AQ_CHKA  AQ_CPT1A   AQ_CSF2  AQ_CXCR1   AQ_FASN   AQ_FOXO3
## 1 5.616e-06 9.936e-08 1.082e-06 4.114e-10 4.739e-06 2.884e-07 0.00004622
## 2 4.283e-06 9.813e-08 1.250e-06 1.682e-09 3.008e-06 2.518e-07 0.00002470
## 3 6.670e-05 7.636e-07 1.195e-05 0.000e+00 8.887e-05 4.277e-06 0.00024841
## 4 1.721e-05 0.000e+00 4.726e-06 7.853e-09 9.079e-06 2.563e-06 0.00035943
## 5 8.436e-06 2.609e-07 3.963e-06 1.499e-08 4.862e-06 7.134e-07 0.00012576
## 6 1.790e-05 4.269e-07 2.688e-06 0.000e+00 9.244e-06 1.403e-06 0.00009826
##    AQ_FOXP3   AQ_G6PD   AQ_GPD2    AQ_GPX1   AQ_IFNG   AQ_IL10   AQ_IL1B
## 1 1.101e-07 9.874e-06 0.000e+00 0.00006258 0.000e+00 8.750e-09 2.414e-06
## 2 5.808e-08 4.496e-06 4.969e-07 0.00002545 3.554e-09 4.510e-09 1.639e-06
## 3 1.387e-06 4.367e-05 4.886e-06 0.00014781 8.644e-07 6.254e-08 2.077e-05
## 4 8.414e-07 2.989e-05 1.247e-06 0.00014760 1.072e-07 2.285e-08 4.645e-06
## 5 1.124e-07 1.077e-05 4.510e-07 0.00005193 1.841e-07 1.883e-08 3.129e-06
## 6 2.522e-07 1.488e-05 1.192e-06 0.00007646 1.204e-07 1.282e-08 8.477e-06
##      AQ_IL6   AQ_IRS1    AQ_JAK1   AQ_JAK3   AQ_LDHA    AQ_LIF  AQ_MAPK1
## 1 7.658e-09 3.845e-08 0.00001136 3.173e-06 5.482e-06 5.734e-09 5.863e-06
## 2 1.634e-09 6.475e-08 0.00001246 1.668e-06 6.688e-06 3.161e-09 2.049e-06
## 3 5.383e-08 1.398e-07 0.00012148 5.262e-05 3.159e-05 0.000e+00 5.995e-05
## 4 1.248e-09 9.758e-08 0.00007567 4.556e-06 1.266e-05 1.413e-08 2.505e-05
## 5 1.410e-08 5.010e-08 0.00002698 7.545e-06 7.178e-06 7.145e-09 9.393e-06
## 6 2.564e-09 7.020e-08 0.00003090 1.368e-05 1.490e-05 0.000e+00 0.000e+00
##   AQ_NFE2L2  AQ_NFKB1  AQ_NLRP3   AQ_NOS2   AQ_NOX5  AQ_PDCD1  AQ_PPARG
## 1 5.132e-06 2.577e-06 1.106e-06 4.114e-10 4.114e-10 9.512e-08 1.178e-08
## 2 2.698e-06 5.056e-07 1.030e-06 3.130e-10 3.130e-10 3.194e-08 1.060e-08
## 3 3.467e-05 2.500e-05 4.253e-06 0.000e+00 0.000e+00 1.645e-06 4.047e-08
## 4 1.704e-05 6.133e-06 2.766e-06 1.248e-09 1.248e-09 1.139e-06 0.000e+00
## 5 1.313e-05 2.283e-06 1.429e-06 1.089e-09 0.000e+00 2.807e-07 1.456e-08
## 6 1.420e-05 1.607e-05 2.161e-06 0.000e+00 7.165e-09 1.487e-07 1.363e-08
##    AQ_PTAFR  AQ_PTGS2 AQ_SLC2A4   AQ_SOD1 AQ_SREBF1  AQ_STAT3   AQ_TGFB1
## 1 1.190e-05 2.095e-06 1.929e-07 4.016e-06 1.631e-06 3.890e-06 0.00005262
## 2 1.190e-05 9.112e-07 8.051e-08 1.310e-06 9.571e-07 1.099e-06 0.00002229
## 3 6.661e-05 7.411e-06 2.245e-07 1.896e-05 6.624e-06 2.932e-05 0.00038151
## 4 1.522e-05 2.512e-06 3.137e-07 1.021e-05 2.977e-06 7.635e-06 0.00024499
## 5 1.649e-05 2.093e-06 7.353e-08 8.320e-06 1.102e-06 5.240e-06 0.00003898
## 6 2.889e-05 2.448e-06 1.972e-07 0.000e+00 4.002e-06 2.237e-05 0.00012047
##     AQ_TLR3   AQ_TLR4    AQ_TNF
## 1 2.093e-08 2.713e-06 1.304e-06
## 2 5.072e-09 2.622e-06 2.441e-07
## 3 2.786e-07 2.881e-05 1.929e-05
## 4 1.248e-09 1.185e-05 4.496e-06
## 5 7.010e-08 4.373e-06 4.060e-06
## 6 6.876e-08 9.354e-06 2.148e-06

#revision_de_data

names(datos)
##   [1] "X"              "id"             "edad"           "sexo"          
##   [5] "exfumador"      "hta"            "dm"             "alergia"       
##   [9] "cardiopatia"    "ETE"            "neumopatia"     "hepatopatia"   
##  [13] "colelitiasis"   "utolitiasis"    "ITU"            "renal"         
##  [17] "neuropatia"     "corticoides"    "tos"            "disnea"        
##  [21] "expect"         "secrecion"      "dolor_garg"     "escalofrios"   
##  [25] "fiebre"         "diarrea"        "nauseas"        "vomitos"       
##  [29] "cefalea"        "mareo"          "cansancio"      "anosmia"       
##  [33] "disgueusia"     "dolor_hueso"    "dolor_abdo"     "perd_ape"      
##  [37] "glucosa"        "leucocitos"     "linfocitos"     "neutrofilos"   
##  [41] "score_dieta"    "chol"           "hdl"            "hierro"        
##  [45] "igA"            "igE"            "igG"            "igN"           
##  [49] "ldl"            "pcr"            "transferrina"   "trigliceridos" 
##  [53] "cpk"            "calidad_fisica" "calidad_mental" "tumor"         
##  [57] "extension"      "trat"           "AQ_ADIPOQ"      "AQ_ALOX5"      
##  [61] "AQ_ARG1"        "AQ_BMP2"        "AQ_CCL2"        "AQ_CCL5"       
##  [65] "AQ_CCR5"        "AQ_CD274"       "AQ_CD36"        "AQ_CHKA"       
##  [69] "AQ_CPT1A"       "AQ_CSF2"        "AQ_CXCR1"       "AQ_FASN"       
##  [73] "AQ_FOXO3"       "AQ_FOXP3"       "AQ_G6PD"        "AQ_GPD2"       
##  [77] "AQ_GPX1"        "AQ_IFNG"        "AQ_IL10"        "AQ_IL1B"       
##  [81] "AQ_IL6"         "AQ_IRS1"        "AQ_JAK1"        "AQ_JAK3"       
##  [85] "AQ_LDHA"        "AQ_LIF"         "AQ_MAPK1"       "AQ_NFE2L2"     
##  [89] "AQ_NFKB1"       "AQ_NLRP3"       "AQ_NOS2"        "AQ_NOX5"       
##  [93] "AQ_PDCD1"       "AQ_PPARG"       "AQ_PTAFR"       "AQ_PTGS2"      
##  [97] "AQ_SLC2A4"      "AQ_SOD1"        "AQ_SREBF1"      "AQ_STAT3"      
## [101] "AQ_TGFB1"       "AQ_TLR3"        "AQ_TLR4"        "AQ_TNF"
summary(datos)
##        X               id             edad           sexo          
##  Min.   : 1.00   Min.   : 1.00   Min.   :30.35   Length:65         
##  1st Qu.:18.00   1st Qu.:18.00   1st Qu.:57.62   Class :character  
##  Median :35.00   Median :35.00   Median :66.49   Mode  :character  
##  Mean   :34.51   Mean   :34.51   Mean   :65.46                     
##  3rd Qu.:51.00   3rd Qu.:51.00   3rd Qu.:75.09                     
##  Max.   :67.00   Max.   :67.00   Max.   :94.06                     
##   exfumador             hta                 dm              alergia         
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##  cardiopatia            ETE             neumopatia        hepatopatia       
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##  colelitiasis       utolitiasis            ITU               renal          
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##   neuropatia        corticoides            tos               disnea         
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     expect           secrecion          dolor_garg        escalofrios       
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     fiebre            diarrea            nauseas            vomitos         
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##    cefalea             mareo            cansancio           anosmia         
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##   disgueusia        dolor_hueso         dolor_abdo          perd_ape        
##  Length:65          Length:65          Length:65          Length:65         
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     glucosa        leucocitos       linfocitos     neutrofilos    
##  Min.   : 76.0   Min.   : 1.345   Min.   :0.350   Min.   : 0.800  
##  1st Qu.: 91.0   1st Qu.: 4.385   1st Qu.:1.100   1st Qu.: 2.350  
##  Median :105.0   Median : 5.690   Median :1.400   Median : 3.650  
##  Mean   :108.9   Mean   : 6.500   Mean   :1.465   Mean   : 4.256  
##  3rd Qu.:114.0   3rd Qu.: 7.525   3rd Qu.:1.800   3rd Qu.: 5.200  
##  Max.   :208.0   Max.   :23.400   Max.   :3.300   Max.   :19.600  
##   score_dieta          chol            hdl             hierro      
##  Min.   : 2.000   Min.   :101.0   Min.   : 22.00   Min.   : 19.00  
##  1st Qu.: 7.000   1st Qu.:146.0   1st Qu.: 37.00   1st Qu.: 53.00  
##  Median : 9.000   Median :178.0   Median : 48.00   Median : 67.00  
##  Mean   : 8.323   Mean   :176.8   Mean   : 49.17   Mean   : 72.36  
##  3rd Qu.:10.000   3rd Qu.:195.0   3rd Qu.: 57.00   3rd Qu.: 84.00  
##  Max.   :12.000   Max.   :263.0   Max.   :108.00   Max.   :207.00  
##       igA             igE              igG              igN        
##  Min.   : 34.0   Min.   :  2.00   Min.   : 252.0   Min.   : 26.00  
##  1st Qu.:153.0   1st Qu.: 13.00   1st Qu.: 711.9   1st Qu.: 62.00  
##  Median :190.8   Median : 59.59   Median : 854.9   Median : 79.00  
##  Mean   :210.5   Mean   : 66.20   Mean   : 868.9   Mean   : 87.73  
##  3rd Qu.:255.1   3rd Qu.: 94.60   3rd Qu.: 938.9   3rd Qu.: 96.00  
##  Max.   :495.0   Max.   :366.00   Max.   :1828.0   Max.   :290.00  
##       ldl             pcr          transferrina   trigliceridos  
##  Min.   :124.0   Min.   :  0.10   Min.   :131.0   Min.   : 43.0  
##  1st Qu.:170.9   1st Qu.:  1.10   1st Qu.:231.0   1st Qu.: 90.0  
##  Median :195.0   Median :  4.80   Median :253.0   Median :129.0  
##  Mean   :205.2   Mean   : 12.22   Mean   :255.6   Mean   :145.5  
##  3rd Qu.:220.0   3rd Qu.: 11.00   3rd Qu.:274.0   3rd Qu.:173.0  
##  Max.   :484.0   Max.   :194.20   Max.   :378.0   Max.   :469.0  
##       cpk         calidad_fisica  calidad_mental     tumor          
##  Min.   : 15.00   Min.   :14.94   Min.   :22.75   Length:65         
##  1st Qu.: 37.00   1st Qu.:32.23   1st Qu.:46.57   Class :character  
##  Median : 57.00   Median :39.43   Median :50.89   Mode  :character  
##  Mean   : 68.99   Mean   :38.99   Mean   :48.62                     
##  3rd Qu.: 91.00   3rd Qu.:49.89   3rd Qu.:56.82                     
##  Max.   :197.00   Max.   :58.05   Max.   :66.76                     
##   extension             trat             AQ_ADIPOQ          AQ_ALOX5        
##  Length:65          Length:65          Min.   :0.00000   Min.   :0.000e+00  
##  Class :character   Class :character   1st Qu.:0.00000   1st Qu.:1.987e-05  
##  Mode  :character   Mode  :character   Median :0.00000   Median :4.428e-05  
##                                        Mean   :0.01538   Mean   :6.958e-05  
##                                        3rd Qu.:0.00000   3rd Qu.:1.100e-04  
##                                        Max.   :1.00000   Max.   :2.573e-04  
##     AQ_ARG1             AQ_BMP2             AQ_CCL2         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:8.099e-07   1st Qu.:1.365e-08   1st Qu.:1.381e-08  
##  Median :2.116e-06   Median :2.936e-08   Median :3.829e-08  
##  Mean   :4.051e-06   Mean   :5.385e-08   Mean   :1.185e-07  
##  3rd Qu.:5.037e-06   3rd Qu.:7.544e-08   3rd Qu.:1.284e-07  
##  Max.   :2.657e-05   Max.   :2.902e-07   Max.   :1.303e-06  
##     AQ_CCL5             AQ_CCR5             AQ_CD274        
##  Min.   :0.0000000   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:0.0001168   1st Qu.:3.201e-06   1st Qu.:5.795e-07  
##  Median :0.0002944   Median :5.585e-06   Median :1.307e-06  
##  Mean   :0.0005178   Mean   :9.236e-06   Mean   :1.930e-06  
##  3rd Qu.:0.0007839   3rd Qu.:1.206e-05   3rd Qu.:2.849e-06  
##  Max.   :0.0024790   Max.   :4.677e-05   Max.   :1.012e-05  
##     AQ_CD36             AQ_CHKA             AQ_CPT1A        
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:9.511e-06   1st Qu.:1.499e-07   1st Qu.:2.688e-06  
##  Median :2.284e-05   Median :4.550e-07   Median :5.168e-06  
##  Mean   :2.868e-05   Mean   :7.393e-07   Mean   :9.178e-06  
##  3rd Qu.:4.474e-05   3rd Qu.:1.105e-06   3rd Qu.:1.323e-05  
##  Max.   :8.596e-05   Max.   :3.703e-06   Max.   :3.898e-05  
##     AQ_CSF2             AQ_CXCR1            AQ_FASN         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:4.883e-10   1st Qu.:4.703e-06   1st Qu.:1.065e-06  
##  Median :1.499e-08   Median :9.432e-06   Median :3.039e-06  
##  Mean   :2.965e-08   Mean   :1.832e-05   Mean   :4.137e-06  
##  3rd Qu.:3.840e-08   3rd Qu.:2.404e-05   3rd Qu.:5.387e-06  
##  Max.   :1.543e-07   Max.   :8.887e-05   Max.   :1.685e-05  
##     AQ_FOXO3            AQ_FOXP3            AQ_G6PD         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:7.279e-05   1st Qu.:3.306e-07   1st Qu.:1.681e-05  
##  Median :1.258e-04   Median :1.047e-06   Median :3.525e-05  
##  Mean   :1.822e-04   Mean   :1.639e-06   Mean   :4.274e-05  
##  3rd Qu.:2.552e-04   3rd Qu.:1.897e-06   3rd Qu.:5.995e-05  
##  Max.   :7.050e-04   Max.   :1.504e-05   Max.   :1.759e-04  
##     AQ_GPD2             AQ_GPX1             AQ_IFNG         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:4.969e-07   1st Qu.:5.104e-05   1st Qu.:4.492e-08  
##  Median :1.706e-06   Median :7.844e-05   Median :2.153e-07  
##  Mean   :2.531e-06   Mean   :9.614e-05   Mean   :3.374e-07  
##  3rd Qu.:4.140e-06   3rd Qu.:1.401e-04   3rd Qu.:4.211e-07  
##  Max.   :1.563e-05   Max.   :2.836e-04   Max.   :1.855e-06  
##     AQ_IL10             AQ_IL1B              AQ_IL6         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:9.934e-09   1st Qu.:3.217e-06   1st Qu.:1.744e-09  
##  Median :4.052e-08   Median :8.477e-06   Median :1.200e-08  
##  Mean   :9.988e-08   Mean   :1.358e-05   Mean   :3.067e-08  
##  3rd Qu.:1.021e-07   3rd Qu.:1.939e-05   3rd Qu.:3.408e-08  
##  Max.   :1.233e-06   Max.   :8.704e-05   Max.   :3.061e-07  
##     AQ_IRS1             AQ_JAK1             AQ_JAK3         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:5.753e-08   1st Qu.:3.977e-05   1st Qu.:6.108e-06  
##  Median :9.505e-08   Median :7.981e-05   Median :1.898e-05  
##  Mean   :1.328e-07   Mean   :1.117e-04   Mean   :2.981e-05  
##  3rd Qu.:1.877e-07   3rd Qu.:1.596e-04   3rd Qu.:3.938e-05  
##  Max.   :5.487e-07   Max.   :4.581e-04   Max.   :2.503e-04  
##     AQ_LDHA              AQ_LIF             AQ_MAPK1        
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:1.266e-05   1st Qu.:1.423e-09   1st Qu.:8.631e-06  
##  Median :2.536e-05   Median :8.366e-09   Median :1.977e-05  
##  Mean   :3.035e-05   Mean   :2.182e-08   Mean   :2.760e-05  
##  3rd Qu.:4.428e-05   3rd Qu.:2.235e-08   3rd Qu.:4.114e-05  
##  Max.   :8.948e-05   Max.   :1.531e-07   Max.   :1.100e-04  
##    AQ_NFE2L2            AQ_NFKB1            AQ_NLRP3        
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:6.425e-06   1st Qu.:2.915e-06   1st Qu.:1.800e-06  
##  Median :2.352e-05   Median :1.353e-05   Median :5.013e-06  
##  Mean   :3.090e-05   Mean   :1.576e-05   Mean   :6.757e-06  
##  3rd Qu.:4.180e-05   3rd Qu.:2.513e-05   3rd Qu.:9.657e-06  
##  Max.   :1.008e-04   Max.   :5.448e-05   Max.   :2.814e-05  
##     AQ_NOS2             AQ_NOX5           AQ_PDCD1            AQ_PPARG        
##  Min.   :0.000e+00   Min.   :0.00000   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:0.000e+00   1st Qu.:0.00000   1st Qu.:4.073e-07   1st Qu.:1.456e-08  
##  Median :7.045e-10   Median :0.00000   Median :8.844e-07   Median :5.469e-08  
##  Mean   :3.118e-09   Mean   :0.01538   Mean   :1.694e-06   Mean   :1.429e-07  
##  3rd Qu.:2.827e-09   3rd Qu.:0.00000   3rd Qu.:1.651e-06   3rd Qu.:1.911e-07  
##  Max.   :2.258e-08   Max.   :1.00000   Max.   :1.209e-05   Max.   :1.115e-06  
##     AQ_PTAFR            AQ_PTGS2           AQ_SLC2A4        
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:1.594e-05   1st Qu.:2.093e-06   1st Qu.:7.946e-08  
##  Median :3.280e-05   Median :2.834e-06   Median :1.438e-07  
##  Mean   :4.573e-05   Mean   :4.857e-06   Mean   :1.936e-07  
##  3rd Qu.:6.716e-05   3rd Qu.:7.218e-06   3rd Qu.:2.441e-07  
##  Max.   :1.501e-04   Max.   :2.633e-05   Max.   :1.432e-06  
##     AQ_SOD1            AQ_SREBF1            AQ_STAT3        
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:7.001e-06   1st Qu.:2.927e-06   1st Qu.:9.751e-06  
##  Median :1.563e-05   Median :6.505e-06   Median :2.840e-05  
##  Mean   :2.058e-05   Mean   :8.676e-06   Mean   :3.802e-05  
##  3rd Qu.:2.386e-05   3rd Qu.:1.428e-05   3rd Qu.:4.876e-05  
##  Max.   :8.115e-05   Max.   :3.157e-05   Max.   :2.000e-04  
##     AQ_TGFB1            AQ_TLR3             AQ_TLR4         
##  Min.   :0.000e+00   Min.   :0.000e+00   Min.   :0.000e+00  
##  1st Qu.:9.901e-05   1st Qu.:4.106e-08   1st Qu.:5.644e-06  
##  Median :1.896e-04   Median :2.333e-07   Median :1.333e-05  
##  Mean   :2.738e-04   Mean   :4.426e-07   Mean   :1.886e-05  
##  3rd Qu.:3.815e-04   3rd Qu.:4.701e-07   3rd Qu.:2.881e-05  
##  Max.   :1.296e-03   Max.   :3.253e-06   Max.   :8.054e-05  
##      AQ_TNF         
##  Min.   :0.000e+00  
##  1st Qu.:2.683e-06  
##  Median :6.582e-06  
##  Mean   :1.104e-05  
##  3rd Qu.:1.611e-05  
##  Max.   :6.215e-05
colSums(is.na(datos))
##              X             id           edad           sexo      exfumador 
##              0              0              0              0              0 
##            hta             dm        alergia    cardiopatia            ETE 
##              0              0              0              0              0 
##     neumopatia    hepatopatia   colelitiasis    utolitiasis            ITU 
##              0              0              0              0              0 
##          renal     neuropatia    corticoides            tos         disnea 
##              0              0              0              0              0 
##         expect      secrecion     dolor_garg    escalofrios         fiebre 
##              0              0              0              0              0 
##        diarrea        nauseas        vomitos        cefalea          mareo 
##              0              0              0              0              0 
##      cansancio        anosmia     disgueusia    dolor_hueso     dolor_abdo 
##              0              0              0              0              0 
##       perd_ape        glucosa     leucocitos     linfocitos    neutrofilos 
##              0              0              0              0              0 
##    score_dieta           chol            hdl         hierro            igA 
##              0              0              0              0              0 
##            igE            igG            igN            ldl            pcr 
##              0              0              0              0              0 
##   transferrina  trigliceridos            cpk calidad_fisica calidad_mental 
##              0              0              0              0              0 
##          tumor      extension           trat      AQ_ADIPOQ       AQ_ALOX5 
##              0              0              0              0              0 
##        AQ_ARG1        AQ_BMP2        AQ_CCL2        AQ_CCL5        AQ_CCR5 
##              0              0              0              0              0 
##       AQ_CD274        AQ_CD36        AQ_CHKA       AQ_CPT1A        AQ_CSF2 
##              0              0              0              0              0 
##       AQ_CXCR1        AQ_FASN       AQ_FOXO3       AQ_FOXP3        AQ_G6PD 
##              0              0              0              0              0 
##        AQ_GPD2        AQ_GPX1        AQ_IFNG        AQ_IL10        AQ_IL1B 
##              0              0              0              0              0 
##         AQ_IL6        AQ_IRS1        AQ_JAK1        AQ_JAK3        AQ_LDHA 
##              0              0              0              0              0 
##         AQ_LIF       AQ_MAPK1      AQ_NFE2L2       AQ_NFKB1       AQ_NLRP3 
##              0              0              0              0              0 
##        AQ_NOS2        AQ_NOX5       AQ_PDCD1       AQ_PPARG       AQ_PTAFR 
##              0              0              0              0              0 
##       AQ_PTGS2      AQ_SLC2A4        AQ_SOD1      AQ_SREBF1       AQ_STAT3 
##              0              0              0              0              0 
##       AQ_TGFB1        AQ_TLR3        AQ_TLR4         AQ_TNF 
##              0              0              0              0
datos <- na.omit(datos)

#Convertir_variables_categóricas_como_“hta, sexo, exfumador”_en_factores.

datos$sexo <- as.factor(datos$sexo)
datos$hta <- as.factor(datos$hta)
datos$exfumador <- as.factor(datos$exfumador)

“Parte B _ Graficos basicos”

library(ggplot2)

#Grafico_de_barras

ggplot(datos, aes(x = sexo, fill = sexo)) +
  geom_bar() +
  labs(title = "Distribución por sexo", x = "Sexo", y = "Número de pacientes")

“El gráfico de barras mostró la proporción de pacientes según el sexo biológico. Se observó una distribución relativamente homogénea entre hombres y mujeres, lo que indica que la muestra estuvo balanceada y no presenta sesgos marcados por esta variable. Este equilibrio permitió comparar la expresión génica y las condiciones clínicas sin que el sexo se constituyera como un factor de confusión principal.

Desde un punto biológico significa que mantener una representación equitativa por sexo es relevante, ya que existen diferencias hormonales y metabólicas que pueden influir en la respuesta inflamatoria, la expresión de genes inmunorreguladores y la susceptibilidad a enfermedades cardiovasculares como la hipertensión arterial (HTA).”

#Graficos_pastel

df_pie <- as.data.frame(table(datos$dm))
ggplot(df_pie, aes(x = "", y = Freq, fill = Var1)) +
  geom_bar(stat = "identity", width = 1) +
  coord_polar("y", start = 0) +
  labs(title = "Proporción de pacientes con diabetes")

“El gráfico de pastel evidenció la proporción de individuos diagnosticados con diabetes mellitus frente a aquellos sin la enfermedad. La fracción correspondiente a pacientes diabéticos representó un subconjunto relevante del total, lo cual sugiere una posible coexistencia de comorbilidades metabólicas dentro de la cohorte analizada.

La presencia de DM constituye un factor biológico clave en estudios transcriptómicos, ya que la hiperglucemia crónica genera alteraciones en la expresión de genes asociados al estrés oxidativo, inflamación sistémica y disfunción endotelial. Por tanto, la proporción observada refuerza la necesidad de considerar la diabetes como variable clínica de impacto al interpretar los perfiles de expresión génica en los pacientes estudiados.”

#Boxplot

ggplot(datos, aes(x = exfumador, y = AQ_IL6, fill = exfumador)) +
  geom_boxplot() +
  labs(title = "Expresión de IL6 según exfumador", x = "Exfumador", y = "Expresión IL6")

“El diagrama de caja comparó la expresión del gen AQ_IL6 entre pacientes exfumadores (“sí”) y no exfumadores (“no”). Se observó una tendencia hacia una mayor expresión de IL6 en el grupo exfumador, con una dispersión más amplia de los valores. Este patrón sugiere que el antecedente de exposición al tabaco podría haber inducido una activación persistente de rutas proinflamatorias, incluso tras el cese del hábito.

El gen IL6 codifica para una citoquina clave en la inflamación sistémica, cuya sobreexpresión se ha asociado a procesos de daño endotelial, resistencia a la insulina y remodelación vascular. Biológicamente, estos resultados apoyan la hipótesis de que el tabaquismo deja una huella inflamatoria a nivel transcriptómico que puede contribuir a la patogénesis de enfermedades cardiovasculares y metabólicas.”

#Dispersion_con_linea_de_tendencia

ggplot(datos, aes(x = AQ_TLR4, y = AQ_TNF)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Relación entre TLR4 y TNF", x = "AQ_TLR4", y = "AQ_TNF")
## `geom_smooth()` using formula = 'y ~ x'

“El gráfico de dispersión con línea de tendencia mostró una correlación positiva entre los niveles de expresión de los genes AQ_TLR4 y AQ_TNF. Este resultado es coherente con la función biológica conocida de ambos genes dentro de las rutas de señalización inflamatoria mediadas por el factor nuclear κB (NF-κB).

El aumento simultáneo de la expresión de TLR4 y TNF sugiere que ambos participan de manera coordinada en la activación de la respuesta inmunitaria innata frente a estímulos proinflamatorios. En términos fisiopatológicos, esta correlación apoya el modelo en el que la activación de TLR4 en células inmunes o endoteliales estimula la liberación de TNF-α, promoviendo la inflamación vascular y el incremento de la presión arterial observada en cuadros hipertensivos.

La pendiente positiva de la línea de tendencia refuerza esta relación biológica, indicando que la expresión de TLR4 podría modular directamente la de TNF, lo que convierte a ambos genes en posibles marcadores de actividad inflamatoria en el contexto clínico analizado.”

“Parte C _ Mapas complejos” #Heatmap_Jerarquico

library(pheatmap)
genes <- datos[, c("AQ_IL6","AQ_TNF","AQ_TLR4","AQ_STAT3","AQ_TGFB1","AQ_IFNG")]
rownames(genes) <- datos$id
anotaciones <- data.frame(
  sexo = factor(datos$sexo),
  hta  = factor(datos$hta)
)
rownames(anotaciones) <- datos$id

pheatmap(
  scale(genes),
  annotation_row = anotaciones,
  main = "Heatmap jerárquico de genes inflamatorios"
)

“El mapa de calor mostró los patrones de expresión de seis genes clave involucrados en la respuesta inflamatoria: AQ_IL6, AQ_TNF, AQ_TLR4, AQ_STAT3, AQ_TGFB1 y AQ_IFNG. Los valores fueron estandarizados mediante scale() para permitir la comparación relativa entre pacientes. El agrupamiento jerárquico permitió distinguir subgrupos de individuos con perfiles transcriptómicos similares.

Se observó que ciertos pacientes presentaron niveles coordinadamente elevados de IL6, TNF y TLR4, genes relacionados con la activación del eje proinflamatorio y la señalización mediada por receptores tipo Toll. En contraste, otros grupos mostraron una expresión atenuada de STAT3 y TGFB1, genes con funciones reguladoras e inmunomoduladoras. La coincidencia entre estos patrones y las anotaciones clínicas (sexo y presencia de HTA) sugiere una posible asociación entre la hipertensión arterial y una sobreexpresión coordinada de genes proinflamatorios, lo cual es consistente con la literatura que relaciona el estrés oxidativo y la inflamación crónica con el desarrollo de hipertensión.

Además en el heatmap evidenció que los pacientes hipertensos tendieron a agruparse en clústeres con mayor expresión de IL6, TNF y TLR4, mientras que los no hipertensos mostraron una expresión más baja y homogénea. Esto indica la existencia de perfiles transcripcionales diferenciados según el estado clínico, lo que respalda la hipótesis de un componente inmunoinflamatorio en la fisiopatología de la HTA.”

#Volcano_plot

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

datos$hta <- tolower(as.character(datos$hta))    # ahora "si" / "no"
datos$hta <- factor(datos$hta, levels = c("no","si"))

#Selección de genes
genes <- datos %>% select(starts_with("AQ_"))
gene_names <- colnames(genes)

#Dividir grupos ("si" y "no" )
grupo_Si <- datos %>% filter(hta == "si")
grupo_No <- datos %>% filter(hta == "no")

#Calculo de log2FC y p-value por gen y uso de (small pseudocount para evitar division por 0)
epsilon <- 1e-6

genes_Si <- grupo_Si[, gene_names]
genes_No <- grupo_No[, gene_names]

log2FC_vec <- sapply(gene_names, function(gene) {
  mean_si <- mean(genes_Si[[gene]], na.rm = TRUE)
  mean_no <- mean(genes_No[[gene]], na.rm = TRUE)
  log2((mean_si + epsilon) / (mean_no + epsilon))
})

pval_vec <- sapply(gene_names, function(gene) {
  x <- na.omit(grupo_Si[[gene]])
  y <- na.omit(grupo_No[[gene]])
  if(length(x) < 2 || length(y) < 2) return(NA)
  t.test(x, y)$p.value
})

resultados <- data.frame(
  gen = gene_names,
  log2FC = log2FC_vec,
  pvalue = pval_vec,
  negLogP = -log10(pval_vec)
)

#Clasificacion de significancia (umbral p < 0.05 y |log2FC| > 1)
resultados <- resultados %>%
  mutate(
    significativo = case_when(
      !is.na(pvalue) & pvalue < 0.05 & log2FC > 1  ~ "Sobreexpresado",
      !is.na(pvalue) & pvalue < 0.05 & log2FC < -1 ~ "Reprimido",
      TRUE ~ "No significativo"
    )
  )

#Primeras filas
head(resultados)
##                 gen        log2FC    pvalue    negLogP    significativo
## AQ_ADIPOQ AQ_ADIPOQ -14.643853801 0.3236361 0.48994304 No significativo
## AQ_ALOX5   AQ_ALOX5   0.078546554 0.8211087 0.08559934 No significativo
## AQ_ARG1     AQ_ARG1   0.182617631 0.6546783 0.18397208 No significativo
## AQ_BMP2     AQ_BMP2   0.002963636 0.8937587 0.04877971 No significativo
## AQ_CCL2     AQ_CCL2  -0.004224262 0.9549000 0.02004210 No significativo
## AQ_CCL5     AQ_CCL5  -0.327992113 0.3991723 0.39883956 No significativo
#Tabla con los 5 genes más significativos por p-valor
top5_p <- resultados %>% arrange(pvalue) %>% slice_head(n = 5)
write.csv(top5_p, "top5_genes_por_pvalue.csv", row.names = FALSE)

resultados <- resultados %>% filter(!is.na(pvalue))

#Volcano plot
ggplot(resultados, aes(x = log2FC, y = negLogP, color = significativo)) +
  geom_point(size = 2, alpha = 0.8) +
  geom_text(
    data = subset(resultados, pvalue < 0.01 & abs(log2FC) > 2),
    aes(label = gen),
    vjust = -1, size = 3, show.legend = FALSE
  ) +
  labs(
    title = "Volcano plot: HTA (si vs no)",
    x = "log2(Fold Change)",
    y = "-log10(p-valor)",
    color = "Clasificación"
  ) +
  theme_minimal(base_size = 13)

ggsave("Volcano_HTA.png", width = 8, height = 6, dpi = 300)

“El volcano plot representó la magnitud del cambio de expresión (log₂FC) frente a la significancia estadística (–log₁₀ p-valor) para todos los genes de la matriz transcriptómica. Los genes ubicados en los extremos del gráfico, tanto en el cuadrante superior derecho como en el izquierdo, correspondieron a aquellos con mayor diferencia de expresión entre los grupos hipertensos y no hipertensos.

Se identificó que los genes sobreexpresados (marcados de rojo) en el grupo HTA, asociados a rutas inflamatorias y estrés oxidativo, como IL6, TNF, NFKB1 y TLR4. Estas moléculas actúan como mediadores proinflamatorios que promueven la activación de macrófagos, la producción de citocinas y la disfunción endotelial, mecanismos implicados en la elevación crónica de la presión arterial. En cambio, los genes reprimidos (azul), entre ellos FOXO3 y PPARG, se relacionan con la homeostasis metabólica y la regulación antioxidante, indicando una posible pérdida de funciones protectoras en pacientes hipertensos.

Los genes no significativos (gris) se distribuyeron en torno al eje central (log₂FC ≈ 0), reflejando una expresión estable entre los grupos. En conjunto, el gráfico permitió visualizar de forma clara los candidatos génicos con posible relevancia biológica en la HTA y constituye un punto de partida para posteriores análisis funcionales o validaciones experimentales.”