library(DESeq2)
library(genefilter)
library(ggplot2)
library(ggrepel)
library(pheatmap)

SKCM_ICGC_BRAF_vs_RAS_RNA-seq

#load Data
TCGA_SKCM_PvsM <- readRDS("~/Desktop/crg_analysis_railab_tcga_skcm_tmtp_n471_raw_cnts_starseq.rds")
TCGA_SKCM_PvsM_info <- readRDS("~/Desktop/crg_analysis_railab_tcga_skcm_tmtp_n471_sample_info_starseq.rds")

#source functions
source("~/Desktop/plots2Plot.R")

#shift first column to rownames
TCGA_SKCM_PvsM <- as.data.frame(TCGA_SKCM_PvsM)
rownames(TCGA_SKCM_PvsM) <- TCGA_SKCM_PvsM[,1]
TCGA_SKCM_PvsM <- TCGA_SKCM_PvsM[,-1]

#check if column names match metadata
colnames(TCGA_SKCM_PvsM) == TCGA_SKCM_PvsM_info$analysis_id
##   [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE
## [241] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [253] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [265] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [277] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [289] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [301] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [313] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [325] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [337] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [349] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [361] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [373] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [385] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE
## [397] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [409] FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [421] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [433] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [445] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [457] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [469] FALSE FALSE FALSE
#match colnames with metadata
match(colnames(TCGA_SKCM_PvsM), TCGA_SKCM_PvsM_info$analysis_id)
##   [1] 279 361 347 431   2 105 100 331 341 399  72 234 315 130  63 330 291 248
##  [19] 452 442 176 289 203 179 249 295 205  69 193  42 216 422 382 348 106 219
##  [37] 292 454 155  59 118 468  38 362 337 109 309 177 213 141 469  36 275 310
##  [55]  83 428  46 284 122 298 434 425 200  53 420 450 194 283 225 170 404 124
##  [73] 259  64 123 360 217 150 126 138 174 305   6 132 221 104 343  54 272 189
##  [91] 378  41 339 374  76 406 195 117 224 128 457 107 228 467 257  44 379 218
## [109]  79 427 202 394 235 405 166 316  31 349 268  57 471 267  92   8 408 423
## [127] 239 233  17 256 190 466 344 262 282 280  52 134 247 307 236 121 207 401
## [145] 204 115 270 366 208 116 317 137 326 172 211 325  11 135 342 254 417 188
## [163] 253  65  78 286 238 365  96 178  39  19  66 120 263 424 376 227  55 246
## [181] 313 335 184 384 392  61 125 143 380  70  71 111 381 163  73 338 433 329
## [199] 171 261  40  49 192 133 449 403 357 148 296  84 297 146  77  89 142  91
## [217] 161 455 165 445 359 373  82 324 266 398 369  25  97 265 175 183 139  81
## [235] 209 311 201 421  18 240 458 410 367  85 363 149 147 443   9  12 191 180
## [253] 154 301 214  20 226 230  74 169  30 463 198  43 346 412 167 278  94 386
## [271]  90  27 237  21  51 456  50 460 323 396 397   1 186 312 136 112 277 400
## [289] 464  67 370 352 358 152   7 271 158  60 273   4 432 127 181 288  45  29
## [307]  95 244 453 462 415  28 131 182 419 345 229  99 119 113 264 220 440 371
## [325] 250 388 465 353 281  58 258 151  14 407  33 110 231 402  15 285  62 385
## [343] 354 101 391 159 242  24 389 328 430 287 251 429 293 300 320 274 103 157
## [361] 383 413  26 260 319 241 306 437 114   3 162 187  10 333 290 441 196 439
## [379] 356 252 245 212 168 164 156 436 416  88  86 364 332 129 393 451 318  93
## [397] 438 414 314 140  16 294 243 336  47  98 409 377 340 302 411 308 197 435
## [415] 304  68 387  23 276 355   5 108 447 418 199  13 223  56 459  87 299 375
## [433] 444 232 303 145  80 461 102 153 210 255 390  22 446  75  35 222  32 322
## [451]  34 144 215  37 426 470 269 160 321 350 368 351  48 206 395 327 372 185
## [469] 334 448 173
match <- match(colnames(TCGA_SKCM_PvsM), TCGA_SKCM_PvsM_info$analysis_id)
TCGA_SKCM_PvsM_matched <- TCGA_SKCM_PvsM_info[match,]
TCGA_SKCM_PvsM_matched$analysis_id == colnames(TCGA_SKCM_PvsM)
##   [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [211] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [226] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [241] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [256] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [271] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [286] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [301] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [316] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [331] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [346] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [361] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [376] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [391] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [406] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [421] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [436] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [451] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [466] TRUE TRUE TRUE TRUE TRUE TRUE
rownames(TCGA_SKCM_PvsM_matched) <- TCGA_SKCM_PvsM_matched$analysis_id
View(TCGA_SKCM_PvsM_matched)

#Extract Subtype

#BRAF and RAS
extract <- function(TCGA_SKCM_PvsM_matched, MUTATIONSUBTYPES){TCGA_SKCM_PvsM[TCGA_SKCM_PvsM_matched$MUTATIONSUBTYPES %in% MUTATIONSUBTYPES]}
Extract_BRAF_RAS <- extract(TCGA_SKCM_PvsM_matched = TCGA_SKCM_PvsM_matched, MUTATIONSUBTYPES = c("BRAF_Hotspot_Mutants", "RAS_Hotspot_Mutants"))
colnames(Extract_BRAF_RAS) == TCGA_SKCM_PvsM_matched$analysis_id
##   [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [241] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [253] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [265] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [277] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [289] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [301] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [313] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [325] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [337] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [349] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [361] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [373] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [385] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [397] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [409] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [421] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [433] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [445] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [457] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [469] FALSE FALSE FALSE
match(colnames(Extract_BRAF_RAS), TCGA_SKCM_PvsM_matched$analysis_id)
##   [1]   2   3   4   5   6   7   9  10  11  12  13  14  17  19  22  23  24  25
##  [19]  28  29  30  31  33  35  38  39  40  41  45  46  47  49  51  53  54  57
##  [37]  58  61  63  64  66  67  69  70  71  76  78  79  80  83  84  85  87  88
##  [55]  90  92  93  95  99 100 101 102 103 106 108 109 110 111 112 115 118 128
##  [73] 130 132 134 135 137 140 141 142 143 144 145 147 148 149 151 154 155 156
##  [91] 159 160 161 162 164 166 167 169 170 172 175 177 178 181 183 186 190 192
## [109] 194 195 196 197 199 200 201 203 208 209 210 211 213 217 219 220 225 226
## [127] 228 229 230 234 235 237 240 242 243 245 246 247 248 249 250 252 255 257
## [145] 260 264 265 268 272 274 276 277 278 280 283 284 285 286 287 289 291 296
## [163] 297 298 300 303 307 308 312 313 315 318 320 322 323 324 330 332 338 340
## [181] 341 342 343 344 345 346 347 349 350 354 355 356 359 360 361 367 370 373
## [199] 375 376 377 379 383 384 385 386 391 392 393 394 395 396 398 401 402 403
## [217] 404 406 407 408 409 411 415 421 425 428 432 438 442 444 445 446 448 451
## [235] 456 458 459 461 463 466 467 470
match2 <- match(colnames(Extract_BRAF_RAS), TCGA_SKCM_PvsM_matched$analysis_id)
Extract_BRAF_RAS_matched <- TCGA_SKCM_PvsM_matched[match2,]
colnames(Extract_BRAF_RAS) == Extract_BRAF_RAS_matched$analysis_id
##   [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [211] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [226] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [241] TRUE TRUE
View(Extract_BRAF_RAS_matched)

extract2 <- function(Extract_BRAF_RAS_matched, sample_type){Extract_BRAF_RAS[Extract_BRAF_RAS_matched$sample_type %in% sample_type]}
Extract_BRAF_RAS_TM <- extract2(Extract_BRAF_RAS_matched = Extract_BRAF_RAS_matched, sample_type = "TM")
colnames(Extract_BRAF_RAS_TM) == Extract_BRAF_RAS_matched$analysis_id
##   [1]  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
##  [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [241] FALSE FALSE
match(colnames(Extract_BRAF_RAS_TM), Extract_BRAF_RAS_matched$analysis_id)
##   [1]   1   3   4   5   6   7   8  11  12  13  14  15  16  17  18  19  20  21
##  [19]  23  24  25  28  29  30  31  32  33  34  35  36  37  39  41  42  43  44
##  [37]  45  47  48  49  50  51  52  54  55  56  57  58  59  60  61  62  63  64
##  [55]  65  66  67  68  69  71  72  73  75  76  77  79  80  81  82  83  84  86
##  [73]  89  92  93  94  95  97  98  99 100 101 102 104 106 107 108 109 110 111
##  [91] 112 113 114 116 117 118 119 121 122 124 125 126 127 129 130 131 132 133
## [109] 134 135 136 138 139 140 141 142 144 145 146 147 149 151 152 153 154 155
## [127] 156 157 158 160 161 162 163 164 165 166 167 168 169 170 171 173 174 175
## [145] 176 177 178 180 181 183 184 185 186 190 191 193 194 195 197 198 199 200
## [163] 201 202 203 204 205 206 208 209 210 211 213 214 215 217 218 219 220 221
## [181] 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240
## [199] 241
match2 <- match(colnames(Extract_BRAF_RAS_TM), Extract_BRAF_RAS_matched$analysis_id)
Extract_BRAF_RAS_matched_TM <- Extract_BRAF_RAS_matched[match2,]
colnames(Extract_BRAF_RAS_TM) == Extract_BRAF_RAS_matched_TM$analysis_id
##   [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
##  [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE
View(Extract_BRAF_RAS_matched_TM)

#setting factors (levels) and filetering low expressed genes

#BRAFvsRAS
Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES <- factor(Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES) #, levels = c("RAS_Hotspot_Mutants", "BRAF_Hotspot_Mutants"))
Extract_BRAF_RAS_matched_TM$sample_type <- relevel(Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES, ref = "RAS_Hotspot_Mutants")
dds2 <- DESeqDataSetFromMatrix(countData = as.matrix(Extract_BRAF_RAS_TM), colData = Extract_BRAF_RAS_matched_TM, design = ~ MUTATIONSUBTYPES)
dds2 = estimateSizeFactors(dds2)
dat2 = counts(dds2, normalized=TRUE)
ind <- rowMeans(dat2) > 500
dat2 <- dat2[ind,]
dds <- dds2[ind,]
print(dim(dat2))
## [1] 11182   199

PCA analysis

genotypes = Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES
PCAplot(data = log2(dat2+1), genotypes = genotypes, conditions = genotypes,title = Extract_BRAF_RAS)

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.