library(DESeq2)
library(genefilter)
library(ggplot2)
library(ggrepel)
library(pheatmap)
#load Data
TCGA_SKCM_PvsM <- readRDS("~/Desktop/crg_analysis_railab_tcga_skcm_tmtp_n471_raw_cnts_starseq.rds")
TCGA_SKCM_PvsM_info <- readRDS("~/Desktop/crg_analysis_railab_tcga_skcm_tmtp_n471_sample_info_starseq.rds")
#source functions
source("~/Desktop/plots2Plot.R")
#shift first column to rownames
TCGA_SKCM_PvsM <- as.data.frame(TCGA_SKCM_PvsM)
rownames(TCGA_SKCM_PvsM) <- TCGA_SKCM_PvsM[,1]
TCGA_SKCM_PvsM <- TCGA_SKCM_PvsM[,-1]
#check if column names match metadata
colnames(TCGA_SKCM_PvsM) == TCGA_SKCM_PvsM_info$analysis_id
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
## [241] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [253] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [265] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [277] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [289] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [301] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [313] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [325] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [337] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [349] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [361] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [373] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [385] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## [397] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [409] FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [421] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [433] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [445] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [457] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [469] FALSE FALSE FALSE
#match colnames with metadata
match(colnames(TCGA_SKCM_PvsM), TCGA_SKCM_PvsM_info$analysis_id)
## [1] 279 361 347 431 2 105 100 331 341 399 72 234 315 130 63 330 291 248
## [19] 452 442 176 289 203 179 249 295 205 69 193 42 216 422 382 348 106 219
## [37] 292 454 155 59 118 468 38 362 337 109 309 177 213 141 469 36 275 310
## [55] 83 428 46 284 122 298 434 425 200 53 420 450 194 283 225 170 404 124
## [73] 259 64 123 360 217 150 126 138 174 305 6 132 221 104 343 54 272 189
## [91] 378 41 339 374 76 406 195 117 224 128 457 107 228 467 257 44 379 218
## [109] 79 427 202 394 235 405 166 316 31 349 268 57 471 267 92 8 408 423
## [127] 239 233 17 256 190 466 344 262 282 280 52 134 247 307 236 121 207 401
## [145] 204 115 270 366 208 116 317 137 326 172 211 325 11 135 342 254 417 188
## [163] 253 65 78 286 238 365 96 178 39 19 66 120 263 424 376 227 55 246
## [181] 313 335 184 384 392 61 125 143 380 70 71 111 381 163 73 338 433 329
## [199] 171 261 40 49 192 133 449 403 357 148 296 84 297 146 77 89 142 91
## [217] 161 455 165 445 359 373 82 324 266 398 369 25 97 265 175 183 139 81
## [235] 209 311 201 421 18 240 458 410 367 85 363 149 147 443 9 12 191 180
## [253] 154 301 214 20 226 230 74 169 30 463 198 43 346 412 167 278 94 386
## [271] 90 27 237 21 51 456 50 460 323 396 397 1 186 312 136 112 277 400
## [289] 464 67 370 352 358 152 7 271 158 60 273 4 432 127 181 288 45 29
## [307] 95 244 453 462 415 28 131 182 419 345 229 99 119 113 264 220 440 371
## [325] 250 388 465 353 281 58 258 151 14 407 33 110 231 402 15 285 62 385
## [343] 354 101 391 159 242 24 389 328 430 287 251 429 293 300 320 274 103 157
## [361] 383 413 26 260 319 241 306 437 114 3 162 187 10 333 290 441 196 439
## [379] 356 252 245 212 168 164 156 436 416 88 86 364 332 129 393 451 318 93
## [397] 438 414 314 140 16 294 243 336 47 98 409 377 340 302 411 308 197 435
## [415] 304 68 387 23 276 355 5 108 447 418 199 13 223 56 459 87 299 375
## [433] 444 232 303 145 80 461 102 153 210 255 390 22 446 75 35 222 32 322
## [451] 34 144 215 37 426 470 269 160 321 350 368 351 48 206 395 327 372 185
## [469] 334 448 173
match <- match(colnames(TCGA_SKCM_PvsM), TCGA_SKCM_PvsM_info$analysis_id)
TCGA_SKCM_PvsM_matched <- TCGA_SKCM_PvsM_info[match,]
TCGA_SKCM_PvsM_matched$analysis_id == colnames(TCGA_SKCM_PvsM)
## [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [211] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [226] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [241] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [256] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [271] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [286] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [301] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [316] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [331] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [346] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [361] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [376] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [391] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [406] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [421] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [436] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [451] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [466] TRUE TRUE TRUE TRUE TRUE TRUE
rownames(TCGA_SKCM_PvsM_matched) <- TCGA_SKCM_PvsM_matched$analysis_id
View(TCGA_SKCM_PvsM_matched)
#Extract Subtype
#BRAF and RAS
extract <- function(TCGA_SKCM_PvsM_matched, MUTATIONSUBTYPES){TCGA_SKCM_PvsM[TCGA_SKCM_PvsM_matched$MUTATIONSUBTYPES %in% MUTATIONSUBTYPES]}
Extract_BRAF_RAS <- extract(TCGA_SKCM_PvsM_matched = TCGA_SKCM_PvsM_matched, MUTATIONSUBTYPES = c("BRAF_Hotspot_Mutants", "RAS_Hotspot_Mutants"))
colnames(Extract_BRAF_RAS) == TCGA_SKCM_PvsM_matched$analysis_id
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [241] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [253] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [265] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [277] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [289] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [301] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [313] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [325] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [337] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [349] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [361] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [373] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [385] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [397] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [409] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [421] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [433] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [445] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [457] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [469] FALSE FALSE FALSE
match(colnames(Extract_BRAF_RAS), TCGA_SKCM_PvsM_matched$analysis_id)
## [1] 2 3 4 5 6 7 9 10 11 12 13 14 17 19 22 23 24 25
## [19] 28 29 30 31 33 35 38 39 40 41 45 46 47 49 51 53 54 57
## [37] 58 61 63 64 66 67 69 70 71 76 78 79 80 83 84 85 87 88
## [55] 90 92 93 95 99 100 101 102 103 106 108 109 110 111 112 115 118 128
## [73] 130 132 134 135 137 140 141 142 143 144 145 147 148 149 151 154 155 156
## [91] 159 160 161 162 164 166 167 169 170 172 175 177 178 181 183 186 190 192
## [109] 194 195 196 197 199 200 201 203 208 209 210 211 213 217 219 220 225 226
## [127] 228 229 230 234 235 237 240 242 243 245 246 247 248 249 250 252 255 257
## [145] 260 264 265 268 272 274 276 277 278 280 283 284 285 286 287 289 291 296
## [163] 297 298 300 303 307 308 312 313 315 318 320 322 323 324 330 332 338 340
## [181] 341 342 343 344 345 346 347 349 350 354 355 356 359 360 361 367 370 373
## [199] 375 376 377 379 383 384 385 386 391 392 393 394 395 396 398 401 402 403
## [217] 404 406 407 408 409 411 415 421 425 428 432 438 442 444 445 446 448 451
## [235] 456 458 459 461 463 466 467 470
match2 <- match(colnames(Extract_BRAF_RAS), TCGA_SKCM_PvsM_matched$analysis_id)
Extract_BRAF_RAS_matched <- TCGA_SKCM_PvsM_matched[match2,]
colnames(Extract_BRAF_RAS) == Extract_BRAF_RAS_matched$analysis_id
## [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [211] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [226] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [241] TRUE TRUE
View(Extract_BRAF_RAS_matched)
extract2 <- function(Extract_BRAF_RAS_matched, sample_type){Extract_BRAF_RAS[Extract_BRAF_RAS_matched$sample_type %in% sample_type]}
Extract_BRAF_RAS_TM <- extract2(Extract_BRAF_RAS_matched = Extract_BRAF_RAS_matched, sample_type = "TM")
colnames(Extract_BRAF_RAS_TM) == Extract_BRAF_RAS_matched$analysis_id
## [1] TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [49] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [73] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [85] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [97] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [133] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [145] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [157] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [169] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [181] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [193] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [205] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [217] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [229] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [241] FALSE FALSE
match(colnames(Extract_BRAF_RAS_TM), Extract_BRAF_RAS_matched$analysis_id)
## [1] 1 3 4 5 6 7 8 11 12 13 14 15 16 17 18 19 20 21
## [19] 23 24 25 28 29 30 31 32 33 34 35 36 37 39 41 42 43 44
## [37] 45 47 48 49 50 51 52 54 55 56 57 58 59 60 61 62 63 64
## [55] 65 66 67 68 69 71 72 73 75 76 77 79 80 81 82 83 84 86
## [73] 89 92 93 94 95 97 98 99 100 101 102 104 106 107 108 109 110 111
## [91] 112 113 114 116 117 118 119 121 122 124 125 126 127 129 130 131 132 133
## [109] 134 135 136 138 139 140 141 142 144 145 146 147 149 151 152 153 154 155
## [127] 156 157 158 160 161 162 163 164 165 166 167 168 169 170 171 173 174 175
## [145] 176 177 178 180 181 183 184 185 186 190 191 193 194 195 197 198 199 200
## [163] 201 202 203 204 205 206 208 209 210 211 213 214 215 217 218 219 220 221
## [181] 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240
## [199] 241
match2 <- match(colnames(Extract_BRAF_RAS_TM), Extract_BRAF_RAS_matched$analysis_id)
Extract_BRAF_RAS_matched_TM <- Extract_BRAF_RAS_matched[match2,]
colnames(Extract_BRAF_RAS_TM) == Extract_BRAF_RAS_matched_TM$analysis_id
## [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [31] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [46] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [76] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [91] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [106] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [136] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [151] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [166] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [181] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [196] TRUE TRUE TRUE TRUE
View(Extract_BRAF_RAS_matched_TM)
#setting factors (levels) and filetering low expressed genes
#BRAFvsRAS
Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES <- factor(Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES) #, levels = c("RAS_Hotspot_Mutants", "BRAF_Hotspot_Mutants"))
Extract_BRAF_RAS_matched_TM$sample_type <- relevel(Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES, ref = "RAS_Hotspot_Mutants")
dds2 <- DESeqDataSetFromMatrix(countData = as.matrix(Extract_BRAF_RAS_TM), colData = Extract_BRAF_RAS_matched_TM, design = ~ MUTATIONSUBTYPES)
dds2 = estimateSizeFactors(dds2)
dat2 = counts(dds2, normalized=TRUE)
ind <- rowMeans(dat2) > 500
dat2 <- dat2[ind,]
dds <- dds2[ind,]
print(dim(dat2))
## [1] 11182 199
genotypes = Extract_BRAF_RAS_matched_TM$MUTATIONSUBTYPES
PCAplot(data = log2(dat2+1), genotypes = genotypes, conditions = genotypes,title = Extract_BRAF_RAS)
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.