Na aula faremos um apanhado geral sobre as características da linguagem R, envolvendo o uso de codigos para sumarização de dados. Serão demonstradas também as estruturas de laços de loop e repetição, bem como a criação de funções.
Nesta etapa, carregamos as bibliotecas necessárias para realizar análises. Elas incluem ferramentas para estatística multivariada, visualização e clusterização.
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.4.4 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(vegan)
## Carregando pacotes exigidos: permute
## Carregando pacotes exigidos: lattice
library(cluster)
library(FactoMineR)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(MASS)
##
## Anexando pacote: 'MASS'
##
## O seguinte objeto é mascarado por 'package:dplyr':
##
## select
dados <- read.csv("dataset_biotecnologia_bioinformatica.csv", header = TRUE, row.names = 1)
head(dados)
## GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001 74.11829 0.007434746 53.30684 37.25679
## SAMP_002 79.22424 0.011495031 62.59375 27.21473
## SAMP_003 134.87424 0.011992478 43.48266 37.25540
## SAMP_004 84.03875 0.010909128 67.10306 35.10971
## SAMP_005 100.59366 0.001051073 60.02868 38.22588
## SAMP_006 121.38632 0.019778563 52.96255 41.95792
## Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001 216.1288 9.290182 4.897089 0.99891841 Low_A
## SAMP_002 178.2917 8.634924 4.717372 0.04061612 High_A
## SAMP_003 251.6240 6.692604 5.142426 0.64582252 High_A
## SAMP_004 190.2829 12.506672 5.541231 0.03869959 Low_A
## SAMP_005 229.7035 7.341842 6.340099 0.76021026 Low_A
## SAMP_006 190.0444 10.556067 3.430744 0.23008996 High_A
Nesta seção, inserimos exemplos básicos de loops e funções antes das análises. Mas primeiro:
| Característica | Linguagem R | Linguagem Python |
|---|---|---|
| Finalidade da Indentação | Principalmente para Legibilidade e Bom Estilo de código. | Obrigatória para a Funcionalidade e Estrutura do código (define blocos/escopo). |
| Delimitador de Bloco | Chaves ({}) definem onde
o bloco de código começa e termina. |
Indentação (espaços) define onde o bloco de código começa e termina. Não usa chaves. |
| Espaços Padrão | 2 espaços por nível de indentação é a convenção mais amplamente aceita. | 4 espaços por nível de indentação é a regra estrita da convenção PEP 8. |
| Quebra de Linha | Quebrar após o operador pipe
(%>%) ou operador binário (+,
-, *). Indentar a nova linha. |
Quebrar antes de um operador binário (+,
-, *). Indentar a nova linha. |
| Exemplo Estrutura | if (x > 0) { print("Positivo")} else { print("Não positivo")} |
if x > 0: print("Positivo")else: print("Não positivo") |
| Importância | Sem indentação, o código ainda roda. A chave é o fator delimitador. | Sem indentação correta, o código falha com um erro
(IndentationError). |
formedias_for <- NULL
for (i in 1:ncol(dados)) {
medias_for[i] <- mean(dados[[i]])
}
## Warning in mean.default(dados[[i]]): argumento não é numérico nem lógico:
## retornando NA
medias_for
## [1] 100.81893412 0.01094278 50.22039545 38.72790725 195.63239499
## [6] 9.94047035 4.76958043 0.53766856 NA
library(dplyr)
dados %>%
summarise(across(where(is.numeric), mean, na.rm = TRUE))
## Warning: There was 1 warning in `summarise()`.
## ℹ In argument: `across(where(is.numeric), mean, na.rm = TRUE)`.
## Caused by warning:
## ! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
## Supply arguments directly to `.fns` through an anonymous function instead.
##
## # Previously
## across(a:b, mean, na.rm = TRUE)
##
## # Now
## across(a:b, \(x) mean(x, na.rm = TRUE))
## GeneExpression_B MutationRate GC_Content Coverage_Depth Protein_Abundance
## 1 100.8189 0.01094278 50.2204 38.72791 195.6324
## Metabolite_X Metabolite_Y PathwayScore
## 1 9.94047 4.76958 0.5376686
whileA estrutura while em R é um tipo de loop que executa um bloco de código enquanto uma condição lógica for verdadeira. Ela é usada quando não sabemos previamente quantas repetições serão necessárias, mas sabemos a condição de parada.
contador <- 1
soma <- 0
while (contador <= 8) {
soma <- soma + mean(dados[[contador]])
contador <- contador + 1
}
soma
## [1] 400.6583
O que acontece se você esquecer o “contador” ?
library(dplyr)
soma <- dados %>%
dplyr::select(where(is.numeric)) %>%
summarise(across(everything(), mean)) %>%
sum()
soma
## [1] 400.6583
resumo_var <- function(coluna) {
media <- mean(coluna)
dp <- sd(coluna)
return(list(media = media, desvio = dp))
}
resumo_var(dados$GC_Content)
## $media
## [1] 50.2204
##
## $desvio
## [1] 11.88766
Suponha a variável chamada GeneExpression_A (expressão de um gene importante). Podemos criar uma classificação simples:
expr_media <- mean(dados$GeneExpression_B)
expr_media
## [1] 100.8189
if (expr_media > 100) {
cat("A expressão média de Gene foi ALTA.\n")
} else {
cat("A expressão média de Gene foi MODERADA ou BAIXA.\n")
}
## A expressão média de Gene foi ALTA.
Aqui vamos transformar valores numéricos em categorias úteis para análise posterior
dados$Categoria_Mutation <- ifelse(
dados$MutationRate > 0.01,
"Alta",
"Baixa"
)
Resultado:
dados
## GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001 74.11829 0.007434746 53.30684 37.25679
## SAMP_002 79.22424 0.011495031 62.59375 27.21473
## SAMP_003 134.87424 0.011992478 43.48266 37.25540
## SAMP_004 84.03875 0.010909128 67.10306 35.10971
## SAMP_005 100.59366 0.001051073 60.02868 38.22588
## SAMP_006 121.38632 0.019778563 52.96255 41.95792
## SAMP_007 117.81413 0.018201490 60.06576 40.88596
## SAMP_008 135.09772 0.004945081 33.16596 39.85016
## SAMP_009 129.91288 0.006557299 64.37556 40.99791
## SAMP_010 121.38785 0.010880193 62.86016 39.36941
## SAMP_011 84.54583 0.018136316 66.39487 40.98509
## SAMP_012 115.89725 0.019688987 35.14525 23.84472
## SAMP_013 106.28544 0.005893299 33.27120 38.65353
## SAMP_014 73.47469 0.011722822 35.53662 39.44575
## SAMP_015 128.34598 0.016332405 45.97515 38.29369
## SAMP_016 116.14473 0.008493031 46.97227 38.91027
## SAMP_017 100.90980 0.014890388 52.48874 43.51655
## SAMP_018 95.33816 0.004060311 34.88974 37.00947
## SAMP_019 76.03398 0.012413273 38.05598 51.00351
## SAMP_020 103.99048 0.017451425 62.46577 43.44148
## SAMP_021 109.36878 0.019686911 48.71950 39.96846
## SAMP_022 83.37690 0.002507950 62.31753 38.96669
## SAMP_023 123.24408 0.009138598 30.29706 39.56739
## SAMP_024 78.05594 0.004886314 52.06371 35.42346
## SAMP_025 57.53799 0.009562093 67.27729 39.52399
## SAMP_026 120.79454 0.011407508 53.28702 41.39342
## SAMP_027 91.93268 0.002773207 38.24383 42.89771
## SAMP_028 97.47941 0.006640355 58.71030 42.89845
## SAMP_029 83.24967 0.018624101 45.15943 38.62561
## SAMP_030 67.88074 0.011811071 56.73536 32.91959
## SAMP_031 125.10475 0.009690828 31.17279 36.65449
## SAMP_032 86.22262 0.015316994 55.43601 48.06097
## SAMP_033 133.21905 0.015095381 31.28792 44.48029
## SAMP_034 116.14616 0.001923002 59.79123 41.84810
## SAMP_035 93.70484 0.014465251 48.91652 36.19353
## SAMP_036 78.28195 0.016945624 34.87017 40.01823
## SAMP_037 85.35076 0.004152820 51.70544 33.72166
## SAMP_038 75.74954 0.015838961 32.67098 37.24032
## SAMP_039 141.74227 0.006444196 56.13459 38.77398
## SAMP_040 103.28882 0.006822925 69.84345 38.19180
## SAMP_041 123.00411 0.013639968 60.77589 44.78301
## SAMP_042 74.65296 0.003116451 52.95096 32.90637
## SAMP_043 103.62070 0.013632577 34.10541 35.67284
## SAMP_044 123.55724 0.017869279 57.99336 33.12656
## SAMP_045 93.29978 0.014229914 56.44671 33.81323
## SAMP_046 120.62229 0.009366230 31.96389 40.62028
## SAMP_047 78.30864 0.009326073 61.69197 31.99780
## SAMP_048 72.73057 0.015536826 50.74866 43.76934
## SAMP_049 107.58801 0.011747198 47.03471 38.76592
## SAMP_050 92.41647 0.002613179 61.52749 40.34394
## Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001 216.12884 9.290182 4.897089 9.989184e-01 Low_A
## SAMP_002 178.29167 8.634924 4.717372 4.061612e-02 High_A
## SAMP_003 251.62399 6.692604 5.142426 6.458225e-01 High_A
## SAMP_004 190.28286 12.506672 5.541231 3.869959e-02 Low_A
## SAMP_005 229.70351 7.341842 6.340099 7.602103e-01 Low_A
## SAMP_006 190.04438 10.556067 3.430744 2.300900e-01 High_A
## SAMP_007 214.54372 7.850467 4.489657 8.983187e-02 Low_A
## SAMP_008 213.98313 11.336634 4.552229 6.484497e-01 Low_A
## SAMP_009 212.49850 11.911665 5.937850 7.326012e-01 High_A
## SAMP_010 151.28461 8.244773 4.643337 6.780953e-01 Low_A
## SAMP_011 221.79379 6.152569 3.104824 5.190095e-02 Low_A
## SAMP_012 184.05215 11.391575 5.087730 2.943069e-01 High_A
## SAMP_013 231.52440 13.751601 4.966311 4.510883e-01 High_A
## SAMP_014 92.37533 10.831389 5.179752 2.871033e-01 Low_A
## SAMP_015 126.74419 10.321089 3.959837 8.105135e-01 Low_A
## SAMP_016 218.17228 11.639521 6.719035 1.311151e-01 Low_A
## SAMP_017 293.14638 11.530110 4.676140 6.121794e-01 High_A
## SAMP_018 241.75294 8.342022 4.811703 9.882149e-01 High_A
## SAMP_019 165.87745 8.681697 4.099991 9.025565e-01 High_A
## SAMP_020 115.39738 11.222247 4.068998 2.221571e-01 High_A
## SAMP_021 237.13431 9.711973 3.777263 8.188761e-05 High_A
## SAMP_022 195.97084 12.633211 4.606689 9.805973e-01 High_A
## SAMP_023 229.53521 8.591316 4.042418 8.827130e-01 Low_A
## SAMP_024 205.76494 11.501220 7.056467 9.194725e-01 High_A
## SAMP_025 201.48215 10.685276 3.111508 4.155036e-01 Low_A
## SAMP_026 347.93127 9.747125 3.871669 7.446155e-01 Low_A
## SAMP_027 199.69350 12.351822 4.598586 2.128315e-01 High_A
## SAMP_028 192.03774 11.360143 5.673491 3.923041e-01 Low_A
## SAMP_029 193.92757 7.990066 4.586243 8.515481e-01 Low_A
## SAMP_030 170.82316 11.280437 5.675963 1.276122e-01 Low_A
## SAMP_031 249.50664 12.749981 4.013196 8.938654e-01 Low_A
## SAMP_032 182.31228 9.739111 5.059291 4.965080e-01 Low_A
## SAMP_033 231.79714 9.502688 6.744041 4.260957e-01 Low_A
## SAMP_034 214.23015 8.660706 4.032256 3.056464e-01 Low_A
## SAMP_035 260.94929 9.972792 5.419568 9.168488e-01 High_A
## SAMP_036 221.00898 11.372401 5.206928 5.176235e-01 Low_A
## SAMP_037 139.33076 8.364663 2.748465 8.040264e-01 High_A
## SAMP_038 133.67561 7.307285 4.411029 8.576518e-01 High_A
## SAMP_039 270.41846 9.248500 6.131152 9.223824e-01 Low_A
## SAMP_040 169.56446 7.240550 5.135078 3.033807e-01 High_A
## SAMP_041 133.96987 11.046437 3.787731 3.398109e-01 Low_A
## SAMP_042 166.51907 9.146620 5.690777 5.950739e-01 Low_A
## SAMP_043 263.23126 6.489196 4.520877 4.413241e-01 Low_A
## SAMP_044 128.98935 9.302785 5.360051 9.328425e-01 High_A
## SAMP_045 156.67524 9.614770 5.376920 3.975641e-01 High_A
## SAMP_046 166.65962 10.898271 3.881304 4.777780e-01 High_A
## SAMP_047 137.44051 9.709273 5.789828 6.171861e-01 High_A
## SAMP_048 140.78363 13.737453 3.992491 4.047395e-01 High_A
## SAMP_049 124.09460 8.962592 3.694214 9.924784e-01 High_A
## SAMP_050 176.94063 9.875203 4.117171 9.885128e-02 High_A
## Categoria_Mutation
## SAMP_001 Baixa
## SAMP_002 Alta
## SAMP_003 Alta
## SAMP_004 Alta
## SAMP_005 Baixa
## SAMP_006 Alta
## SAMP_007 Alta
## SAMP_008 Baixa
## SAMP_009 Baixa
## SAMP_010 Alta
## SAMP_011 Alta
## SAMP_012 Alta
## SAMP_013 Baixa
## SAMP_014 Alta
## SAMP_015 Alta
## SAMP_016 Baixa
## SAMP_017 Alta
## SAMP_018 Baixa
## SAMP_019 Alta
## SAMP_020 Alta
## SAMP_021 Alta
## SAMP_022 Baixa
## SAMP_023 Baixa
## SAMP_024 Baixa
## SAMP_025 Baixa
## SAMP_026 Alta
## SAMP_027 Baixa
## SAMP_028 Baixa
## SAMP_029 Alta
## SAMP_030 Alta
## SAMP_031 Baixa
## SAMP_032 Alta
## SAMP_033 Alta
## SAMP_034 Baixa
## SAMP_035 Alta
## SAMP_036 Alta
## SAMP_037 Baixa
## SAMP_038 Alta
## SAMP_039 Baixa
## SAMP_040 Baixa
## SAMP_041 Alta
## SAMP_042 Baixa
## SAMP_043 Alta
## SAMP_044 Alta
## SAMP_045 Alta
## SAMP_046 Baixa
## SAMP_047 Baixa
## SAMP_048 Alta
## SAMP_049 Alta
## SAMP_050 Baixa
summary(dados)
## GeneExpression_B MutationRate GC_Content Coverage_Depth
## Min. : 57.54 Min. :0.001051 Min. :30.30 Min. :23.84
## 1st Qu.: 83.28 1st Qu.:0.006578 1st Qu.:38.10 1st Qu.:36.74
## Median :100.75 Median :0.011451 Median :52.72 Median :38.94
## Mean :100.82 Mean :0.010943 Mean :50.22 Mean :38.73
## 3rd Qu.:120.75 3rd Qu.:0.015262 3rd Qu.:60.06 3rd Qu.:40.99
## Max. :141.74 Max. :0.019779 Max. :69.84 Max. :51.00
## Protein_Abundance Metabolite_X Metabolite_Y PathwayScore
## Min. : 92.38 Min. : 6.153 Min. :2.748 Min. :8.189e-05
## 1st Qu.:166.04 1st Qu.: 8.641 1st Qu.:4.035 1st Qu.:2.966e-01
## Median :194.95 Median : 9.743 Median :4.660 Median :5.071e-01
## Mean :195.63 Mean : 9.940 Mean :4.770 Mean :5.377e-01
## 3rd Qu.:227.60 3rd Qu.:11.354 3rd Qu.:5.373 3rd Qu.:8.413e-01
## Max. :347.93 Max. :13.752 Max. :7.056 Max. :9.989e-01
## Target_Class Categoria_Mutation
## Length:50 Length:50
## Class :character Class :character
## Mode :character Mode :character
##
##
##
cor_mat <- cor(dados[,1:8])
cor_mat
## GeneExpression_B MutationRate GC_Content Coverage_Depth
## GeneExpression_B 1.00000000 0.06809685 -0.18870467 0.118872127
## MutationRate 0.06809685 1.00000000 -0.09595584 0.037265753
## GC_Content -0.18870467 -0.09595584 1.00000000 -0.026489144
## Coverage_Depth 0.11887213 0.03726575 -0.02648914 1.000000000
## Protein_Abundance 0.29401515 -0.11881031 -0.15044151 0.091580231
## Metabolite_X -0.04667775 -0.10236329 -0.09120914 0.092602661
## Metabolite_Y 0.03758577 -0.22289977 0.01226474 -0.221228276
## PathwayScore 0.09152632 -0.22825347 -0.26886474 -0.008345773
## Protein_Abundance Metabolite_X Metabolite_Y PathwayScore
## GeneExpression_B 0.29401515 -0.04667775 0.03758577 0.091526322
## MutationRate -0.11881031 -0.10236329 -0.22289977 -0.228253472
## GC_Content -0.15044151 -0.09120914 0.01226474 -0.268864741
## Coverage_Depth 0.09158023 0.09260266 -0.22122828 -0.008345773
## Protein_Abundance 1.00000000 -0.05882687 0.13330802 0.112768785
## Metabolite_X -0.05882687 1.00000000 0.12868616 -0.122566725
## Metabolite_Y 0.13330802 0.12868616 1.00000000 0.077547876
## PathwayScore 0.11276878 -0.12256673 0.07754788 1.000000000
Gráfico:
library(corrplot)
## corrplot 0.95 loaded
corrplot::corrplot(cor_mat, method = "color", tl.cex = 0.8)
ggplot(stack(dados[,1:8]), aes(x = ind, y = values)) +
geom_boxplot() +
theme_minimal() +
labs(title = "Distribuição das Variáveis", x = "Variáveis", y = "Valores") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
A MANOVA testa diferenças multivariadas entre grupos considerando várias variáveis-resposta simultaneamente. É útil em experimentos com múltiplos marcadores moleculares, perfis de expressão gênica ou características fenotípicas medidas em conjunto. Criamos uma variável de grupo fictícia para fins didáticos.
Grupo <- factor(rep(c("A","B","C","D"), length.out = nrow(dados)))
modelo_manova <- manova(as.matrix(dados[,1:8]) ~ Grupo)
summary(modelo_manova)
## Df Pillai approx F num Df den Df Pr(>F)
## Grupo 3 0.49425 1.0109 24 123 0.4581
## Residuals 46
summary.aov(modelo_manova)
## Response GeneExpression_B :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 1046.3 348.75 0.7441 0.5313
## Residuals 46 21559.1 468.68
##
## Response MutationRate :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 0.00007825 2.6085e-05 0.8845 0.4562
## Residuals 46 0.00135663 2.9492e-05
##
## Response GC_Content :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 264.6 88.185 0.6091 0.6125
## Residuals 46 6660.0 144.782
##
## Response Coverage_Depth :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 20.39 6.7959 0.2978 0.8268
## Residuals 46 1049.59 22.8171
##
## Response Protein_Abundance :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 9120 3040.0 1.2316 0.309
## Residuals 46 113540 2468.3
##
## Response Metabolite_X :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 24.108 8.0360 2.5727 0.06547 .
## Residuals 46 143.684 3.1236
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Response Metabolite_Y :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 4.335 1.44500 1.6127 0.1993
## Residuals 46 41.217 0.89601
##
## Response PathwayScore :
## Df Sum Sq Mean Sq F value Pr(>F)
## Grupo 3 0.2572 0.085746 0.8774 0.4597
## Residuals 46 4.4952 0.097722
A clusterização permite identificar agrupamentos naturais entre as amostras com base em múltiplas variáveis. Essa técnica é amplamente usada em Bioinformática, por exemplo, na identificação de padrões de expressão gênica. ## Normalização dos Dados
dados_sc <- scale(dados[,1:8])
dist_euc <- dist(dados_sc, method = "euclidean")
dist_man <- dist(dados_sc, method = "manhattan")
town_ward <- hclust(dist_euc, method = "ward.D2")
town_avg <- hclust(dist_euc, method = "average")
town_comp <- hclust(dist_euc, method = "complete")
plot(town_ward, main="Ward - Distância Euclidiana")
plot(town_avg, main="UPGMA - Distância Euclidiana")
plot(town_comp, main="Ligação Completa - Distância Euclidiana")
k3 <- kmeans(dados_sc, centers = 3)
Gráfico:
fviz_cluster(k3, data = dados_sc, main = "Clusterização K-means (k=3)")
A PCA reduz a dimensionalidade dos dados preservando a maior variação possível. Em biotecnologia, é comum usá-la para explorar dados ômicos (RNA-seq, proteômica, metabolômica).
pca_res <- PCA(dados[,1:8], scale.unit = TRUE, graph = FALSE)
Gráficos:
fviz_pca_biplot(pca_res, repel = TRUE) +
ggtitle("Biplot PCA - Dados de Biotecnologia e Bioinformática")
fviz_pca_var(pca_res,
repel = TRUE,
col.var = "steelblue") +
ggtitle("PCA – Apenas Variáveis")
fviz_pca_biplot(
pca_res,
repel = TRUE,
habillage = as.factor(dados$Categoria_Mutation), # fator
addEllipses = TRUE, # adiciona elipses
ellipse.level = 0.95 # nível de confiança
) +
ggtitle("Biplot PCA com Elipses por Grupo")
dados
## GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001 74.11829 0.007434746 53.30684 37.25679
## SAMP_002 79.22424 0.011495031 62.59375 27.21473
## SAMP_003 134.87424 0.011992478 43.48266 37.25540
## SAMP_004 84.03875 0.010909128 67.10306 35.10971
## SAMP_005 100.59366 0.001051073 60.02868 38.22588
## SAMP_006 121.38632 0.019778563 52.96255 41.95792
## SAMP_007 117.81413 0.018201490 60.06576 40.88596
## SAMP_008 135.09772 0.004945081 33.16596 39.85016
## SAMP_009 129.91288 0.006557299 64.37556 40.99791
## SAMP_010 121.38785 0.010880193 62.86016 39.36941
## SAMP_011 84.54583 0.018136316 66.39487 40.98509
## SAMP_012 115.89725 0.019688987 35.14525 23.84472
## SAMP_013 106.28544 0.005893299 33.27120 38.65353
## SAMP_014 73.47469 0.011722822 35.53662 39.44575
## SAMP_015 128.34598 0.016332405 45.97515 38.29369
## SAMP_016 116.14473 0.008493031 46.97227 38.91027
## SAMP_017 100.90980 0.014890388 52.48874 43.51655
## SAMP_018 95.33816 0.004060311 34.88974 37.00947
## SAMP_019 76.03398 0.012413273 38.05598 51.00351
## SAMP_020 103.99048 0.017451425 62.46577 43.44148
## SAMP_021 109.36878 0.019686911 48.71950 39.96846
## SAMP_022 83.37690 0.002507950 62.31753 38.96669
## SAMP_023 123.24408 0.009138598 30.29706 39.56739
## SAMP_024 78.05594 0.004886314 52.06371 35.42346
## SAMP_025 57.53799 0.009562093 67.27729 39.52399
## SAMP_026 120.79454 0.011407508 53.28702 41.39342
## SAMP_027 91.93268 0.002773207 38.24383 42.89771
## SAMP_028 97.47941 0.006640355 58.71030 42.89845
## SAMP_029 83.24967 0.018624101 45.15943 38.62561
## SAMP_030 67.88074 0.011811071 56.73536 32.91959
## SAMP_031 125.10475 0.009690828 31.17279 36.65449
## SAMP_032 86.22262 0.015316994 55.43601 48.06097
## SAMP_033 133.21905 0.015095381 31.28792 44.48029
## SAMP_034 116.14616 0.001923002 59.79123 41.84810
## SAMP_035 93.70484 0.014465251 48.91652 36.19353
## SAMP_036 78.28195 0.016945624 34.87017 40.01823
## SAMP_037 85.35076 0.004152820 51.70544 33.72166
## SAMP_038 75.74954 0.015838961 32.67098 37.24032
## SAMP_039 141.74227 0.006444196 56.13459 38.77398
## SAMP_040 103.28882 0.006822925 69.84345 38.19180
## SAMP_041 123.00411 0.013639968 60.77589 44.78301
## SAMP_042 74.65296 0.003116451 52.95096 32.90637
## SAMP_043 103.62070 0.013632577 34.10541 35.67284
## SAMP_044 123.55724 0.017869279 57.99336 33.12656
## SAMP_045 93.29978 0.014229914 56.44671 33.81323
## SAMP_046 120.62229 0.009366230 31.96389 40.62028
## SAMP_047 78.30864 0.009326073 61.69197 31.99780
## SAMP_048 72.73057 0.015536826 50.74866 43.76934
## SAMP_049 107.58801 0.011747198 47.03471 38.76592
## SAMP_050 92.41647 0.002613179 61.52749 40.34394
## Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001 216.12884 9.290182 4.897089 9.989184e-01 Low_A
## SAMP_002 178.29167 8.634924 4.717372 4.061612e-02 High_A
## SAMP_003 251.62399 6.692604 5.142426 6.458225e-01 High_A
## SAMP_004 190.28286 12.506672 5.541231 3.869959e-02 Low_A
## SAMP_005 229.70351 7.341842 6.340099 7.602103e-01 Low_A
## SAMP_006 190.04438 10.556067 3.430744 2.300900e-01 High_A
## SAMP_007 214.54372 7.850467 4.489657 8.983187e-02 Low_A
## SAMP_008 213.98313 11.336634 4.552229 6.484497e-01 Low_A
## SAMP_009 212.49850 11.911665 5.937850 7.326012e-01 High_A
## SAMP_010 151.28461 8.244773 4.643337 6.780953e-01 Low_A
## SAMP_011 221.79379 6.152569 3.104824 5.190095e-02 Low_A
## SAMP_012 184.05215 11.391575 5.087730 2.943069e-01 High_A
## SAMP_013 231.52440 13.751601 4.966311 4.510883e-01 High_A
## SAMP_014 92.37533 10.831389 5.179752 2.871033e-01 Low_A
## SAMP_015 126.74419 10.321089 3.959837 8.105135e-01 Low_A
## SAMP_016 218.17228 11.639521 6.719035 1.311151e-01 Low_A
## SAMP_017 293.14638 11.530110 4.676140 6.121794e-01 High_A
## SAMP_018 241.75294 8.342022 4.811703 9.882149e-01 High_A
## SAMP_019 165.87745 8.681697 4.099991 9.025565e-01 High_A
## SAMP_020 115.39738 11.222247 4.068998 2.221571e-01 High_A
## SAMP_021 237.13431 9.711973 3.777263 8.188761e-05 High_A
## SAMP_022 195.97084 12.633211 4.606689 9.805973e-01 High_A
## SAMP_023 229.53521 8.591316 4.042418 8.827130e-01 Low_A
## SAMP_024 205.76494 11.501220 7.056467 9.194725e-01 High_A
## SAMP_025 201.48215 10.685276 3.111508 4.155036e-01 Low_A
## SAMP_026 347.93127 9.747125 3.871669 7.446155e-01 Low_A
## SAMP_027 199.69350 12.351822 4.598586 2.128315e-01 High_A
## SAMP_028 192.03774 11.360143 5.673491 3.923041e-01 Low_A
## SAMP_029 193.92757 7.990066 4.586243 8.515481e-01 Low_A
## SAMP_030 170.82316 11.280437 5.675963 1.276122e-01 Low_A
## SAMP_031 249.50664 12.749981 4.013196 8.938654e-01 Low_A
## SAMP_032 182.31228 9.739111 5.059291 4.965080e-01 Low_A
## SAMP_033 231.79714 9.502688 6.744041 4.260957e-01 Low_A
## SAMP_034 214.23015 8.660706 4.032256 3.056464e-01 Low_A
## SAMP_035 260.94929 9.972792 5.419568 9.168488e-01 High_A
## SAMP_036 221.00898 11.372401 5.206928 5.176235e-01 Low_A
## SAMP_037 139.33076 8.364663 2.748465 8.040264e-01 High_A
## SAMP_038 133.67561 7.307285 4.411029 8.576518e-01 High_A
## SAMP_039 270.41846 9.248500 6.131152 9.223824e-01 Low_A
## SAMP_040 169.56446 7.240550 5.135078 3.033807e-01 High_A
## SAMP_041 133.96987 11.046437 3.787731 3.398109e-01 Low_A
## SAMP_042 166.51907 9.146620 5.690777 5.950739e-01 Low_A
## SAMP_043 263.23126 6.489196 4.520877 4.413241e-01 Low_A
## SAMP_044 128.98935 9.302785 5.360051 9.328425e-01 High_A
## SAMP_045 156.67524 9.614770 5.376920 3.975641e-01 High_A
## SAMP_046 166.65962 10.898271 3.881304 4.777780e-01 High_A
## SAMP_047 137.44051 9.709273 5.789828 6.171861e-01 High_A
## SAMP_048 140.78363 13.737453 3.992491 4.047395e-01 High_A
## SAMP_049 124.09460 8.962592 3.694214 9.924784e-01 High_A
## SAMP_050 176.94063 9.875203 4.117171 9.885128e-02 High_A
## Categoria_Mutation
## SAMP_001 Baixa
## SAMP_002 Alta
## SAMP_003 Alta
## SAMP_004 Alta
## SAMP_005 Baixa
## SAMP_006 Alta
## SAMP_007 Alta
## SAMP_008 Baixa
## SAMP_009 Baixa
## SAMP_010 Alta
## SAMP_011 Alta
## SAMP_012 Alta
## SAMP_013 Baixa
## SAMP_014 Alta
## SAMP_015 Alta
## SAMP_016 Baixa
## SAMP_017 Alta
## SAMP_018 Baixa
## SAMP_019 Alta
## SAMP_020 Alta
## SAMP_021 Alta
## SAMP_022 Baixa
## SAMP_023 Baixa
## SAMP_024 Baixa
## SAMP_025 Baixa
## SAMP_026 Alta
## SAMP_027 Baixa
## SAMP_028 Baixa
## SAMP_029 Alta
## SAMP_030 Alta
## SAMP_031 Baixa
## SAMP_032 Alta
## SAMP_033 Alta
## SAMP_034 Baixa
## SAMP_035 Alta
## SAMP_036 Alta
## SAMP_037 Baixa
## SAMP_038 Alta
## SAMP_039 Baixa
## SAMP_040 Baixa
## SAMP_041 Alta
## SAMP_042 Baixa
## SAMP_043 Alta
## SAMP_044 Alta
## SAMP_045 Alta
## SAMP_046 Baixa
## SAMP_047 Baixa
## SAMP_048 Alta
## SAMP_049 Alta
## SAMP_050 Baixa