Introdução

Na aula faremos um apanhado geral sobre as características da linguagem R, envolvendo o uso de codigos para sumarização de dados. Serão demonstradas também as estruturas de laços de loop e repetição, bem como a criação de funções.

1. Carregamento de Pacotes

Nesta etapa, carregamos as bibliotecas necessárias para realizar análises. Elas incluem ferramentas para estatística multivariada, visualização e clusterização.

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.4.4     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(vegan)
## Carregando pacotes exigidos: permute
## Carregando pacotes exigidos: lattice
library(cluster)
library(FactoMineR)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(MASS)
## 
## Anexando pacote: 'MASS'
## 
## O seguinte objeto é mascarado por 'package:dplyr':
## 
##     select

2. Importação dos Dados

dados <- read.csv("dataset_biotecnologia_bioinformatica.csv", header = TRUE, row.names = 1)
head(dados)
##          GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001         74.11829  0.007434746   53.30684       37.25679
## SAMP_002         79.22424  0.011495031   62.59375       27.21473
## SAMP_003        134.87424  0.011992478   43.48266       37.25540
## SAMP_004         84.03875  0.010909128   67.10306       35.10971
## SAMP_005        100.59366  0.001051073   60.02868       38.22588
## SAMP_006        121.38632  0.019778563   52.96255       41.95792
##          Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001          216.1288     9.290182     4.897089   0.99891841        Low_A
## SAMP_002          178.2917     8.634924     4.717372   0.04061612       High_A
## SAMP_003          251.6240     6.692604     5.142426   0.64582252       High_A
## SAMP_004          190.2829    12.506672     5.541231   0.03869959        Low_A
## SAMP_005          229.7035     7.341842     6.340099   0.76021026        Low_A
## SAMP_006          190.0444    10.556067     3.430744   0.23008996       High_A

3. Estruturas de Repetição e Funções no R

Nesta seção, inserimos exemplos básicos de loops e funções antes das análises. Mas primeiro:

Característica Linguagem R Linguagem Python
Finalidade da Indentação Principalmente para Legibilidade e Bom Estilo de código. Obrigatória para a Funcionalidade e Estrutura do código (define blocos/escopo).
Delimitador de Bloco Chaves ({}) definem onde o bloco de código começa e termina. Indentação (espaços) define onde o bloco de código começa e termina. Não usa chaves.
Espaços Padrão 2 espaços por nível de indentação é a convenção mais amplamente aceita. 4 espaços por nível de indentação é a regra estrita da convenção PEP 8.
Quebra de Linha Quebrar após o operador pipe (%>%) ou operador binário (+, -, *). Indentar a nova linha. Quebrar antes de um operador binário (+, -, *). Indentar a nova linha.
Exemplo Estrutura if (x > 0) { print("Positivo")} else { print("Não positivo")} if x > 0: print("Positivo")else: print("Não positivo")
Importância Sem indentação, o código ainda roda. A chave é o fator delimitador. Sem indentação correta, o código falha com um erro (IndentationError).

3.1 Estrutura for

medias_for <- NULL

for (i in 1:ncol(dados)) {
  medias_for[i] <- mean(dados[[i]])
}
## Warning in mean.default(dados[[i]]): argumento não é numérico nem lógico:
## retornando NA
medias_for
## [1] 100.81893412   0.01094278  50.22039545  38.72790725 195.63239499
## [6]   9.94047035   4.76958043   0.53766856           NA

Alternativa com dplyr

library(dplyr)

dados %>%
  summarise(across(where(is.numeric), mean, na.rm = TRUE))
## Warning: There was 1 warning in `summarise()`.
## ℹ In argument: `across(where(is.numeric), mean, na.rm = TRUE)`.
## Caused by warning:
## ! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
## Supply arguments directly to `.fns` through an anonymous function instead.
## 
##   # Previously
##   across(a:b, mean, na.rm = TRUE)
## 
##   # Now
##   across(a:b, \(x) mean(x, na.rm = TRUE))
##   GeneExpression_B MutationRate GC_Content Coverage_Depth Protein_Abundance
## 1         100.8189   0.01094278    50.2204       38.72791          195.6324
##   Metabolite_X Metabolite_Y PathwayScore
## 1      9.94047      4.76958    0.5376686

3.2 Estrutura while

A estrutura while em R é um tipo de loop que executa um bloco de código enquanto uma condição lógica for verdadeira. Ela é usada quando não sabemos previamente quantas repetições serão necessárias, mas sabemos a condição de parada.

contador <- 1
soma <- 0
while (contador <= 8) {
  soma <- soma + mean(dados[[contador]])
  contador <- contador + 1
}
soma
## [1] 400.6583

O que acontece se você esquecer o “contador” ?

alternativa com o dplyr:

library(dplyr)

soma <- dados %>%
  dplyr::select(where(is.numeric)) %>%
  summarise(across(everything(), mean)) %>%
  sum()

soma
## [1] 400.6583

3.3 Função simples

resumo_var <- function(coluna) {
  media <- mean(coluna)
  dp <- sd(coluna)
  return(list(media = media, desvio = dp))
}
resumo_var(dados$GC_Content)
## $media
## [1] 50.2204
## 
## $desvio
## [1] 11.88766

Condicionais em R

Exemplo de condicional if — Classificação baseada em expressão gênica

Suponha a variável chamada GeneExpression_A (expressão de um gene importante). Podemos criar uma classificação simples:

expr_media <- mean(dados$GeneExpression_B)
expr_media
## [1] 100.8189
if (expr_media > 100) {
  cat("A expressão média de Gene foi ALTA.\n")
} else {
  cat("A expressão média de Gene foi MODERADA ou BAIXA.\n")
}
## A expressão média de Gene foi ALTA.

Exemplo com ifelse() — Criar uma nova variável categórica

Aqui vamos transformar valores numéricos em categorias úteis para análise posterior

dados$Categoria_Mutation <- ifelse(
  dados$MutationRate > 0.01,
  "Alta",
  "Baixa"
)

Resultado:

dados
##          GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001         74.11829  0.007434746   53.30684       37.25679
## SAMP_002         79.22424  0.011495031   62.59375       27.21473
## SAMP_003        134.87424  0.011992478   43.48266       37.25540
## SAMP_004         84.03875  0.010909128   67.10306       35.10971
## SAMP_005        100.59366  0.001051073   60.02868       38.22588
## SAMP_006        121.38632  0.019778563   52.96255       41.95792
## SAMP_007        117.81413  0.018201490   60.06576       40.88596
## SAMP_008        135.09772  0.004945081   33.16596       39.85016
## SAMP_009        129.91288  0.006557299   64.37556       40.99791
## SAMP_010        121.38785  0.010880193   62.86016       39.36941
## SAMP_011         84.54583  0.018136316   66.39487       40.98509
## SAMP_012        115.89725  0.019688987   35.14525       23.84472
## SAMP_013        106.28544  0.005893299   33.27120       38.65353
## SAMP_014         73.47469  0.011722822   35.53662       39.44575
## SAMP_015        128.34598  0.016332405   45.97515       38.29369
## SAMP_016        116.14473  0.008493031   46.97227       38.91027
## SAMP_017        100.90980  0.014890388   52.48874       43.51655
## SAMP_018         95.33816  0.004060311   34.88974       37.00947
## SAMP_019         76.03398  0.012413273   38.05598       51.00351
## SAMP_020        103.99048  0.017451425   62.46577       43.44148
## SAMP_021        109.36878  0.019686911   48.71950       39.96846
## SAMP_022         83.37690  0.002507950   62.31753       38.96669
## SAMP_023        123.24408  0.009138598   30.29706       39.56739
## SAMP_024         78.05594  0.004886314   52.06371       35.42346
## SAMP_025         57.53799  0.009562093   67.27729       39.52399
## SAMP_026        120.79454  0.011407508   53.28702       41.39342
## SAMP_027         91.93268  0.002773207   38.24383       42.89771
## SAMP_028         97.47941  0.006640355   58.71030       42.89845
## SAMP_029         83.24967  0.018624101   45.15943       38.62561
## SAMP_030         67.88074  0.011811071   56.73536       32.91959
## SAMP_031        125.10475  0.009690828   31.17279       36.65449
## SAMP_032         86.22262  0.015316994   55.43601       48.06097
## SAMP_033        133.21905  0.015095381   31.28792       44.48029
## SAMP_034        116.14616  0.001923002   59.79123       41.84810
## SAMP_035         93.70484  0.014465251   48.91652       36.19353
## SAMP_036         78.28195  0.016945624   34.87017       40.01823
## SAMP_037         85.35076  0.004152820   51.70544       33.72166
## SAMP_038         75.74954  0.015838961   32.67098       37.24032
## SAMP_039        141.74227  0.006444196   56.13459       38.77398
## SAMP_040        103.28882  0.006822925   69.84345       38.19180
## SAMP_041        123.00411  0.013639968   60.77589       44.78301
## SAMP_042         74.65296  0.003116451   52.95096       32.90637
## SAMP_043        103.62070  0.013632577   34.10541       35.67284
## SAMP_044        123.55724  0.017869279   57.99336       33.12656
## SAMP_045         93.29978  0.014229914   56.44671       33.81323
## SAMP_046        120.62229  0.009366230   31.96389       40.62028
## SAMP_047         78.30864  0.009326073   61.69197       31.99780
## SAMP_048         72.73057  0.015536826   50.74866       43.76934
## SAMP_049        107.58801  0.011747198   47.03471       38.76592
## SAMP_050         92.41647  0.002613179   61.52749       40.34394
##          Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001         216.12884     9.290182     4.897089 9.989184e-01        Low_A
## SAMP_002         178.29167     8.634924     4.717372 4.061612e-02       High_A
## SAMP_003         251.62399     6.692604     5.142426 6.458225e-01       High_A
## SAMP_004         190.28286    12.506672     5.541231 3.869959e-02        Low_A
## SAMP_005         229.70351     7.341842     6.340099 7.602103e-01        Low_A
## SAMP_006         190.04438    10.556067     3.430744 2.300900e-01       High_A
## SAMP_007         214.54372     7.850467     4.489657 8.983187e-02        Low_A
## SAMP_008         213.98313    11.336634     4.552229 6.484497e-01        Low_A
## SAMP_009         212.49850    11.911665     5.937850 7.326012e-01       High_A
## SAMP_010         151.28461     8.244773     4.643337 6.780953e-01        Low_A
## SAMP_011         221.79379     6.152569     3.104824 5.190095e-02        Low_A
## SAMP_012         184.05215    11.391575     5.087730 2.943069e-01       High_A
## SAMP_013         231.52440    13.751601     4.966311 4.510883e-01       High_A
## SAMP_014          92.37533    10.831389     5.179752 2.871033e-01        Low_A
## SAMP_015         126.74419    10.321089     3.959837 8.105135e-01        Low_A
## SAMP_016         218.17228    11.639521     6.719035 1.311151e-01        Low_A
## SAMP_017         293.14638    11.530110     4.676140 6.121794e-01       High_A
## SAMP_018         241.75294     8.342022     4.811703 9.882149e-01       High_A
## SAMP_019         165.87745     8.681697     4.099991 9.025565e-01       High_A
## SAMP_020         115.39738    11.222247     4.068998 2.221571e-01       High_A
## SAMP_021         237.13431     9.711973     3.777263 8.188761e-05       High_A
## SAMP_022         195.97084    12.633211     4.606689 9.805973e-01       High_A
## SAMP_023         229.53521     8.591316     4.042418 8.827130e-01        Low_A
## SAMP_024         205.76494    11.501220     7.056467 9.194725e-01       High_A
## SAMP_025         201.48215    10.685276     3.111508 4.155036e-01        Low_A
## SAMP_026         347.93127     9.747125     3.871669 7.446155e-01        Low_A
## SAMP_027         199.69350    12.351822     4.598586 2.128315e-01       High_A
## SAMP_028         192.03774    11.360143     5.673491 3.923041e-01        Low_A
## SAMP_029         193.92757     7.990066     4.586243 8.515481e-01        Low_A
## SAMP_030         170.82316    11.280437     5.675963 1.276122e-01        Low_A
## SAMP_031         249.50664    12.749981     4.013196 8.938654e-01        Low_A
## SAMP_032         182.31228     9.739111     5.059291 4.965080e-01        Low_A
## SAMP_033         231.79714     9.502688     6.744041 4.260957e-01        Low_A
## SAMP_034         214.23015     8.660706     4.032256 3.056464e-01        Low_A
## SAMP_035         260.94929     9.972792     5.419568 9.168488e-01       High_A
## SAMP_036         221.00898    11.372401     5.206928 5.176235e-01        Low_A
## SAMP_037         139.33076     8.364663     2.748465 8.040264e-01       High_A
## SAMP_038         133.67561     7.307285     4.411029 8.576518e-01       High_A
## SAMP_039         270.41846     9.248500     6.131152 9.223824e-01        Low_A
## SAMP_040         169.56446     7.240550     5.135078 3.033807e-01       High_A
## SAMP_041         133.96987    11.046437     3.787731 3.398109e-01        Low_A
## SAMP_042         166.51907     9.146620     5.690777 5.950739e-01        Low_A
## SAMP_043         263.23126     6.489196     4.520877 4.413241e-01        Low_A
## SAMP_044         128.98935     9.302785     5.360051 9.328425e-01       High_A
## SAMP_045         156.67524     9.614770     5.376920 3.975641e-01       High_A
## SAMP_046         166.65962    10.898271     3.881304 4.777780e-01       High_A
## SAMP_047         137.44051     9.709273     5.789828 6.171861e-01       High_A
## SAMP_048         140.78363    13.737453     3.992491 4.047395e-01       High_A
## SAMP_049         124.09460     8.962592     3.694214 9.924784e-01       High_A
## SAMP_050         176.94063     9.875203     4.117171 9.885128e-02       High_A
##          Categoria_Mutation
## SAMP_001              Baixa
## SAMP_002               Alta
## SAMP_003               Alta
## SAMP_004               Alta
## SAMP_005              Baixa
## SAMP_006               Alta
## SAMP_007               Alta
## SAMP_008              Baixa
## SAMP_009              Baixa
## SAMP_010               Alta
## SAMP_011               Alta
## SAMP_012               Alta
## SAMP_013              Baixa
## SAMP_014               Alta
## SAMP_015               Alta
## SAMP_016              Baixa
## SAMP_017               Alta
## SAMP_018              Baixa
## SAMP_019               Alta
## SAMP_020               Alta
## SAMP_021               Alta
## SAMP_022              Baixa
## SAMP_023              Baixa
## SAMP_024              Baixa
## SAMP_025              Baixa
## SAMP_026               Alta
## SAMP_027              Baixa
## SAMP_028              Baixa
## SAMP_029               Alta
## SAMP_030               Alta
## SAMP_031              Baixa
## SAMP_032               Alta
## SAMP_033               Alta
## SAMP_034              Baixa
## SAMP_035               Alta
## SAMP_036               Alta
## SAMP_037              Baixa
## SAMP_038               Alta
## SAMP_039              Baixa
## SAMP_040              Baixa
## SAMP_041               Alta
## SAMP_042              Baixa
## SAMP_043               Alta
## SAMP_044               Alta
## SAMP_045               Alta
## SAMP_046              Baixa
## SAMP_047              Baixa
## SAMP_048               Alta
## SAMP_049               Alta
## SAMP_050              Baixa

DESAFIO!

Crie uma única função que envolva o uso de estruturas de repetição e condicionais

4. Sumarização das Variáveis

summary(dados)
##  GeneExpression_B  MutationRate        GC_Content    Coverage_Depth 
##  Min.   : 57.54   Min.   :0.001051   Min.   :30.30   Min.   :23.84  
##  1st Qu.: 83.28   1st Qu.:0.006578   1st Qu.:38.10   1st Qu.:36.74  
##  Median :100.75   Median :0.011451   Median :52.72   Median :38.94  
##  Mean   :100.82   Mean   :0.010943   Mean   :50.22   Mean   :38.73  
##  3rd Qu.:120.75   3rd Qu.:0.015262   3rd Qu.:60.06   3rd Qu.:40.99  
##  Max.   :141.74   Max.   :0.019779   Max.   :69.84   Max.   :51.00  
##  Protein_Abundance  Metabolite_X     Metabolite_Y    PathwayScore      
##  Min.   : 92.38    Min.   : 6.153   Min.   :2.748   Min.   :8.189e-05  
##  1st Qu.:166.04    1st Qu.: 8.641   1st Qu.:4.035   1st Qu.:2.966e-01  
##  Median :194.95    Median : 9.743   Median :4.660   Median :5.071e-01  
##  Mean   :195.63    Mean   : 9.940   Mean   :4.770   Mean   :5.377e-01  
##  3rd Qu.:227.60    3rd Qu.:11.354   3rd Qu.:5.373   3rd Qu.:8.413e-01  
##  Max.   :347.93    Max.   :13.752   Max.   :7.056   Max.   :9.989e-01  
##  Target_Class       Categoria_Mutation
##  Length:50          Length:50         
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
## 

5. Análise de Correlação

cor_mat <- cor(dados[,1:8])
cor_mat
##                   GeneExpression_B MutationRate  GC_Content Coverage_Depth
## GeneExpression_B        1.00000000   0.06809685 -0.18870467    0.118872127
## MutationRate            0.06809685   1.00000000 -0.09595584    0.037265753
## GC_Content             -0.18870467  -0.09595584  1.00000000   -0.026489144
## Coverage_Depth          0.11887213   0.03726575 -0.02648914    1.000000000
## Protein_Abundance       0.29401515  -0.11881031 -0.15044151    0.091580231
## Metabolite_X           -0.04667775  -0.10236329 -0.09120914    0.092602661
## Metabolite_Y            0.03758577  -0.22289977  0.01226474   -0.221228276
## PathwayScore            0.09152632  -0.22825347 -0.26886474   -0.008345773
##                   Protein_Abundance Metabolite_X Metabolite_Y PathwayScore
## GeneExpression_B         0.29401515  -0.04667775   0.03758577  0.091526322
## MutationRate            -0.11881031  -0.10236329  -0.22289977 -0.228253472
## GC_Content              -0.15044151  -0.09120914   0.01226474 -0.268864741
## Coverage_Depth           0.09158023   0.09260266  -0.22122828 -0.008345773
## Protein_Abundance        1.00000000  -0.05882687   0.13330802  0.112768785
## Metabolite_X            -0.05882687   1.00000000   0.12868616 -0.122566725
## Metabolite_Y             0.13330802   0.12868616   1.00000000  0.077547876
## PathwayScore             0.11276878  -0.12256673   0.07754788  1.000000000

Gráfico:

library(corrplot)
## corrplot 0.95 loaded
corrplot::corrplot(cor_mat, method = "color", tl.cex = 0.8)

Distribuição das Variáveis

ggplot(stack(dados[,1:8]), aes(x = ind, y = values)) +
  geom_boxplot() +
  theme_minimal() +
  labs(title = "Distribuição das Variáveis", x = "Variáveis", y = "Valores") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

4. Análise de Variância Multivariada (MANOVA)

A MANOVA testa diferenças multivariadas entre grupos considerando várias variáveis-resposta simultaneamente. É útil em experimentos com múltiplos marcadores moleculares, perfis de expressão gênica ou características fenotípicas medidas em conjunto. Criamos uma variável de grupo fictícia para fins didáticos.

Grupo <- factor(rep(c("A","B","C","D"), length.out = nrow(dados)))
modelo_manova <- manova(as.matrix(dados[,1:8]) ~ Grupo)
summary(modelo_manova)
##           Df  Pillai approx F num Df den Df Pr(>F)
## Grupo      3 0.49425   1.0109     24    123 0.4581
## Residuals 46

Testes univariados

summary.aov(modelo_manova)
##  Response GeneExpression_B :
##             Df  Sum Sq Mean Sq F value Pr(>F)
## Grupo        3  1046.3  348.75  0.7441 0.5313
## Residuals   46 21559.1  468.68               
## 
##  Response MutationRate :
##             Df     Sum Sq    Mean Sq F value Pr(>F)
## Grupo        3 0.00007825 2.6085e-05  0.8845 0.4562
## Residuals   46 0.00135663 2.9492e-05               
## 
##  Response GC_Content :
##             Df Sum Sq Mean Sq F value Pr(>F)
## Grupo        3  264.6  88.185  0.6091 0.6125
## Residuals   46 6660.0 144.782               
## 
##  Response Coverage_Depth :
##             Df  Sum Sq Mean Sq F value Pr(>F)
## Grupo        3   20.39  6.7959  0.2978 0.8268
## Residuals   46 1049.59 22.8171               
## 
##  Response Protein_Abundance :
##             Df Sum Sq Mean Sq F value Pr(>F)
## Grupo        3   9120  3040.0  1.2316  0.309
## Residuals   46 113540  2468.3               
## 
##  Response Metabolite_X :
##             Df  Sum Sq Mean Sq F value  Pr(>F)  
## Grupo        3  24.108  8.0360  2.5727 0.06547 .
## Residuals   46 143.684  3.1236                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Metabolite_Y :
##             Df Sum Sq Mean Sq F value Pr(>F)
## Grupo        3  4.335 1.44500  1.6127 0.1993
## Residuals   46 41.217 0.89601               
## 
##  Response PathwayScore :
##             Df Sum Sq  Mean Sq F value Pr(>F)
## Grupo        3 0.2572 0.085746  0.8774 0.4597
## Residuals   46 4.4952 0.097722

5. Clusterização

A clusterização permite identificar agrupamentos naturais entre as amostras com base em múltiplas variáveis. Essa técnica é amplamente usada em Bioinformática, por exemplo, na identificação de padrões de expressão gênica. ## Normalização dos Dados

dados_sc <- scale(dados[,1:8])

Matrizes de Distância

dist_euc <- dist(dados_sc, method = "euclidean")
dist_man <- dist(dados_sc, method = "manhattan")

Métodos de Ligação

town_ward <- hclust(dist_euc, method = "ward.D2")
town_avg <- hclust(dist_euc, method = "average")
town_comp <- hclust(dist_euc, method = "complete")

Dendrogramas

plot(town_ward, main="Ward - Distância Euclidiana")

plot(town_avg, main="UPGMA - Distância Euclidiana")

plot(town_comp, main="Ligação Completa - Distância Euclidiana")

6. K-means

k3 <- kmeans(dados_sc, centers = 3)

Gráfico:

fviz_cluster(k3, data = dados_sc, main = "Clusterização K-means (k=3)")

7. Análise de Componentes Principais (PCA)

A PCA reduz a dimensionalidade dos dados preservando a maior variação possível. Em biotecnologia, é comum usá-la para explorar dados ômicos (RNA-seq, proteômica, metabolômica).

pca_res <- PCA(dados[,1:8], scale.unit = TRUE, graph = FALSE)

Gráficos:

fviz_pca_biplot(pca_res, repel = TRUE) +
  ggtitle("Biplot PCA - Dados de Biotecnologia e Bioinformática")

fviz_pca_var(pca_res, 
             repel = TRUE,
             col.var = "steelblue") +
  ggtitle("PCA – Apenas Variáveis")

fviz_pca_biplot(
  pca_res,
  repel = TRUE,
  habillage = as.factor(dados$Categoria_Mutation),   # fator
  addEllipses = TRUE,        # adiciona elipses
  ellipse.level = 0.95        # nível de confiança
) +
  ggtitle("Biplot PCA com Elipses por Grupo")

dados
##          GeneExpression_B MutationRate GC_Content Coverage_Depth
## SAMP_001         74.11829  0.007434746   53.30684       37.25679
## SAMP_002         79.22424  0.011495031   62.59375       27.21473
## SAMP_003        134.87424  0.011992478   43.48266       37.25540
## SAMP_004         84.03875  0.010909128   67.10306       35.10971
## SAMP_005        100.59366  0.001051073   60.02868       38.22588
## SAMP_006        121.38632  0.019778563   52.96255       41.95792
## SAMP_007        117.81413  0.018201490   60.06576       40.88596
## SAMP_008        135.09772  0.004945081   33.16596       39.85016
## SAMP_009        129.91288  0.006557299   64.37556       40.99791
## SAMP_010        121.38785  0.010880193   62.86016       39.36941
## SAMP_011         84.54583  0.018136316   66.39487       40.98509
## SAMP_012        115.89725  0.019688987   35.14525       23.84472
## SAMP_013        106.28544  0.005893299   33.27120       38.65353
## SAMP_014         73.47469  0.011722822   35.53662       39.44575
## SAMP_015        128.34598  0.016332405   45.97515       38.29369
## SAMP_016        116.14473  0.008493031   46.97227       38.91027
## SAMP_017        100.90980  0.014890388   52.48874       43.51655
## SAMP_018         95.33816  0.004060311   34.88974       37.00947
## SAMP_019         76.03398  0.012413273   38.05598       51.00351
## SAMP_020        103.99048  0.017451425   62.46577       43.44148
## SAMP_021        109.36878  0.019686911   48.71950       39.96846
## SAMP_022         83.37690  0.002507950   62.31753       38.96669
## SAMP_023        123.24408  0.009138598   30.29706       39.56739
## SAMP_024         78.05594  0.004886314   52.06371       35.42346
## SAMP_025         57.53799  0.009562093   67.27729       39.52399
## SAMP_026        120.79454  0.011407508   53.28702       41.39342
## SAMP_027         91.93268  0.002773207   38.24383       42.89771
## SAMP_028         97.47941  0.006640355   58.71030       42.89845
## SAMP_029         83.24967  0.018624101   45.15943       38.62561
## SAMP_030         67.88074  0.011811071   56.73536       32.91959
## SAMP_031        125.10475  0.009690828   31.17279       36.65449
## SAMP_032         86.22262  0.015316994   55.43601       48.06097
## SAMP_033        133.21905  0.015095381   31.28792       44.48029
## SAMP_034        116.14616  0.001923002   59.79123       41.84810
## SAMP_035         93.70484  0.014465251   48.91652       36.19353
## SAMP_036         78.28195  0.016945624   34.87017       40.01823
## SAMP_037         85.35076  0.004152820   51.70544       33.72166
## SAMP_038         75.74954  0.015838961   32.67098       37.24032
## SAMP_039        141.74227  0.006444196   56.13459       38.77398
## SAMP_040        103.28882  0.006822925   69.84345       38.19180
## SAMP_041        123.00411  0.013639968   60.77589       44.78301
## SAMP_042         74.65296  0.003116451   52.95096       32.90637
## SAMP_043        103.62070  0.013632577   34.10541       35.67284
## SAMP_044        123.55724  0.017869279   57.99336       33.12656
## SAMP_045         93.29978  0.014229914   56.44671       33.81323
## SAMP_046        120.62229  0.009366230   31.96389       40.62028
## SAMP_047         78.30864  0.009326073   61.69197       31.99780
## SAMP_048         72.73057  0.015536826   50.74866       43.76934
## SAMP_049        107.58801  0.011747198   47.03471       38.76592
## SAMP_050         92.41647  0.002613179   61.52749       40.34394
##          Protein_Abundance Metabolite_X Metabolite_Y PathwayScore Target_Class
## SAMP_001         216.12884     9.290182     4.897089 9.989184e-01        Low_A
## SAMP_002         178.29167     8.634924     4.717372 4.061612e-02       High_A
## SAMP_003         251.62399     6.692604     5.142426 6.458225e-01       High_A
## SAMP_004         190.28286    12.506672     5.541231 3.869959e-02        Low_A
## SAMP_005         229.70351     7.341842     6.340099 7.602103e-01        Low_A
## SAMP_006         190.04438    10.556067     3.430744 2.300900e-01       High_A
## SAMP_007         214.54372     7.850467     4.489657 8.983187e-02        Low_A
## SAMP_008         213.98313    11.336634     4.552229 6.484497e-01        Low_A
## SAMP_009         212.49850    11.911665     5.937850 7.326012e-01       High_A
## SAMP_010         151.28461     8.244773     4.643337 6.780953e-01        Low_A
## SAMP_011         221.79379     6.152569     3.104824 5.190095e-02        Low_A
## SAMP_012         184.05215    11.391575     5.087730 2.943069e-01       High_A
## SAMP_013         231.52440    13.751601     4.966311 4.510883e-01       High_A
## SAMP_014          92.37533    10.831389     5.179752 2.871033e-01        Low_A
## SAMP_015         126.74419    10.321089     3.959837 8.105135e-01        Low_A
## SAMP_016         218.17228    11.639521     6.719035 1.311151e-01        Low_A
## SAMP_017         293.14638    11.530110     4.676140 6.121794e-01       High_A
## SAMP_018         241.75294     8.342022     4.811703 9.882149e-01       High_A
## SAMP_019         165.87745     8.681697     4.099991 9.025565e-01       High_A
## SAMP_020         115.39738    11.222247     4.068998 2.221571e-01       High_A
## SAMP_021         237.13431     9.711973     3.777263 8.188761e-05       High_A
## SAMP_022         195.97084    12.633211     4.606689 9.805973e-01       High_A
## SAMP_023         229.53521     8.591316     4.042418 8.827130e-01        Low_A
## SAMP_024         205.76494    11.501220     7.056467 9.194725e-01       High_A
## SAMP_025         201.48215    10.685276     3.111508 4.155036e-01        Low_A
## SAMP_026         347.93127     9.747125     3.871669 7.446155e-01        Low_A
## SAMP_027         199.69350    12.351822     4.598586 2.128315e-01       High_A
## SAMP_028         192.03774    11.360143     5.673491 3.923041e-01        Low_A
## SAMP_029         193.92757     7.990066     4.586243 8.515481e-01        Low_A
## SAMP_030         170.82316    11.280437     5.675963 1.276122e-01        Low_A
## SAMP_031         249.50664    12.749981     4.013196 8.938654e-01        Low_A
## SAMP_032         182.31228     9.739111     5.059291 4.965080e-01        Low_A
## SAMP_033         231.79714     9.502688     6.744041 4.260957e-01        Low_A
## SAMP_034         214.23015     8.660706     4.032256 3.056464e-01        Low_A
## SAMP_035         260.94929     9.972792     5.419568 9.168488e-01       High_A
## SAMP_036         221.00898    11.372401     5.206928 5.176235e-01        Low_A
## SAMP_037         139.33076     8.364663     2.748465 8.040264e-01       High_A
## SAMP_038         133.67561     7.307285     4.411029 8.576518e-01       High_A
## SAMP_039         270.41846     9.248500     6.131152 9.223824e-01        Low_A
## SAMP_040         169.56446     7.240550     5.135078 3.033807e-01       High_A
## SAMP_041         133.96987    11.046437     3.787731 3.398109e-01        Low_A
## SAMP_042         166.51907     9.146620     5.690777 5.950739e-01        Low_A
## SAMP_043         263.23126     6.489196     4.520877 4.413241e-01        Low_A
## SAMP_044         128.98935     9.302785     5.360051 9.328425e-01       High_A
## SAMP_045         156.67524     9.614770     5.376920 3.975641e-01       High_A
## SAMP_046         166.65962    10.898271     3.881304 4.777780e-01       High_A
## SAMP_047         137.44051     9.709273     5.789828 6.171861e-01       High_A
## SAMP_048         140.78363    13.737453     3.992491 4.047395e-01       High_A
## SAMP_049         124.09460     8.962592     3.694214 9.924784e-01       High_A
## SAMP_050         176.94063     9.875203     4.117171 9.885128e-02       High_A
##          Categoria_Mutation
## SAMP_001              Baixa
## SAMP_002               Alta
## SAMP_003               Alta
## SAMP_004               Alta
## SAMP_005              Baixa
## SAMP_006               Alta
## SAMP_007               Alta
## SAMP_008              Baixa
## SAMP_009              Baixa
## SAMP_010               Alta
## SAMP_011               Alta
## SAMP_012               Alta
## SAMP_013              Baixa
## SAMP_014               Alta
## SAMP_015               Alta
## SAMP_016              Baixa
## SAMP_017               Alta
## SAMP_018              Baixa
## SAMP_019               Alta
## SAMP_020               Alta
## SAMP_021               Alta
## SAMP_022              Baixa
## SAMP_023              Baixa
## SAMP_024              Baixa
## SAMP_025              Baixa
## SAMP_026               Alta
## SAMP_027              Baixa
## SAMP_028              Baixa
## SAMP_029               Alta
## SAMP_030               Alta
## SAMP_031              Baixa
## SAMP_032               Alta
## SAMP_033               Alta
## SAMP_034              Baixa
## SAMP_035               Alta
## SAMP_036               Alta
## SAMP_037              Baixa
## SAMP_038               Alta
## SAMP_039              Baixa
## SAMP_040              Baixa
## SAMP_041               Alta
## SAMP_042              Baixa
## SAMP_043               Alta
## SAMP_044               Alta
## SAMP_045               Alta
## SAMP_046              Baixa
## SAMP_047              Baixa
## SAMP_048               Alta
## SAMP_049               Alta
## SAMP_050              Baixa