1. load libraries

2. Load Data into Seurat


# Patient IDs and H5 files (replace with your actual file paths)

# Define paths to your H5 files
h5_files <- list(
   "MF1" = "../data/MF/GSM5538777_MF17raw_feature_bc_matrix.h5", #MF-Patient
   "MF2" = "../data/MF/GSM5538778_MF18raw_feature_bc_matrix.h5", #MF-Patient
   "MF3" = "../data/MF/GSM5687768_MF19raw_feature_bc_matrix.h5", #MF-Patient
   "MF4" = "../data/MF/GSM5538779_MF21raw_feature_bc_matrix.h5", #MF-Patient
   "MF5" = "../data/MF/GSM5538780_MF24_raw_feature_bc_matrix.h5", #MF-Patient
  "HC1_2" = "../data/Disease_state_Healthy_Control/GSM5538785_SC327raw_feature_bc_matrix.h5", # disease state: Healthy control/tissue: Skin tumor
  "HC3_4" = "../data/Disease_state_Healthy_Control/GSM5538786_SC374raw_feature_bc_matrix.h5" # disease state: Healthy control/tissue: Skin tumor
)

# Read and create individual Seurat objects
seurat_list <- list()

3. Load each patient sample with metadata


seurat_list <- list()

for (patient in names(h5_files)) {
  raw_data <- Read10X_h5(h5_files[[patient]])

  # If raw_data is a list (multi-modal), extract "Gene Expression"
  if (is.list(raw_data)) {
    if (!"Gene Expression" %in% names(raw_data)) {
      stop(paste("Gene Expression modality not found in patient", patient))
    }
    raw_counts <- raw_data[["Gene Expression"]]
  } else {
    # Single modality
    raw_counts <- raw_data
  }

  seu <- CreateSeuratObject(
    counts = raw_counts,
    min.cells = 3,
    min.features = 200,
    project = patient
  )

  seu$patient_id <- patient
  seurat_list[[patient]] <- seu
}

Genome matrix has multiple modalities, returning a list of matrices for this genome
Genome matrix has multiple modalities, returning a list of matrices for this genome
Genome matrix has multiple modalities, returning a list of matrices for this genome
Genome matrix has multiple modalities, returning a list of matrices for this genome

4. Merge All Patients into One Seurat Object


# Merge into combined Seurat object
combined_seu <- merge(
  seurat_list[[1]],
  y = seurat_list[-1],
  add.cell.ids = names(seurat_list),
  project = "MF_HC_Merged"
)

# Using LogNormalize for simplicity and compatibility with reference datasets; 
# SCTransform could be used for deeper integration.

# Normalization (LogNormalize)
combined_seu <- NormalizeData(combined_seu, normalization.method = "LogNormalize", scale.factor = 10000)

Normalizing layer: counts.MF1
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.MF2
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.MF3
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.MF4
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.MF5
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.HC1_2
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Normalizing layer: counts.HC3_4
Performing log-normalization
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|

# Variable features selection
combined_seu <- FindVariableFeatures(combined_seu, selection.method = "vst", nfeatures = 2000)

Finding variable features for layer counts.MF1
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.MF2
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.MF3
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.MF4
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.MF5
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.HC1_2
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Finding variable features for layer counts.HC3_4
Calculating gene variances
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
Calculating feature variances of standardized and clipped values
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|

# Scaling
combined_seu <- ScaleData(combined_seu)

Centering and scaling data matrix

  |                                                                                                     
  |                                                                                               |   0%
  |                                                                                                     
  |================================================                                               |  50%
  |                                                                                                     
  |===============================================================================================| 100%

# PCA
combined_seu <- RunPCA(combined_seu, features = VariableFeatures(combined_seu))

PC_ 1 
Positive:  LGALS7B, KRT6A, KRT16, KRT14, KRT10, KRT1, KRTDAP, S100A8, DMKN, SFN 
       S100A9, PERP, CALML5, LGALS7, KRT5, AQP3, LY6D, S100A7, SBSN, SERPINB4 
       DSP, IFI27, SPRR1B, LYPD3, S100A14, TACSTD2, KRT6B, JUP, KRT2, FABP5 
Negative:  IFITM2, VIM, SRGN, TSC22D3, SLC2A3, S100A4, S100A6, IL32, LDHB, LAPTM5 
       CORO1A, BST2, CD37, ITM2A, GYPC, GMFG, LGALS1, RAC2, EMP3, PTPRC 
       FYB1, CD52, ITGB2, COTL1, ANXA6, CD3E, NR4A2, CXCR4, LIMD2, TGFBR2 
PC_ 2 
Positive:  IGFBP7, CALD1, SERPING1, SPARC, IFITM3, SOD3, TCF4, CAVIN1, PLAC9, SPARCL1 
       PLPP3, ADIRF, CXCL12, TIMP3, CST3, MGP, PRRX1, GSN, NNMT, CAVIN3 
       COL1A2, S100A13, MYL9, COL6A1, LGALS7B, KRT14, CCDC80, CAV1, FSTL1, IFI27 
Negative:  CORO1A, CD52, CD3E, RAC2, PTPRC, CD37, SRGN, FYB1, LAPTM5, CD3D 
       CYTIP, CXCR4, CD69, CD2, TRBC2, LIMD2, TSC22D3, RHOH, LAT, HCST 
       LCP1, IL32, SKAP1, ITGB2, UCP2, CD48, DUSP2, LTB, CD27, DOK2 
PC_ 3 
Positive:  SOD3, PLAC9, MYL9, TIMP3, SPARCL1, PRRX1, IGFBP7, PCOLCE, COL1A2, MFAP4 
       CALD1, TRBV18, MGP, AEBP1, ITM2A, FXYD1, COL3A1, PLPP3, IGFBP4, SLIT3 
       CPE, PDGFRB, ISLR, COL6A2, LHFPL6, CXCL12, COL1A1, SPARC, IFITM1, CD3E 
Negative:  LYZ, IFI30, FCER1G, AIF1, SPI1, C1QA, IGSF6, CD68, TYROBP, C1QB 
       MS4A6A, SERPINA1, HLA-DMB, LGALS2, C1QC, LST1, CYBB, HLA-DQA1, CSF1R, CD14 
       LILRB4, CTSZ, HLA-DQB1, HLA-DPB1, CALHM6, CLEC10A, HLA-DMA, PILRA, FCGR2A, HLA-DPA1 
PC_ 4 
Positive:  ECSCR, EGFL7, PLVAP, EMCN, ADGRL4, CLEC14A, RAMP2, PECAM1, CLDN5, VWF 
       SOX18, ESAM, TSPAN7, CD34, RAMP3, CCL14, CDH5, NPDC1, ACKR1, TM4SF1 
       BCAM, MYCT1, GNG11, CYYR1, SOX17, ERG, CD93, PCAT19, ROBO4, PTPRB 
Negative:  LUM, MFAP4, MXRA8, COL1A2, DPT, CTSK, COL3A1, TMEM176B, SOD3, TMEM176A 
       COL1A1, COL6A2, ISLR, CCDC80, DCN, PCOLCE, CD248, FBLN1, SERPINF1, OLFML3 
       COL6A1, PRRX1, PTGDS, PLAC9, CFD, VCAN, TWIST2, AEBP1, THY1, LRP1 
PC_ 5 
Positive:  NEAT1, AC020916.1, FGFR3, SPINT2, PTPRF, EVPL, DUOX1, NECTIN1, IFFO2, CYP3A5 
       EPHA2, SLC2A1, TFAP2A, MIR222HG, IMPA2, EPHB6, CD3E, GPC1, LTB4R, IRX2 
       CA12, PRRG4, CEBPB, CXADR, AHNAK2, PKP1, ERBB3, HMGB2, ITPKC, EGFR 
Negative:  EGFL7, PLVAP, ECSCR, RAMP2, PECAM1, EMCN, CLEC14A, ADGRL4, CD34, A2M 
       GNG11, CCL14, ENG, MCTP1, VWF, ESAM, TSPAN7, RAMP3, CLDN5, AQP1 
       ACKR1, RNASE1, HLA-DPA1, CD93, HLA-DRA, HLA-DPB1, SPARCL1, CDH5, SOX18, JAM2

# Elbow Plot to decide number of PCs
ElbowPlot(combined_seu)



# # Step 8: JackStraw (optional but useful for PC significance)
# combined_seu <- JackStraw(combined_seu, num.replicate = 100)
# combined_seu <- ScoreJackStraw(combined_seu, dims = 1:20)
# JackStrawPlot(combined_seu, dims = 1:20)

5. QC


# Calculate percent.mt for each cell
combined_seu[["percent.mt"]] <- PercentageFeatureSet(combined_seu, pattern = "^MT-")

# Filter cells with too few or too many genes
combined_seu <- subset(combined_seu, 
                       subset = nFeature_RNA > 200 & 
                                nFeature_RNA < 8000 & 
                                percent.mt < 10)


VlnPlot(combined_seu, features = c("nFeature_RNA", 
                                    "nCount_RNA", 
                                    "percent.mt"), 
                                      ncol = 3)

Warning: The `slot` argument of `FetchData()` is deprecated as of SeuratObject 5.0.0.
Please use the `layer` argument instead.Warning: `PackageCheck()` was deprecated in SeuratObject 5.0.0.
Please use `rlang::check_installed()` instead.

VlnPlot(combined_seu, features = c("nFeature_RNA", 
                                         "nCount_RNA", 
                                         "percent.mt",
                                         "percent.rb"), 
                            ncol = 4, pt.size = 0.1) & 
              theme(plot.title = element_text(size=10))

Warning: The following requested variables were not found: percent.rb

FeatureScatter(combined_seu, 
               feature1 = "nCount_RNA", 
               feature2 = "nFeature_RNA") +
  geom_smooth(method = 'lm')

##FeatureScatter is typically used to visualize feature-feature relationships ##for anything calculated by the object, ##i.e. columns in object metadata, PC scores etc.


FeatureScatter(combined_seu, 
               feature1 = "nCount_RNA", 
               feature2 = "percent.mt")+
  geom_smooth(method = 'lm')


FeatureScatter(combined_seu, 
               feature1 = "nCount_RNA", 
               feature2 = "nFeature_RNA")+
  geom_smooth(method = 'lm')

6. PCA Visualization




# TEST-1
# given that the output of RunPCA is "pca"
# replace "so" by the name of your seurat object

pct <- combined_seu[["pca"]]@stdev / sum(combined_seu[["pca"]]@stdev) * 100
cumu <- cumsum(pct) # Calculate cumulative percents for each PC
# Determine the difference between variation of PC and subsequent PC
co2 <- sort(which((pct[-length(pct)] - pct[-1]) > 0.1), decreasing = T)[1] + 1
# last point where change of % of variation is more than 0.1%. -> co2
co2

[1] 17

# TEST-2
# get significant PCs
stdv <- combined_seu[["pca"]]@stdev
sum.stdv <- sum(combined_seu[["pca"]]@stdev)
percent.stdv <- (stdv / sum.stdv) * 100
cumulative <- cumsum(percent.stdv)
co1 <- which(cumulative > 90 & percent.stdv < 5)[1]
co2 <- sort(which((percent.stdv[1:length(percent.stdv) - 1] - 
                       percent.stdv[2:length(percent.stdv)]) > 0.1), 
              decreasing = T)[1] + 1
min.pc <- min(co1, co2)
min.pc

[1] 17

# Create a dataframe with values
plot_df <- data.frame(pct = percent.stdv, 
           cumu = cumulative, 
           rank = 1:length(percent.stdv))

# Elbow plot to visualize 
  ggplot(plot_df, aes(cumulative, percent.stdv, label = rank, color = rank > min.pc)) + 
  geom_text() + 
  geom_vline(xintercept = 90, color = "grey") + 
  geom_hline(yintercept = min(percent.stdv[percent.stdv > 5]), color = "grey") +
  theme_bw()

NA
NA
NA

8. Clustering (resolution = 0.2)



combined_seu <- FindNeighbors(combined_seu, dims = 1:17)

Computing nearest neighbor graph
Computing SNN

combined_seu <- FindClusters(combined_seu, resolution = 0.2)

Modularity Optimizer version 1.3.0 by Ludo Waltman and Nees Jan van Eck

Number of nodes: 60239
Number of edges: 1451156

Running Louvain algorithm...

0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|

Maximum modularity in 10 random starts: 0.9536
Number of communities: 14
Elapsed time: 10 seconds

1 singletons identified. 13 final clusters.

# Run UMAP
combined_seu <- RunUMAP(combined_seu, dims = 1:17)

Warning: The default method for RunUMAP has changed from calling Python UMAP via reticulate to the R-native UWOT using the cosine metric
To use Python UMAP via reticulate, set umap.method to 'umap-learn' and metric to 'correlation'
This message will be shown once per session14:57:24 UMAP embedding parameters a = 0.9922 b = 1.112
14:57:24 Read 60239 rows and found 17 numeric columns
14:57:24 Using Annoy for neighbor search, n_neighbors = 30
14:57:24 Building Annoy index with metric = cosine, n_trees = 50
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
14:57:29 Writing NN index file to temp file /tmp/Rtmp59uyjN/file6c080219bb1b9
14:57:29 Searching Annoy index using 1 thread, search_k = 3000
14:57:47 Annoy recall = 100%
14:57:48 Commencing smooth kNN distance calibration using 1 thread with target n_neighbors = 30
14:57:50 Initializing from normalized Laplacian + noise (using RSpectra)
14:57:53 Commencing optimization for 200 epochs, with 2713556 positive edges
14:57:53 Using rng type: pcg
Using method 'umap'
0%   10   20   30   40   50   60   70   80   90   100%
[----|----|----|----|----|----|----|----|----|----|
**************************************************|
14:58:14 Optimization finished

# UMAP plot colored by clusters
DimPlot(combined_seu, reduction = "umap", label = TRUE, pt.size = 0.2) +
  ggtitle("UMAP of CD4+ T Cells (Resolution = 0.2)")

9. Visualize UMAP with Clusters


DimPlot(combined_seu, reduction = "umap", group.by = "patient_id", label = TRUE, pt.size = 0.6) +
  ggtitle("UMAP of Sézary Syndrome CD4+ T Cells")


DimPlot(combined_seu, reduction = "umap", label = TRUE,label.box = T,repel = T, pt.size = 0.6) +
  ggtitle("UMAP of Sézary Syndrome CD4+ T Cells")

NA
NA
NA

##. Metadata enhancements


combined_seu$disease_status <- ifelse(grepl("MF", combined_seu$patient_id), "MF", "Healthy")

10. FeaturePlots for Top50 UP

top_50_up <- read.csv("../top_50_upregulated.csv")        # or read.delim("top_50_up.tsv")
top_50_down <- read.csv("../top_50_downregulated.csv")



FeaturePlot(combined_seu, 
             features = top_50_up$gene[1:10], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)



FeaturePlot(combined_seu, 
             features = top_50_up$gene[11:20], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)


FeaturePlot(combined_seu, 
             features = top_50_up$gene[21:30], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

FeaturePlot(combined_seu, 
             features = top_50_up$gene[31:40], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

FeaturePlot(combined_seu, 
             features = top_50_up$gene[41:50], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

11. FeaturePlots for Top50 DOWN


FeaturePlot(combined_seu, 
             features = top_50_down$gene[1:10], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)



FeaturePlot(combined_seu, 
             features = top_50_down$gene[11:20], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)


FeaturePlot(combined_seu, 
             features = top_50_down$gene[21:30], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

FeaturePlot(combined_seu, 
             features = top_50_down$gene[31:40], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

FeaturePlot(combined_seu, 
             features = top_50_down$gene[41:50], 
             reduction = "umap", 
             cols = c("lightblue", "red"),  # Custom color gradient from light blue to red
             label = TRUE)

Visualization



DimPlot(combined_seu, group.by = "seurat_clusters", label = T, label.box = T, repel = T, reduction = "umap")

NA
NA

Visualization of Potential biomarkers-Upregulated



# Vector of genes to plot
up_genes <- c("CLIC1", "COX5A","GTSF1", "MAD2L1","MYBL2","MYL6B","NME1","PLK1", "PYCR1", "SLC25A5", "SRI", "TUBA1C", "UBE2T", "YWHAH")

# DotPlot with custom firebrick-red gradient
DotPlot(combined_seu, features = up_genes) +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Upregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Scale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

# DotPlot with custom firebrick-red gradient
DotPlot(combined_seu, features = up_genes, group.by = "patient_id") +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Upregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Scale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

# DotPlot with custom firebrick-red gradient
DotPlot(combined_seu, features = up_genes, group.by = "disease_status") +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Upregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Warning: Scaling data with a low number of groups may produce misleading resultsScale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

Visualization of Potential biomarkers-Downregulated



# Downregulated genes
down_genes <- c("TXNIP", "RASA3", "RIPOR2", 
                "ZFP36", "ZFP36L1", "ZFP36L2",
                "PRMT2", "MAX", "PIK3IP1", 
                "BTG1", "CDKN1B")

# DotPlot with firebrick color for high expression
DotPlot(combined_seu, features = down_genes) +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Downregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Scale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

# DotPlot with firebrick color for high expression
DotPlot(combined_seu, features = down_genes, group.by = "patient_id") +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Downregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Scale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

# DotPlot with firebrick color for high expression
DotPlot(combined_seu, features = down_genes, group.by = "disease_status") +
  RotatedAxis() +
  scale_color_gradient2(low = "lightblue", mid = "red", high = "firebrick", midpoint = 1) +
  ggtitle("Expression of Downregulated Genes in Sézary Syndrome") +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
    axis.text.y = element_text(size = 12),
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Warning: Scaling data with a low number of groups may produce misleading resultsScale for colour is already present.
Adding another scale for colour, which will replace the existing scale.

12. Compare disease status using RNA assay

# Load required libraries
library(Seurat)
library(dplyr)
library(tibble)

# Join the layers of the RNA assay
combined_seu <- JoinLayers(combined_seu, assay = "RNA")

# Ensure your identity class is set to disease status
Idents(combined_seu) <- "disease_status"  # e.g., levels: "SS", "Control"

# Run differential expression between SS vs Control
markers_disease <- FindMarkers(
  object = combined_seu,
  ident.1 = "MF",
  ident.2 = "Healthy",
  assay = "RNA",
  logfc.threshold = 0,
  min.pct = 0,
  test.use = "wilcox"  # or "MAST" if RNA assay supports it
)

# Save results to CSV
write.csv(markers_disease, file = "DE_MF_vs_Healthy.csv", row.names = TRUE)

# Get log-normalized expression matrix (RNA assay)
expression_data_RNA <- GetAssayData(combined_seu, assay = "RNA", slot = "data")

# Get cell names for each group
ss_cells <- WhichCells(combined_seu, idents = "MF")
healthy_cells <- WhichCells(combined_seu, idents = "Healthy")

# Function to add mean expression per group
calculate_mean_expression <- function(markers, group1_cells, group2_cells, expression_data) {
  group1_mean <- rowMeans(expression_data[, group1_cells, drop = FALSE], na.rm = TRUE)
  group2_mean <- rowMeans(expression_data[, group2_cells, drop = FALSE], na.rm = TRUE)
  markers <- markers %>%
    rownames_to_column("gene") %>%
    mutate(
      mean_expr_SS = group1_mean[gene],
      mean_expr_Healthy = group2_mean[gene],
      log2FC_manual = log2(mean_expr_SS + 1) - log2(mean_expr_Healthy + 1)
    )
  return(markers)
}

# Apply the function and save final result
markers_disease_with_mean <- calculate_mean_expression(markers_disease, ss_cells, healthy_cells, expression_data_RNA)
write.csv(markers_disease_with_mean, "DE_MF_vs_Healthy_with_MeanExpr.csv", row.names = FALSE)

Save the Seurat object as an RDS



saveRDS(combined_seu, file = "../data/MF_Gaydosik_MF_Healthy_Combined.rds")

LS0tCnRpdGxlOiAiUG90ZW50aWFsIGJpb21hcmtlcnMgVmFsaWRhdGlvbiAoR2F5ZG9zaWtfM19NYWxpZ25hbnRfMl9EaXNlYXNlX3N0YXRlX2hlYWx0aHkpLU1GIgphdXRob3I6IE5hc2lyIE1haG1vb2QgQWJiYXNpCmRhdGU6ICJgciBTeXMuRGF0ZSgpYCIKb3V0cHV0OgogICNybWRmb3JtYXRzOjpyZWFkdGhlZG93bgogIGh0bWxfbm90ZWJvb2s6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgdG9jX2NvbGxhcHNlZDogdHJ1ZQotLS0KCiMgMS4gbG9hZCBsaWJyYXJpZXMKYGBge3IgLCBpbmNsdWRlPUZBTFNFfQoKIyBBdCB0aGUgdG9wIG9mIHlvdXIgc2NyaXB0LCBjb21iaW5lIHBhY2thZ2VzIGxpa2UgdGhpczoKbGlicmFyeSh0aWR5dmVyc2UpICAgICAgIyBpbmNsdWRlcyBkcGx5ciwgZ2dwbG90MiwgdGliYmxlLCByZWFkciwgZXRjLgpsaWJyYXJ5KFNldXJhdCkKbGlicmFyeShoYXJtb255KQpsaWJyYXJ5KGRpdHRvU2VxKQpsaWJyYXJ5KHBsb3RseSkKbGlicmFyeShTZXVyYXREaXNrKQpsaWJyYXJ5KHBhdGNod29yaykKbGlicmFyeShybWFya2Rvd24pCmxpYnJhcnkoa25pdHIpCmxpYnJhcnkodGlueXRleCkKbGlicmFyeShBemltdXRoKQpsaWJyYXJ5KFNUQUNBUykKbGlicmFyeShQcm9qZWNUSUxzKQpsaWJyYXJ5KFNpbmdsZUNlbGxFeHBlcmltZW50KQoKYGBgCgoKIyAyLiBMb2FkIERhdGEgaW50byBTZXVyYXQKYGBge3IgfQoKIyBQYXRpZW50IElEcyBhbmQgSDUgZmlsZXMgKHJlcGxhY2Ugd2l0aCB5b3VyIGFjdHVhbCBmaWxlIHBhdGhzKQoKIyBEZWZpbmUgcGF0aHMgdG8geW91ciBINSBmaWxlcwpoNV9maWxlcyA8LSBsaXN0KAogICAiTUYxIiA9ICIuLi9kYXRhL01GL0dTTTU1Mzg3NzdfTUYxN3Jhd19mZWF0dXJlX2JjX21hdHJpeC5oNSIsICNNRi1QYXRpZW50CiAgICJNRjIiID0gIi4uL2RhdGEvTUYvR1NNNTUzODc3OF9NRjE4cmF3X2ZlYXR1cmVfYmNfbWF0cml4Lmg1IiwgI01GLVBhdGllbnQKICAgIk1GMyIgPSAiLi4vZGF0YS9NRi9HU001Njg3NzY4X01GMTlyYXdfZmVhdHVyZV9iY19tYXRyaXguaDUiLCAjTUYtUGF0aWVudAogICAiTUY0IiA9ICIuLi9kYXRhL01GL0dTTTU1Mzg3NzlfTUYyMXJhd19mZWF0dXJlX2JjX21hdHJpeC5oNSIsICNNRi1QYXRpZW50CiAgICJNRjUiID0gIi4uL2RhdGEvTUYvR1NNNTUzODc4MF9NRjI0X3Jhd19mZWF0dXJlX2JjX21hdHJpeC5oNSIsICNNRi1QYXRpZW50CiAgIkhDMV8yIiA9ICIuLi9kYXRhL0Rpc2Vhc2Vfc3RhdGVfSGVhbHRoeV9Db250cm9sL0dTTTU1Mzg3ODVfU0MzMjdyYXdfZmVhdHVyZV9iY19tYXRyaXguaDUiLCAjIGRpc2Vhc2Ugc3RhdGU6IEhlYWx0aHkgY29udHJvbC90aXNzdWU6IFNraW4gdHVtb3IKICAiSEMzXzQiID0gIi4uL2RhdGEvRGlzZWFzZV9zdGF0ZV9IZWFsdGh5X0NvbnRyb2wvR1NNNTUzODc4Nl9TQzM3NHJhd19mZWF0dXJlX2JjX21hdHJpeC5oNSIgIyBkaXNlYXNlIHN0YXRlOiBIZWFsdGh5IGNvbnRyb2wvdGlzc3VlOiBTa2luIHR1bW9yCikKCiMgUmVhZCBhbmQgY3JlYXRlIGluZGl2aWR1YWwgU2V1cmF0IG9iamVjdHMKc2V1cmF0X2xpc3QgPC0gbGlzdCgpCgpgYGAKCiMgMy4gTG9hZCBlYWNoIHBhdGllbnQgc2FtcGxlIHdpdGggbWV0YWRhdGEKYGBge3IgLCBmaWcuaGVpZ2h0PTYsIGZpZy53aWR0aD0xMH0KCnNldXJhdF9saXN0IDwtIGxpc3QoKQoKZm9yIChwYXRpZW50IGluIG5hbWVzKGg1X2ZpbGVzKSkgewogIHJhd19kYXRhIDwtIFJlYWQxMFhfaDUoaDVfZmlsZXNbW3BhdGllbnRdXSkKCiAgIyBJZiByYXdfZGF0YSBpcyBhIGxpc3QgKG11bHRpLW1vZGFsKSwgZXh0cmFjdCAiR2VuZSBFeHByZXNzaW9uIgogIGlmIChpcy5saXN0KHJhd19kYXRhKSkgewogICAgaWYgKCEiR2VuZSBFeHByZXNzaW9uIiAlaW4lIG5hbWVzKHJhd19kYXRhKSkgewogICAgICBzdG9wKHBhc3RlKCJHZW5lIEV4cHJlc3Npb24gbW9kYWxpdHkgbm90IGZvdW5kIGluIHBhdGllbnQiLCBwYXRpZW50KSkKICAgIH0KICAgIHJhd19jb3VudHMgPC0gcmF3X2RhdGFbWyJHZW5lIEV4cHJlc3Npb24iXV0KICB9IGVsc2UgewogICAgIyBTaW5nbGUgbW9kYWxpdHkKICAgIHJhd19jb3VudHMgPC0gcmF3X2RhdGEKICB9CgogIHNldSA8LSBDcmVhdGVTZXVyYXRPYmplY3QoCiAgICBjb3VudHMgPSByYXdfY291bnRzLAogICAgbWluLmNlbGxzID0gMywKICAgIG1pbi5mZWF0dXJlcyA9IDIwMCwKICAgIHByb2plY3QgPSBwYXRpZW50CiAgKQoKICBzZXUkcGF0aWVudF9pZCA8LSBwYXRpZW50CiAgc2V1cmF0X2xpc3RbW3BhdGllbnRdXSA8LSBzZXUKfQoKCgpgYGAKCiMgNC4gTWVyZ2UgQWxsIFBhdGllbnRzIGludG8gT25lIFNldXJhdCBPYmplY3QKYGBge3IgfQoKIyBNZXJnZSBpbnRvIGNvbWJpbmVkIFNldXJhdCBvYmplY3QKY29tYmluZWRfc2V1IDwtIG1lcmdlKAogIHNldXJhdF9saXN0W1sxXV0sCiAgeSA9IHNldXJhdF9saXN0Wy0xXSwKICBhZGQuY2VsbC5pZHMgPSBuYW1lcyhzZXVyYXRfbGlzdCksCiAgcHJvamVjdCA9ICJNRl9IQ19NZXJnZWQiCikKCiMgVXNpbmcgTG9nTm9ybWFsaXplIGZvciBzaW1wbGljaXR5IGFuZCBjb21wYXRpYmlsaXR5IHdpdGggcmVmZXJlbmNlIGRhdGFzZXRzOyAKIyBTQ1RyYW5zZm9ybSBjb3VsZCBiZSB1c2VkIGZvciBkZWVwZXIgaW50ZWdyYXRpb24uCgojIE5vcm1hbGl6YXRpb24gKExvZ05vcm1hbGl6ZSkKY29tYmluZWRfc2V1IDwtIE5vcm1hbGl6ZURhdGEoY29tYmluZWRfc2V1LCBub3JtYWxpemF0aW9uLm1ldGhvZCA9ICJMb2dOb3JtYWxpemUiLCBzY2FsZS5mYWN0b3IgPSAxMDAwMCkKCiMgVmFyaWFibGUgZmVhdHVyZXMgc2VsZWN0aW9uCmNvbWJpbmVkX3NldSA8LSBGaW5kVmFyaWFibGVGZWF0dXJlcyhjb21iaW5lZF9zZXUsIHNlbGVjdGlvbi5tZXRob2QgPSAidnN0IiwgbmZlYXR1cmVzID0gMjAwMCkKCiMgU2NhbGluZwpjb21iaW5lZF9zZXUgPC0gU2NhbGVEYXRhKGNvbWJpbmVkX3NldSkKCiMgUENBCmNvbWJpbmVkX3NldSA8LSBSdW5QQ0EoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IFZhcmlhYmxlRmVhdHVyZXMoY29tYmluZWRfc2V1KSkKCiMgRWxib3cgUGxvdCB0byBkZWNpZGUgbnVtYmVyIG9mIFBDcwpFbGJvd1Bsb3QoY29tYmluZWRfc2V1KQoKCiMgIyBTdGVwIDg6IEphY2tTdHJhdyAob3B0aW9uYWwgYnV0IHVzZWZ1bCBmb3IgUEMgc2lnbmlmaWNhbmNlKQojIGNvbWJpbmVkX3NldSA8LSBKYWNrU3RyYXcoY29tYmluZWRfc2V1LCBudW0ucmVwbGljYXRlID0gMTAwKQojIGNvbWJpbmVkX3NldSA8LSBTY29yZUphY2tTdHJhdyhjb21iaW5lZF9zZXUsIGRpbXMgPSAxOjIwKQojIEphY2tTdHJhd1Bsb3QoY29tYmluZWRfc2V1LCBkaW1zID0gMToyMCkKCgpgYGAKCgoKIyA1LiBRQwpgYGB7ciAsIGZpZy5oZWlnaHQ9NiwgZmlnLndpZHRoPTEwfQoKIyBDYWxjdWxhdGUgcGVyY2VudC5tdCBmb3IgZWFjaCBjZWxsCmNvbWJpbmVkX3NldVtbInBlcmNlbnQubXQiXV0gPC0gUGVyY2VudGFnZUZlYXR1cmVTZXQoY29tYmluZWRfc2V1LCBwYXR0ZXJuID0gIl5NVC0iKQoKIyBGaWx0ZXIgY2VsbHMgd2l0aCB0b28gZmV3IG9yIHRvbyBtYW55IGdlbmVzCmNvbWJpbmVkX3NldSA8LSBzdWJzZXQoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgICAgICAgICAgICBzdWJzZXQgPSBuRmVhdHVyZV9STkEgPiAyMDAgJiAKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBuRmVhdHVyZV9STkEgPCA4MDAwICYgCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgcGVyY2VudC5tdCA8IDEwKQoKClZsblBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IGMoIm5GZWF0dXJlX1JOQSIsIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAibkNvdW50X1JOQSIsIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAicGVyY2VudC5tdCIpLCAKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBuY29sID0gMykKClZsblBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IGMoIm5GZWF0dXJlX1JOQSIsIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICJuQ291bnRfUk5BIiwgCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgInBlcmNlbnQubXQiLAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICJwZXJjZW50LnJiIiksIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgbmNvbCA9IDQsIHB0LnNpemUgPSAwLjEpICYgCiAgICAgICAgICAgICAgdGhlbWUocGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChzaXplPTEwKSkKCkZlYXR1cmVTY2F0dGVyKGNvbWJpbmVkX3NldSwgCiAgICAgICAgICAgICAgIGZlYXR1cmUxID0gIm5Db3VudF9STkEiLCAKICAgICAgICAgICAgICAgZmVhdHVyZTIgPSAibkZlYXR1cmVfUk5BIikgKwogIGdlb21fc21vb3RoKG1ldGhvZCA9ICdsbScpCgpgYGAKCiMjRmVhdHVyZVNjYXR0ZXIgaXMgdHlwaWNhbGx5IHVzZWQgdG8gdmlzdWFsaXplIGZlYXR1cmUtZmVhdHVyZSByZWxhdGlvbnNoaXBzCiMjZm9yIGFueXRoaW5nIGNhbGN1bGF0ZWQgYnkgdGhlIG9iamVjdCwgCiMjaS5lLiBjb2x1bW5zIGluIG9iamVjdCBtZXRhZGF0YSwgUEMgc2NvcmVzIGV0Yy4KCmBgYHtyICwgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTB9CgpGZWF0dXJlU2NhdHRlcihjb21iaW5lZF9zZXUsIAogICAgICAgICAgICAgICBmZWF0dXJlMSA9ICJuQ291bnRfUk5BIiwgCiAgICAgICAgICAgICAgIGZlYXR1cmUyID0gInBlcmNlbnQubXQiKSsKICBnZW9tX3Ntb290aChtZXRob2QgPSAnbG0nKQoKRmVhdHVyZVNjYXR0ZXIoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgICAgZmVhdHVyZTEgPSAibkNvdW50X1JOQSIsIAogICAgICAgICAgICAgICBmZWF0dXJlMiA9ICJuRmVhdHVyZV9STkEiKSsKICBnZW9tX3Ntb290aChtZXRob2QgPSAnbG0nKQoKYGBgCgojIDYuIFBDQSBWaXN1YWxpemF0aW9uCmBgYHtyIFBDQS1URVNUMiwgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTB9CgoKCiMgVEVTVC0xCiMgZ2l2ZW4gdGhhdCB0aGUgb3V0cHV0IG9mIFJ1blBDQSBpcyAicGNhIgojIHJlcGxhY2UgInNvIiBieSB0aGUgbmFtZSBvZiB5b3VyIHNldXJhdCBvYmplY3QKCnBjdCA8LSBjb21iaW5lZF9zZXVbWyJwY2EiXV1Ac3RkZXYgLyBzdW0oY29tYmluZWRfc2V1W1sicGNhIl1dQHN0ZGV2KSAqIDEwMApjdW11IDwtIGN1bXN1bShwY3QpICMgQ2FsY3VsYXRlIGN1bXVsYXRpdmUgcGVyY2VudHMgZm9yIGVhY2ggUEMKIyBEZXRlcm1pbmUgdGhlIGRpZmZlcmVuY2UgYmV0d2VlbiB2YXJpYXRpb24gb2YgUEMgYW5kIHN1YnNlcXVlbnQgUEMKY28yIDwtIHNvcnQod2hpY2goKHBjdFstbGVuZ3RoKHBjdCldIC0gcGN0Wy0xXSkgPiAwLjEpLCBkZWNyZWFzaW5nID0gVClbMV0gKyAxCiMgbGFzdCBwb2ludCB3aGVyZSBjaGFuZ2Ugb2YgJSBvZiB2YXJpYXRpb24gaXMgbW9yZSB0aGFuIDAuMSUuIC0+IGNvMgpjbzIKCiMgVEVTVC0yCiMgZ2V0IHNpZ25pZmljYW50IFBDcwpzdGR2IDwtIGNvbWJpbmVkX3NldVtbInBjYSJdXUBzdGRldgpzdW0uc3RkdiA8LSBzdW0oY29tYmluZWRfc2V1W1sicGNhIl1dQHN0ZGV2KQpwZXJjZW50LnN0ZHYgPC0gKHN0ZHYgLyBzdW0uc3RkdikgKiAxMDAKY3VtdWxhdGl2ZSA8LSBjdW1zdW0ocGVyY2VudC5zdGR2KQpjbzEgPC0gd2hpY2goY3VtdWxhdGl2ZSA+IDkwICYgcGVyY2VudC5zdGR2IDwgNSlbMV0KY28yIDwtIHNvcnQod2hpY2goKHBlcmNlbnQuc3RkdlsxOmxlbmd0aChwZXJjZW50LnN0ZHYpIC0gMV0gLSAKICAgICAgICAgICAgICAgICAgICAgICBwZXJjZW50LnN0ZHZbMjpsZW5ndGgocGVyY2VudC5zdGR2KV0pID4gMC4xKSwgCiAgICAgICAgICAgICAgZGVjcmVhc2luZyA9IFQpWzFdICsgMQptaW4ucGMgPC0gbWluKGNvMSwgY28yKQptaW4ucGMKCiMgQ3JlYXRlIGEgZGF0YWZyYW1lIHdpdGggdmFsdWVzCnBsb3RfZGYgPC0gZGF0YS5mcmFtZShwY3QgPSBwZXJjZW50LnN0ZHYsIAogICAgICAgICAgIGN1bXUgPSBjdW11bGF0aXZlLCAKICAgICAgICAgICByYW5rID0gMTpsZW5ndGgocGVyY2VudC5zdGR2KSkKCiMgRWxib3cgcGxvdCB0byB2aXN1YWxpemUgCiAgZ2dwbG90KHBsb3RfZGYsIGFlcyhjdW11bGF0aXZlLCBwZXJjZW50LnN0ZHYsIGxhYmVsID0gcmFuaywgY29sb3IgPSByYW5rID4gbWluLnBjKSkgKyAKICBnZW9tX3RleHQoKSArIAogIGdlb21fdmxpbmUoeGludGVyY2VwdCA9IDkwLCBjb2xvciA9ICJncmV5IikgKyAKICBnZW9tX2hsaW5lKHlpbnRlcmNlcHQgPSBtaW4ocGVyY2VudC5zdGR2W3BlcmNlbnQuc3RkdiA+IDVdKSwgY29sb3IgPSAiZ3JleSIpICsKICB0aGVtZV9idygpCgogIAoKYGBgCgojIDguIENsdXN0ZXJpbmcgKHJlc29sdXRpb24gPSAwLjIpCmBgYHtyICwgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTB9CgoKY29tYmluZWRfc2V1IDwtIEZpbmROZWlnaGJvcnMoY29tYmluZWRfc2V1LCBkaW1zID0gMToxNykKY29tYmluZWRfc2V1IDwtIEZpbmRDbHVzdGVycyhjb21iaW5lZF9zZXUsIHJlc29sdXRpb24gPSAwLjIpCgojIFJ1biBVTUFQCmNvbWJpbmVkX3NldSA8LSBSdW5VTUFQKGNvbWJpbmVkX3NldSwgZGltcyA9IDE6MTcpCgojIFVNQVAgcGxvdCBjb2xvcmVkIGJ5IGNsdXN0ZXJzCkRpbVBsb3QoY29tYmluZWRfc2V1LCByZWR1Y3Rpb24gPSAidW1hcCIsIGxhYmVsID0gVFJVRSwgcHQuc2l6ZSA9IDAuMikgKwogIGdndGl0bGUoIlVNQVAgb2YgQ0Q0KyBUIENlbGxzIChSZXNvbHV0aW9uID0gMC4yKSIpCgpgYGAKCiMgOS4gVmlzdWFsaXplIFVNQVAgd2l0aCBDbHVzdGVycwpgYGB7ciAsIGZpZy5oZWlnaHQ9NiwgZmlnLndpZHRoPTEwfQoKRGltUGxvdChjb21iaW5lZF9zZXUsIHJlZHVjdGlvbiA9ICJ1bWFwIiwgZ3JvdXAuYnkgPSAicGF0aWVudF9pZCIsIGxhYmVsID0gVFJVRSwgcHQuc2l6ZSA9IDAuNikgKwogIGdndGl0bGUoIlVNQVAgb2YgU8OpemFyeSBTeW5kcm9tZSBDRDQrIFQgQ2VsbHMiKQoKRGltUGxvdChjb21iaW5lZF9zZXUsIHJlZHVjdGlvbiA9ICJ1bWFwIiwgbGFiZWwgPSBUUlVFLGxhYmVsLmJveCA9IFQscmVwZWwgPSBULCBwdC5zaXplID0gMC42KSArCiAgZ2d0aXRsZSgiVU1BUCBvZiBTw6l6YXJ5IFN5bmRyb21lIENENCsgVCBDZWxscyIpCgoKCmBgYAoKIyMuIE1ldGFkYXRhIGVuaGFuY2VtZW50cwpgYGB7ciAsIGZpZy5oZWlnaHQ9NiwgZmlnLndpZHRoPTEwfQoKY29tYmluZWRfc2V1JGRpc2Vhc2Vfc3RhdHVzIDwtIGlmZWxzZShncmVwbCgiTUYiLCBjb21iaW5lZF9zZXUkcGF0aWVudF9pZCksICJNRiIsICJIZWFsdGh5IikKCgoKYGBgCgoKIyAxMC4gIEZlYXR1cmVQbG90cyBmb3IgVG9wNTAgVVAKYGBge3IgLCBmaWcuaGVpZ2h0PTE2LCBmaWcud2lkdGg9MjB9CnRvcF81MF91cCA8LSByZWFkLmNzdigiLi4vdG9wXzUwX3VwcmVndWxhdGVkLmNzdiIpICAgICAgICAjIG9yIHJlYWQuZGVsaW0oInRvcF81MF91cC50c3YiKQp0b3BfNTBfZG93biA8LSByZWFkLmNzdigiLi4vdG9wXzUwX2Rvd25yZWd1bGF0ZWQuY3N2IikKCgoKRmVhdHVyZVBsb3QoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgIGZlYXR1cmVzID0gdG9wXzUwX3VwJGdlbmVbMToxMF0sIAogICAgICAgICAgICAgcmVkdWN0aW9uID0gInVtYXAiLCAKICAgICAgICAgICAgIGNvbHMgPSBjKCJsaWdodGJsdWUiLCAicmVkIiksICAjIEN1c3RvbSBjb2xvciBncmFkaWVudCBmcm9tIGxpZ2h0IGJsdWUgdG8gcmVkCiAgICAgICAgICAgICBsYWJlbCA9IFRSVUUpCgoKRmVhdHVyZVBsb3QoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgIGZlYXR1cmVzID0gdG9wXzUwX3VwJGdlbmVbMTE6MjBdLCAKICAgICAgICAgICAgIHJlZHVjdGlvbiA9ICJ1bWFwIiwgCiAgICAgICAgICAgICBjb2xzID0gYygibGlnaHRibHVlIiwgInJlZCIpLCAgIyBDdXN0b20gY29sb3IgZ3JhZGllbnQgZnJvbSBsaWdodCBibHVlIHRvIHJlZAogICAgICAgICAgICAgbGFiZWwgPSBUUlVFKQoKRmVhdHVyZVBsb3QoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgIGZlYXR1cmVzID0gdG9wXzUwX3VwJGdlbmVbMjE6MzBdLCAKICAgICAgICAgICAgIHJlZHVjdGlvbiA9ICJ1bWFwIiwgCiAgICAgICAgICAgICBjb2xzID0gYygibGlnaHRibHVlIiwgInJlZCIpLCAgIyBDdXN0b20gY29sb3IgZ3JhZGllbnQgZnJvbSBsaWdodCBibHVlIHRvIHJlZAogICAgICAgICAgICAgbGFiZWwgPSBUUlVFKQpGZWF0dXJlUGxvdChjb21iaW5lZF9zZXUsIAogICAgICAgICAgICAgZmVhdHVyZXMgPSB0b3BfNTBfdXAkZ2VuZVszMTo0MF0sIAogICAgICAgICAgICAgcmVkdWN0aW9uID0gInVtYXAiLCAKICAgICAgICAgICAgIGNvbHMgPSBjKCJsaWdodGJsdWUiLCAicmVkIiksICAjIEN1c3RvbSBjb2xvciBncmFkaWVudCBmcm9tIGxpZ2h0IGJsdWUgdG8gcmVkCiAgICAgICAgICAgICBsYWJlbCA9IFRSVUUpCkZlYXR1cmVQbG90KGNvbWJpbmVkX3NldSwgCiAgICAgICAgICAgICBmZWF0dXJlcyA9IHRvcF81MF91cCRnZW5lWzQxOjUwXSwgCiAgICAgICAgICAgICByZWR1Y3Rpb24gPSAidW1hcCIsIAogICAgICAgICAgICAgY29scyA9IGMoImxpZ2h0Ymx1ZSIsICJyZWQiKSwgICMgQ3VzdG9tIGNvbG9yIGdyYWRpZW50IGZyb20gbGlnaHQgYmx1ZSB0byByZWQKICAgICAgICAgICAgIGxhYmVsID0gVFJVRSkKCmBgYAoKCgojIDExLiAgRmVhdHVyZVBsb3RzIGZvciBUb3A1MCBET1dOCmBgYHtyICwgZmlnLmhlaWdodD0xNiwgZmlnLndpZHRoPTIwfQoKRmVhdHVyZVBsb3QoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgIGZlYXR1cmVzID0gdG9wXzUwX2Rvd24kZ2VuZVsxOjEwXSwgCiAgICAgICAgICAgICByZWR1Y3Rpb24gPSAidW1hcCIsIAogICAgICAgICAgICAgY29scyA9IGMoImxpZ2h0Ymx1ZSIsICJyZWQiKSwgICMgQ3VzdG9tIGNvbG9yIGdyYWRpZW50IGZyb20gbGlnaHQgYmx1ZSB0byByZWQKICAgICAgICAgICAgIGxhYmVsID0gVFJVRSkKCgpGZWF0dXJlUGxvdChjb21iaW5lZF9zZXUsIAogICAgICAgICAgICAgZmVhdHVyZXMgPSB0b3BfNTBfZG93biRnZW5lWzExOjIwXSwgCiAgICAgICAgICAgICByZWR1Y3Rpb24gPSAidW1hcCIsIAogICAgICAgICAgICAgY29scyA9IGMoImxpZ2h0Ymx1ZSIsICJyZWQiKSwgICMgQ3VzdG9tIGNvbG9yIGdyYWRpZW50IGZyb20gbGlnaHQgYmx1ZSB0byByZWQKICAgICAgICAgICAgIGxhYmVsID0gVFJVRSkKCkZlYXR1cmVQbG90KGNvbWJpbmVkX3NldSwgCiAgICAgICAgICAgICBmZWF0dXJlcyA9IHRvcF81MF9kb3duJGdlbmVbMjE6MzBdLCAKICAgICAgICAgICAgIHJlZHVjdGlvbiA9ICJ1bWFwIiwgCiAgICAgICAgICAgICBjb2xzID0gYygibGlnaHRibHVlIiwgInJlZCIpLCAgIyBDdXN0b20gY29sb3IgZ3JhZGllbnQgZnJvbSBsaWdodCBibHVlIHRvIHJlZAogICAgICAgICAgICAgbGFiZWwgPSBUUlVFKQpGZWF0dXJlUGxvdChjb21iaW5lZF9zZXUsIAogICAgICAgICAgICAgZmVhdHVyZXMgPSB0b3BfNTBfZG93biRnZW5lWzMxOjQwXSwgCiAgICAgICAgICAgICByZWR1Y3Rpb24gPSAidW1hcCIsIAogICAgICAgICAgICAgY29scyA9IGMoImxpZ2h0Ymx1ZSIsICJyZWQiKSwgICMgQ3VzdG9tIGNvbG9yIGdyYWRpZW50IGZyb20gbGlnaHQgYmx1ZSB0byByZWQKICAgICAgICAgICAgIGxhYmVsID0gVFJVRSkKRmVhdHVyZVBsb3QoY29tYmluZWRfc2V1LCAKICAgICAgICAgICAgIGZlYXR1cmVzID0gdG9wXzUwX2Rvd24kZ2VuZVs0MTo1MF0sIAogICAgICAgICAgICAgcmVkdWN0aW9uID0gInVtYXAiLCAKICAgICAgICAgICAgIGNvbHMgPSBjKCJsaWdodGJsdWUiLCAicmVkIiksICAjIEN1c3RvbSBjb2xvciBncmFkaWVudCBmcm9tIGxpZ2h0IGJsdWUgdG8gcmVkCiAgICAgICAgICAgICBsYWJlbCA9IFRSVUUpCmBgYAoKIyMgVmlzdWFsaXphdGlvbgpgYGB7ciAsIGZpZy5oZWlnaHQ9NiwgZmlnLndpZHRoPTEwfQoKCkRpbVBsb3QoY29tYmluZWRfc2V1LCBncm91cC5ieSA9ICJzZXVyYXRfY2x1c3RlcnMiLCBsYWJlbCA9IFQsIGxhYmVsLmJveCA9IFQsIHJlcGVsID0gVCwgcmVkdWN0aW9uID0gInVtYXAiKQoKCmBgYAoKIyMgVmlzdWFsaXphdGlvbiBvZiBQb3RlbnRpYWwgYmlvbWFya2Vycy1VcHJlZ3VsYXRlZApgYGB7ciAsIGZpZy5oZWlnaHQ9NiwgZmlnLndpZHRoPTEwfQoKCiMgVmVjdG9yIG9mIGdlbmVzIHRvIHBsb3QKdXBfZ2VuZXMgPC0gYygiQ0xJQzEiLCAiQ09YNUEiLCJHVFNGMSIsICJNQUQyTDEiLCJNWUJMMiIsIk1ZTDZCIiwiTk1FMSIsIlBMSzEiLCAiUFlDUjEiLCAiU0xDMjVBNSIsICJTUkkiLCAiVFVCQTFDIiwgIlVCRTJUIiwgIllXSEFIIikKCiMgRG90UGxvdCB3aXRoIGN1c3RvbSBmaXJlYnJpY2stcmVkIGdyYWRpZW50CkRvdFBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IHVwX2dlbmVzKSArCiAgUm90YXRlZEF4aXMoKSArCiAgc2NhbGVfY29sb3JfZ3JhZGllbnQyKGxvdyA9ICJsaWdodGJsdWUiLCBtaWQgPSAicmVkIiwgaGlnaCA9ICJmaXJlYnJpY2siLCBtaWRwb2ludCA9IDEpICsKICBnZ3RpdGxlKCJFeHByZXNzaW9uIG9mIFVwcmVndWxhdGVkIEdlbmVzIGluIFPDqXphcnkgU3luZHJvbWUiKSArCiAgdGhlbWUoCiAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1LCBoanVzdCA9IDEsIHNpemUgPSAxMiksCiAgICBheGlzLnRleHQueSA9IGVsZW1lbnRfdGV4dChzaXplID0gMTIpLAogICAgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChoanVzdCA9IDAuNSwgZmFjZSA9ICJib2xkIiwgc2l6ZSA9IDE0KQogICkKCiMgRG90UGxvdCB3aXRoIGN1c3RvbSBmaXJlYnJpY2stcmVkIGdyYWRpZW50CkRvdFBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IHVwX2dlbmVzLCBncm91cC5ieSA9ICJwYXRpZW50X2lkIikgKwogIFJvdGF0ZWRBeGlzKCkgKwogIHNjYWxlX2NvbG9yX2dyYWRpZW50Mihsb3cgPSAibGlnaHRibHVlIiwgbWlkID0gInJlZCIsIGhpZ2ggPSAiZmlyZWJyaWNrIiwgbWlkcG9pbnQgPSAxKSArCiAgZ2d0aXRsZSgiRXhwcmVzc2lvbiBvZiBVcHJlZ3VsYXRlZCBHZW5lcyBpbiBTw6l6YXJ5IFN5bmRyb21lIikgKwogIHRoZW1lKAogICAgYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA0NSwgaGp1c3QgPSAxLCBzaXplID0gMTIpLAogICAgYXhpcy50ZXh0LnkgPSBlbGVtZW50X3RleHQoc2l6ZSA9IDEyKSwKICAgIHBsb3QudGl0bGUgPSBlbGVtZW50X3RleHQoaGp1c3QgPSAwLjUsIGZhY2UgPSAiYm9sZCIsIHNpemUgPSAxNCkKICApCgojIERvdFBsb3Qgd2l0aCBjdXN0b20gZmlyZWJyaWNrLXJlZCBncmFkaWVudApEb3RQbG90KGNvbWJpbmVkX3NldSwgZmVhdHVyZXMgPSB1cF9nZW5lcywgZ3JvdXAuYnkgPSAiZGlzZWFzZV9zdGF0dXMiKSArCiAgUm90YXRlZEF4aXMoKSArCiAgc2NhbGVfY29sb3JfZ3JhZGllbnQyKGxvdyA9ICJsaWdodGJsdWUiLCBtaWQgPSAicmVkIiwgaGlnaCA9ICJmaXJlYnJpY2siLCBtaWRwb2ludCA9IDEpICsKICBnZ3RpdGxlKCJFeHByZXNzaW9uIG9mIFVwcmVndWxhdGVkIEdlbmVzIGluIFPDqXphcnkgU3luZHJvbWUiKSArCiAgdGhlbWUoCiAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1LCBoanVzdCA9IDEsIHNpemUgPSAxMiksCiAgICBheGlzLnRleHQueSA9IGVsZW1lbnRfdGV4dChzaXplID0gMTIpLAogICAgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChoanVzdCA9IDAuNSwgZmFjZSA9ICJib2xkIiwgc2l6ZSA9IDE0KQogICkKYGBgCgoKCiMjIFZpc3VhbGl6YXRpb24gb2YgUG90ZW50aWFsIGJpb21hcmtlcnMtRG93bnJlZ3VsYXRlZApgYGB7ciBDMiwgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTB9CgoKIyBEb3ducmVndWxhdGVkIGdlbmVzCmRvd25fZ2VuZXMgPC0gYygiVFhOSVAiLCAiUkFTQTMiLCAiUklQT1IyIiwgCiAgICAgICAgICAgICAgICAiWkZQMzYiLCAiWkZQMzZMMSIsICJaRlAzNkwyIiwKICAgICAgICAgICAgICAgICJQUk1UMiIsICJNQVgiLCAiUElLM0lQMSIsIAogICAgICAgICAgICAgICAgIkJURzEiLCAiQ0RLTjFCIikKCiMgRG90UGxvdCB3aXRoIGZpcmVicmljayBjb2xvciBmb3IgaGlnaCBleHByZXNzaW9uCkRvdFBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IGRvd25fZ2VuZXMpICsKICBSb3RhdGVkQXhpcygpICsKICBzY2FsZV9jb2xvcl9ncmFkaWVudDIobG93ID0gImxpZ2h0Ymx1ZSIsIG1pZCA9ICJyZWQiLCBoaWdoID0gImZpcmVicmljayIsIG1pZHBvaW50ID0gMSkgKwogIGdndGl0bGUoIkV4cHJlc3Npb24gb2YgRG93bnJlZ3VsYXRlZCBHZW5lcyBpbiBTw6l6YXJ5IFN5bmRyb21lIikgKwogIHRoZW1lKAogICAgYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA0NSwgaGp1c3QgPSAxLCBzaXplID0gMTIpLAogICAgYXhpcy50ZXh0LnkgPSBlbGVtZW50X3RleHQoc2l6ZSA9IDEyKSwKICAgIHBsb3QudGl0bGUgPSBlbGVtZW50X3RleHQoaGp1c3QgPSAwLjUsIGZhY2UgPSAiYm9sZCIsIHNpemUgPSAxNCkKICApCgojIERvdFBsb3Qgd2l0aCBmaXJlYnJpY2sgY29sb3IgZm9yIGhpZ2ggZXhwcmVzc2lvbgpEb3RQbG90KGNvbWJpbmVkX3NldSwgZmVhdHVyZXMgPSBkb3duX2dlbmVzLCBncm91cC5ieSA9ICJwYXRpZW50X2lkIikgKwogIFJvdGF0ZWRBeGlzKCkgKwogIHNjYWxlX2NvbG9yX2dyYWRpZW50Mihsb3cgPSAibGlnaHRibHVlIiwgbWlkID0gInJlZCIsIGhpZ2ggPSAiZmlyZWJyaWNrIiwgbWlkcG9pbnQgPSAxKSArCiAgZ2d0aXRsZSgiRXhwcmVzc2lvbiBvZiBEb3ducmVndWxhdGVkIEdlbmVzIGluIFPDqXphcnkgU3luZHJvbWUiKSArCiAgdGhlbWUoCiAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1LCBoanVzdCA9IDEsIHNpemUgPSAxMiksCiAgICBheGlzLnRleHQueSA9IGVsZW1lbnRfdGV4dChzaXplID0gMTIpLAogICAgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChoanVzdCA9IDAuNSwgZmFjZSA9ICJib2xkIiwgc2l6ZSA9IDE0KQogICkKCiMgRG90UGxvdCB3aXRoIGZpcmVicmljayBjb2xvciBmb3IgaGlnaCBleHByZXNzaW9uCkRvdFBsb3QoY29tYmluZWRfc2V1LCBmZWF0dXJlcyA9IGRvd25fZ2VuZXMsIGdyb3VwLmJ5ID0gImRpc2Vhc2Vfc3RhdHVzIikgKwogIFJvdGF0ZWRBeGlzKCkgKwogIHNjYWxlX2NvbG9yX2dyYWRpZW50Mihsb3cgPSAibGlnaHRibHVlIiwgbWlkID0gInJlZCIsIGhpZ2ggPSAiZmlyZWJyaWNrIiwgbWlkcG9pbnQgPSAxKSArCiAgZ2d0aXRsZSgiRXhwcmVzc2lvbiBvZiBEb3ducmVndWxhdGVkIEdlbmVzIGluIFPDqXphcnkgU3luZHJvbWUiKSArCiAgdGhlbWUoCiAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1LCBoanVzdCA9IDEsIHNpemUgPSAxMiksCiAgICBheGlzLnRleHQueSA9IGVsZW1lbnRfdGV4dChzaXplID0gMTIpLAogICAgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChoanVzdCA9IDAuNSwgZmFjZSA9ICJib2xkIiwgc2l6ZSA9IDE0KQogICkKCmBgYAoKIyAxMi4gQ29tcGFyZSBkaXNlYXNlIHN0YXR1cyB1c2luZyBSTkEgYXNzYXkKYGBge3IgYXppbXV0aF9Bbm5vdGF0aW9uLCBmaWcuaGVpZ2h0PTQsIGZpZy53aWR0aD02fQojIExvYWQgcmVxdWlyZWQgbGlicmFyaWVzCmxpYnJhcnkoU2V1cmF0KQpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KHRpYmJsZSkKCiMgSm9pbiB0aGUgbGF5ZXJzIG9mIHRoZSBSTkEgYXNzYXkKY29tYmluZWRfc2V1IDwtIEpvaW5MYXllcnMoY29tYmluZWRfc2V1LCBhc3NheSA9ICJSTkEiKQoKIyBFbnN1cmUgeW91ciBpZGVudGl0eSBjbGFzcyBpcyBzZXQgdG8gZGlzZWFzZSBzdGF0dXMKSWRlbnRzKGNvbWJpbmVkX3NldSkgPC0gImRpc2Vhc2Vfc3RhdHVzIiAgIyBlLmcuLCBsZXZlbHM6ICJTUyIsICJDb250cm9sIgoKIyBSdW4gZGlmZmVyZW50aWFsIGV4cHJlc3Npb24gYmV0d2VlbiBTUyB2cyBDb250cm9sCm1hcmtlcnNfZGlzZWFzZSA8LSBGaW5kTWFya2VycygKICBvYmplY3QgPSBjb21iaW5lZF9zZXUsCiAgaWRlbnQuMSA9ICJNRiIsCiAgaWRlbnQuMiA9ICJIZWFsdGh5IiwKICBhc3NheSA9ICJSTkEiLAogIGxvZ2ZjLnRocmVzaG9sZCA9IDAsCiAgbWluLnBjdCA9IDAsCiAgdGVzdC51c2UgPSAid2lsY294IiAgIyBvciAiTUFTVCIgaWYgUk5BIGFzc2F5IHN1cHBvcnRzIGl0CikKCiMgU2F2ZSByZXN1bHRzIHRvIENTVgp3cml0ZS5jc3YobWFya2Vyc19kaXNlYXNlLCBmaWxlID0gIkRFX01GX3ZzX0hlYWx0aHkuY3N2Iiwgcm93Lm5hbWVzID0gVFJVRSkKCiMgR2V0IGxvZy1ub3JtYWxpemVkIGV4cHJlc3Npb24gbWF0cml4IChSTkEgYXNzYXkpCmV4cHJlc3Npb25fZGF0YV9STkEgPC0gR2V0QXNzYXlEYXRhKGNvbWJpbmVkX3NldSwgYXNzYXkgPSAiUk5BIiwgc2xvdCA9ICJkYXRhIikKCiMgR2V0IGNlbGwgbmFtZXMgZm9yIGVhY2ggZ3JvdXAKc3NfY2VsbHMgPC0gV2hpY2hDZWxscyhjb21iaW5lZF9zZXUsIGlkZW50cyA9ICJNRiIpCmhlYWx0aHlfY2VsbHMgPC0gV2hpY2hDZWxscyhjb21iaW5lZF9zZXUsIGlkZW50cyA9ICJIZWFsdGh5IikKCiMgRnVuY3Rpb24gdG8gYWRkIG1lYW4gZXhwcmVzc2lvbiBwZXIgZ3JvdXAKY2FsY3VsYXRlX21lYW5fZXhwcmVzc2lvbiA8LSBmdW5jdGlvbihtYXJrZXJzLCBncm91cDFfY2VsbHMsIGdyb3VwMl9jZWxscywgZXhwcmVzc2lvbl9kYXRhKSB7CiAgZ3JvdXAxX21lYW4gPC0gcm93TWVhbnMoZXhwcmVzc2lvbl9kYXRhWywgZ3JvdXAxX2NlbGxzLCBkcm9wID0gRkFMU0VdLCBuYS5ybSA9IFRSVUUpCiAgZ3JvdXAyX21lYW4gPC0gcm93TWVhbnMoZXhwcmVzc2lvbl9kYXRhWywgZ3JvdXAyX2NlbGxzLCBkcm9wID0gRkFMU0VdLCBuYS5ybSA9IFRSVUUpCiAgbWFya2VycyA8LSBtYXJrZXJzICU+JQogICAgcm93bmFtZXNfdG9fY29sdW1uKCJnZW5lIikgJT4lCiAgICBtdXRhdGUoCiAgICAgIG1lYW5fZXhwcl9TUyA9IGdyb3VwMV9tZWFuW2dlbmVdLAogICAgICBtZWFuX2V4cHJfSGVhbHRoeSA9IGdyb3VwMl9tZWFuW2dlbmVdLAogICAgICBsb2cyRkNfbWFudWFsID0gbG9nMihtZWFuX2V4cHJfU1MgKyAxKSAtIGxvZzIobWVhbl9leHByX0hlYWx0aHkgKyAxKQogICAgKQogIHJldHVybihtYXJrZXJzKQp9CgojIEFwcGx5IHRoZSBmdW5jdGlvbiBhbmQgc2F2ZSBmaW5hbCByZXN1bHQKbWFya2Vyc19kaXNlYXNlX3dpdGhfbWVhbiA8LSBjYWxjdWxhdGVfbWVhbl9leHByZXNzaW9uKG1hcmtlcnNfZGlzZWFzZSwgc3NfY2VsbHMsIGhlYWx0aHlfY2VsbHMsIGV4cHJlc3Npb25fZGF0YV9STkEpCndyaXRlLmNzdihtYXJrZXJzX2Rpc2Vhc2Vfd2l0aF9tZWFuLCAiREVfTUZfdnNfSGVhbHRoeV93aXRoX01lYW5FeHByLmNzdiIsIHJvdy5uYW1lcyA9IEZBTFNFKQoKYGBgCgoKIyBTYXZlIHRoZSBTZXVyYXQgb2JqZWN0IGFzIGFuIFJEUwpgYGB7ciBzYXZlUkRTfQoKCnNhdmVSRFMoY29tYmluZWRfc2V1LCBmaWxlID0gIi4uL2RhdGEvTUZfR2F5ZG9zaWtfTUZfSGVhbHRoeV9Db21iaW5lZC5yZHMiKQoKCmBgYAoKCgo=

Potential biomarkers Validation (Gaydosik_3_Malignant_2_Disease_state_healthy)-MF

Nasir Mahmood Abbasi

2025-07-15