knitr::opts_chunk$set(echo = TRUE)

dds <- read_csv("Count Table RNA Seq Data for 6703 presentation.csv")

## Rows: 8232 Columns: 12
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): id, Predicted annotation/function, Predicted ortholog
## dbl (9): NBF1, NBF2, NBF3, BF3hr1, BF3hr2, BF3hr3, BF24hr1, BF24hr3, BF24hr4
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

# I made a csv from the excel file because idk what an rds file is or how to read it 

raw <- read.csv("Count Table RNA Seq Data for 6703 presentation.csv",
                header = TRUE,
                stringsAsFactors = FALSE)

# need to get just the columns we care about 
counts <- raw[, c("NBF1","NBF2","NBF3",
                  "BF3hr1","BF3hr2","BF3hr3",
                  "BF24hr1","BF24hr3","BF24hr4")]


#but we need the gene IDs too 
rownames(counts) <- raw$id

# make a matrix and make the counts be numbers 
#the numbers themnselves are the number of sequencing reads mapped to that gene 
#I THINK higher number = more RNA
counts <- as.matrix(counts)
mode(counts) <- "numeric"

head(counts)

##                       NBF1 NBF2 NBF3 BF3hr1 BF3hr2 BF3hr3 BF24hr1 BF24hr3
## Locus10002v1rpkm9.17    51   50   50    298    191    200     128      93
## Locus10003v1rpkm9.17    31   77   78     15     31     24      45      38
## Locus1000v1rpkm136.27 3044 4470 3098   1289   1344   1276    2222    1897
## Locus1000v2rpkm50.24   866 1076  757    470    643    510     393     376
## Locus10016v1rpkm9.16    75  133  115     38     58     51      50      36
## Locus10018v1rpkm9.16    44   73   47     65     53     34     108      69
##                       BF24hr4
## Locus10002v1rpkm9.17      151
## Locus10003v1rpkm9.17       25
## Locus1000v1rpkm136.27    2371
## Locus1000v2rpkm50.24      509
## Locus10016v1rpkm9.16       56
## Locus10018v1rpkm9.16       80

condition <- factor(c(rep("NBF",3),
                      rep("BF3hr",3),
                      rep("BF24hr",3)))

coldata <- data.frame(
  row.names = colnames(counts),
  condition = condition
)

# Use DESeq2 like in lab 

dds <- DESeqDataSetFromMatrix(
  countData = counts,
  colData = coldata,
  design = ~ condition
)

## converting counts to integer mode

#normalized to account for differences in library size
dds_vst1 <- varianceStabilizingTransformation(dds)

PCA Plot

#plot 
plotPCA(dds_vst1, intgroup = "condition", ntop = 500)

## using ntop=500 top features by variance

#distance along X axis here counts double bc it explains more variance

#make pretty
pca_df <- plotPCA(
  dds_vst1,
  ntop = 500,
  intgroup = c("condition"),
  returnData = TRUE
)

## using ntop=500 top features by variance

pct_var <- round(100 * attr(pca_df, "percentVar"), 1)
pct_var

## [1] 49.4 28.2

ggplot(pca_df) +
  aes(x = PC1, y = PC2, color = condition) +
  geom_point(size = 10) +
  scale_color_brewer(palette = "Dark2", name = "Feeding Treatment") +
  theme_bw(base_size = 26) +
  labs(
    x = paste0("PC1 (", pct_var[1], "%)"),
    y = paste0("PC2 (", pct_var[2], "%)")
  )

Differential expression

#Differentional expression 
dds <- DESeq(dds)

## estimating size factors

## estimating dispersions

## gene-wise dispersion estimates

## mean-dispersion relationship

## final dispersion estimates

## fitting model and testing

Liz: NBF vs. BF3

res_NBF.BF3 <- results(dds, contrast = c("condition", "NBF", "BF3hr"))
head(res_NBF.BF3)

## log2 fold change (MLE): condition NBF vs BF3hr 
## Wald test p-value: condition NBF vs BF3hr 
## DataFrame with 6 rows and 6 columns
##                        baseMean log2FoldChange     lfcSE       stat      pvalue
##                       <numeric>      <numeric> <numeric>  <numeric>   <numeric>
## Locus10002v1rpkm9.17   155.2077      -3.042106 0.2926413 -10.395343 2.60348e-25
## Locus10003v1rpkm9.17    37.9684       0.556711 0.4656658   1.195517 2.31885e-01
## Locus1000v1rpkm136.27 2187.7091       0.569815 0.0922209   6.178813 6.45854e-10
## Locus1000v2rpkm50.24   590.7223      -0.121061 0.1536421  -0.787939 4.30732e-01
## Locus10016v1rpkm9.16    62.6007       0.277192 0.2866525   0.966997 3.33546e-01
## Locus10018v1rpkm9.16    67.4962      -0.780650 0.3325833  -2.347230 1.89136e-02
##                              padj
##                         <numeric>
## Locus10002v1rpkm9.17  1.96121e-23
## Locus10003v1rpkm9.17  3.59586e-01
## Locus1000v1rpkm136.27 1.04455e-08
## Locus1000v2rpkm50.24  5.66604e-01
## Locus10016v1rpkm9.16  4.71060e-01
## Locus10018v1rpkm9.16  4.99676e-02

res_NBF.BF3

## log2 fold change (MLE): condition NBF vs BF3hr 
## Wald test p-value: condition NBF vs BF3hr 
## DataFrame with 8232 rows and 6 columns
##                          baseMean log2FoldChange     lfcSE       stat
##                         <numeric>      <numeric> <numeric>  <numeric>
## Locus10002v1rpkm9.17     155.2077      -3.042106 0.2926413 -10.395343
## Locus10003v1rpkm9.17      37.9684       0.556711 0.4656658   1.195517
## Locus1000v1rpkm136.27   2187.7091       0.569815 0.0922209   6.178813
## Locus1000v2rpkm50.24     590.7223      -0.121061 0.1536421  -0.787939
## Locus10016v1rpkm9.16      62.6007       0.277192 0.2866525   0.966997
## ...                           ...            ...       ...        ...
## Locus998v1rpkm136.49    2767.9947       0.349953  0.146924   2.381864
## Locus999v1rpkm136.41    1313.6537       1.667015  0.180132   9.254418
## Locus999v2rpkm3.78_PRE    12.1084       0.869733  0.881698   0.986429
## Locus99v1rpkm1550.33    6455.4607      -1.006157  0.300965  -3.343101
## Locus9v1rpkm6429.19    23308.1282      -0.175770  0.170318  -1.032008
##                             pvalue        padj
##                          <numeric>   <numeric>
## Locus10002v1rpkm9.17   2.60348e-25 1.96121e-23
## Locus10003v1rpkm9.17   2.31885e-01 3.59586e-01
## Locus1000v1rpkm136.27  6.45854e-10 1.04455e-08
## Locus1000v2rpkm50.24   4.30732e-01 5.66604e-01
## Locus10016v1rpkm9.16   3.33546e-01 4.71060e-01
## ...                            ...         ...
## Locus998v1rpkm136.49   1.72253e-02 4.62514e-02
## Locus999v1rpkm136.41   2.15400e-20 1.17910e-18
## Locus999v2rpkm3.78_PRE 3.23922e-01 4.60160e-01
## Locus99v1rpkm1550.33   8.28479e-04 3.65733e-03
## Locus9v1rpkm6429.19    3.02068e-01 4.37671e-01

sum(res_NBF.BF3$padj < 0.05, na.rm = TRUE)

## [1] 3108

#sum = 3108 --> number of differential expressed genes 
#1 --> filter by values with padj < 0.005, take those, match with orthologs, run David's analysis? 
#2 --> merge this with raw data based on gene ID to get back to orthologs

Emily: NBF vs. BF24

res_NBF.BF24 <- results(dds, contrast = c("condition", "NBF", "BF24hr"))
head(res_NBF.BF24)

## log2 fold change (MLE): condition NBF vs BF24hr 
## Wald test p-value: condition NBF vs BF24hr 
## DataFrame with 6 rows and 6 columns
##                        baseMean log2FoldChange     lfcSE      stat      pvalue
##                       <numeric>      <numeric> <numeric> <numeric>   <numeric>
## Locus10002v1rpkm9.17   155.2077      -2.138095 0.2972055 -7.193996 6.29221e-13
## Locus10003v1rpkm9.17    37.9684      -0.116472 0.4538049 -0.256657 7.97443e-01
## Locus1000v1rpkm136.27 2187.7091      -0.173208 0.0910788 -1.901733 5.72060e-02
## Locus1000v2rpkm50.24   590.7223       0.208926 0.1547960  1.349685 1.77117e-01
## Locus10016v1rpkm9.16    62.6007       0.315576 0.2876792  1.096972 2.72654e-01
## Locus10018v1rpkm9.16    67.4962      -1.539807 0.3243016 -4.748069 2.05368e-06
##                              padj
##                         <numeric>
## Locus10002v1rpkm9.17  1.81920e-11
## Locus10003v1rpkm9.17  8.74004e-01
## Locus1000v1rpkm136.27 1.37104e-01
## Locus1000v2rpkm50.24  3.15877e-01
## Locus10016v1rpkm9.16  4.29200e-01
## Locus10018v1rpkm9.16  2.15448e-05

res_NBF.BF24

## log2 fold change (MLE): condition NBF vs BF24hr 
## Wald test p-value: condition NBF vs BF24hr 
## DataFrame with 8232 rows and 6 columns
##                          baseMean log2FoldChange     lfcSE       stat
##                         <numeric>      <numeric> <numeric>  <numeric>
## Locus10002v1rpkm9.17     155.2077      -2.138095 0.2972055  -7.193996
## Locus10003v1rpkm9.17      37.9684      -0.116472 0.4538049  -0.256657
## Locus1000v1rpkm136.27   2187.7091      -0.173208 0.0910788  -1.901733
## Locus1000v2rpkm50.24     590.7223       0.208926 0.1547960   1.349685
## Locus10016v1rpkm9.16      62.6007       0.315576 0.2876792   1.096972
## ...                           ...            ...       ...        ...
## Locus998v1rpkm136.49    2767.9947      0.4417545  0.147016  3.0048104
## Locus999v1rpkm136.41    1313.6537      0.4863642  0.178014  2.7321671
## Locus999v2rpkm3.78_PRE    12.1084     -0.0433445  0.852601 -0.0508379
## Locus99v1rpkm1550.33    6455.4607     -0.8703339  0.300986 -2.8916134
## Locus9v1rpkm6429.19    23308.1282      0.1873659  0.170347  1.0999069
##                             pvalue        padj
##                          <numeric>   <numeric>
## Locus10002v1rpkm9.17   6.29221e-13 1.81920e-11
## Locus10003v1rpkm9.17   7.97443e-01 8.74004e-01
## Locus1000v1rpkm136.27  5.72060e-02 1.37104e-01
## Locus1000v2rpkm50.24   1.77117e-01 3.15877e-01
## Locus10016v1rpkm9.16   2.72654e-01 4.29200e-01
## ...                            ...         ...
## Locus998v1rpkm136.49    0.00265746   0.0114183
## Locus999v1rpkm136.41    0.00629192   0.0234904
## Locus999v2rpkm3.78_PRE  0.95945470   0.9784980
## Locus99v1rpkm1550.33    0.00383269   0.0155511
## Locus9v1rpkm6429.19     0.27137267   0.4276682

sum(res_NBF.BF24$padj < 0.05, na.rm = TRUE)

## [1] 2613

# First convert the results table into a regular data frame:
as.data.frame(res_NBF.BF24) |>
  # Then, only select the rows/genes that are significant:
  filter(padj < 0.05) |>
  # If you run count() on a logical test, you get the nrs. that are FALSE v. TRUE
  dplyr::count(log2FoldChange > 0)

##   log2FoldChange > 0    n
## 1              FALSE 1439
## 2               TRUE 1174

# Down-regulated (NMBF < BF3):
sum(res_NBF.BF24$log2FoldChange < -1 & res_NBF.BF24$padj < 0.05, na.rm = TRUE)

## [1] 517

# Up-regulated (NBF > BF3):
sum(res_NBF.BF24$log2FoldChange > 1 & res_NBF.BF24$padj < 0.05, na.rm = TRUE)

## [1] 459

EnhancedVolcano(
  toptable = res_NBF.BF24,      
  title = "Non-blood-fed vs. Bloodfed at 24hr dpi",
  x = "log2FoldChange",     
  y = "padj",             
  lab = rownames(res_NBF.BF24), 
  labSize = 4,               # Now we will show the gene labels
  pCutoff = 10e-10,          # Modify the p-value cut-off
  subtitle = NULL,           # I'll also remove the silly subtitle
  caption = NULL,            # ... and the caption
  )

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the EnhancedVolcano package.
##   Please report the issue to the authors.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## Warning: The `size` argument of `element_line()` is deprecated as of ggplot2 3.4.0.
## ℹ Please use the `linewidth` argument instead.
## ℹ The deprecated feature was likely used in the EnhancedVolcano package.
##   Please report the issue to the authors.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

range(res_NBF.BF24$log2FoldChange, na.rm = TRUE)

## [1] -9.282035  7.767340

x <- filter(as.data.frame(res_NBF.BF24$log2FoldChange > 40, na.rm = TRUE))

as.data.frame(res_NBF.BF24) |> filter(log2FoldChange > 14)

## [1] baseMean       log2FoldChange lfcSE          stat           pvalue        
## [6] padj          
## <0 rows> (or 0-length row.names)

# Convert the results table into a regular dataframe and sort by adjusted p-value:
top_df <- data.frame(res_NBF.BF24) |> arrange(padj)

# Gene IDs are the row names: extract the first row name to get the gene of interest
top1 <- rownames(top_df)[1]
top1

## [1] "Locus569v2rpkm130.88"

# Like with the PlotPCA function, 'intgroup' specifies which variable to use for grouping:
plotCounts(dds, gene = top1, intgroup = "condition")

# Use plotCounts with returnData = TRUE just to get a single-gene count table
# that is suitable for plotting:
focal_gene_counts <- plotCounts(
  dds,
  gene = top1,
  intgroup = c("condition"),
  returnData = TRUE
)

# Take a look at the resulting dataframe:
head(focal_gene_counts)

##           count condition
## NBF1   1821.229       NBF
## NBF2   1593.046       NBF
## NBF3   1921.055       NBF
## BF3hr1 1634.110     BF3hr
## BF3hr2 1637.078     BF3hr
## BF3hr3 1522.305     BF3hr

focal_gene_counts |>
  ggplot(aes(x = condition, y = count, fill = condition)) +
  geom_boxplot(alpha = 0.5, outlier.shape = NA) +
  geom_point(size = 4, shape = 21) +
  theme_bw() +
  labs(
    x = "Feeding Treatment",
    y = "Count"
  ) +
  theme(
    legend.position = "none",
    # Make all text bigger:
    axis.title = element_text(size = 30),
    axis.text = element_text(size = 30),
    plot.title = element_text(size = 30, face = "bold"),
    legend.text = element_text(size = 30),
    legend.title = element_text(size = 30)
  )

Mohamad: BF3 vs. BF24

res_BF3.BF24 <- results(dds, contrast = c("condition", "BF3hr", "BF24hr"))
head(res_BF3.BF24)

## log2 fold change (MLE): condition BF3hr vs BF24hr 
## Wald test p-value: condition BF3hr vs BF24hr 
## DataFrame with 6 rows and 6 columns
##                        baseMean log2FoldChange     lfcSE      stat      pvalue
##                       <numeric>      <numeric> <numeric> <numeric>   <numeric>
## Locus10002v1rpkm9.17   155.2077      0.9040112  0.278473   3.24632 1.16907e-03
## Locus10003v1rpkm9.17    37.9684     -0.6731836  0.473807  -1.42080 1.55376e-01
## Locus1000v1rpkm136.27 2187.7091     -0.7430229  0.092877  -8.00007 1.24345e-15
## Locus1000v2rpkm50.24   590.7223      0.3299864  0.156404   2.10983 3.48729e-02
## Locus10016v1rpkm9.16    62.6007      0.0383842  0.300676   0.12766 8.98418e-01
## Locus10018v1rpkm9.16    67.4962     -0.7591571  0.325100  -2.33515 1.95357e-02
##                              padj
##                         <numeric>
## Locus10002v1rpkm9.17  4.04519e-03
## Locus10003v1rpkm9.17  2.56957e-01
## Locus1000v1rpkm136.27 2.67978e-14
## Locus1000v2rpkm50.24  7.56715e-02
## Locus10016v1rpkm9.16  9.31546e-01
## Locus10018v1rpkm9.16  4.70265e-02

res_BF3.BF24

## log2 fold change (MLE): condition BF3hr vs BF24hr 
## Wald test p-value: condition BF3hr vs BF24hr 
## DataFrame with 8232 rows and 6 columns
##                          baseMean log2FoldChange     lfcSE      stat
##                         <numeric>      <numeric> <numeric> <numeric>
## Locus10002v1rpkm9.17     155.2077      0.9040112  0.278473   3.24632
## Locus10003v1rpkm9.17      37.9684     -0.6731836  0.473807  -1.42080
## Locus1000v1rpkm136.27   2187.7091     -0.7430229  0.092877  -8.00007
## Locus1000v2rpkm50.24     590.7223      0.3299864  0.156404   2.10983
## Locus10016v1rpkm9.16      62.6007      0.0383842  0.300676   0.12766
## ...                           ...            ...       ...       ...
## Locus998v1rpkm136.49    2767.9947      0.0918015  0.147632  0.621825
## Locus999v1rpkm136.41    1313.6537     -1.1806512  0.181163 -6.517064
## Locus999v2rpkm3.78_PRE    12.1084     -0.9130771  0.895973 -1.019090
## Locus99v1rpkm1550.33    6455.4607      0.1358235  0.300963  0.451297
## Locus9v1rpkm6429.19    23308.1282      0.3631358  0.170381  2.131312
##                             pvalue        padj
##                          <numeric>   <numeric>
## Locus10002v1rpkm9.17   1.16907e-03 4.04519e-03
## Locus10003v1rpkm9.17   1.55376e-01 2.56957e-01
## Locus1000v1rpkm136.27  1.24345e-15 2.67978e-14
## Locus1000v2rpkm50.24   3.48729e-02 7.56715e-02
## Locus10016v1rpkm9.16   8.98418e-01 9.31546e-01
## ...                            ...         ...
## Locus998v1rpkm136.49   5.34057e-01 6.55379e-01
## Locus999v1rpkm136.41   7.16967e-11 8.60675e-10
## Locus999v2rpkm3.78_PRE 3.08160e-01 4.36485e-01
## Locus99v1rpkm1550.33   6.51776e-01 7.50909e-01
## Locus9v1rpkm6429.19    3.30634e-02 7.23763e-02

sum(res_BF3.BF24$padj < 0.05, na.rm = TRUE)

## [1] 3456

Heat Maps

Emily NBF vs. BF24

meta <- data.frame(colData(dds))

View(meta)

norm_mat <- assay(dds_vst1)
top25_DE <- rownames(top_df)[1:25]
norm_mat_sel <- norm_mat[match(top25_DE, rownames(norm_mat)), ]
meta_sort <- meta |> arrange(condition)

# Sort the columns in the normalized count matrix to match the metadata
norm_mat_sel <- norm_mat_sel[, rownames(meta_sort)]


pheatmap(
  norm_mat_sel,
  annotation_col = meta_sort,  # Add the metadata
  cluster_cols = FALSE,        # Don't cluster samples (=columns, cols)
  show_rownames = FALSE,       # Don't show gene names
  scale = "row",               # Perform z-scaling for each gene
)

top25_hi <- names(sort(rowMeans(norm_mat), decreasing = TRUE)[1:25])
# In the normalized count matrix, select only the genes of interest
norm_mat_sel <- norm_mat[match(top25_hi, rownames(norm_mat)), ]

# Sort the metadata
meta_sort <- meta |>
  arrange(condition) |>
  select(condition)

# Create the heatmap
pheatmap(
  norm_mat_sel,
  annotation_col = meta_sort,
  cluster_cols = FALSE,
  show_rownames = FALSE,
  scale = "row"
)

LS0tDQp0aXRsZTogIkZpbmFsIERhdGEgQW5hbHlzaXMiDQphdXRob3I6ICJFbWlseSBSdW5uaW9uIg0KZGF0ZTogIjIwMjYtMDItMjYiDQpvdXRwdXQ6DQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiB0cnVlDQogICAgdG9jX2RlcHRoOiA0DQogICAgbnVtYmVyX3NlY3Rpb25zOiBmYWxzZQ0KICAgIHRvY19mbG9hdDogdHJ1ZQ0KICAgIHRoZW1lOiBqb3VybmFsDQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQ0KLS0tDQoNCmBgYHtyIHNldHVwLCBpbmNsdWRlPVRSVUV9DQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpDQpgYGANCg0KYGBge3IgbG9hZCBsaWJyYXJpZXMsIGluY2x1ZGU9RkFMU0V9DQoNCmxpYnJhcnkoREVTZXEyKSAgICAjIEZvciBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiBhbmFseXNpcw0KbGlicmFyeShFbmhhbmNlZFZvbGNhbm8pICMgRm9yIGNyZWF0aW5nIHZvbGNhbm8gcGxvdHMNCmxpYnJhcnkodGlkeXZlcnNlKSANCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkocGhlYXRtYXApDQpgYGANCg0KDQpgYGB7cn0NCmRkcyA8LSByZWFkX2NzdigiQ291bnQgVGFibGUgUk5BIFNlcSBEYXRhIGZvciA2NzAzIHByZXNlbnRhdGlvbi5jc3YiKQ0KIyBJIG1hZGUgYSBjc3YgZnJvbSB0aGUgZXhjZWwgZmlsZSBiZWNhdXNlIGlkayB3aGF0IGFuIHJkcyBmaWxlIGlzIG9yIGhvdyB0byByZWFkIGl0IA0KDQpyYXcgPC0gcmVhZC5jc3YoIkNvdW50IFRhYmxlIFJOQSBTZXEgRGF0YSBmb3IgNjcwMyBwcmVzZW50YXRpb24uY3N2IiwNCiAgICAgICAgICAgICAgICBoZWFkZXIgPSBUUlVFLA0KICAgICAgICAgICAgICAgIHN0cmluZ3NBc0ZhY3RvcnMgPSBGQUxTRSkNCmBgYA0KDQpgYGB7cn0NCiMgbmVlZCB0byBnZXQganVzdCB0aGUgY29sdW1ucyB3ZSBjYXJlIGFib3V0IA0KY291bnRzIDwtIHJhd1ssIGMoIk5CRjEiLCJOQkYyIiwiTkJGMyIsDQogICAgICAgICAgICAgICAgICAiQkYzaHIxIiwiQkYzaHIyIiwiQkYzaHIzIiwNCiAgICAgICAgICAgICAgICAgICJCRjI0aHIxIiwiQkYyNGhyMyIsIkJGMjRocjQiKV0NCg0KDQojYnV0IHdlIG5lZWQgdGhlIGdlbmUgSURzIHRvbyANCnJvd25hbWVzKGNvdW50cykgPC0gcmF3JGlkDQoNCmBgYA0KDQpgYGB7cn0NCiMgbWFrZSBhIG1hdHJpeCBhbmQgbWFrZSB0aGUgY291bnRzIGJlIG51bWJlcnMgDQojdGhlIG51bWJlcnMgdGhlbW5zZWx2ZXMgYXJlIHRoZSBudW1iZXIgb2Ygc2VxdWVuY2luZyByZWFkcyBtYXBwZWQgdG8gdGhhdCBnZW5lIA0KI0kgVEhJTksgaGlnaGVyIG51bWJlciA9IG1vcmUgUk5BDQpjb3VudHMgPC0gYXMubWF0cml4KGNvdW50cykNCm1vZGUoY291bnRzKSA8LSAibnVtZXJpYyINCg0KaGVhZChjb3VudHMpDQoNCmNvbmRpdGlvbiA8LSBmYWN0b3IoYyhyZXAoIk5CRiIsMyksDQogICAgICAgICAgICAgICAgICAgICAgcmVwKCJCRjNociIsMyksDQogICAgICAgICAgICAgICAgICAgICAgcmVwKCJCRjI0aHIiLDMpKSkNCg0KY29sZGF0YSA8LSBkYXRhLmZyYW1lKA0KICByb3cubmFtZXMgPSBjb2xuYW1lcyhjb3VudHMpLA0KICBjb25kaXRpb24gPSBjb25kaXRpb24NCikNCg0KDQpgYGANCg0KYGBge3J9DQojIFVzZSBERVNlcTIgbGlrZSBpbiBsYWIgDQoNCmRkcyA8LSBERVNlcURhdGFTZXRGcm9tTWF0cml4KA0KICBjb3VudERhdGEgPSBjb3VudHMsDQogIGNvbERhdGEgPSBjb2xkYXRhLA0KICBkZXNpZ24gPSB+IGNvbmRpdGlvbg0KKQ0KDQpgYGANCg0KDQpgYGB7cn0NCiNub3JtYWxpemVkIHRvIGFjY291bnQgZm9yIGRpZmZlcmVuY2VzIGluIGxpYnJhcnkgc2l6ZQ0KZGRzX3ZzdDEgPC0gdmFyaWFuY2VTdGFiaWxpemluZ1RyYW5zZm9ybWF0aW9uKGRkcykNCg0KYGBgDQoNCg0KIyBQQ0EgUGxvdA0KDQpgYGB7cn0NCiNwbG90IA0KcGxvdFBDQShkZHNfdnN0MSwgaW50Z3JvdXAgPSAiY29uZGl0aW9uIiwgbnRvcCA9IDUwMCkNCiNkaXN0YW5jZSBhbG9uZyBYIGF4aXMgaGVyZSBjb3VudHMgZG91YmxlIGJjIGl0IGV4cGxhaW5zIG1vcmUgdmFyaWFuY2UgDQpgYGANCg0KYGBge3IsIGZpZy53aWR0aD0xNCwgZmlnLmhlaWdodD04fQ0KI21ha2UgcHJldHR5DQpwY2FfZGYgPC0gcGxvdFBDQSgNCiAgZGRzX3ZzdDEsDQogIG50b3AgPSA1MDAsDQogIGludGdyb3VwID0gYygiY29uZGl0aW9uIiksDQogIHJldHVybkRhdGEgPSBUUlVFDQopDQoNCnBjdF92YXIgPC0gcm91bmQoMTAwICogYXR0cihwY2FfZGYsICJwZXJjZW50VmFyIiksIDEpDQpwY3RfdmFyDQoNCmdncGxvdChwY2FfZGYpICsNCiAgYWVzKHggPSBQQzEsIHkgPSBQQzIsIGNvbG9yID0gY29uZGl0aW9uKSArDQogIGdlb21fcG9pbnQoc2l6ZSA9IDEwKSArDQogIHNjYWxlX2NvbG9yX2JyZXdlcihwYWxldHRlID0gIkRhcmsyIiwgbmFtZSA9ICJGZWVkaW5nIFRyZWF0bWVudCIpICsNCiAgdGhlbWVfYncoYmFzZV9zaXplID0gMjYpICsNCiAgbGFicygNCiAgICB4ID0gcGFzdGUwKCJQQzEgKCIsIHBjdF92YXJbMV0sICIlKSIpLA0KICAgIHkgPSBwYXN0ZTAoIlBDMiAoIiwgcGN0X3ZhclsyXSwgIiUpIikNCiAgKQ0KYGBgDQoNCiMgRGlmZmVyZW50aWFsIGV4cHJlc3Npb24gDQoNCmBgYHtyfQ0KI0RpZmZlcmVudGlvbmFsIGV4cHJlc3Npb24gDQpkZHMgPC0gREVTZXEoZGRzKQ0KYGBgDQoNCiMjIExpejogTkJGIHZzLiBCRjMNCg0KYGBge3J9DQpyZXNfTkJGLkJGMyA8LSByZXN1bHRzKGRkcywgY29udHJhc3QgPSBjKCJjb25kaXRpb24iLCAiTkJGIiwgIkJGM2hyIikpDQpoZWFkKHJlc19OQkYuQkYzKQ0KcmVzX05CRi5CRjMNCnN1bShyZXNfTkJGLkJGMyRwYWRqIDwgMC4wNSwgbmEucm0gPSBUUlVFKQ0KI3N1bSA9IDMxMDggLS0+IG51bWJlciBvZiBkaWZmZXJlbnRpYWwgZXhwcmVzc2VkIGdlbmVzIA0KIzEgLS0+IGZpbHRlciBieSB2YWx1ZXMgd2l0aCBwYWRqIDwgMC4wMDUsIHRha2UgdGhvc2UsIG1hdGNoIHdpdGggb3J0aG9sb2dzLCBydW4gRGF2aWQncyBhbmFseXNpcz8gDQojMiAtLT4gbWVyZ2UgdGhpcyB3aXRoIHJhdyBkYXRhIGJhc2VkIG9uIGdlbmUgSUQgdG8gZ2V0IGJhY2sgdG8gb3J0aG9sb2dzIA0KYGBgDQoNCg0KIyMgRW1pbHk6IE5CRiB2cy4gQkYyNA0KDQpgYGB7cn0NCnJlc19OQkYuQkYyNCA8LSByZXN1bHRzKGRkcywgY29udHJhc3QgPSBjKCJjb25kaXRpb24iLCAiTkJGIiwgIkJGMjRociIpKQ0KaGVhZChyZXNfTkJGLkJGMjQpDQpyZXNfTkJGLkJGMjQNCnN1bShyZXNfTkJGLkJGMjQkcGFkaiA8IDAuMDUsIG5hLnJtID0gVFJVRSkNCg0KYGBgDQoNCmBgYHtyfQ0KIyBGaXJzdCBjb252ZXJ0IHRoZSByZXN1bHRzIHRhYmxlIGludG8gYSByZWd1bGFyIGRhdGEgZnJhbWU6DQphcy5kYXRhLmZyYW1lKHJlc19OQkYuQkYyNCkgfD4NCiAgIyBUaGVuLCBvbmx5IHNlbGVjdCB0aGUgcm93cy9nZW5lcyB0aGF0IGFyZSBzaWduaWZpY2FudDoNCiAgZmlsdGVyKHBhZGogPCAwLjA1KSB8Pg0KICAjIElmIHlvdSBydW4gY291bnQoKSBvbiBhIGxvZ2ljYWwgdGVzdCwgeW91IGdldCB0aGUgbnJzLiB0aGF0IGFyZSBGQUxTRSB2LiBUUlVFDQogIGRwbHlyOjpjb3VudChsb2cyRm9sZENoYW5nZSA+IDApDQpgYGANCg0KYGBge3J9DQojIERvd24tcmVndWxhdGVkIChOTUJGIDwgQkYzKToNCnN1bShyZXNfTkJGLkJGMjQkbG9nMkZvbGRDaGFuZ2UgPCAtMSAmIHJlc19OQkYuQkYyNCRwYWRqIDwgMC4wNSwgbmEucm0gPSBUUlVFKQ0KDQojIFVwLXJlZ3VsYXRlZCAoTkJGID4gQkYzKToNCnN1bShyZXNfTkJGLkJGMjQkbG9nMkZvbGRDaGFuZ2UgPiAxICYgcmVzX05CRi5CRjI0JHBhZGogPCAwLjA1LCBuYS5ybSA9IFRSVUUpDQoNCmBgYA0KYGBge3IsIGZpZy53aWR0aD0xMiwgZmlnLmhlaWdodD04fQ0KRW5oYW5jZWRWb2xjYW5vKA0KICB0b3B0YWJsZSA9IHJlc19OQkYuQkYyNCwgICAgICANCiAgdGl0bGUgPSAiTm9uLWJsb29kLWZlZCB2cy4gQmxvb2RmZWQgYXQgMjRociBkcGkiLA0KICB4ID0gImxvZzJGb2xkQ2hhbmdlIiwgICAgIA0KICB5ID0gInBhZGoiLCAgICAgICAgICAgICANCiAgbGFiID0gcm93bmFtZXMocmVzX05CRi5CRjI0KSwgDQogIGxhYlNpemUgPSA0LCAgICAgICAgICAgICAgICMgTm93IHdlIHdpbGwgc2hvdyB0aGUgZ2VuZSBsYWJlbHMNCiAgcEN1dG9mZiA9IDEwZS0xMCwgICAgICAgICAgIyBNb2RpZnkgdGhlIHAtdmFsdWUgY3V0LW9mZg0KICBzdWJ0aXRsZSA9IE5VTEwsICAgICAgICAgICAjIEknbGwgYWxzbyByZW1vdmUgdGhlIHNpbGx5IHN1YnRpdGxlDQogIGNhcHRpb24gPSBOVUxMLCAgICAgICAgICAgICMgLi4uIGFuZCB0aGUgY2FwdGlvbg0KICApDQpgYGANCg0KYGBge3IsIGZpZy53aWR0aD04LCBmaWcuaGVpZ2h0PTYsIG91dC53aWR0aD0iODAlIn0NCnJhbmdlKHJlc19OQkYuQkYyNCRsb2cyRm9sZENoYW5nZSwgbmEucm0gPSBUUlVFKQ0KDQp4IDwtIGZpbHRlcihhcy5kYXRhLmZyYW1lKHJlc19OQkYuQkYyNCRsb2cyRm9sZENoYW5nZSA+IDQwLCBuYS5ybSA9IFRSVUUpKQ0KDQphcy5kYXRhLmZyYW1lKHJlc19OQkYuQkYyNCkgfD4gZmlsdGVyKGxvZzJGb2xkQ2hhbmdlID4gMTQpDQoNCg0KIyBDb252ZXJ0IHRoZSByZXN1bHRzIHRhYmxlIGludG8gYSByZWd1bGFyIGRhdGFmcmFtZSBhbmQgc29ydCBieSBhZGp1c3RlZCBwLXZhbHVlOg0KdG9wX2RmIDwtIGRhdGEuZnJhbWUocmVzX05CRi5CRjI0KSB8PiBhcnJhbmdlKHBhZGopDQoNCiMgR2VuZSBJRHMgYXJlIHRoZSByb3cgbmFtZXM6IGV4dHJhY3QgdGhlIGZpcnN0IHJvdyBuYW1lIHRvIGdldCB0aGUgZ2VuZSBvZiBpbnRlcmVzdA0KdG9wMSA8LSByb3duYW1lcyh0b3BfZGYpWzFdDQp0b3AxDQoNCiMgTGlrZSB3aXRoIHRoZSBQbG90UENBIGZ1bmN0aW9uLCAnaW50Z3JvdXAnIHNwZWNpZmllcyB3aGljaCB2YXJpYWJsZSB0byB1c2UgZm9yIGdyb3VwaW5nOg0KcGxvdENvdW50cyhkZHMsIGdlbmUgPSB0b3AxLCBpbnRncm91cCA9ICJjb25kaXRpb24iKQ0KDQoNCg0KIyBVc2UgcGxvdENvdW50cyB3aXRoIHJldHVybkRhdGEgPSBUUlVFIGp1c3QgdG8gZ2V0IGEgc2luZ2xlLWdlbmUgY291bnQgdGFibGUNCiMgdGhhdCBpcyBzdWl0YWJsZSBmb3IgcGxvdHRpbmc6DQpmb2NhbF9nZW5lX2NvdW50cyA8LSBwbG90Q291bnRzKA0KICBkZHMsDQogIGdlbmUgPSB0b3AxLA0KICBpbnRncm91cCA9IGMoImNvbmRpdGlvbiIpLA0KICByZXR1cm5EYXRhID0gVFJVRQ0KKQ0KDQojIFRha2UgYSBsb29rIGF0IHRoZSByZXN1bHRpbmcgZGF0YWZyYW1lOg0KaGVhZChmb2NhbF9nZW5lX2NvdW50cykNCg0KDQoNCmZvY2FsX2dlbmVfY291bnRzIHw+DQogIGdncGxvdChhZXMoeCA9IGNvbmRpdGlvbiwgeSA9IGNvdW50LCBmaWxsID0gY29uZGl0aW9uKSkgKw0KICBnZW9tX2JveHBsb3QoYWxwaGEgPSAwLjUsIG91dGxpZXIuc2hhcGUgPSBOQSkgKw0KICBnZW9tX3BvaW50KHNpemUgPSA0LCBzaGFwZSA9IDIxKSArDQogIHRoZW1lX2J3KCkgKw0KICBsYWJzKA0KICAgIHggPSAiRmVlZGluZyBUcmVhdG1lbnQiLA0KICAgIHkgPSAiQ291bnQiDQogICkgKw0KICB0aGVtZSgNCiAgICBsZWdlbmQucG9zaXRpb24gPSAibm9uZSIsDQogICAgIyBNYWtlIGFsbCB0ZXh0IGJpZ2dlcjoNCiAgICBheGlzLnRpdGxlID0gZWxlbWVudF90ZXh0KHNpemUgPSAzMCksDQogICAgYXhpcy50ZXh0ID0gZWxlbWVudF90ZXh0KHNpemUgPSAzMCksDQogICAgcGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChzaXplID0gMzAsIGZhY2UgPSAiYm9sZCIpLA0KICAgIGxlZ2VuZC50ZXh0ID0gZWxlbWVudF90ZXh0KHNpemUgPSAzMCksDQogICAgbGVnZW5kLnRpdGxlID0gZWxlbWVudF90ZXh0KHNpemUgPSAzMCkNCiAgKQ0KYGBgDQoNCiMjIE1vaGFtYWQ6IEJGMyB2cy4gQkYyNA0KDQpgYGB7cn0NCnJlc19CRjMuQkYyNCA8LSByZXN1bHRzKGRkcywgY29udHJhc3QgPSBjKCJjb25kaXRpb24iLCAiQkYzaHIiLCAiQkYyNGhyIikpDQpoZWFkKHJlc19CRjMuQkYyNCkNCnJlc19CRjMuQkYyNA0Kc3VtKHJlc19CRjMuQkYyNCRwYWRqIDwgMC4wNSwgbmEucm0gPSBUUlVFKQ0KYGBgDQoNCiMgSGVhdCBNYXBzDQoNCiMjIEVtaWx5IE5CRiB2cy4gQkYyNA0KYGBge3J9DQptZXRhIDwtIGRhdGEuZnJhbWUoY29sRGF0YShkZHMpKQ0KDQpWaWV3KG1ldGEpDQoNCm5vcm1fbWF0IDwtIGFzc2F5KGRkc192c3QxKQ0KdG9wMjVfREUgPC0gcm93bmFtZXModG9wX2RmKVsxOjI1XQ0Kbm9ybV9tYXRfc2VsIDwtIG5vcm1fbWF0W21hdGNoKHRvcDI1X0RFLCByb3duYW1lcyhub3JtX21hdCkpLCBdDQptZXRhX3NvcnQgPC0gbWV0YSB8PiBhcnJhbmdlKGNvbmRpdGlvbikNCmBgYA0KDQpgYGB7cn0NCiMgU29ydCB0aGUgY29sdW1ucyBpbiB0aGUgbm9ybWFsaXplZCBjb3VudCBtYXRyaXggdG8gbWF0Y2ggdGhlIG1ldGFkYXRhDQpub3JtX21hdF9zZWwgPC0gbm9ybV9tYXRfc2VsWywgcm93bmFtZXMobWV0YV9zb3J0KV0NCg0KDQpwaGVhdG1hcCgNCiAgbm9ybV9tYXRfc2VsLA0KICBhbm5vdGF0aW9uX2NvbCA9IG1ldGFfc29ydCwgICMgQWRkIHRoZSBtZXRhZGF0YQ0KICBjbHVzdGVyX2NvbHMgPSBGQUxTRSwgICAgICAgICMgRG9uJ3QgY2x1c3RlciBzYW1wbGVzICg9Y29sdW1ucywgY29scykNCiAgc2hvd19yb3duYW1lcyA9IEZBTFNFLCAgICAgICAjIERvbid0IHNob3cgZ2VuZSBuYW1lcw0KICBzY2FsZSA9ICJyb3ciLCAgICAgICAgICAgICAgICMgUGVyZm9ybSB6LXNjYWxpbmcgZm9yIGVhY2ggZ2VuZQ0KKQ0KYGBgDQoNCmBgYHtyfQ0KdG9wMjVfaGkgPC0gbmFtZXMoc29ydChyb3dNZWFucyhub3JtX21hdCksIGRlY3JlYXNpbmcgPSBUUlVFKVsxOjI1XSkNCiMgSW4gdGhlIG5vcm1hbGl6ZWQgY291bnQgbWF0cml4LCBzZWxlY3Qgb25seSB0aGUgZ2VuZXMgb2YgaW50ZXJlc3QNCm5vcm1fbWF0X3NlbCA8LSBub3JtX21hdFttYXRjaCh0b3AyNV9oaSwgcm93bmFtZXMobm9ybV9tYXQpKSwgXQ0KDQojIFNvcnQgdGhlIG1ldGFkYXRhDQptZXRhX3NvcnQgPC0gbWV0YSB8Pg0KICBhcnJhbmdlKGNvbmRpdGlvbikgfD4NCiAgc2VsZWN0KGNvbmRpdGlvbikNCg0KIyBDcmVhdGUgdGhlIGhlYXRtYXANCnBoZWF0bWFwKA0KICBub3JtX21hdF9zZWwsDQogIGFubm90YXRpb25fY29sID0gbWV0YV9zb3J0LA0KICBjbHVzdGVyX2NvbHMgPSBGQUxTRSwNCiAgc2hvd19yb3duYW1lcyA9IEZBTFNFLA0KICBzY2FsZSA9ICJyb3ciDQopDQoNCg0KYGBgDQoNCg==

Final Data Analysis

Emily Runnion

2026-02-26