Wetenschappers onderzoeken een nieuw geneesmiddel dat is ontwikkeld
om de groei van kankercellen te remmen. Het doel van dit onderzoek is om
de dosis-responsrelatie van dit geneesmiddel op de expressie van
bepaalde peptiden te bestuderen.
Hiervoor zetten de onderzoekers een experiment op waarbij 40
kankercellen in vitro worden gekweekt. De kankercellen worden vervolgens
in 5 groepen (1,2,3,4 en 5) verdeeld, waarbij elke groep bestaat uit 8
cellen. Elke groep wordt behandeld met een specifieke concentratie van
het geneesmiddel (respectivelijk 0.25, 0.98, 1.4, 10.12, 20 nmol/l). Na
de behandeling worden de cellen 24u geïncubeerd en vervolgens wordt de
expressie van 2 peptiden (pepA en pepB, afkomstig van 2 verschillende
soorten proteïnen) gemeten met behulp van een massaspectrometer.
De expressie van peptides wordt gemeten via een massaspectrometer, waarbij de intensiteit een maat is voor de abundantie van het peptide.
data <- data.frame(cel = 1:40, group = rep(1:5, each = 8),
concentration = rep(c(0.25, 0.98, 1.4, 10.12, 20), each = 8),
pepA = c(0.53903031, 0.83668945, 0.73150722, 0.04758242,
1.05569492, 0.25237967, 0.79858061, 0.30402012,
4.19057655, 10.00207124, 1.15189680, 14.18709938,
3.64299323, 1.79284779, 0.78992487, 3.45530821,
24.75821757, 2.04160052, 8.93804065, 1.22949345,
9.16564751, 20.91279171, 2.13736851, 20.16839510,
34.97903014, 216.25146186, 52.83360018, NA,
76.87925384, 44.30768163, 56.12876543, 21.07390806,
182.63327882, 64.02607834, 126.71525959, 64.54102212,
810.36964413, 105.64201691, 55.96835112, 173.52342097),
pepB = c(1.0480042, 0.4763875, 2.2259871, 0.1845394, 0.6928071,
0.7549293, 0.4103188, 1.2605083, 5.5202356,
7.5744594, 6.3398971, NA, 2.1682267, 5.5115491,
4.6424738, 15.4610185, 18.2702392, 18.0317841,
6.4593219, 27.8969173, 23.6455037, 28.8882159,
15.5689466, 15.8275305, 218.1058816, 190.6978574,
712.3240839, 942.3198537, 914.9005209, 141.2025639,
101.9501581, 225.3851336, 328.9863893, 1392.1280855,
468.6460232, 3081.8692608, 1119.4268196, 1751.1158002,
806.6476239, 2955.3655010))De dataset data heeft volgende variabelen:
De onderzoekers willen de relatie tussen de dosis van het geneesmiddel en de gemeten intensiteiten van de peptiden onderzoeken. Concreet willen ze antwoord geven op de volgende vragen:
Bijkomend willen ze via hun analyse een antwoord geven op volgende vraag: Als de toedieningsdosis van het geneesmiddel verdrievoudigd, met welke factor wordt de intensiteit van pepB dan gemiddeld vermenigvuldigd?
Hou de onderzoeksvragen in je achterhoofd wanneer je data-exploratie doet.
Ga voor een model steeds de voorwaarden na.
Bedenk wel model het meest gepast is om de bijkomende onderzoeksvraag te beantwoorden
Je hoeft niet alle parameters te interpreteren, enkel diegene die relevant zijn voor je vraagstelling.
Formuleer de nulhypothese en alternatieve hypothese en interpreteer het resultaat altijd in functie van je vraagstelling.
Zorg ervoor dat ook je conclusie volledig is, ook al moet je daarvoor iets herhalen. Rapporteer indien mogelijk 95% betrouwbaarheidsintervallen.
Dit project verloopt individueel of in groep, met maximaal 4
studenten. Per groep dient 1 student dit aangevulde Rmd-bestand in als
Rmd-bestand + als html/pdf - rapport op Ufora (via “Ufora tools” >
“Herkansingsproject”) met daarin een grondige data-exploratie,
data-analyse, conclusie en antwoord op de bonusvraag en met
vermelding van de namen van elke student in de groep. De
deadline is zondag 01/09/2024 om 23u59.
Als je deelneemt aan het herkansingsproject vervangt de score voor het
herkansingsproject automatisch je score voor de twee projecten uit de
eerste zittijd. Indien je score op het herkansingsproject hoger is dan
de score voor het opvolgen van de cursus en/of oefeningen in Dodona, dan
zal de score op het herkansingsproject ook deze onderdelen
vervangen.
#nulhypothese en alternatieve hypothese n0: er is geen verband tussen de concentratie geneesmiddel en de expressie van Peptide A of B n1: er is een verband tussen de concentratie geneesmiddel en de expressie van Peptide A of B
library(tidyverse) library(broom) library(gridExtra) library(ggplot2)
glimpse(data) summary(data)
PepA_model <- ggplot(data, aes(x = concentration, y = pepA)) + geom_point() + geom_smooth(method = “lm”, se = FALSE) + labs(title = “verhouding tussen de concentratie geneesmiddel en expressie van peptide A”, x = “Concentratie (nmol/l)”, y = “Peptide A expressie”)
PepB_model <- ggplot(data, aes(x = concentration, y = pepB)) + geom_point() + geom_smooth(method = “lm”, se = FALSE) + labs(title = “Verhouding tussen de concentratie geneesmiddel en expressie van peptide B”, x = “Concentratie (nmol/l)”, y = “Peptide B expressie”)
#Voor gemakkelijke visualisatie worden de beide grafieken boven elkaar weergegeven grid.arrange(PepA_model, PepB_model, nrow = 2)
Voor beide genexpressie werk ik met een lineair model om het verband te tonen, dit omdat dit model bij beide gevallen vrij goed past: bij Pep A zijn er 2 outliers, maar deze heeft minimale impact op de grafiek. Ook bij Pep B wordt er een lineair model gebruikt, hoewel de gegevens hier meer verspreid zijn, zijn ze redelijk symmetrisch verdeeld waardoor een lineair verband ook hier redelijk accuraat is.
model_pepA <- lm(pepA ~ concentration, data = data) summary(model_pepA)
PepA_model
model_pepB <- lm(pepB ~ concentration, data = data) summary(model_pepB)
PepB_model
#opnieuw om beide grafieken samen gemakkelijk voor te stellen grid.arrange(PepA_model, PepB_model, nrow = 2)
Zowel bij de peptide A als bij de peptide B analyses blijkt er een lineair verband te zijn tussen de concentratie van het geneesmiddel en de expressie van beide peptiden die gevormd worden. Bij de samenvatting van beide peptiden blijkt de kans op het verkrijgen van deze waarden, wanneer er in werkelijkheid geen verband is tussen de concentratie geneesmiddel en de expressie van peptide A als peptide B, enorm klein (<0,1%) wat dus minder dan 5% is en dus mag vernomen worden als een significante impact van het geneesmiddel op de expressie van beide onderzochte peptiden.
Om rekening te houden met de natuurlijke variabiliteit in peptidehoeveelheid tussen verschillende kankercellen, zou er met een mixed effects model kunnen gewerkt worden, waarbij de individuele kankercellen als een random effect worden gemodelleerd. hierdoor zou de heterogeniteit van de cellen opgevangen worden en de schatting van de effecten preciezer zijn.
#verwerkt door Alex Vandaele