In dit groepsproject hebben we onderzocht in hoeverre vrouwelijke patiënten met relapsing remitting multiple sclerose (RRMS) die bepaalde medicamenteuze therapieën ondergaan, meer gerapporteerde COVID-19 symptomen ervaren in vergelijking met andere behandelingen.
Hypotheses:
- H₀: Het gebruik van
specifieke medicatie heeft geen effect op de kans op het
ontwikkelen van bepaalde symptomen.
- Hₐ: Het
gebruik van specifieke medicatie heeft wél een effect op de kans
op het ontwikkelen van bepaalde symptomen.
Zijn er bepaalde COVID-19 symptomen die vaker samen voorkomen?
GDSI_OpenDataset_Final
.We hebben gewerkt in verschillende stappen om ons onderzoek systematisch uit te voeren:
De dataset GDSI_OpenDataset_Final
werd geïmporteerd en
gecontroleerd op volledigheid.
Het aantal vrouwen met RRMS dat COVID-19 symptomen rapporteerde werd geanalyseerd, inclusief de verdeling van suspected en confirmed gevallen. Daarnaast werd medicatiegebruik in kaart gebracht.
De dataset werd gefilterd om alleen vrouwen met RRMS te behouden, aangezien deze groep het meest vertegenwoordigd is.
Missende antwoorden in de symptoomkolommen werden vervangen door “no” om uniformiteit in de dataset te krijgen.
Symptoomkolommen werden binair gemaakt (aanwezig = 1, afwezig = 0) om clustering mogelijk te maken.
Symptomen werden geclusterd met een hiërarchische methode, resulterend in een dendrogram om de samenhang tussen symptomen te visualiseren.
Een Chi-kwadraat test voor goodness of fit werd uitgevoerd om te beoordelen of de clustering van symptomen significant is.
Een extra kolom werd toegevoegd aan de dataset met de clusterinformatie per patiënt.
Per symptoom werd een logistische regressie uitgevoerd om te onderzoeken welke factoren de kans op het optreden van een symptoom beïnvloeden.
De resultaten van de analyses werden geïnterpreteerd en besproken.
We hebben de data van vrouwen met RRMS geanalyseerd om inzicht te krijgen in hun COVID-19 symptomen en medicatiegebruik. Hieronder worden de resultaten weergegeven.
Symptoomstatus | Aantal |
---|---|
7 | |
no | 489 |
yes | 243 |
Type Medicatie | Aantal |
---|---|
82 | |
currently not using any DMT | 59 |
currently on alemtuzumab | 8 |
currently on another drug not listed | 117 |
currently on cladribine | 29 |
currently on dimethyl fumarate | 101 |
currently on fingolimod | 90 |
currently on glatiramer | 43 |
currently on interferon | 59 |
currently on natalizumab | 49 |
currently on ocrelizumab | 52 |
currently on rituximab | 8 |
currently on teriflunomide | 42 |
Symptoom | Aantal ‘Yes’ |
---|---|
Droge hoest | 139 |
Rillingen | 74 |
Vermoeidheid | 159 |
Kortademigheid | 70 |
Keelpijn | 114 |
Koorts | 95 |
Verlies van reuk/smaak | 60 |
Pijn | 125 |
Longontsteking | 10 |
Neusverstopping | 115 |
# transpose
symptomen_transposed <- data.table::transpose(as.data.table(vrouwenRRMS_symptomen),keep.names = "col")
# gebruik eerste kolom (omschrijving van het symptoom) als rownames
symptomen_transposed <- data.frame(symptomen_transposed, row.names = 1)
rm(vrouwenRRMS_symptomen) # tabel niet meer nodig
#afstand berekenen
distance_matrix <- dist(symptomen_transposed, method = "binary")
fviz_dist(distance_matrix)
#cluster methode
hclust_result <- hclust(distance_matrix, method = "ward.D")
plot(hclust_result, main = "Dendrogram van Hiërarchische Clustering voor COVID-19 Symptomen",labels = rownames(symptomen_transposed),
cex=0.7)
Cluster | Frequency | Proportion |
---|---|---|
1 | 3 | 0.3 |
2 | 5 | 0.5 |
3 | 1 | 0.1 |
4 | 1 | 0.1 |
Statistiek | p.waarde | Vrijheidsgraden | |
---|---|---|---|
X-squared | 4.4 | 0.2213854 | 3 |
Medicatie | Cluster_0 | Cluster_1 | Cluster_2 | Cluster_3 | Cluster_4 |
---|---|---|---|---|---|
62 | 7 | 6 | 6 | 1 | |
currently not using any DMT | 36 | 4 | 13 | 6 | 0 |
currently on alemtuzumab | 8 | 0 | 0 | 0 | 0 |
currently on another drug not listed | 81 | 12 | 17 | 6 | 1 |
currently on cladribine | 20 | 2 | 5 | 2 | 0 |
currently on dimethyl fumarate | 75 | 6 | 11 | 9 | 0 |
currently on fingolimod | 59 | 8 | 19 | 3 | 1 |
currently on glatiramer | 29 | 4 | 7 | 3 | 0 |
currently on interferon | 43 | 4 | 11 | 1 | 0 |
currently on natalizumab | 28 | 9 | 12 | 0 | 0 |
currently on ocrelizumab | 32 | 6 | 8 | 6 | 0 |
currently on rituximab | 6 | 0 | 2 | 0 | 0 |
currently on teriflunomide | 30 | 3 | 7 | 2 | 0 |
Statistiek | P-waarde | Vrijheidsgraden | |
---|---|---|---|
X-squared | 44.2145 | 0.6287114 | 48 |
Onze descriptieve analyses zorgden ervoor dat we de dataset konden vereenvoudigen naar enkel vrouwen met relapsing remitting multiple sclerose (RRMS). Hieruit kwam de vraag of dat vrouwen met RRMS bepaalde symptomen meer vertonen indien ze een specifieke medicamenteuze behandeling ondergaan. Deze symptomen varieerden van vermoeidheid en keelpijn tot ernstige symptomen zoals kortademigheid en pneumonie.
De clustering liet zien dat er een groepering van symptomen was met een resultaat van 4 clusters. Deze clusteranalyse was niet significant ten opzichte van de voorspelde waardes. Dit wil zeggen dat dat clusters die we gevormd hebben niet verschillen van een willekeurige verdeling. Redenen hiervoor kunnen zijn:
Binaire data zijn minder geschikt voor de Ward’s methode omdat deze beter met euclidische afstanden berekend wordt. De manier waarop Ward afstanden tussen gegevens berekent, komt dus niet goed overeen met binaire data, die moeilijk om te vormen zijn naar een continue en meetbare afstanden. Voor deze specifieke data zouden complete en average linkage methoden geschikter zijn geweest.
Daarnaast hebben we enkel gekeken naar patiënten met symptomen en aangenomen dat zij de diagnose ‘suspected’ of ‘confirmed’ COVID-19 hadden. Hieruit volgt dat we geen conclusies kunnen trekken over het aanwezig zijn van COVID-19 uit onze data aangezien de symptomen ook voorkomen binnen andere ziekten. Bovendien werden variabele (“not answered”) omgezet naar (“no”) wat mogelijks heeft geleidt tot onderschatting van symptomen. En tot slot is er een observationele bias aangezien de studie ook zelf gerapporteerde symptomen bevatten waarbij subjectieve interpretaties kunnen ontstaan.
De kruistabel toont dat patiënten meerdere clusters delen, waardoor het totale medicatiegebruik hoger is dan het aantal patiënten. Cluster_0 kent het meeste medicatiegebruik, maar door overlap en ontbrekende data moeten we voorzichtig zijn met conclusies over “typische” medicaties per cluster.
Er is geen statistisch significant verschil gevonden tussen de waargenomen en verwachte verdeling van COVID-19-symptoomclusters bij vrouwen met RRMS.
Gezien de overlap tussen clusters is het onjuist om te spreken van “typische” medicatie per cluster, en de chi-kwadraat test bevestigt bovendien dat er geen significant verschil is.
De bevindingen wijzen er op dat het gebruik van specifieke medicatie geen invloed heeft op de kans op het ontwikkelen van bepaalde COVID-19-symptomen bij vrouwelijke RRMS-patiënten.