Introductie

Onderzoeksgroep: Vrouwen met RRMS en COVID-19 Symptomen

In dit groepsproject hebben we onderzocht in hoeverre vrouwelijke patiënten met relapsing remitting multiple sclerose (RRMS) die bepaalde medicamenteuze therapieën ondergaan, meer gerapporteerde COVID-19 symptomen ervaren in vergelijking met andere behandelingen.

Hypotheses:
- H₀: Het gebruik van specifieke medicatie heeft geen effect op de kans op het ontwikkelen van bepaalde symptomen.
- Hₐ: Het gebruik van specifieke medicatie heeft wél een effect op de kans op het ontwikkelen van bepaalde symptomen.

Bijkomende onderzoeksvraag:

Zijn er bepaalde COVID-19 symptomen die vaker samen voorkomen?


Objectieven

  1. Het voorkomen van COVID-19 symptomen bij vrouwen met RRMS beschrijven.
  2. Het medicatiegebruik bij vrouwen met RRMS in kaart brengen.
  3. Het verband onderzoeken tussen medicatiegebruik en meer gerapporteerde COVID-19 symptomen, gebruikmakend van de dataset GDSI_OpenDataset_Final.

Groepsleden

  • An-Sofie Verhoeven
  • Dennis Hertoghe
  • Dries Nassen


Methodologie

We hebben gewerkt in verschillende stappen om ons onderzoek systematisch uit te voeren:

1. Inladen van de data

De dataset GDSI_OpenDataset_Final werd geïmporteerd en gecontroleerd op volledigheid.

2. Descriptieve analyse

Het aantal vrouwen met RRMS dat COVID-19 symptomen rapporteerde werd geanalyseerd, inclusief de verdeling van suspected en confirmed gevallen. Daarnaast werd medicatiegebruik in kaart gebracht.

3. Sorteren op enkel vrouwen met RRMS

De dataset werd gefilterd om alleen vrouwen met RRMS te behouden, aangezien deze groep het meest vertegenwoordigd is.

4. Imputatie van missende waarden

Missende antwoorden in de symptoomkolommen werden vervangen door “no” om uniformiteit in de dataset te krijgen.

5. Data voorbereiden voor clusteranalyse

Symptoomkolommen werden binair gemaakt (aanwezig = 1, afwezig = 0) om clustering mogelijk te maken.

6. Hiërarchische clustering

Symptomen werden geclusterd met een hiërarchische methode, resulterend in een dendrogram om de samenhang tussen symptomen te visualiseren.

7. Statistische toetsing

Een Chi-kwadraat test voor goodness of fit werd uitgevoerd om te beoordelen of de clustering van symptomen significant is.

8. Clusterinformatie toevoegen

Een extra kolom werd toegevoegd aan de dataset met de clusterinformatie per patiënt.

9. Logistische regressie

Per symptoom werd een logistische regressie uitgevoerd om te onderzoeken welke factoren de kans op het optreden van een symptoom beïnvloeden.

10. Discussie en interpretatie

De resultaten van de analyses werden geïnterpreteerd en besproken.

Descriptieve Analyse

We hebben de data van vrouwen met RRMS geanalyseerd om inzicht te krijgen in hun COVID-19 symptomen en medicatiegebruik. Hieronder worden de resultaten weergegeven.

Tabellen

Aantal vrouwen met RRMS die COVID-19 symptomen rapporteren.
Symptoomstatus Aantal
7
no 489
yes 243
Verdeling van medicatiegebruik onder vrouwen met RRMS.
Type Medicatie Aantal
82
currently not using any DMT 59
currently on alemtuzumab 8
currently on another drug not listed 117
currently on cladribine 29
currently on dimethyl fumarate 101
currently on fingolimod 90
currently on glatiramer 43
currently on interferon 59
currently on natalizumab 49
currently on ocrelizumab 52
currently on rituximab 8
currently on teriflunomide 42
Aantal vrouwen die ‘Yes’ hebben geantwoord op specifieke COVID-19 symptomen.
Symptoom Aantal ‘Yes’
Droge hoest 139
Rillingen 74
Vermoeidheid 159
Kortademigheid 70
Keelpijn 114
Koorts 95
Verlies van reuk/smaak 60
Pijn 125
Longontsteking 10
Neusverstopping 115

Clusteranalyse

Visualisatie van afstandmatrix

# transpose

symptomen_transposed <- data.table::transpose(as.data.table(vrouwenRRMS_symptomen),keep.names = "col")

# gebruik eerste kolom (omschrijving van het symptoom) als rownames

symptomen_transposed <- data.frame(symptomen_transposed, row.names = 1)

rm(vrouwenRRMS_symptomen)  # tabel niet meer nodig

#afstand berekenen
distance_matrix <- dist(symptomen_transposed, method = "binary")

fviz_dist(distance_matrix)

Hierargisch clusteren

#cluster methode  
hclust_result <- hclust(distance_matrix, method = "ward.D")

plot(hclust_result, main = "Dendrogram van Hiërarchische Clustering voor COVID-19 Symptomen",labels = rownames(symptomen_transposed),
     cex=0.7)

Cluster frequenties

Aantal items en proporties per cluster
Cluster Frequency Proportion
1 3 0.3
2 5 0.5
3 1 0.1
4 1 0.1

Histogram cluster frequenties

Chi-kwadraat test van clusters

Resultaten van de Chi-kwadraattoets
Statistiek p.waarde Vrijheidsgraden
X-squared 4.4 0.2213854 3

Kruistabel van medicatie en clusters

Frequenties van Medicatiegebruik per Symptoomcluster (Breed Formaat)
Medicatie Cluster_0 Cluster_1 Cluster_2 Cluster_3 Cluster_4
62 7 6 6 1
currently not using any DMT 36 4 13 6 0
currently on alemtuzumab 8 0 0 0 0
currently on another drug not listed 81 12 17 6 1
currently on cladribine 20 2 5 2 0
currently on dimethyl fumarate 75 6 11 9 0
currently on fingolimod 59 8 19 3 1
currently on glatiramer 29 4 7 3 0
currently on interferon 43 4 11 1 0
currently on natalizumab 28 9 12 0 0
currently on ocrelizumab 32 6 8 6 0
currently on rituximab 6 0 2 0 0
currently on teriflunomide 30 3 7 2 0

Chi-kwadraat test van kruistabel

Resultaten van de Chi-Kwadraattoets
Statistiek P-waarde Vrijheidsgraden
X-squared 44.2145 0.6287114 48

Discussie resultaat

Onze descriptieve analyses zorgden ervoor dat we de dataset konden vereenvoudigen naar enkel vrouwen met relapsing remitting multiple sclerose (RRMS). Hieruit kwam de vraag of dat vrouwen met RRMS bepaalde symptomen meer vertonen indien ze een specifieke medicamenteuze behandeling ondergaan. Deze symptomen varieerden van vermoeidheid en keelpijn tot ernstige symptomen zoals kortademigheid en pneumonie.

De clustering liet zien dat er een groepering van symptomen was met een resultaat van 4 clusters. Deze clusteranalyse was niet significant ten opzichte van de voorspelde waardes. Dit wil zeggen dat dat clusters die we gevormd hebben niet verschillen van een willekeurige verdeling. Redenen hiervoor kunnen zijn:

Binaire data zijn minder geschikt voor de Ward’s methode omdat deze beter met euclidische afstanden berekend wordt. De manier waarop Ward afstanden tussen gegevens berekent, komt dus niet goed overeen met binaire data, die moeilijk om te vormen zijn naar een continue en meetbare afstanden. Voor deze specifieke data zouden complete en average linkage methoden geschikter zijn geweest.

Daarnaast hebben we enkel gekeken naar patiënten met symptomen en aangenomen dat zij de diagnose ‘suspected’ of ‘confirmed’ COVID-19 hadden. Hieruit volgt dat we geen conclusies kunnen trekken over het aanwezig zijn van COVID-19 uit onze data aangezien de symptomen ook voorkomen binnen andere ziekten. Bovendien werden variabele (“not answered”) omgezet naar (“no”) wat mogelijks heeft geleidt tot onderschatting van symptomen. En tot slot is er een observationele bias aangezien de studie ook zelf gerapporteerde symptomen bevatten waarbij subjectieve interpretaties kunnen ontstaan.

De kruistabel toont dat patiënten meerdere clusters delen, waardoor het totale medicatiegebruik hoger is dan het aantal patiënten. Cluster_0 kent het meeste medicatiegebruik, maar door overlap en ontbrekende data moeten we voorzichtig zijn met conclusies over “typische” medicaties per cluster.

Bespreking groepsproject

Er is geen statistisch significant verschil gevonden tussen de waargenomen en verwachte verdeling van COVID-19-symptoomclusters bij vrouwen met RRMS.

Gezien de overlap tussen clusters is het onjuist om te spreken van “typische” medicatie per cluster, en de chi-kwadraat test bevestigt bovendien dat er geen significant verschil is.

De bevindingen wijzen er op dat het gebruik van specifieke medicatie geen invloed heeft op de kans op het ontwikkelen van bepaalde COVID-19-symptomen bij vrouwelijke RRMS-patiënten.