https://rpubs.com/alex_istrate/609152

1 Partea generală

2 Partea specială

2.1 Introducere

2.1.1 Obiective

2.2 Material și metode

2.2.1 Analiza statistică a datelor

Pentru variabilele calitative, am folosit pie-uri sau bar-chart-uri și am calculat frecvențele absolute și relative ale categoriilor formate. Pentru a descrie relațiile dintre variabilele calitative am folosit testele Fisher și Odds-Ratio (OR) cu IC95% sau Chi² și Cramer V. Am prezentat grafic rezultatele sub forma unor bar-chart-uri.

Pentru a studia relațiile dintre variabilele cantitative și cele binare, am folosit testul Mann-Whitney (MW). Am prezentat valorile p generate de aceste teste precum și mediile ±DS ale grupurilor și diferența mediilor cu IC95% asociat. Pentru a descrie relațiile dintre variabilele calitative am folosit testul Chi² sau Fisher și indicatorii Cramer V și Odds-Ratio (OR) cu IC95%. Am prezentat grafic rezultatele sub forma unor bar-chart-uri.

Pentru a studia relațiile dintre variabilele cantitative am folosit coeficientul de corelație Spearman (R), cu valoarea p asociata și am prezentat grafic relațiile sub forma unor scatter-plot-uri pe care am adăugat linia de regresie.

Am folosit WPS Office 2019 pentru managementul bazei de date. Pentru toate analizele statistice și graficele ulterioare am folosit R version 4.0.0 (2020-04-24) [1]. Am considerat p < 0.05 ca fiind semnificativ statistic și p < 0.1 ca prezentând doar o tendință spre semnificativitate statistică.

2.3 Rezultate

2.3.1 Demografie

Din totalul de 40 pacienti, jumătate femei și jumătate bărbați, 18 (45.0%) au fost din mediul rural și 22 (55.0%) au fost din mediul urban. Distribuția pe sexe a fost păstrată egală și între pacienții din fecare mediu de viață.

Majoritatea pacieților au fost căsătoriți (55% din totalul eșantionului), 70% dintre femei, 40% dintre bărbați, diferență între sexe cu tendință spre semnificație statistică (p=0.065).

Erau activi profesional 27 (67.5%) pacienți, fără diferențe semnificative între sexe (11 femei, 55.0%; 16 bărbați, 80.0%; OR=0.31, p=0.176) sau între cele 2 medii de viață (13 rural, 72.2%; 14 urban, 63.6%; OR=1.49, p=0.737)

Vârsta pacienților a avut valori între 31 și 75 ani (mediana: 51) cu o medie de 52.15 ±10.8 ani. În cazul femeilor (N=20, 50.0%) a avut valori între 38 și 69 ani (mediana: 50) cu o medie de 54.05 ±10.8 ani. În cazul bărbaților (N=20, 50.0%) a avut valori între 31 și 75 ani (mediana: 51.5) cu o medie de 50.25 ±10.7 ani. Această diferență de 3.8 ani nu a fost semnificativă statistic (p=0.271) conform testului T pentru eșantioane cu varaiții egale.

Vârsta pacienților din mediul rural (N=18, 45.0%) a avut valori între 38 și 67 ani (mediana: 47) cu o medie de 50.00 ±8.76 ani. Vârsta pacienților din mediul urban (N=22, 55.0%) a avut valori între 31 și 75 ani (mediana: 53.5) cu o medie de 53.91 ±12.1 ani. Această diferență de 3.91 ani nu a fost semnificativă statistic (p=0.260) conform testului T pentru eșantioane cu varaiții egale.

Tabel 1: Descrierea demografică a eșantionului (în funcție de sex).

Variabila

Detalii

F

M

Total

Teste statistice

Sex

20 (50.0%)

20 (50.0%)

40

Vârsta (ani)

M (min:max)

50 (38:69)

51.5 (31:75)

51 (31:75)

T-test: p=0.271

μ ±DS

54.05 ±10.8

50.25 ±10.7

52.15 ±10.8

Statut marital

căsătorit

14 (70.0%)

8 (40.0%)

22 (55.0%)

V=0.42 (p=0.065)

divorțat

4 (20.0%)

3 (15.0%)

7 (17.5%)

necăsătorit

1 (5.0%)

8 (40.0%)

9 (22.5%)

văduv

1 (5.0%)

1 (5.0%)

2 (5.0%)

Activitate profesională

activ

11 (55.0%)

16 (80.0%)

27 (67.5%)

OR=0.31 [0.07, 1.25] (p=0.176)

pensionat

9 (45.0%)

4 (20.0%)

13 (32.5%)

Mediu de viață

rural

9 (45.0%)

9 (45.0%)

18 (45.0%)

OR=1.00 [0.29, 3.48] (p>0.999)

urban

11 (55.0%)

11 (55.0%)

22 (55.0%)

μ ±DS = Media (deviația standard); M (min:max) = Mediana (min:max); MW = Test Mann-Whitney; OR = odds-ratio [cu IC 95%] și p calculat prin testul Fisher); V = Cramér V (p calculat prin testul Chi²);

Tabel 2: Descrierea demografică a eșantionului (în funcție de mediul de viață).

Variabila

Detalii

rural

urban

Total

Teste statistice

Mediu de viață

18 (45.0%)

22 (55.0%)

40

Sex

F

9 (50.0%)

11 (50.0%)

20 (50.0%)

OR=1.00 [0.29, 3.48] (p>0.999)

M

9 (50.0%)

11 (50.0%)

20 (50.0%)

Vârsta (ani)

M (min:max)

47 (38:67)

53.5 (31:75)

51 (31:75)

T-test: p=0.260

μ ±DS

50.00 ±8.76

53.91 ±12.1

52.15 ±10.8

Statut marital

căsătorit

10 (55.6%)

12 (54.5%)

22 (55.0%)

V=0.23 (p=0.561)

divorțat

3 (16.7%)

4 (18.2%)

7 (17.5%)

necăsătorit

5 (27.8%)

4 (18.2%)

9 (22.5%)

văduv

0

2 (9.1%)

2 (5.0%)

Activitate profesională

activ

13 (72.2%)

14 (63.6%)

27 (67.5%)

OR=1.49 [0.39, 5.72] (p=0.737)

pensionat

5 (27.8%)

8 (36.4%)

13 (32.5%)

μ ±DS = Media (deviația standard); M (min:max) = Mediana (min:max); MW = Test Mann-Whitney; OR = odds-ratio [cu IC 95%] și p calculat prin testul Fisher); V = Cramér V (p calculat prin testul Chi²);

Tabel 3: Descrierea demografică a eșantionului, în funcție de vârstă.

Subset

N

Mean ±SD

Med (min:max)

Vârsta (ani) (Shapiro-Wilk normality test: p=0.353)

(total)

40 (100.0%)

52.150 ±10.79

51.00 (31.00:75.0)

Sex (Welch Two Sample t-test: p=0.271)

F

20 (50.0%)

54.050 ±10.85

50.00 (38.00:69.0)

M

20 (50.0%)

50.250 ±10.67

51.50 (31.00:75.0)

Statut marital (ANOVA: p=0.003)

căsătorit

22 (55.0%)

55.136 ±9.80

53.50 (38.00:69.0)

divorțat

7 (17.5%)

46.714 ±6.78

48.00 (40.00:59.0)

necăsătorit

9 (22.5%)

45.222 ±9.69

46.00 (31.00:58.0)

văduv

2 (5.0%)

69.500 ±7.78

69.50 (64.00:75.0)

Activitate profesională (Welch Two Sample t-test: p<0.001)

activ

27 (67.5%)

46.667 ±6.96

46.00 (31.00:59.0)

pensionat

13 (32.5%)

63.538 ±8.09

66.00 (41.00:75.0)

Mediu de viață (Welch Two Sample t-test: p=0.245)

rural

18 (45.0%)

50.000 ±8.76

47.00 (38.00:67.0)

urban

22 (55.0%)

53.909 ±12.12

53.50 (31.00:75.0)

Figura 1: Distribuția pacienților pe medii de viață și sexe.

Figura 2: Distribuția pacienților pe vârste.

Figura 3: Distribuția vârstei pe medii de viață și sexe.

Figura 4: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat.

Figura 5: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat (pe sexe).

Figura 6: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat (pe medii de viață).

Figura 7: Distribuția vârstei în funcție de Activitate profesionala și Statut marital.

2.3.2 Nr. internări

Nr. Internari a avut valori între 1 și 35 (mediana: 2.5) cu o medie de 4.65 ±6.75. În cazul numărului de internări, distribuția a fost foarte asimetrică, motiv pentru care mediana este un indicator de centralitate mai util decât media.

Femeile au avut până la 10 interări (mediana: 2.5) cu o medie de 2.90 ±2.1 internări de la debutul bolii. Bărbații au avut până la 35 internări (mediana: 2.5) cu o medie de 6.40 ±9.09. Această diferență de 3.5 internări nu a fost semnificativă statistic (p=0.332) conform testului Mann-Whitney.

Nr. Internari la pacienții din mediul rural a avut valori între 1 și 35 (mediana: 3) cu o medie de 5.61 ±8.0. Nr. Internari la pacienții din mediul urban a avut valori până la 27 (mediana: 2) cu o medie de 3.86 ±5.6. Această diferență de 1.75 nu a fost semnificativă statistic (p=0.112) conform testului Mann-Whitney.

Figura 8: Distribuția pacienților în funcție de numărul de internări, pe sexe.

Figura 9: Distribuția pacienților în funcție de numărul de internări, pe medii de viață.

Numărul de internări nu s-a corelat semnificativ statstic cu vârsta (R=-0.023, p=0.886). Evaluand această relație în detaliu, am observatcă în cazul femeilor, vârsta mai înaintată s-a corelat cu mai multe internări (R=0.320, p=0.170), în mod similar la pacienții din cele 2 medii de viață. În cazul bărbaților, această relație a fost inversată, deci vârsta mai înaintată s-a corelat cu mai puține internări (R=-0.370, p=0.110), relație chair mai puternică în cazul bărbaților din mediul rural. Niciuna dintre aceste corelații nu a fost semnificativă statistic (posibil din cauza eșantionului prea mic).

Figura 10: Corelația dintre vârstă și numărul de internări, pe sexe și mediu de viață.

2.3.3 HADS, AUDIT

Scorul AUDIT a avut valori între 3 și 36 (mediana: 18) cu o medie de 18.48 ±8.54.

Figura 11: Distribuția pacienților în funcție de scorul AUDIT.

Scorul HADS-Depresie a avut valori între 0 și 21 (mediana: 7) cu o medie de 7.92 ±4.84.

Figura 12: Distribuția pacienților în funcție de scorul HADS-Depresie.

Scorurile HADS-Depresie și AUDIT s-au corelat semnificativ statistic între ele (R=0.331, p=0.037). Deși în cazul femeilor, această corelație a avut valori numerice asemănătoare, nu a fost semnificativă statistic (R=0.250, p=0.290, aspect similar la pacienții din ambele medi de viață). În cazul bărbaților, corelația a fost semnificativă și chiar mai puternică (R=0.560, p=0.010, mai puternică lapacienții din mediul rural).

Figura 13: Corelația dintre scorurile AUDIT și HADS-Depresie, pe sexe și mediu de viață.

2.3.3.1 Corelații AUDIT

În cazul femeilor scorul AUDIT a avut valori între 3 și 30 (mediana: 17) cu o medie de 16.40 ±8.49. În cazul bărbaților scorul AUDIT a avut valori între 8 și 36 (mediana: 20) cu o medie de 20.55 ±8.27. Această diferență de 4.15 nu a fost semnificativă statistic (p=0.126) conform testului T pentru eșantioane cu varaiții egale.

Scorul AUDIT la pacienții din mediul rural a avut valori între 3 și 31 (mediana: 20) cu o medie de 19.89 ±9.66. AUDIT la pacienții din mediul urban scorul AUDIT a avut valori între 4 și 36 (mediana: 16) cu o medie de 17.32 ±7.53. Această diferență de 2.57 nu a fost semnificativă statistic (p=0.350) conform testului T pentru eșantioane cu varaiții egale.

Scorul AUDT nu s-a corelat semnificativ cu vârsta (R=-0.233, p=0.149) la niciunul dintre sexe, dar s-a corelat cu Nr. internări (R=0.447, p=0.004). Această corelație a fost mai puternică la bărbați (R=0.550, p=0.012) decât la femei (R=0.280, p=0.230).

Scorul AUDIT a fost semnificativ statistic mai mic la pacienții căsătoriți decât la cei necăsătoriți / divorțați / văduvi (15.727 ±8.61, mediana = 14.50 vs 21.833 ±7.34, mediana = 21.50, p=0.020)

Tabel 4: Descrierea scorului AUDIT, în funcție de paramertrii demografici.

Subset

N

Mean ±SD

Med (min:max)

AUDIT (Shapiro-Wilk normality test: p=0.355)

(total)

40 (100.0%)

18.475 ±8.54

18.00 (3.00:36.0)

Sex (Welch Two Sample t-test: p=0.126)

F

20 (50.0%)

16.400 ±8.49

17.00 (3.00:30.0)

M

20 (50.0%)

20.550 ±8.27

20.00 (8.00:36.0)

Vârsta (ani) (Spearman's rank correlation rho: R=-0.233, p=0.149)

(total)

40 (100.0%)

52.150 ±10.79

51.00 (31.00:75.0)

Statut marital (ANOVA: p=0.050)

căsătorit

22 (55.0%)

15.727 ±8.61

14.50 (3.00:30.0)

divorțat

7 (17.5%)

21.000 ±6.51

21.00 (14.00:31.0)

necăsătorit

9 (22.5%)

24.222 ±7.17

22.00 (14.00:36.0)

văduv

2 (5.0%)

14.000 ±8.49

14.00 (8.00:20.0)

Activitate profesională (Welch Two Sample t-test: p=0.271)

activ

27 (67.5%)

19.630 ±7.70

18.00 (3.00:36.0)

pensionat

13 (32.5%)

16.077 ±9.96

14.00 (4.00:31.0)

Mediu de viață (Welch Two Sample t-test: p=0.363)

rural

18 (45.0%)

19.889 ±9.66

20.00 (3.00:31.0)

urban

22 (55.0%)

17.318 ±7.53

16.00 (4.00:36.0)

Nr. internări (Spearman's rank correlation rho: R=0.447, p=0.004)

(total)

40 (100.0%)

4.650 ±6.75

2.50 (1.00:35.0)

Figura 14: Distribuția scorului AUDIT în funcșie de parametrii demografici.

List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE

Figura 15: Corelația dintre vârstă și scorul AUDIT, pe sexe și mediu de viață.

List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE

Figura 16: Corelația dintre numarul de interări și scorul AUDIT, pe sexe și mediu de viață.

2.3.3.2 Reg: AUDIT

Am efectuat 2 modele multivariate pentru a evalua corelațiile scorului audit, ajustând pentru efectul celorlalte variabile. Ambele modele folosesc coeficienți standardizați (folosind transformările Z ale variabilelor numerice, Z = media / deviația standard). Am prezentat atât modelul care include toate variabilele (Full, albastru) cât și un model bazat pe selecția automată (algoritmul Stepwise) a celor mai importante variabile (roșu).

Astfel, ajustând pentru efectul celorlalte variabile, am obținut că o creștere a scoului AUDIT s-a corelat semnificativ statistic cu o creștere a numărului de internări (ambele modele) și, marginal, cu o creștere a scorului HADS-Depresie (ambele modele) și cu statusul profesional activ (mai evident în modelul Stepwise).

Figura 17: Coeficienții beta (standardizați) ai scorului AUDIT în regresie multivariată cu restul variabilelor. Am efectuat 2 modele: Full (albastru) și Stepwise (roșu). Valori p: * <0.05, ** < 0.01 .

2.3.3.3 Corelații HADS-Depresie

În cazul femeilor scorul HADS-Depresie a avut valori între 3 și 21 (mediana: 8) cu o medie de 8.85 ±5.02. În cazul bărbaților scorul HADS-Depresie a avut valori între 0 și 21 (mediana: 7) cu o medie de 7.00 ±4.59. Această diferență de 1.85 nu a fost semnificativă statistic (p=0.295) conform testului Mann-Whitney.

Scorul HADS-Depresie la pacienții din mediul rural a avut valori între 1 și 21 (mediana: 9.5) cu o medie de 9.83 ±5.91, iar la pacienții din mediul urban (N=22, 55.0%) a avut valori între 0 și 14 (mediana: 6.5) cu o medie de 6.36 ±3.08. Această diferență de 3.47 a fost semnificativă statistic (p=0.040) conform testului Mann-Whitney.

Scorul HADS-Depresie nu s-a corelat semnificativ cu vârsta (R=-0.143, p=0.379) la niciunul dintre sexe, dar s-a corelat cu Nr. internări (R=0.322, p=0.043). Această corelație a fost mai puternică la bărbați (R=0.410, p=0.069) decât la femei (R=0.330, p=0.150).

Scorul HADS-Depresie a fost mai mic, dar nu semnificativ statistic, la pacienții căsătoriți decât la cei necăsătoriți / divorțați / văduvi (7.00 ±4.70, mediana = 6.50 vs 9.06 ±4.89, mediana = 7.50, p=0.129).

Tabel 5: Descrierea scorului HADS-Depresie, în funcție de paramertrii demografici.

Subset

N

Mean ±SD

Med (min:max)

HADS-Depresie (Shapiro-Wilk normality test: p=0.012)

(total)

40 (100.0%)

7.925 ±4.84

7.00 (0.00:21.0)

Sex (Wilcoxon rank sum test with continuity correction: p=0.295)

F

20 (50.0%)

8.850 ±5.02

8.00 (3.00:21.0)

M

20 (50.0%)

7.000 ±4.59

7.00 (0.00:21.0)

Vârsta (ani) (Spearman's rank correlation rho: R=-0.143, p=0.379)

(total)

40 (100.0%)

52.150 ±10.79

51.00 (31.00:75.0)

Statut marital (Kruskal-Wallis rank sum test: p=0.335)

căsătorit

22 (55.0%)

7.000 ±4.70

6.50 (0.00:21.0)

divorțat

7 (17.5%)

8.857 ±5.30

7.00 (1.00:16.0)

necăsătorit

9 (22.5%)

8.778 ±5.14

7.00 (4.00:21.0)

văduv

2 (5.0%)

11.000 ±4.24

11.00 (8.00:14.0)

Activitate profesională (Wilcoxon rank sum test with continuity correction: p=0.850)

activ

27 (67.5%)

8.111 ±5.08

7.00 (1.00:21.0)

pensionat

13 (32.5%)

7.538 ±4.46

6.00 (0.00:14.0)

Mediu de viață (Wilcoxon rank sum test with continuity correction: p=0.040)

rural

18 (45.0%)

9.833 ±5.91

9.50 (1.00:21.0)

urban

22 (55.0%)

6.364 ±3.08

6.50 (0.00:14.0)

Nr. internări (Spearman's rank correlation rho: R=0.322, p=0.043)

(total)

40 (100.0%)

4.650 ±6.75

2.50 (1.00:35.0)

Figura 18: Distribuția scorului HADS-Depresie în funcție de parametrii demografici.

List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE

Figura 19: Corelația dintre vârstă și scorul HADS-Depresie, pe sexe și mediu de viață.

List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE

Figura 20: Corelația dintre numărul de internări și scorul HADS-Depresie, pe sexe și mediu de viață.

2.3.3.4 Reg: Depresie

Am efectuat 2 modele multivariate pentru a evalua corelațiile scorului HADS-Depresie, ajustând pentru efectul celorlalte variabile. Ambele modele folosesc coeficienți standardizați (folosind transformările Z ale variabilelor numerice, Z = media / deviația standard). Am prezentat atât modelul care include toate variabilele (Full, albastru) cât și un model bazat pe selecția automată (algoritmul Stepwise) a celor mai importante variabile (roșu).

Astfel, ajustând pentru efectul celorlalte variabile, am obținut că o creștere a scoului HADS-Depresie s-a asociat semnificativ statistic cu sexul faminin și mediul rural (ambele modele). Fără semnificație statistică, am observat și o corelație slabă cu scorul AUDIT (ambele modele).

[1] “căsătorit” “divorțat” “necăsătorit” “văduv”

Figura 17: Coeficienții beta (standardizați) ai scorului AUDIT în regresie multivariată cu restul variabilelor. Am efectuat 2 modele: Full (albastru) și Stepwise (roșu). Valori p: * <0.05, ** < 0.01 .

2.4 Discuții

2.5 Concluzie

3 Bibliografie

  1. R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

.