https://rpubs.com/alex_istrate/609152
Pentru variabilele calitative, am folosit pie-uri sau bar-chart-uri și am calculat frecvențele absolute și relative ale categoriilor formate. Pentru a descrie relațiile dintre variabilele calitative am folosit testele Fisher și Odds-Ratio (OR) cu IC95% sau Chi² și Cramer V. Am prezentat grafic rezultatele sub forma unor bar-chart-uri.
Pentru a studia relațiile dintre variabilele cantitative și cele binare, am folosit testul Mann-Whitney (MW). Am prezentat valorile p generate de aceste teste precum și mediile ±DS ale grupurilor și diferența mediilor cu IC95% asociat. Pentru a descrie relațiile dintre variabilele calitative am folosit testul Chi² sau Fisher și indicatorii Cramer V și Odds-Ratio (OR) cu IC95%. Am prezentat grafic rezultatele sub forma unor bar-chart-uri.
Pentru a studia relațiile dintre variabilele cantitative am folosit coeficientul de corelație Spearman (R), cu valoarea p asociata și am prezentat grafic relațiile sub forma unor scatter-plot-uri pe care am adăugat linia de regresie.
Am folosit WPS Office 2019 pentru managementul bazei de date. Pentru toate analizele statistice și graficele ulterioare am folosit R version 4.0.0 (2020-04-24) [1]. Am considerat p < 0.05 ca fiind semnificativ statistic și p < 0.1 ca prezentând doar o tendință spre semnificativitate statistică.
Din totalul de 40 pacienti, jumătate femei și jumătate bărbați, 18 (45.0%) au fost din mediul rural și 22 (55.0%) au fost din mediul urban. Distribuția pe sexe a fost păstrată egală și între pacienții din fecare mediu de viață.
Majoritatea pacieților au fost căsătoriți (55% din totalul eșantionului), 70% dintre femei, 40% dintre bărbați, diferență între sexe cu tendință spre semnificație statistică (p=0.065).
Erau activi profesional 27 (67.5%) pacienți, fără diferențe semnificative între sexe (11 femei, 55.0%; 16 bărbați, 80.0%; OR=0.31, p=0.176) sau între cele 2 medii de viață (13 rural, 72.2%; 14 urban, 63.6%; OR=1.49, p=0.737)
Vârsta pacienților a avut valori între 31 și 75 ani (mediana: 51) cu o medie de 52.15 ±10.8 ani. În cazul femeilor (N=20, 50.0%) a avut valori între 38 și 69 ani (mediana: 50) cu o medie de 54.05 ±10.8 ani. În cazul bărbaților (N=20, 50.0%) a avut valori între 31 și 75 ani (mediana: 51.5) cu o medie de 50.25 ±10.7 ani. Această diferență de 3.8 ani nu a fost semnificativă statistic (p=0.271) conform testului T pentru eșantioane cu varaiții egale.
Vârsta pacienților din mediul rural (N=18, 45.0%) a avut valori între 38 și 67 ani (mediana: 47) cu o medie de 50.00 ±8.76 ani. Vârsta pacienților din mediul urban (N=22, 55.0%) a avut valori între 31 și 75 ani (mediana: 53.5) cu o medie de 53.91 ±12.1 ani. Această diferență de 3.91 ani nu a fost semnificativă statistic (p=0.260) conform testului T pentru eșantioane cu varaiții egale.
Tabel 1: Descrierea demografică a eșantionului (în funcție de sex).
Variabila | Detalii | F | M | Total | Teste statistice |
Sex | 20 (50.0%) | 20 (50.0%) | 40 | ||
Vârsta (ani) | M (min:max) | 50 (38:69) | 51.5 (31:75) | 51 (31:75) | T-test: p=0.271 |
μ ±DS | 54.05 ±10.8 | 50.25 ±10.7 | 52.15 ±10.8 | ||
Statut marital | căsătorit | 14 (70.0%) | 8 (40.0%) | 22 (55.0%) | V=0.42 (p=0.065) |
divorțat | 4 (20.0%) | 3 (15.0%) | 7 (17.5%) | ||
necăsătorit | 1 (5.0%) | 8 (40.0%) | 9 (22.5%) | ||
văduv | 1 (5.0%) | 1 (5.0%) | 2 (5.0%) | ||
Activitate profesională | activ | 11 (55.0%) | 16 (80.0%) | 27 (67.5%) | OR=0.31 [0.07, 1.25] (p=0.176) |
pensionat | 9 (45.0%) | 4 (20.0%) | 13 (32.5%) | ||
Mediu de viață | rural | 9 (45.0%) | 9 (45.0%) | 18 (45.0%) | OR=1.00 [0.29, 3.48] (p>0.999) |
urban | 11 (55.0%) | 11 (55.0%) | 22 (55.0%) | ||
μ ±DS = Media (deviația standard); M (min:max) = Mediana (min:max); MW = Test Mann-Whitney; OR = odds-ratio [cu IC 95%] și p calculat prin testul Fisher); V = Cramér V (p calculat prin testul Chi²); |
Tabel 2: Descrierea demografică a eșantionului (în funcție de mediul de viață).
Variabila | Detalii | rural | urban | Total | Teste statistice |
Mediu de viață | 18 (45.0%) | 22 (55.0%) | 40 | ||
Sex | F | 9 (50.0%) | 11 (50.0%) | 20 (50.0%) | OR=1.00 [0.29, 3.48] (p>0.999) |
M | 9 (50.0%) | 11 (50.0%) | 20 (50.0%) | ||
Vârsta (ani) | M (min:max) | 47 (38:67) | 53.5 (31:75) | 51 (31:75) | T-test: p=0.260 |
μ ±DS | 50.00 ±8.76 | 53.91 ±12.1 | 52.15 ±10.8 | ||
Statut marital | căsătorit | 10 (55.6%) | 12 (54.5%) | 22 (55.0%) | V=0.23 (p=0.561) |
divorțat | 3 (16.7%) | 4 (18.2%) | 7 (17.5%) | ||
necăsătorit | 5 (27.8%) | 4 (18.2%) | 9 (22.5%) | ||
văduv | 0 | 2 (9.1%) | 2 (5.0%) | ||
Activitate profesională | activ | 13 (72.2%) | 14 (63.6%) | 27 (67.5%) | OR=1.49 [0.39, 5.72] (p=0.737) |
pensionat | 5 (27.8%) | 8 (36.4%) | 13 (32.5%) | ||
μ ±DS = Media (deviația standard); M (min:max) = Mediana (min:max); MW = Test Mann-Whitney; OR = odds-ratio [cu IC 95%] și p calculat prin testul Fisher); V = Cramér V (p calculat prin testul Chi²); |
Tabel 3: Descrierea demografică a eșantionului, în funcție de vârstă.
Subset | N | Mean ±SD | Med (min:max) |
Vârsta (ani) (Shapiro-Wilk normality test: p=0.353) | |||
(total) | 40 (100.0%) | 52.150 ±10.79 | 51.00 (31.00:75.0) |
Sex (Welch Two Sample t-test: p=0.271) | |||
F | 20 (50.0%) | 54.050 ±10.85 | 50.00 (38.00:69.0) |
M | 20 (50.0%) | 50.250 ±10.67 | 51.50 (31.00:75.0) |
Statut marital (ANOVA: p=0.003) | |||
căsătorit | 22 (55.0%) | 55.136 ±9.80 | 53.50 (38.00:69.0) |
divorțat | 7 (17.5%) | 46.714 ±6.78 | 48.00 (40.00:59.0) |
necăsătorit | 9 (22.5%) | 45.222 ±9.69 | 46.00 (31.00:58.0) |
văduv | 2 (5.0%) | 69.500 ±7.78 | 69.50 (64.00:75.0) |
Activitate profesională (Welch Two Sample t-test: p<0.001) | |||
activ | 27 (67.5%) | 46.667 ±6.96 | 46.00 (31.00:59.0) |
pensionat | 13 (32.5%) | 63.538 ±8.09 | 66.00 (41.00:75.0) |
Mediu de viață (Welch Two Sample t-test: p=0.245) | |||
rural | 18 (45.0%) | 50.000 ±8.76 | 47.00 (38.00:67.0) |
urban | 22 (55.0%) | 53.909 ±12.12 | 53.50 (31.00:75.0) |
Figura 1: Distribuția pacienților pe medii de viață și sexe.
Figura 2: Distribuția pacienților pe vârste.
Figura 3: Distribuția vârstei pe medii de viață și sexe.
Figura 4: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat.
Figura 5: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat (pe sexe).
Figura 6: Distribuția pacienților în funcție de statusul mariatal și de statusul de angajat (pe medii de viață).
Figura 7: Distribuția vârstei în funcție de Activitate profesionala și Statut marital.
Nr. Internari a avut valori între 1 și 35 (mediana: 2.5) cu o medie de 4.65 ±6.75. În cazul numărului de internări, distribuția a fost foarte asimetrică, motiv pentru care mediana este un indicator de centralitate mai util decât media.
Femeile au avut până la 10 interări (mediana: 2.5) cu o medie de 2.90 ±2.1 internări de la debutul bolii. Bărbații au avut până la 35 internări (mediana: 2.5) cu o medie de 6.40 ±9.09. Această diferență de 3.5 internări nu a fost semnificativă statistic (p=0.332) conform testului Mann-Whitney.
Nr. Internari la pacienții din mediul rural a avut valori între 1 și 35 (mediana: 3) cu o medie de 5.61 ±8.0. Nr. Internari la pacienții din mediul urban a avut valori până la 27 (mediana: 2) cu o medie de 3.86 ±5.6. Această diferență de 1.75 nu a fost semnificativă statistic (p=0.112) conform testului Mann-Whitney.
Figura 8: Distribuția pacienților în funcție de numărul de internări, pe sexe.
Figura 9: Distribuția pacienților în funcție de numărul de internări, pe medii de viață.
Numărul de internări nu s-a corelat semnificativ statstic cu vârsta (R=-0.023, p=0.886). Evaluand această relație în detaliu, am observatcă în cazul femeilor, vârsta mai înaintată s-a corelat cu mai multe internări (R=0.320, p=0.170), în mod similar la pacienții din cele 2 medii de viață. În cazul bărbaților, această relație a fost inversată, deci vârsta mai înaintată s-a corelat cu mai puține internări (R=-0.370, p=0.110), relație chair mai puternică în cazul bărbaților din mediul rural. Niciuna dintre aceste corelații nu a fost semnificativă statistic (posibil din cauza eșantionului prea mic).
Figura 10: Corelația dintre vârstă și numărul de internări, pe sexe și mediu de viață.
Scorul AUDIT a avut valori între 3 și 36 (mediana: 18) cu o medie de 18.48 ±8.54.
Figura 11: Distribuția pacienților în funcție de scorul AUDIT.
Scorul HADS-Depresie a avut valori între 0 și 21 (mediana: 7) cu o medie de 7.92 ±4.84.
Figura 12: Distribuția pacienților în funcție de scorul HADS-Depresie.
Scorurile HADS-Depresie și AUDIT s-au corelat semnificativ statistic între ele (R=0.331, p=0.037). Deși în cazul femeilor, această corelație a avut valori numerice asemănătoare, nu a fost semnificativă statistic (R=0.250, p=0.290, aspect similar la pacienții din ambele medi de viață). În cazul bărbaților, corelația a fost semnificativă și chiar mai puternică (R=0.560, p=0.010, mai puternică lapacienții din mediul rural).
Figura 13: Corelația dintre scorurile AUDIT și HADS-Depresie, pe sexe și mediu de viață.
În cazul femeilor scorul AUDIT a avut valori între 3 și 30 (mediana: 17) cu o medie de 16.40 ±8.49. În cazul bărbaților scorul AUDIT a avut valori între 8 și 36 (mediana: 20) cu o medie de 20.55 ±8.27. Această diferență de 4.15 nu a fost semnificativă statistic (p=0.126) conform testului T pentru eșantioane cu varaiții egale.
Scorul AUDIT la pacienții din mediul rural a avut valori între 3 și 31 (mediana: 20) cu o medie de 19.89 ±9.66. AUDIT la pacienții din mediul urban scorul AUDIT a avut valori între 4 și 36 (mediana: 16) cu o medie de 17.32 ±7.53. Această diferență de 2.57 nu a fost semnificativă statistic (p=0.350) conform testului T pentru eșantioane cu varaiții egale.
Scorul AUDT nu s-a corelat semnificativ cu vârsta (R=-0.233, p=0.149) la niciunul dintre sexe, dar s-a corelat cu Nr. internări (R=0.447, p=0.004). Această corelație a fost mai puternică la bărbați (R=0.550, p=0.012) decât la femei (R=0.280, p=0.230).
Scorul AUDIT a fost semnificativ statistic mai mic la pacienții căsătoriți decât la cei necăsătoriți / divorțați / văduvi (15.727 ±8.61, mediana = 14.50 vs 21.833 ±7.34, mediana = 21.50, p=0.020)
Tabel 4: Descrierea scorului AUDIT, în funcție de paramertrii demografici.
Subset | N | Mean ±SD | Med (min:max) |
AUDIT (Shapiro-Wilk normality test: p=0.355) | |||
(total) | 40 (100.0%) | 18.475 ±8.54 | 18.00 (3.00:36.0) |
Sex (Welch Two Sample t-test: p=0.126) | |||
F | 20 (50.0%) | 16.400 ±8.49 | 17.00 (3.00:30.0) |
M | 20 (50.0%) | 20.550 ±8.27 | 20.00 (8.00:36.0) |
Vârsta (ani) (Spearman's rank correlation rho: R=-0.233, p=0.149) | |||
(total) | 40 (100.0%) | 52.150 ±10.79 | 51.00 (31.00:75.0) |
Statut marital (ANOVA: p=0.050) | |||
căsătorit | 22 (55.0%) | 15.727 ±8.61 | 14.50 (3.00:30.0) |
divorțat | 7 (17.5%) | 21.000 ±6.51 | 21.00 (14.00:31.0) |
necăsătorit | 9 (22.5%) | 24.222 ±7.17 | 22.00 (14.00:36.0) |
văduv | 2 (5.0%) | 14.000 ±8.49 | 14.00 (8.00:20.0) |
Activitate profesională (Welch Two Sample t-test: p=0.271) | |||
activ | 27 (67.5%) | 19.630 ±7.70 | 18.00 (3.00:36.0) |
pensionat | 13 (32.5%) | 16.077 ±9.96 | 14.00 (4.00:31.0) |
Mediu de viață (Welch Two Sample t-test: p=0.363) | |||
rural | 18 (45.0%) | 19.889 ±9.66 | 20.00 (3.00:31.0) |
urban | 22 (55.0%) | 17.318 ±7.53 | 16.00 (4.00:36.0) |
Nr. internări (Spearman's rank correlation rho: R=0.447, p=0.004) | |||
(total) | 40 (100.0%) | 4.650 ±6.75 | 2.50 (1.00:35.0) |
Figura 14: Distribuția scorului AUDIT în funcșie de parametrii demografici.
List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE
Figura 15: Corelația dintre vârstă și scorul AUDIT, pe sexe și mediu de viață.
List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE
Figura 16: Corelația dintre numarul de interări și scorul AUDIT, pe sexe și mediu de viață.
Am efectuat 2 modele multivariate pentru a evalua corelațiile scorului audit, ajustând pentru efectul celorlalte variabile. Ambele modele folosesc coeficienți standardizați (folosind transformările Z ale variabilelor numerice, Z = media / deviația standard). Am prezentat atât modelul care include toate variabilele (Full, albastru) cât și un model bazat pe selecția automată (algoritmul Stepwise) a celor mai importante variabile (roșu).
Astfel, ajustând pentru efectul celorlalte variabile, am obținut că o creștere a scoului AUDIT s-a corelat semnificativ statistic cu o creștere a numărului de internări (ambele modele) și, marginal, cu o creștere a scorului HADS-Depresie (ambele modele) și cu statusul profesional activ (mai evident în modelul Stepwise).
Figura 17: Coeficienții beta (standardizați) ai scorului AUDIT în regresie multivariată cu restul variabilelor. Am efectuat 2 modele: Full (albastru) și Stepwise (roșu). Valori p: * <0.05, ** < 0.01 .
În cazul femeilor scorul HADS-Depresie a avut valori între 3 și 21 (mediana: 8) cu o medie de 8.85 ±5.02. În cazul bărbaților scorul HADS-Depresie a avut valori între 0 și 21 (mediana: 7) cu o medie de 7.00 ±4.59. Această diferență de 1.85 nu a fost semnificativă statistic (p=0.295) conform testului Mann-Whitney.
Scorul HADS-Depresie la pacienții din mediul rural a avut valori între 1 și 21 (mediana: 9.5) cu o medie de 9.83 ±5.91, iar la pacienții din mediul urban (N=22, 55.0%) a avut valori între 0 și 14 (mediana: 6.5) cu o medie de 6.36 ±3.08. Această diferență de 3.47 a fost semnificativă statistic (p=0.040) conform testului Mann-Whitney.
Scorul HADS-Depresie nu s-a corelat semnificativ cu vârsta (R=-0.143, p=0.379) la niciunul dintre sexe, dar s-a corelat cu Nr. internări (R=0.322, p=0.043). Această corelație a fost mai puternică la bărbați (R=0.410, p=0.069) decât la femei (R=0.330, p=0.150).
Scorul HADS-Depresie a fost mai mic, dar nu semnificativ statistic, la pacienții căsătoriți decât la cei necăsătoriți / divorțați / văduvi (7.00 ±4.70, mediana = 6.50 vs 9.06 ±4.89, mediana = 7.50, p=0.129).
Tabel 5: Descrierea scorului HADS-Depresie, în funcție de paramertrii demografici.
Subset | N | Mean ±SD | Med (min:max) |
HADS-Depresie (Shapiro-Wilk normality test: p=0.012) | |||
(total) | 40 (100.0%) | 7.925 ±4.84 | 7.00 (0.00:21.0) |
Sex (Wilcoxon rank sum test with continuity correction: p=0.295) | |||
F | 20 (50.0%) | 8.850 ±5.02 | 8.00 (3.00:21.0) |
M | 20 (50.0%) | 7.000 ±4.59 | 7.00 (0.00:21.0) |
Vârsta (ani) (Spearman's rank correlation rho: R=-0.143, p=0.379) | |||
(total) | 40 (100.0%) | 52.150 ±10.79 | 51.00 (31.00:75.0) |
Statut marital (Kruskal-Wallis rank sum test: p=0.335) | |||
căsătorit | 22 (55.0%) | 7.000 ±4.70 | 6.50 (0.00:21.0) |
divorțat | 7 (17.5%) | 8.857 ±5.30 | 7.00 (1.00:16.0) |
necăsătorit | 9 (22.5%) | 8.778 ±5.14 | 7.00 (4.00:21.0) |
văduv | 2 (5.0%) | 11.000 ±4.24 | 11.00 (8.00:14.0) |
Activitate profesională (Wilcoxon rank sum test with continuity correction: p=0.850) | |||
activ | 27 (67.5%) | 8.111 ±5.08 | 7.00 (1.00:21.0) |
pensionat | 13 (32.5%) | 7.538 ±4.46 | 6.00 (0.00:14.0) |
Mediu de viață (Wilcoxon rank sum test with continuity correction: p=0.040) | |||
rural | 18 (45.0%) | 9.833 ±5.91 | 9.50 (1.00:21.0) |
urban | 22 (55.0%) | 6.364 ±3.08 | 6.50 (0.00:14.0) |
Nr. internări (Spearman's rank correlation rho: R=0.322, p=0.043) | |||
(total) | 40 (100.0%) | 4.650 ±6.75 | 2.50 (1.00:35.0) |
Figura 18: Distribuția scorului HADS-Depresie în funcție de parametrii demografici.
List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE
Figura 19: Corelația dintre vârstă și scorul HADS-Depresie, pe sexe și mediu de viață.
List of 2 $ legend.position : num [1:2] 1 1 $ legend.justification: num [1:2] 1 1 - attr(, “class”)= chr [1:2] “theme” “gg” - attr(, “complete”)= logi FALSE - attr(*, “validate”)= logi TRUE
Figura 20: Corelația dintre numărul de internări și scorul HADS-Depresie, pe sexe și mediu de viață.
Am efectuat 2 modele multivariate pentru a evalua corelațiile scorului HADS-Depresie, ajustând pentru efectul celorlalte variabile. Ambele modele folosesc coeficienți standardizați (folosind transformările Z ale variabilelor numerice, Z = media / deviația standard). Am prezentat atât modelul care include toate variabilele (Full, albastru) cât și un model bazat pe selecția automată (algoritmul Stepwise) a celor mai importante variabile (roșu).
Astfel, ajustând pentru efectul celorlalte variabile, am obținut că o creștere a scoului HADS-Depresie s-a asociat semnificativ statistic cu sexul faminin și mediul rural (ambele modele). Fără semnificație statistică, am observat și o corelație slabă cu scorul AUDIT (ambele modele).
[1] “căsătorit” “divorțat” “necăsătorit” “văduv”
Figura 17: Coeficienții beta (standardizați) ai scorului AUDIT în regresie multivariată cu restul variabilelor. Am efectuat 2 modele: Full (albastru) și Stepwise (roșu). Valori p: * <0.05, ** < 0.01 .
.