1. Istoric al diabetului de tip II

Diabetul zaharat de tip II a fost cunoscut in trecut, sub denumirea de diabet zaharat non-insulinodependent sau diabetul adultului . Acest tip de diabet este caracterizat de un nivel ridicat al glicemiei, pe fondul unei rezistente la insulina si a unei deficiente relative de insulina. Este opus diabetului zaharat de tip I, unde exista o deficienta absoluta de insulina.Acest tip de diabet reprezinta aproximativ 90% din cazurile de diabet. Se presupune ca obezitatea reprezinta cauza principala a acestei boli, la persoanele predispuse genetic.

Complicatiile pe termen lung cauzate de un nivel ridicat al glicemiei pot include accidente vasculare, insuficienta renala, retinopatie diabetica si circulatia deficitara a membrelor.

Evolutia diabetului la nivel mondial:

Anul Cazuri de diabet la nivel mondial
1985 30 milioane
1995 217 milioane
2010 285 milioane

Factorii de risc pentru diabetul de tip II includ: varsta avansata, obezitatea, inactivitatea fizica, cazurile anterioare de diabet in familie si rasa. Afro-americanii, latinoamericanii, amerindienii, sud-asiaticii, unii americani de origine asiatica au o predispozitie pentru aceasta boala. Deasemenea, femeile prezinta un risc mai mare de a se imbolnavi.

In anul 2010, cele mai multe cazuri de diabet erau in:

India China Statele Unite Indonezia Japonia
31.7 20.8 17.7 8.4 6.8

Organizatia Mondiala a Sanatatii considera aceasta boala o epidemie.

Boala cardiaca coronariana (CHD) ramane cea mai frecventa cauza de deces in randul populatiei de culoare neagra, iar în ceea ce priveste diferenta de mortalitate CHD intre populatia de culoare neagra si cea alba, aceasta este in crestere. Aceasta tendinta se poate datora, in parte la rate mai mari de factori de risc CHD printre negrii. Populatia din zonele rurale ale Statelor Unite ale Americii este predispusa la mai multe boli cronice decat cea din mediul urban.Neavand doctori in apropiere si laboratoare de analize, pana ajung sa fie diagnosticati, problemele de sanatate pot fi mai mari.

2. Tipul studiului

2.1 Populatia studiata

Populatia studiata este cea de afro-americani din zona centrala a statului Virginia (SUA) si anume, din localitatile Louisa si Buckingham.

2.2 Criterii de includere/excludere

Criteriile de includere/excludere au fost ca populatia studiata sa fie de afro-americani cu varsta mai mare de 19 ani (se poate observa in datele afisate mai jos), din localitatile Louisa si Buckingham centrul statului Virginia.

2.3 Caracteristici

Acest studiu face parte dintr-un studiu mai amplu si anume al determinarii prevalentei obezitatii, diabetului si a altor factori de risc cardiovascular pentru afro-americanii din zona centrala a statului Virginia (SUA). Datele sunt extrase din revista Southern Medical Association din anul 1997 si sunt obtinute prin amabilitatea Dr. John SCHORLING de la Departamentul de Medicina al Universitatii din Virginia.

Datele studiului consta in 19 variabile adunate pe 403 subiecti dintr-un total de 1046 care au fost intervievati in studiul pentru factorii de risc în boli coronariene, cei 403 subiecti fiind cei care au fost de fapt testati pentru diabet. Potrivit lui Dr. John Hong, diabetul zaharat de tip II este asociat cel mai puternic cu obezitatea si de asemenea cu hipertensiune arteriala - acestea pot fi atat o parte din “Sindromul X”(cauzat de alimentatie nesanatoasa, stil de viata sedentar si plin de stres). Raportul talie / sold poate fi un predictor in diabet si bolile de inima.

Hemoglobina glicata, HbA1C ,este o analiza medicala care reflecta media glicemiei in ultimele 3 luni. Rezultatul HbA1C se exprima ca procent din Hemoglobina totala.

Limite de valori
Valori normale 4.5%-5.7%
Prediabet 5.7%-6.9%
Diabet >7%

Hemoglobina glicata cu o valoare mai mare de 7.0 % este luata de obicei ca un diagnostic pozitiv al diabetului.

2.4 Tipul studiului

Studiul este unul de tip observational, transversal, cunoscut si sub numele de studiu de prevalenta sau cross-sectional, in care este examinat un esantion din populatia de referinta, la un anumit moment dat.

2.5 Explorarea si intelegerea datelor

In cadrul studiului au fost colectate date despre populatia studiata si inregistrate ca si date de tip numeric si categorie.

In tabelul de mai jos avem descrierea variabilelor cu semnificatie si cu numarul de campuri cu date lipsa.

Variabile Semnificatie NA
id id-ul subiectului 0
chol colesterolul total 1
stab.glu glicemie 0
hdl HDL colesterol 1
ratio colesterolul total/HDL colesterol 1
glyhb hemoglobina glicata 13
location localitatea 0
age varsta 0
gender genul 0
height inaltimea (inch) 5
weight greutatea (pounds) 1
frame marimea (S,M,L) 12
bp.1s tensiunea sistolica-1 5
bp.1d tensiunea diastolica-1 5
bp.2s tensiunea sistolica-2 262
bp.2d tensiunea diastolica-2 262
waist circumferinta talie 2
hip circumferinta sold 2
time.ppn timpul de la ultima masa, pana la recoltarea analizei 3

Un “summary” in limbajul R pe baza de date ne arata ca avem un total de 403 persoane inrolate in studiu dintre care 234 femei si 169 barbati si valorile de minim, maxim, media si quartilele pentru variabilele afisate mai sus.

diabetes=read.csv("diabetes.csv")
summary(diabetes) 
##        id             chol          stab.glu          hdl        
##  Min.   : 1000   Min.   : 78.0   Min.   : 48.0   Min.   : 12.00  
##  1st Qu.: 4792   1st Qu.:179.0   1st Qu.: 81.0   1st Qu.: 38.00  
##  Median :15766   Median :204.0   Median : 89.0   Median : 46.00  
##  Mean   :15978   Mean   :207.8   Mean   :106.7   Mean   : 50.45  
##  3rd Qu.:20336   3rd Qu.:230.0   3rd Qu.:106.0   3rd Qu.: 59.00  
##  Max.   :41756   Max.   :443.0   Max.   :385.0   Max.   :120.00  
##                  NA's   :1                       NA's   :1       
##      ratio            glyhb             location        age       
##  Min.   : 1.500   Min.   : 2.68   Buckingham:200   Min.   :19.00  
##  1st Qu.: 3.200   1st Qu.: 4.38   Louisa    :203   1st Qu.:34.00  
##  Median : 4.200   Median : 4.84                    Median :45.00  
##  Mean   : 4.522   Mean   : 5.59                    Mean   :46.85  
##  3rd Qu.: 5.400   3rd Qu.: 5.60                    3rd Qu.:60.00  
##  Max.   :19.300   Max.   :16.11                    Max.   :92.00  
##  NA's   :1        NA's   :13                                      
##     gender        height          weight         frame         bp.1s      
##  female:234   Min.   :52.00   Min.   : 99.0         : 12   Min.   : 90.0  
##  male  :169   1st Qu.:63.00   1st Qu.:151.0   large :103   1st Qu.:121.2  
##               Median :66.00   Median :172.5   medium:184   Median :136.0  
##               Mean   :66.02   Mean   :177.6   small :104   Mean   :136.9  
##               3rd Qu.:69.00   3rd Qu.:200.0                3rd Qu.:146.8  
##               Max.   :76.00   Max.   :325.0                Max.   :250.0  
##               NA's   :5       NA's   :1                    NA's   :5      
##      bp.1d            bp.2s           bp.2d            waist     
##  Min.   : 48.00   Min.   :110.0   Min.   : 60.00   Min.   :26.0  
##  1st Qu.: 75.00   1st Qu.:138.0   1st Qu.: 84.00   1st Qu.:33.0  
##  Median : 82.00   Median :149.0   Median : 92.00   Median :37.0  
##  Mean   : 83.32   Mean   :152.4   Mean   : 92.52   Mean   :37.9  
##  3rd Qu.: 90.00   3rd Qu.:161.0   3rd Qu.:100.00   3rd Qu.:41.0  
##  Max.   :124.00   Max.   :238.0   Max.   :124.00   Max.   :56.0  
##  NA's   :5        NA's   :262     NA's   :262      NA's   :2     
##       hip           time.ppn     
##  Min.   :30.00   Min.   :   5.0  
##  1st Qu.:39.00   1st Qu.:  90.0  
##  Median :42.00   Median : 240.0  
##  Mean   :43.04   Mean   : 341.2  
##  3rd Qu.:46.00   3rd Qu.: 517.5  
##  Max.   :64.00   Max.   :1560.0  
##  NA's   :2       NA's   :3

3. Ipoteza de cercetare

Obiectivul principal al studiului a fost de a determina prevalenta factorilor de risc ce favorizeaza aparitia diabetului de tip II in randul populatiei afro-americane din statul Virginia, SUA.

4. Analiza studiului

Prevalenta unei boli/afectiuni medicale, este probabilitatea de a avea la momentul prezent afectiunea respectiva, neavand importanta de cat timp ea este prezenta in organism. Statistic, prevalenta este obtinuta impartind numarul de oameni care au afectiunea respectiva la numarul de persoane totale din studiu.

Tabelul de mai jos ne va afisa prevalenta diabetului in functie de varsta si gen pentru populatia studiata. Remarcam o valoare a analizei de Hemoglobina glicata, HbA1C, mai mare de 7% din Hemoglobina totala, cu o prevalenta mai mare la grupa de varsta 55-65 de ani si indeosebi la femei.

Grupe de varsta Prevalenta populatie Prevalenta femei Prevalenta barbati
19-25 0% 0% 0%
25-35 4% 5% 3%
35-45 6% 6% 5.5%
45-55 19.6% 16% 24%
55-65 35.3% 38% 32%
65-75 28.6% 29% 27.7%
75-85 22% 33% 11%
85-92 33% 33% 0%

Prevalenta diabetului in cadrul pupulatiei studiate

attach(diabetes)
agec=cut(age, c(19,25,35,45,55,65,75,85,92), include.lowest=T)
glyhbc=cut(glyhb,c(2.68,7,16.11),labels=c("<=7%",">7%"),include.lowest=T)
addmargins(table(gender,glyhbc))
##         glyhbc
## gender   <=7% >7% Sum
##   female  194  34 228
##   male    136  26 162
##   Sum     330  60 390
barplot(table(glyhbc, agec),xlab="Grupe de varsta",ylab="Prevalenta diabetului", main="Populatia studiului")

Avem urmatoarele date:

Cu diabet(glyhb>7%) Fara diabet(glyhb<=7%) Total
Barbati 26 136 162
Femei 34 194 228
Total 60 330 390

Daca calculam indicele ODDS RATIO vom observa ca:

OR=\((26*194)/(34*136)=1.09\) , ceea ce inseamna ca femeile au cu 9% sanse mai mari decat barbatii sa faca diabet.

Dorim sa testam daca genul influenteaza prezenta diabetului in randul populatiei afro-americane din centrul statului Virginia.

Testam daca populatiile au o distributie normala:

shapiro.test(glyhb[gender=="female"])
## 
##  Shapiro-Wilk normality test
## 
## data:  glyhb[gender == "female"]
## W = 0.72279, p-value < 2.2e-16
shapiro.test(glyhb[gender=="male"])
## 
##  Shapiro-Wilk normality test
## 
## data:  glyhb[gender == "male"]
## W = 0.72126, p-value = 3.526e-16

Observam ca p-value< 0.05 deci populatiile nu au o distributie normala, ca atare nu putem aplica teste parametrice.

Aplicam testul neparametric Wilcoxon pentru a testa ipoteza statistica:

H0: Genul nu influenteaza diabetul in cazul populatiei noastre

Ha: Genul influenteaza diabetul in cazul populatiei noastre

wilcox.test(glyhb[gender=="female"],glyhb[gender=="male"],alternative="less")
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  glyhb[gender == "female"] and glyhb[gender == "male"]
## W = 17136, p-value = 0.1125
## alternative hypothesis: true location shift is less than 0

p-value=0.113 > 0.05 deci nu respingem ipoteza H0, dar nu inseamna ca o acceptam.

Pe baza rezultatelor date de esantion, nu ne putem permite sa respingem ipoteza nula.

Aplicam Chi-test pentru a testa semnificatia statistica:

m=matrix(c(26,136,34,194),nrow=2,byrow=T)
chisq.test(m)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  m
## X-squared = 0.026997, df = 1, p-value = 0.8695

In urma aplicarii testului Chi-patrat, p-value=0.8695 > 0.05, se observa ca diferentele intre populatia de femei si cea de barbati, din cele doua localitati, nu sunt semnificative din punct de vedere statistic.

Marimea (frame) influenteaza sau nu hemoglobina glicata (glyhb)?

table(frame,glyhbc)
##         glyhbc
## frame    <=7% >7%
##             9   2
##   large    76  23
##   medium  152  26
##   small    93   9
plot(frame, glyhb, xlab="Marimea", ylab="Hemoglobina glicata")

Stabilirea modelului liniar optim pentru a afla care dintre variabilele noastre (covariate) influenteaza nivelul de hemoglobina glicata :

Cream modelul liniar cu urmatoarele covariate:

e1=lm(glyhb~chol+stab.glu+hdl+ratio+location+age+gender+height+weight+frame+bp.1s+bp.1d+waist+hip+time.ppn)
summary(e1)
## 
## Call:
## lm(formula = glyhb ~ chol + stab.glu + hdl + ratio + location + 
##     age + gender + height + weight + frame + bp.1s + bp.1d + 
##     waist + hip + time.ppn)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.6826 -0.6918 -0.1315  0.4703  9.8638 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -2.5408109  2.2879923  -1.110   0.2675    
## chol            0.0041589  0.0032587   1.276   0.2027    
## stab.glu        0.0274573  0.0015006  18.298   <2e-16 ***
## hdl            -0.0009551  0.0100674  -0.095   0.9245    
## ratio           0.1074493  0.1115257   0.963   0.3360    
## locationLouisa -0.2241166  0.1575545  -1.422   0.1558    
## age             0.0129350  0.0059161   2.186   0.0294 *  
## gendermale     -0.1079461  0.2449762  -0.441   0.6597    
## height          0.0208417  0.0296639   0.703   0.4828    
## weight         -0.0040443  0.0051957  -0.778   0.4369    
## framelarge      0.3861208  0.5131394   0.752   0.4523    
## framemedium     0.6544898  0.5020623   1.304   0.1932    
## framesmall      0.5935537  0.5175051   1.147   0.2522    
## bp.1s           0.0026343  0.0047750   0.552   0.5815    
## bp.1d          -0.0015519  0.0074402  -0.209   0.8349    
## waist           0.0312572  0.0302725   1.033   0.3025    
## hip             0.0144394  0.0344868   0.419   0.6757    
## time.ppn        0.0005639  0.0002465   2.287   0.0228 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.427 on 357 degrees of freedom
##   (28 observations deleted due to missingness)
## Multiple R-squared:  0.6043, Adjusted R-squared:  0.5855 
## F-statistic: 32.07 on 17 and 357 DF,  p-value: < 2.2e-16

Modelul liniar optim este:

e12=lm(glyhb~time.ppn+stab.glu+ratio+age)
summary(e12)
## 
## Call:
## lm(formula = glyhb ~ time.ppn + stab.glu + ratio + age)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.2750 -0.7193 -0.1418  0.4681  9.8624 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.8727968  0.2925344   2.984 0.003033 ** 
## time.ppn    0.0005772  0.0002378   2.427 0.015670 *  
## stab.glu    0.0284683  0.0014676  19.398  < 2e-16 ***
## ratio       0.1562330  0.0441218   3.541 0.000448 ***
## age         0.0163850  0.0046755   3.504 0.000512 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.44 on 381 degrees of freedom
##   (17 observations deleted due to missingness)
## Multiple R-squared:  0.595,  Adjusted R-squared:  0.5907 
## F-statistic: 139.9 on 4 and 381 DF,  p-value: < 2.2e-16

Observam ca p-valorile pentru covariatele ramase in modelul liniar sunt < 0.05, ceea ce inseamna ca ele sunt cele care influenteaza nivelul de hemoglobina glicata si anume:

-timpul de la ultima masa pana la recoltarea analizei (time.ppn)

-glicemia (stab.glu)

-raportul dintre colesterolul total si colesterol HDL (ratio)

-varsta (age).

5. Concluziile studiului

1.In urma aplicarii testelor statistice, nu s-a gasit nici o legatura intre factorii: gen, marime, greutate, colesterol, tensiunea arteriala sistolica, tensiunea arteriala diastolica, circumferinta talie, circumferinta sold, localitate, inaltime si hemoglobina glicata.

2.Factorii de risc care favorizeaza aparitia diabetului sunt: varsta, glicemia, raportul dintre colesterolul total si colesterolul HDL si timpul de la ultima masa pana la recoltarea analizei.

6. Referinte bibliografice

1.Bernard Rosner-“Fundamentals of Biostatistics”-Ed.7

2.Diana Lungeanu-“Biostatistica medicala I. Meta-analiza statistica”-Curs

3.Romeo Negrea-“Teoria si practica modelelor liniare aplicate in medicina”-Curs

4.https://ro.wikipedia.org/wiki/Diabet_zaharat

5.http://www.nutritionistcluj.ro/vi-pagina-pacientului/diabet-zaharat/hemoglobina-glicozilata-hba1c-media-glicemiilor-valori-glicata/

6.http://www.dsptimis.ro/promovare/diabet_zaharat.htm

7.https://ro.wikipedia.org/wiki/Diabet_zaharat_de_tipul_2

8.http://www.ncbi.nlm.nih.gov/pubmed/9258308

9.https://www.nlm.nih.gov/medlineplus/ruralhealthconcerns.html