Per quanto riguarda le variabili continue come età gestazionale e peso alla nascita, utilizzo ANOVA.

** Test di Shapiro **

shapiro.test(ETA)
## 
##  Shapiro-Wilk normality test
## 
## data:  ETA
## W = 0.96572, p-value = 0.1057
shapiro.test(ETA_GEST)
## 
##  Shapiro-Wilk normality test
## 
## data:  ETA_GEST
## W = 0.74547, p-value = 1.364e-08
shapiro.test(PESO_NASCITA)
## 
##  Shapiro-Wilk normality test
## 
## data:  PESO_NASCITA
## W = 0.85385, p-value = 6.332e-06

Per la variabile “età materna” la normalità è soddisfatta. Per “età gestazionale” e “peso alla nascita” no.

** Test di Bartlett **

bartlett.test(ETA~as.factor(TIPO))
## 
##  Bartlett test of homogeneity of variances
## 
## data:  ETA by as.factor(TIPO)
## Bartlett's K-squared = 2.6613, df = 2, p-value = 0.2643
bartlett.test(ETA_GEST~as.factor(TIPO))
## 
##  Bartlett test of homogeneity of variances
## 
## data:  ETA_GEST by as.factor(TIPO)
## Bartlett's K-squared = 18.847, df = 2, p-value = 8.082e-05
bartlett.test(PESO_NASCITA~as.factor(TIPO)) 
## 
##  Bartlett test of homogeneity of variances
## 
## data:  PESO_NASCITA by as.factor(TIPO)
## Bartlett's K-squared = 17.431, df = 2, p-value = 0.000164

Per la variabile “età” accetto l’ipotesi nulla (omoschedasticità). Per le altre due no.

** ANOVA **

summary(aov(ETA~as.factor(TIPO)))
##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## as.factor(TIPO)  2  485.3  242.67   15.15 6.01e-06 ***
## Residuals       54  865.2   16.02                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(aov(ETA_GEST~as.factor(TIPO)))
##                 Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(TIPO)  2   9.69   4.847   1.082  0.346
## Residuals       54 241.93   4.480
summary(aov(PESO_NASCITA~as.factor(TIPO))) 
##                 Df   Sum Sq Mean Sq F value Pr(>F)
## as.factor(TIPO)  2   176601   88300   0.405  0.669
## Residuals       54 11765948  217888

Guardando il p-value possiamo affermare che per le variabili peso alla nascita e età gestazionale le medie non sono differenti. Non è così per la variabile “età”: i gruppi hanno le medie differenti (con ANOVA non si può dire quale gruppo è differente, puoi aiutarti con il grafico).

** Test del chi quadro **

Per le variabili categoriche, uso il test del chi quadro:

chisq.test(xtabs(freq ~ STATO_CIVILE + TIPO, STATO_CIVILE_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ STATO_CIVILE + TIPO, STATO_CIVILE_f)
## X-squared = 1.4583, df = 2, p-value = 0.4823
chisq.test(xtabs(freq ~ ISTRUZIONE + TIPO, ISTRUZIONE_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ ISTRUZIONE + TIPO, ISTRUZIONE_f)
## X-squared = 13.136, df = 10, p-value = 0.2162
chisq.test(xtabs(freq ~ NUTRIMENTO + TIPO, NUTRIMENTO_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ NUTRIMENTO + TIPO, NUTRIMENTO_f)
## X-squared = 3.5337, df = 4, p-value = 0.4728
chisq.test(xtabs(freq ~ ABORTI + TIPO, ABORTI_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ ABORTI + TIPO, ABORTI_f)
## X-squared = 4.3273, df = 4, p-value = 0.3635
chisq.test(xtabs(freq ~ PARTO + TIPO, PARTO_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ PARTO + TIPO, PARTO_f)
## X-squared = 9.8107, df = 4, p-value = 0.04374

Solo per la variabile “PARTO” posso respingere l’ipotesi di indipendenza e quindi affermare che c’è un legame tra la tipologia di gravidanza e tiplogia di parto.