Per quanto riguarda le variabili continue come età materna, età gestazionale e peso alla nascita, utilizzo ANOVA.

** Test di Shapiro **

shapiro.test(ETA)
## 
##  Shapiro-Wilk normality test
## 
## data:  ETA
## W = 0.96572, p-value = 0.1057
shapiro.test(ETA_GEST)
## 
##  Shapiro-Wilk normality test
## 
## data:  ETA_GEST
## W = 0.74547, p-value = 1.364e-08
shapiro.test(PESO_NASCITA)
## 
##  Shapiro-Wilk normality test
## 
## data:  PESO_NASCITA
## W = 0.85385, p-value = 6.332e-06

Per la variabile “età materna” la normalità è soddisfatta. Per “età gestazionale” e “peso alla nascita” no.

** Test di Bartlett **

bartlett.test(ETA~as.factor(TIPO))
## 
##  Bartlett test of homogeneity of variances
## 
## data:  ETA by as.factor(TIPO)
## Bartlett's K-squared = 2.6613, df = 2, p-value = 0.2643
bartlett.test(ETA_GEST~as.factor(TIPO))
## 
##  Bartlett test of homogeneity of variances
## 
## data:  ETA_GEST by as.factor(TIPO)
## Bartlett's K-squared = 18.847, df = 2, p-value = 8.082e-05
bartlett.test(PESO_NASCITA~as.factor(TIPO)) 
## 
##  Bartlett test of homogeneity of variances
## 
## data:  PESO_NASCITA by as.factor(TIPO)
## Bartlett's K-squared = 17.431, df = 2, p-value = 0.000164

Per la variabile “età” accetto l’ipotesi nulla (omoschedasticità). Per le altre due no.

** ANOVA **

summary(aov(ETA~as.factor(NUTRIMENTO)))
##                       Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(NUTRIMENTO)  2   69.6   34.79   1.467   0.24
## Residuals             54 1281.0   23.72
summary(aov(ETA_GEST~as.factor(NUTRIMENTO)))
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## as.factor(NUTRIMENTO)  2  65.49   32.74     9.5 0.000292 ***
## Residuals             54 186.14    3.45                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(aov(PESO_NASCITA~as.factor(NUTRIMENTO))) 
##                       Df  Sum Sq Mean Sq F value  Pr(>F)   
## as.factor(NUTRIMENTO)  2 2420824 1210412   6.865 0.00221 **
## Residuals             54 9521725  176328                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Guardando il p-value possiamo affermare che per le variabili peso alla nascita e età gestazionale le medie sono differenti. Non è così per la variabile “età” (accetto l’ipotesi nulla)

** Test del chi quadro **

Per le variabili categoriche, uso il test del chi quadro:

chisq.test(xtabs(freq ~ STATO_CIVILE + NUTRIMENTO, STATO_CIVILE_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ STATO_CIVILE + NUTRIMENTO, STATO_CIVILE_f)
## X-squared = 4.9785, df = 2, p-value = 0.08297
chisq.test(xtabs(freq ~ ISTRUZIONE + NUTRIMENTO, ISTRUZIONE_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ ISTRUZIONE + NUTRIMENTO, ISTRUZIONE_f)
## X-squared = 12.833, df = 10, p-value = 0.2332
chisq.test(xtabs(freq ~ TIPO + NUTRIMENTO, TIPO_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ TIPO + NUTRIMENTO, TIPO_f)
## X-squared = 3.5337, df = 4, p-value = 0.4728
chisq.test(xtabs(freq ~ ABORTI + NUTRIMENTO, ABORTI_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ ABORTI + NUTRIMENTO, ABORTI_f)
## X-squared = 3.6795, df = 4, p-value = 0.4511
chisq.test(xtabs(freq ~ PARTO + NUTRIMENTO, PARTO_f))
## 
##  Pearson's Chi-squared test
## 
## data:  xtabs(freq ~ PARTO + NUTRIMENTO, PARTO_f)
## X-squared = 8.5183, df = 4, p-value = 0.07433

In questo caso con un livello di significatività del 5% non posso rifiutare nessuna ipotesi nulla. Se prendo invece il livello di significatività del 10% respingo per stato civile e tipologia di parto.