Per quanto riguarda le variabili continue come età materna, età gestazionale e peso alla nascita, utilizzo ANOVA.
** Test di Shapiro **
shapiro.test(ETA)
##
## Shapiro-Wilk normality test
##
## data: ETA
## W = 0.96572, p-value = 0.1057
shapiro.test(ETA_GEST)
##
## Shapiro-Wilk normality test
##
## data: ETA_GEST
## W = 0.74547, p-value = 1.364e-08
shapiro.test(PESO_NASCITA)
##
## Shapiro-Wilk normality test
##
## data: PESO_NASCITA
## W = 0.85385, p-value = 6.332e-06
Per la variabile “età materna” la normalità è soddisfatta. Per “età gestazionale” e “peso alla nascita” no.
** Test di Bartlett **
bartlett.test(ETA~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: ETA by as.factor(TIPO)
## Bartlett's K-squared = 2.6613, df = 2, p-value = 0.2643
bartlett.test(ETA_GEST~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: ETA_GEST by as.factor(TIPO)
## Bartlett's K-squared = 18.847, df = 2, p-value = 8.082e-05
bartlett.test(PESO_NASCITA~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: PESO_NASCITA by as.factor(TIPO)
## Bartlett's K-squared = 17.431, df = 2, p-value = 0.000164
Per la variabile “età” accetto l’ipotesi nulla (omoschedasticità). Per le altre due no.
** ANOVA **
summary(aov(ETA~as.factor(NUTRIMENTO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(NUTRIMENTO) 2 69.6 34.79 1.467 0.24
## Residuals 54 1281.0 23.72
summary(aov(ETA_GEST~as.factor(NUTRIMENTO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(NUTRIMENTO) 2 65.49 32.74 9.5 0.000292 ***
## Residuals 54 186.14 3.45
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(aov(PESO_NASCITA~as.factor(NUTRIMENTO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(NUTRIMENTO) 2 2420824 1210412 6.865 0.00221 **
## Residuals 54 9521725 176328
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Guardando il p-value possiamo affermare che per le variabili peso alla nascita e età gestazionale le medie sono differenti. Non è così per la variabile “età” (accetto l’ipotesi nulla)
** Test del chi quadro **
Per le variabili categoriche, uso il test del chi quadro:
chisq.test(xtabs(freq ~ STATO_CIVILE + NUTRIMENTO, STATO_CIVILE_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ STATO_CIVILE + NUTRIMENTO, STATO_CIVILE_f)
## X-squared = 4.9785, df = 2, p-value = 0.08297
chisq.test(xtabs(freq ~ ISTRUZIONE + NUTRIMENTO, ISTRUZIONE_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ ISTRUZIONE + NUTRIMENTO, ISTRUZIONE_f)
## X-squared = 12.833, df = 10, p-value = 0.2332
chisq.test(xtabs(freq ~ TIPO + NUTRIMENTO, TIPO_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ TIPO + NUTRIMENTO, TIPO_f)
## X-squared = 3.5337, df = 4, p-value = 0.4728
chisq.test(xtabs(freq ~ ABORTI + NUTRIMENTO, ABORTI_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ ABORTI + NUTRIMENTO, ABORTI_f)
## X-squared = 3.6795, df = 4, p-value = 0.4511
chisq.test(xtabs(freq ~ PARTO + NUTRIMENTO, PARTO_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ PARTO + NUTRIMENTO, PARTO_f)
## X-squared = 8.5183, df = 4, p-value = 0.07433
In questo caso con un livello di significatività del 5% non posso rifiutare nessuna ipotesi nulla. Se prendo invece il livello di significatività del 10% respingo per stato civile e tipologia di parto.