Per quanto riguarda le variabili continue come età gestazionale e peso alla nascita, utilizzo ANOVA.
** Test di Shapiro **
shapiro.test(ETA)
##
## Shapiro-Wilk normality test
##
## data: ETA
## W = 0.96572, p-value = 0.1057
shapiro.test(ETA_GEST)
##
## Shapiro-Wilk normality test
##
## data: ETA_GEST
## W = 0.74547, p-value = 1.364e-08
shapiro.test(PESO_NASCITA)
##
## Shapiro-Wilk normality test
##
## data: PESO_NASCITA
## W = 0.85385, p-value = 6.332e-06
Per la variabile “età materna” la normalità è soddisfatta. Per “età gestazionale” e “peso alla nascita” no.
** Test di Bartlett **
bartlett.test(ETA~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: ETA by as.factor(TIPO)
## Bartlett's K-squared = 2.6613, df = 2, p-value = 0.2643
bartlett.test(ETA_GEST~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: ETA_GEST by as.factor(TIPO)
## Bartlett's K-squared = 18.847, df = 2, p-value = 8.082e-05
bartlett.test(PESO_NASCITA~as.factor(TIPO))
##
## Bartlett test of homogeneity of variances
##
## data: PESO_NASCITA by as.factor(TIPO)
## Bartlett's K-squared = 17.431, df = 2, p-value = 0.000164
Per la variabile “età” accetto l’ipotesi nulla (omoschedasticità). Per le altre due no.
** ANOVA **
summary(aov(ETA~as.factor(TIPO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(TIPO) 2 485.3 242.67 15.15 6.01e-06 ***
## Residuals 54 865.2 16.02
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(aov(ETA_GEST~as.factor(TIPO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(TIPO) 2 9.69 4.847 1.082 0.346
## Residuals 54 241.93 4.480
summary(aov(PESO_NASCITA~as.factor(TIPO)))
## Df Sum Sq Mean Sq F value Pr(>F)
## as.factor(TIPO) 2 176601 88300 0.405 0.669
## Residuals 54 11765948 217888
Guardando il p-value possiamo affermare che per le variabili peso alla nascita e età gestazionale le medie non sono differenti. Non è così per la variabile “età”: i gruppi hanno le medie differenti (con ANOVA non si può dire quale gruppo è differente, puoi aiutarti con il grafico).
** Test del chi quadro **
Per le variabili categoriche, uso il test del chi quadro:
chisq.test(xtabs(freq ~ STATO_CIVILE + TIPO, STATO_CIVILE_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ STATO_CIVILE + TIPO, STATO_CIVILE_f)
## X-squared = 1.4583, df = 2, p-value = 0.4823
chisq.test(xtabs(freq ~ ISTRUZIONE + TIPO, ISTRUZIONE_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ ISTRUZIONE + TIPO, ISTRUZIONE_f)
## X-squared = 13.136, df = 10, p-value = 0.2162
chisq.test(xtabs(freq ~ NUTRIMENTO + TIPO, NUTRIMENTO_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ NUTRIMENTO + TIPO, NUTRIMENTO_f)
## X-squared = 3.5337, df = 4, p-value = 0.4728
chisq.test(xtabs(freq ~ ABORTI + TIPO, ABORTI_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ ABORTI + TIPO, ABORTI_f)
## X-squared = 4.3273, df = 4, p-value = 0.3635
chisq.test(xtabs(freq ~ PARTO + TIPO, PARTO_f))
##
## Pearson's Chi-squared test
##
## data: xtabs(freq ~ PARTO + TIPO, PARTO_f)
## X-squared = 9.8107, df = 4, p-value = 0.04374
Solo per la variabile “PARTO” posso respingere l’ipotesi di indipendenza e quindi affermare che c’è un legame tra la tipologia di gravidanza e tiplogia di parto.