## --- 1. Preparazione dei Dati ---
##
## Struttura del dataset dopo la preparazione:
## 'data.frame': 2498 obs. of 10 variables:
## $ Anni_madre : int 26 21 34 28 20 32 26 25 22 23 ...
## $ N_gravidanze: int 0 2 3 1 0 0 1 0 1 0 ...
## $ Fumatrici : Factor w/ 2 levels "Non Fumatrice",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Gestazione : int 42 39 38 41 38 40 39 40 40 41 ...
## $ Peso : int 3380 3150 3640 3690 3700 3200 3100 3580 3670 3700 ...
## $ Lunghezza : int 490 490 500 515 480 495 480 510 500 510 ...
## $ Cranio : int 325 345 375 365 335 340 345 349 335 362 ...
## $ Tipo_parto : Factor w/ 2 levels "Ces","Nat": 2 2 2 2 2 2 2 2 1 1 ...
## $ Ospedale : Factor w/ 3 levels "osp1","osp2",..: 3 1 2 2 3 2 3 1 2 2 ...
## $ Sesso : Factor w/ 2 levels "F","M": 2 1 2 2 1 1 1 2 1 1 ...
## NULL
##
## Statistiche descrittive dopo la preparazione:
## Anni_madre N_gravidanze Fumatrici Gestazione
## Min. :13.00 Min. : 0.0000 Non Fumatrice:2394 Min. :25.00
## 1st Qu.:25.00 1st Qu.: 0.0000 Fumatrice : 104 1st Qu.:38.00
## Median :28.00 Median : 1.0000 Median :39.00
## Mean :28.19 Mean : 0.9816 Mean :38.98
## 3rd Qu.:32.00 3rd Qu.: 1.0000 3rd Qu.:40.00
## Max. :46.00 Max. :12.0000 Max. :43.00
## Peso Lunghezza Cranio Tipo_parto Ospedale Sesso
## Min. : 830 Min. :310.0 Min. :235 Ces: 728 osp1:816 F:1255
## 1st Qu.:2990 1st Qu.:480.0 1st Qu.:330 Nat:1770 osp2:848 M:1243
## Median :3300 Median :500.0 Median :340 osp3:834
## Mean :3284 Mean :494.7 Mean :340
## 3rd Qu.:3620 3rd Qu.:510.0 3rd Qu.:350
## Max. :4930 Max. :565.0 Max. :390
##
## Controllo valori mancanti (NA) per colonna:
##
##
## Table: Conteggio Valori Mancanti (NA) per Variabile
##
## | |x |
## |:------------|:--|
## |Anni_madre |0 |
## |N_gravidanze |0 |
## |Fumatrici |0 |
## |Gestazione |0 |
## |Peso |0 |
## |Lunghezza |0 |
## |Cranio |0 |
## |Tipo_parto |0 |
## |Ospedale |0 |
## |Sesso |0 |
##
##
## --- 2. Analisi Esplorativa e Test di Ipotesi ---
##
## Diagnosi Outlier con Boxplot:



##
## Grafico dell'andamento medio per Peso vs. Gestazione, raggruppato per Tipo di Parto:
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

##
## Grafico dell'andamento medio per Lunghezza vs. Gestazione, raggruppato per Tipo di Parto:

##
## Confronto tra le distribuzioni di Peso e Lunghezza:

##
## Matrice di correlazione di Pearson (variabili numeriche):
## Gestazione Cranio Peso Lunghezza Anni_madre N_gravidanze
## Gestazione 1.00 0.46 0.59 0.62 -0.13 -0.10
## Cranio 0.46 1.00 0.70 0.60 0.02 0.04
## Peso 0.59 0.70 1.00 0.80 -0.02 0.00
## Lunghezza 0.62 0.60 0.80 1.00 -0.06 -0.06
## Anni_madre -0.13 0.02 -0.02 -0.06 1.00 0.38
## N_gravidanze -0.10 0.04 0.00 -0.06 0.38 1.00

##
## Matrice di correlazione di Spearman (non parametrica):
## Gestazione Cranio Peso Lunghezza Anni_madre N_gravidanze
## Gestazione 1.00 0.29 0.43 0.45 -0.14 -0.14
## Cranio 0.29 1.00 0.63 0.52 0.03 0.06
## Peso 0.43 0.63 1.00 0.75 -0.01 0.02
## Lunghezza 0.45 0.52 0.75 1.00 -0.05 -0.07
## Anni_madre -0.14 0.03 -0.01 -0.05 1.00 0.39
## N_gravidanze -0.14 0.06 0.02 -0.07 0.39 1.00

##
##
## --- Analisi per variabile: Fumatrici ---
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

##
##
## --- Analisi per variabile: Tipo_parto ---

##
##
## --- Analisi per variabile: Ospedale ---

##
##
## --- Analisi per variabile: Sesso ---

##
## Ipotesi: Associazione tra Ospedale e Tipo di Parto
##
## Pearson's Chi-squared test
##
## data: table(dati$Ospedale, dati$Tipo_parto)
## X-squared = 1.083, df = 2, p-value = 0.5819
##
## Test di Correlazione tra Gestazione e Peso (H0: rho = 0)
##
## Pearson's product-moment correlation
##
## data: dati$Gestazione and dati$Peso
## t = 36.694, df = 2496, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.5658780 0.6168568
## sample estimates:
## cor
## 0.5919592
##
##
## --- 3. Costruzione e Selezione del Modello ---
##
## VIF del Modello Completo:
## GVIF Df GVIF^(1/(2*Df))
## Anni_madre 1.190241 1 1.090982
## N_gravidanze 1.189278 1 1.090540
## Fumatrici 1.007426 1 1.003706
## Gestazione 1.695675 1 1.302181
## Lunghezza 2.086879 1 1.444604
## Cranio 1.631049 1 1.277125
## Tipo_parto 1.004227 1 1.002111
## Ospedale 1.004267 2 1.001065
## Sesso 1.040743 1 1.020168
##
## Selezione Variabili con metodo `step()`:
##
## Sommario del Modello Finale Selezionato:
##
## Call:
## lm(formula = Peso ~ N_gravidanze + Gestazione + Lunghezza + Cranio +
## Tipo_parto + Ospedale + Sesso, data = dati)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1113.07 -181.71 -16.66 161.08 2619.57
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6707.9252 136.0257 -49.314 < 2e-16 ***
## N_gravidanze 12.3360 4.3344 2.846 0.00446 **
## Gestazione 32.0386 3.7925 8.448 < 2e-16 ***
## Lunghezza 10.3059 0.3006 34.286 < 2e-16 ***
## Cranio 10.4920 0.4257 24.648 < 2e-16 ***
## Tipo_partoNat 29.4080 12.0875 2.433 0.01505 *
## Ospedaleosp2 -10.8939 13.4447 -0.810 0.41786
## Ospedaleosp3 28.7917 13.4969 2.133 0.03301 *
## SessoM 77.4657 11.1842 6.926 5.48e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 274 on 2489 degrees of freedom
## Multiple R-squared: 0.7287, Adjusted R-squared: 0.7278
## F-statistic: 835.7 on 8 and 2489 DF, p-value: < 2.2e-16
##
## Intervalli di Confidenza al 95% per i Coefficienti del Modello:
## 2.5 % 97.5 %
## (Intercept) -6974.660416 -6441.19002
## N_gravidanze 3.836519 20.83546
## Gestazione 24.601827 39.47528
## Lunghezza 9.716444 10.89528
## Cranio 9.657300 11.32670
## Tipo_partoNat 5.705451 53.11049
## Ospedaleosp2 -37.257863 15.47001
## Ospedaleosp3 2.325274 55.25808
## SessoM 55.534361 99.39695
##
## VIF del Modello Finale:
## GVIF Df GVIF^(1/(2*Df))
## N_gravidanze 1.025249 1 1.012546
## Gestazione 1.670864 1 1.292619
## Lunghezza 2.083003 1 1.443261
## Cranio 1.626636 1 1.275396
## Tipo_parto 1.003840 1 1.001918
## Ospedale 1.003079 2 1.000769
## Sesso 1.040433 1 1.020016
##
##
## --- 4. Diagnostica e Validazione ---
##
## Grafici di Diagnostica dei Residui:

##
## Test di Normalità dei Residui (Anderson-Darling):
##
## Anderson-Darling normality test
##
## data: residuals(modello_finale)
## A = 5.2721, p-value = 5.141e-13
##
## Test di Omoschedasticità (Breusch-Pagan):
##
## studentized Breusch-Pagan test
##
## data: modello_finale
## BP = 91.829, df = 8, p-value < 2.2e-16
##
## Performance del Modello sul Test Set:
## RMSE Rsquared MAE
## 249.6157919 0.6837997 199.8086199
##
## Risultati della 10-Fold Cross-Validation:
## Linear Regression
##
## 2498 samples
## 7 predictor
##
## No pre-processing
## Resampling: Cross-Validated (10 fold)
## Summary of sample sizes: 2248, 2249, 2249, 2248, 2249, 2247, ...
## Resampling results:
##
## RMSE Rsquared MAE
## 274.0311 0.7267127 210.6971
##
## Tuning parameter 'intercept' was held constant at a value of TRUE
##
##
## --- 5. Previsione e Interpretazione Finale ---
##
## Previsione del Peso per un Nuovo Profilo:
## N_gravidanze Gestazione Lunghezza Cranio Tipo_parto Ospedale Sesso
## 1 2 39 494.6958 340.0292 Nat osp1 F
##
## Peso previsto (g) e Intervallo di Predizione 95%:
## fit lwr upr
## 1 3261.511 2723.643 3799.378
##
## Grafico degli Effetti Principali:
