## --- 1. Preparazione dei Dati ---
## 
## Struttura del dataset dopo la preparazione:
## 'data.frame':    2498 obs. of  10 variables:
##  $ Anni_madre  : int  26 21 34 28 20 32 26 25 22 23 ...
##  $ N_gravidanze: int  0 2 3 1 0 0 1 0 1 0 ...
##  $ Fumatrici   : Factor w/ 2 levels "Non Fumatrice",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Gestazione  : int  42 39 38 41 38 40 39 40 40 41 ...
##  $ Peso        : int  3380 3150 3640 3690 3700 3200 3100 3580 3670 3700 ...
##  $ Lunghezza   : int  490 490 500 515 480 495 480 510 500 510 ...
##  $ Cranio      : int  325 345 375 365 335 340 345 349 335 362 ...
##  $ Tipo_parto  : Factor w/ 2 levels "Ces","Nat": 2 2 2 2 2 2 2 2 1 1 ...
##  $ Ospedale    : Factor w/ 3 levels "osp1","osp2",..: 3 1 2 2 3 2 3 1 2 2 ...
##  $ Sesso       : Factor w/ 2 levels "F","M": 2 1 2 2 1 1 1 2 1 1 ...
## NULL
## 
## Statistiche descrittive dopo la preparazione:
##    Anni_madre     N_gravidanze             Fumatrici      Gestazione   
##  Min.   :13.00   Min.   : 0.0000   Non Fumatrice:2394   Min.   :25.00  
##  1st Qu.:25.00   1st Qu.: 0.0000   Fumatrice    : 104   1st Qu.:38.00  
##  Median :28.00   Median : 1.0000                        Median :39.00  
##  Mean   :28.19   Mean   : 0.9816                        Mean   :38.98  
##  3rd Qu.:32.00   3rd Qu.: 1.0000                        3rd Qu.:40.00  
##  Max.   :46.00   Max.   :12.0000                        Max.   :43.00  
##       Peso        Lunghezza         Cranio    Tipo_parto Ospedale   Sesso   
##  Min.   : 830   Min.   :310.0   Min.   :235   Ces: 728   osp1:816   F:1255  
##  1st Qu.:2990   1st Qu.:480.0   1st Qu.:330   Nat:1770   osp2:848   M:1243  
##  Median :3300   Median :500.0   Median :340              osp3:834           
##  Mean   :3284   Mean   :494.7   Mean   :340                                 
##  3rd Qu.:3620   3rd Qu.:510.0   3rd Qu.:350                                 
##  Max.   :4930   Max.   :565.0   Max.   :390
## 
## Controllo valori mancanti (NA) per colonna:
## 
## 
## Table: Conteggio Valori Mancanti (NA) per Variabile
## 
## |             |x  |
## |:------------|:--|
## |Anni_madre   |0  |
## |N_gravidanze |0  |
## |Fumatrici    |0  |
## |Gestazione   |0  |
## |Peso         |0  |
## |Lunghezza    |0  |
## |Cranio       |0  |
## |Tipo_parto   |0  |
## |Ospedale     |0  |
## |Sesso        |0  |
## 
## 
## --- 2. Analisi Esplorativa e Test di Ipotesi ---
## 
## Diagnosi Outlier con Boxplot:

## 
## Grafico dell'andamento medio per Peso vs. Gestazione, raggruppato per Tipo di Parto:
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## 
## Grafico dell'andamento medio per Lunghezza vs. Gestazione, raggruppato per Tipo di Parto:

## 
## Confronto tra le distribuzioni di Peso e Lunghezza:

## 
## Matrice di correlazione di Pearson (variabili numeriche):
##              Gestazione Cranio  Peso Lunghezza Anni_madre N_gravidanze
## Gestazione         1.00   0.46  0.59      0.62      -0.13        -0.10
## Cranio             0.46   1.00  0.70      0.60       0.02         0.04
## Peso               0.59   0.70  1.00      0.80      -0.02         0.00
## Lunghezza          0.62   0.60  0.80      1.00      -0.06        -0.06
## Anni_madre        -0.13   0.02 -0.02     -0.06       1.00         0.38
## N_gravidanze      -0.10   0.04  0.00     -0.06       0.38         1.00

## 
## Matrice di correlazione di Spearman (non parametrica):
##              Gestazione Cranio  Peso Lunghezza Anni_madre N_gravidanze
## Gestazione         1.00   0.29  0.43      0.45      -0.14        -0.14
## Cranio             0.29   1.00  0.63      0.52       0.03         0.06
## Peso               0.43   0.63  1.00      0.75      -0.01         0.02
## Lunghezza          0.45   0.52  0.75      1.00      -0.05        -0.07
## Anni_madre        -0.14   0.03 -0.01     -0.05       1.00         0.39
## N_gravidanze      -0.14   0.06  0.02     -0.07       0.39         1.00

## 
## 
## --- Analisi per variabile: Fumatrici ---
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## 
## 
## --- Analisi per variabile: Tipo_parto ---

## 
## 
## --- Analisi per variabile: Ospedale ---

## 
## 
## --- Analisi per variabile: Sesso ---

## 
## Ipotesi: Associazione tra Ospedale e Tipo di Parto
## 
##  Pearson's Chi-squared test
## 
## data:  table(dati$Ospedale, dati$Tipo_parto)
## X-squared = 1.083, df = 2, p-value = 0.5819
## 
## Test di Correlazione tra Gestazione e Peso (H0: rho = 0)
## 
##  Pearson's product-moment correlation
## 
## data:  dati$Gestazione and dati$Peso
## t = 36.694, df = 2496, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.5658780 0.6168568
## sample estimates:
##       cor 
## 0.5919592
## 
## 
## --- 3. Costruzione e Selezione del Modello ---
## 
## VIF del Modello Completo:
##                  GVIF Df GVIF^(1/(2*Df))
## Anni_madre   1.190241  1        1.090982
## N_gravidanze 1.189278  1        1.090540
## Fumatrici    1.007426  1        1.003706
## Gestazione   1.695675  1        1.302181
## Lunghezza    2.086879  1        1.444604
## Cranio       1.631049  1        1.277125
## Tipo_parto   1.004227  1        1.002111
## Ospedale     1.004267  2        1.001065
## Sesso        1.040743  1        1.020168
## 
## Selezione Variabili con metodo `step()`:
## 
## Sommario del Modello Finale Selezionato:
## 
## Call:
## lm(formula = Peso ~ N_gravidanze + Gestazione + Lunghezza + Cranio + 
##     Tipo_parto + Ospedale + Sesso, data = dati)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1113.07  -181.71   -16.66   161.08  2619.57 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -6707.9252   136.0257 -49.314  < 2e-16 ***
## N_gravidanze     12.3360     4.3344   2.846  0.00446 ** 
## Gestazione       32.0386     3.7925   8.448  < 2e-16 ***
## Lunghezza        10.3059     0.3006  34.286  < 2e-16 ***
## Cranio           10.4920     0.4257  24.648  < 2e-16 ***
## Tipo_partoNat    29.4080    12.0875   2.433  0.01505 *  
## Ospedaleosp2    -10.8939    13.4447  -0.810  0.41786    
## Ospedaleosp3     28.7917    13.4969   2.133  0.03301 *  
## SessoM           77.4657    11.1842   6.926 5.48e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 274 on 2489 degrees of freedom
## Multiple R-squared:  0.7287, Adjusted R-squared:  0.7278 
## F-statistic: 835.7 on 8 and 2489 DF,  p-value: < 2.2e-16
## 
## Intervalli di Confidenza al 95% per i Coefficienti del Modello:
##                      2.5 %      97.5 %
## (Intercept)   -6974.660416 -6441.19002
## N_gravidanze      3.836519    20.83546
## Gestazione       24.601827    39.47528
## Lunghezza         9.716444    10.89528
## Cranio            9.657300    11.32670
## Tipo_partoNat     5.705451    53.11049
## Ospedaleosp2    -37.257863    15.47001
## Ospedaleosp3      2.325274    55.25808
## SessoM           55.534361    99.39695
## 
## VIF del Modello Finale:
##                  GVIF Df GVIF^(1/(2*Df))
## N_gravidanze 1.025249  1        1.012546
## Gestazione   1.670864  1        1.292619
## Lunghezza    2.083003  1        1.443261
## Cranio       1.626636  1        1.275396
## Tipo_parto   1.003840  1        1.001918
## Ospedale     1.003079  2        1.000769
## Sesso        1.040433  1        1.020016
## 
## 
## --- 4. Diagnostica e Validazione ---
## 
## Grafici di Diagnostica dei Residui:

## 
## Test di Normalità dei Residui (Anderson-Darling):
## 
##  Anderson-Darling normality test
## 
## data:  residuals(modello_finale)
## A = 5.2721, p-value = 5.141e-13
## 
## Test di Omoschedasticità (Breusch-Pagan):
## 
##  studentized Breusch-Pagan test
## 
## data:  modello_finale
## BP = 91.829, df = 8, p-value < 2.2e-16
## 
## Performance del Modello sul Test Set:
##        RMSE    Rsquared         MAE 
## 249.6157919   0.6837997 199.8086199
## 
## Risultati della 10-Fold Cross-Validation:
## Linear Regression 
## 
## 2498 samples
##    7 predictor
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold) 
## Summary of sample sizes: 2248, 2249, 2249, 2248, 2249, 2247, ... 
## Resampling results:
## 
##   RMSE      Rsquared   MAE     
##   274.0311  0.7267127  210.6971
## 
## Tuning parameter 'intercept' was held constant at a value of TRUE
## 
## 
## --- 5. Previsione e Interpretazione Finale ---
## 
## Previsione del Peso per un Nuovo Profilo:
##   N_gravidanze Gestazione Lunghezza   Cranio Tipo_parto Ospedale Sesso
## 1            2         39  494.6958 340.0292        Nat     osp1     F
## 
## Peso previsto (g) e Intervallo di Predizione 95%:
##        fit      lwr      upr
## 1 3261.511 2723.643 3799.378
## 
## Grafico degli Effetti Principali: