1. Raccolta dei dati e struttura del dataset

 

Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
26 0 0 42 3380 490 325 Nat osp3 M
21 2 0 39 3150 490 345 Nat osp1 F
34 3 0 38 3640 500 375 Nat osp2 M
28 1 0 41 3690 515 365 Nat osp2 M
20 0 0 38 3700 480 335 Nat osp3 F
32 0 0 40 3200 495 340 Nat osp2 F
26 1 0 39 3100 480 345 Nat osp3 F
25 0 0 40 3580 510 349 Nat osp1 M
22 1 0 40 3670 500 335 Ces osp2 F
23 0 0 41 3700 510 362 Ces osp2 F

 

Dimensioni del Dataset: 2500 righe x 10 colonne

Struttura del dataset
Tipo Esempi
Anni.madre integer 26, 21, 34
N.gravidanze integer 0, 2, 3
Fumatrici integer 0, 0, 0
Gestazione integer 42, 39, 38
Peso integer 3380, 3150, 3640
Lunghezza integer 490, 490, 500
Cranio integer 325, 345, 375
Tipo.parto factor Nat, Nat, Nat
Ospedale factor osp3, osp1, osp2
Sesso factor M, F, M

Anni.madre

Età della madre (in anni)
Tipo: Quantitativa discreta in scala di rapporti

N.gravidanze

Quante gravidanze ha avuto la madre
teniamo conto che 0 indica che è alla prima gravidanza ma non ha mai partorito prima
Tipo: Quantitativa discreta in scala di rapporti

Fumatrici (1)

Se la mamma fuma (0=non fumatrice, 1=fumatrice)
Tipo: Qualitativa dicotomica

Gestazione

Durata della gravidanza (in settimane)
Tipo: Quantitativa continua in scala di rapporti

Peso => VARIABILE TARGET

Peso del neonato (in grammi)
Tipo: Quantitativa continua in scala di rapporti

Lunghezza

Lunghezza del neonato (in millimetri)
Tipo: Quantitativa continua in scala di rapporti

Cranio (2)

Circonferenza del cranio (in millimetri) e non diametro del cranio
Tipo: Quantitativa continua in scala di rapporti

Tipo.parto (3)

Tipo di parto (Nat = Naturale, Ces = Cesareo)
Tipo: Qualitativa nominale

Ospedale (4)

Ospedale di nascita (osp1, osp2, osp3)
Tipo: Qualitativa nominale

Sesso

Sesso del neonato (M = Maschio, F = Femmina)
Tipo: Qualitativa dicotomica

 


 

2. Analisi e modellizzazione

 

Analisi preliminare

 

Analisi di “Anni.madre

Statistiche di Anni.madre
Misura Valore
Min 0
Media 28.164
Max 46
Q1 25
Mediana 28
Q3 32
IQR 7
Limite Inf. IQR 14.5
Limite Sup. IQR 42.5
Skewness 0.0428115004569053
Kurtosis 0.3804165222879
Shapiro-Wilk W 0.993080970998317
Shapiro-Wilk p-value 1.64e-09
Numero Outlier 13
Outlier estremi di Anni.madre
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
1380 0 0 0 39 3060 490 330 Nat osp3 M
1152 1 1 0 41 3250 490 350 Nat osp2 F
138 13 0 0 38 2760 470 325 Nat osp2 F
1075 14 1 0 39 3510 490 365 Nat osp2 M
1532 14 0 0 39 3550 500 355 Ces osp1 M
335 44 0 1 38 3150 465 335 Nat osp3 F
2026 44 0 0 40 3050 505 345 Nat osp1 M
2098 44 5 0 38 3280 475 346 Ces osp1 F
205 45 2 0 38 3850 505 384 Nat osp3 M
1106 46 5 0 36 2710 470 347 Nat osp2 M

La variabile segue una distribuzione leggermenete assimmetrica con code meno pronucniate rispetto ad una distribuzione normale. Il testo di Shapiro-Wilk indica che la distribuzione non è normale, ma dall’istrogramma della distribuzione la forma ricorda la distribuzione normale percui potremmo per ora considerare la distribuzione come normale e fare ulteriori analisi successivamente per vedere l’influenza sul modello.

Analizzando gli outlier possiamo vedere valori molto bassi di 0, 1, 13, 14 anni e valori più alti di 44, 45, 46 anni.

I valori 0 e 1 sono valori chiaramente anomali dovuto quasi sicuramente a errori di inserimento.

I valori di 13 e 14 anni (5), sono valori plausibili anche se gravidanze a queste giovane età posso comportare maggiori rischi a causa di complicanze.

I valori di 44, 45 e 46 anni sono valori plausibili (6) e sta diventando sempre più anche grazie ai progressi della medicina riproduttiva.

Sulla base di questo decido di sostituire i valori 0 e 1 con la mediana delle età delle madri per evitare di elinminarli e perdere informazione e di tenere gli altri valori in quando plausibili e necessari per mantenere significativo il dataset.

 

Analisi di “N.gravidanze

 

Statistiche di N.gravidanze
Misura Valore
Min 0
Media 0.9812
Max 12
Q1 0
Mediana 1
Q3 1
IQR 1
Limite Inf. IQR -1.5
Limite Sup. IQR 2.5
Skewness 2.51425407710076
Kurtosis 10.9894063615823
Shapiro-Wilk W 0.721249287971459
Shapiro-Wilk p-value < 2e-16
Numero Outlier 246
Outlier estremi di N.gravidanze
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
3 34 3 0 38 3640 500 375 Nat osp2 M
15 33 3 0 34 2400 470 298 Ces osp3 M
18 32 3 0 40 3030 490 335 Ces osp3 M
40 34 3 0 38 3050 460 336 Nat osp3 F
47 29 3 0 39 2680 450 346 Nat osp3 F
2221 35 10 0 39 2950 495 335 Nat osp1 F
2422 33 10 0 40 3090 485 353 Nat osp3 M
2471 34 10 0 38 2880 470 345 Ces osp2 M
1130 33 11 0 43 3400 475 360 Nat osp1 M
1219 38 12 0 39 3350 490 344 Nat osp2 M

La distribuzione è molto assimmetrica a desta con una coda lunga e con molti valori outlier, questo significa che meno di 3 gravidanze e un dato comune, invece più di 3 gravidanze sono casi piuttosto rari che rappresntano circa il 10% dei casi totali.

 

Analisi di “Fumatrici

 

Tabella delle Frequenze di Fumatrici
Categoria Frequenza Percentuale
0 2396 95.84
1 104 4.16
Risultati dei Test Statistici
Test P_value
Chi-quadro 0
Test binomiale 0

Nel nostro campione le madri Fumatrici rappresentano circa il 4% rendendo questa distribuzione molto sbilanciata e potrebbe non essere correttamente rappresentativa nel modello.

Ma considerando che la media sulla popolazione sarebbe intorno al 10% (1) questo permetterebbe di ottenere risultati più significativi e affidabili per il modello, indicando che probabilmente è il nostro campione a non essere perfettamente bilanciato.

 

Analisi di “Gestazione

 

Statistiche di Gestazione
Misura Valore
Min 25
Media 38.9804
Max 43
Q1 38
Mediana 39
Q3 40
IQR 2
Limite Inf. IQR 35
Limite Sup. IQR 43
Skewness -2.06531325911714
Kurtosis 8.2581495549494
Shapiro-Wilk W 0.833276929649533
Shapiro-Wilk p-value < 2e-16
Numero Outlier 67
Outlier estremi di Gestazione
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
1780 25 2 0 25 900 325 253 Nat osp3 F
2452 28 0 0 26 930 345 245 Ces osp3 F
2120 32 0 0 27 1140 370 267 Nat osp3 F
2437 28 1 0 27 980 320 265 Nat osp1 M
310 40 3 0 28 1560 420 379 Nat osp3 F
1311 40 6 0 34 1840 430 305 Nat osp1 F
1400 22 0 0 34 2590 485 314 Nat osp2 M
1893 22 1 0 34 3030 470 312 Nat osp2 F
1977 39 4 0 34 2970 480 350 Ces osp2 F
2257 40 0 0 34 1580 400 300 Nat osp2 F

Le gravidanze durano dalle 25 alle 43 settimane, con un media di 39 settimane che si attesta vicino alla durata tipica di una gravidanza che è di 40 settimane. Sono presenti diversi outlier sopratutto sotto le 35 settimane che identificano i parti prematuri.

 

Analisi di “Peso

 

Statistiche di Peso
Misura Valore
Min 830
Media 3284.0808
Max 4930
Q1 2990
Mediana 3300
Q3 3620
IQR 630
Limite Inf. IQR 2045
Limite Sup. IQR 4565
Skewness -0.647030832752079
Kurtosis 2.03153184511532
Shapiro-Wilk W 0.970657098407693
Shapiro-Wilk p-value < 2e-16
Numero Outlier 69
Outlier estremi di Peso
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
928 25 0 0 28 830 310 254 Nat osp1 F
1780 25 2 0 25 900 325 253 Nat osp3 F
2175 37 8 0 28 930 355 235 Nat osp1 F
2452 28 0 0 26 930 345 245 Ces osp3 F
2437 28 1 0 27 980 320 265 Nat osp1 M
2392 28 1 0 40 4720 540 355 Nat osp3 M
1639 39 3 0 40 4760 550 365 Nat osp2 F
1433 31 4 0 41 4810 530 364 Ces osp3 M
1306 23 0 0 41 4900 510 352 Nat osp2 F
1920 26 0 1 39 4930 550 350 Ces osp2 F

 

Siccome il peso medio e il peso mediano hanno valori abbastanza simili in generale la maggior parte dei neonati da un peso introno a questi valori ma con alcuni neonati che hanno peso significativamente più bassi che potrebbe dipendere da nascite premature o condiczione che influenzano la crescita del feto.

 

Analisi di “Lunghezza

 

Statistiche di Lunghezza
Misura Valore
Min 310
Media 494.692
Max 565
Q1 480
Mediana 500
Q3 510
IQR 30
Limite Inf. IQR 435
Limite Sup. IQR 555
Skewness -1.51469914804306
Kurtosis 6.48717388620972
Shapiro-Wilk W 0.90940573211939
Shapiro-Wilk p-value < 2e-16
Numero Outlier 59
Outlier estremi di Lunghezza
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
928 25 0 0 28 830 310 254 Nat osp1 F
1551 35 1 0 38 4370 315 374 Nat osp3 F
2437 28 1 0 27 980 320 265 Nat osp1 M
1780 25 2 0 25 900 325 253 Nat osp3 F
1619 31 0 0 31 990 340 278 Ces osp2 F
2359 25 6 0 33 2230 430 313 Nat osp3 F
2458 31 0 0 31 1730 430 300 Nat osp3 F
471 29 0 0 40 3680 560 346 Nat osp2 M
1513 25 0 0 40 4620 560 367 Nat osp2 M
2391 36 1 0 41 4400 565 366 Nat osp1 F

La distribuzione è assimetrica con prevalenza di valori più bassi. I valori più bassi si possono riferire ai parti prematuri, mentre quelli più alti potrebbero essere errori di muisurazione o casi particolari rari.

 

Analisi di “Cranio

 

Statistiche di Cranio
Misura Valore
Min 235
Media 340.0292
Max 390
Q1 330
Mediana 340
Q3 350
IQR 20
Limite Inf. IQR 300
Limite Sup. IQR 380
Skewness -0.785052711819754
Kurtosis 2.94620625365155
Shapiro-Wilk W 0.963571337559393
Shapiro-Wilk p-value < 2e-16
Numero Outlier 48
Outlier estremi di Cranio
Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Tipo.parto Ospedale Sesso
2175 37 8 0 28 930 355 235 Nat osp1 F
2452 28 0 0 26 930 345 245 Ces osp3 F
1780 25 2 0 25 900 325 253 Nat osp3 F
928 25 0 0 28 830 310 254 Nat osp1 F
2437 28 1 0 27 980 320 265 Nat osp1 M
565 24 1 0 40 4250 520 386 Nat osp2 F
190 26 2 0 39 4050 525 390 Nat osp1 M
684 30 1 0 39 3000 475 390 Ces osp2 F
1356 32 1 0 40 4090 525 390 Ces osp3 F
1868 29 0 0 40 3470 525 390 Nat osp1 M

Si evidenzia una distribuzione tendenzialmente simmetrica ma con una leggera asimmetria negativa e la presenza di diversi outlier, confermata dal test di Shapiro-Wilk che indica una deviazione dalla normalità.

 

Analisi di “Sesso

 

Tabella delle Frequenze di Sesso
Categoria Frequenza Percentuale
F 1256 50.24
M 1244 49.76
Risultati dei Test Statistici
Test P_value
Chi-quadro 0.8103303
Test binomiale 0.8258766

L’analisi della distribuzione del sesso nel campione evidenzia un equilibrio tra maschi e femmine. I test statistici confermano l’assenza di differenze significative indicando che la variabile sesso risulta ben bilanciata e rappresentativa della popolazione di riferimento.

 

In alcuni ospedali si fanno più parti cesarei

H₀ (ipotesi nulla): La frequenza di parti cesarei è uguale nei tre ospedali (Ospedale e Tipo di Parto sono indipendenti).

H₁ (ipotesi alternativa): La frequenza di cesarei varia tra gli ospedali (Ospedale e Tipo di Parto sono associati).

Distribuzione percentuale dei tipi di parto per ospedale
Ces Nat
osp1 30 70
osp2 30 70
osp3 28 72
Risultati del Test Chi-Quadrato: Ospedale vs Tipo di Parto
Statistica Gradi_libertà P_value
X-squared 0.129 2 0.9377

Il test del Chi-Quadrato non evidenzia differenze significative nella frequenza dei parti cesarei tra i tre ospedali. Pertanto, non vi è evidenza di un’associazione tra ospedale e tipo di parto. Percui non rifiuto l’ipotesi nulla e posso indicare che ospedale e tipo parto sono indipendenti.

 

La media del peso e della lunghezza di questo campione di neonati sono significativamente uguali a quelle della popolazione

H₀ (nulla): La media del peso del campione è uguale alla media della popolazione (μ = μ₀)

H₁ (alternativa): La media del peso del campione è diversa da quella della popolazione (μ ≠ μ₀)

 

H₀ (nulla): La media della lunghezza del campione è uguale alla media della popolazione (μ = μ₀)

H₁ (alternativa): La media della lunghezza del campione è diversa da quella della popolazione (μ ≠ μ₀)

 

Risultati del Test t: Confronto tra la Media Campionaria e la Media Teorica della Popolazione
Variabile Media_Campionaria Media_Popolazione t_value p_value
Peso alla nascita 3284.1 3250 3.246 0.0012
Lunghezza 494.7 500 -10.084 0.0000

Considerando puramente i risultati del test t questi indicano che sia la media del peso alla nascita che la media della lunghezza dei neonati del campione sono significativamente diverse dai valori teorici della popolazione (p-value < 0.05). Pertanto, la media del campione non è uguale a quella della popolazione per entrambe le variabili analizzate. Ma considerando la presenza di outliner (che rappresentano casi particolari) analizzando i valori del peso medio del campione 3284 su un media della popolazione di 3250 e i valori della lunghezza di 494,7 su una media della popolazione di 500 e considerando i valori medi (2) posso dichiarare che i valori del nostro campione sono significativamente uguali a quelli della popolazione.

 

Le misure antropometriche sono significativamente diverse tra i due sessi

H₀ (ipotesi nulla): La media è uguale tra maschi e femmine

H₁ (alternativa): La media è diversa tra maschi e femmine

Test t per confrontare Peso, Lunghezza e Cranio tra Maschi e Femmine
Variabile t_value p_value
Peso -12.106 < 2e-16
Lunghezza -9.582 < 2e-16
Cranio -7.410 < 2e-16

I neonati di sesso maschile mostrano valori medi superiori per tutte le variabili considerate rispetto alle femmine. Questa differenza risulta evidente sia dai test statistici (p-value < 0.0001) sia dalla disposizione delle mediane e dei box nei grafici.

 

Creazione del Modello di Regressione

 

Analisi della correlazione tra le variabili

 

Considerazioni:

  • La correlazione tra Peso e Lunghezza risulta elevato(0.80) e questo suggerisce che i neonati più lunghi tendono ad avere un peso maggiore.
  • La correlazione tra Peso e Gestazione alto me meno forte di quello precedente (0.59)ma permette di sostenere che una gestazione più lunga tende ad aumentare il peso alla nascita.
  • La correlazione tra Lunghezza e Cranio è alta (0.60), come ci si attende per due variabili antropometriche che mappano la crescita fetale.
  • La correlazione tra Peso e Cranio è alta (0.70), come ci si attende per due variabili antropometriche che mappano la crescita fetale.
  • Durata della gestazione mostra una distribuzione concentrata intorno alle 40 settimane che è il valore atteso per una gravidanza a termine.
  • Fumatrici e Peso hanno una bassa correlazione (0.032) ma considerando le informazioni trovate (1) valuto di mantenere nel dataset la variabile Fumatrici in quanto sembrerebbe essere significativa per determinare il peso del neonato alla nascita.
  • In base a quanto indicato nel note (3) e (4) e in base alla bassa correlazione con il Peso posso escludere con cognizione dal modello e da ulteriori analisi le varibili Tipo di parto e Ospedale in quanto non significative per il nostro obbiettivo.

 

 

Modello 1

Precedo alla realizzazione del primo modello, escludendo come detto precedentemente Tipo di parto e Ospedale.

 

Residui del Modello 1

Valore
Min -1161.56
1Q -181.19
Median -15.75
3Q 163.70
Max 2630.75

Coefficienti del Modello 1

term estimate std.error statistic p.value significance
(Intercept) -6714.411 141.151 -47.569 < 2e-16 ***
Anni.madre 0.958 1.135 0.845 0.3984 ns
N.gravidanze 11.276 4.669 2.415 0.0158 *
Fumatrici -30.296 27.597 -1.098 0.2724 ns
Gestazione 32.933 3.827 8.606 < 2e-16 ***
Lunghezza 10.234 0.301 34.009 < 2e-16 ***
Cranio 10.518 0.427 24.642 < 2e-16 ***
Sesso 78.085 11.204 6.969 4.06e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 1

Residual standard error: 274.6 on 2492 degrees of freedom

Multiple R-squared: 0.7272, Adjusted R-squared: 0.7264

F-statistic: 949 on 7 and 2492 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
Anni.madre 1.187
N.gravidanze 1.185
Fumatrici 1.007
Gestazione 1.695
Lunghezza 2.079
Cranio 1.629
Sesso 1.040
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

 

Dall’analisi dei coefficienti del Modello 1 risulta che la variabile Anni.madre non è statisticamente significativa, indicando che l’età materna non ha un effetto rilevante sul peso neonatale.

Nonostante la variabile Fumatrici non risulta statisticamente significativa nel nostro modello, potrebbe comunque avere un impatto indiretto sullo sviluppo fetale non catturato dai dati disponibili.

Inoltre, il valore del Variance Inflation Factor (VIF) per le variabili è ben al di sotto della soglia di 2.5, confermando l’assenza di multicollinearità e rendendo possibile una riduzione del modello senza compromettere la stabilità delle stime.

 

Modello 2

Provo ad escludere la variabile Anni.madre, con l’obiettivo di ottenere un modello più parsimonioso ma altrettanto informativo.

Residui del Modello 2

Valore
Min -1150.32
1Q -181.27
Median -15.70
3Q 163.00
Max 2636.33

Coefficienti del Modello 2

term estimate std.error statistic p.value significance
(Intercept) -6681.671 135.718 -49.232 < 2e-16 ***
N.gravidanze 12.719 4.345 2.927 0.0035 **
Fumatrici -30.463 27.595 -1.104 0.2697 ns
Gestazione 32.591 3.805 8.565 < 2e-16 ***
Lunghezza 10.234 0.301 34.011 < 2e-16 ***
Cranio 10.536 0.426 24.718 < 2e-16 ***
Sesso 78.171 11.203 6.978 3.83e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 2

Residual standard error: 274.6 on 2493 degrees of freedom

Multiple R-squared: 0.7271, Adjusted R-squared: 0.7265

F-statistic: 1107.2 on 6 and 2493 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
N.gravidanze 1.026
Fumatrici 1.007
Gestazione 1.676
Lunghezza 2.079
Cranio 1.625
Sesso 1.040
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

 

Escludendo Anni.madre non ha compromesso la bontà del modello: l’Adjusted R-squared resta infatti pressoché invariato (0.7265 contro 0.7264 nel Modello 1), a conferma che l’età materna non fornisce un contributo informativo rilevante.

I valori del Variance Inflation Factor (VIF) per tutte le variabili risultano inferiori a 2.1, escludendo problemi di multicollinearità. Le altre variabili — in particolare Gestazione, Lunghezza, Cranio e Sesso — si confermano altamente significative.

Il Modello 2 rappresenta dunque una versione più parsimoniosa rispetto al modello iniziale, mantenendo però al suo interno variabili di rilevanza clinica per garantire una maggiore utilità applicativa in contesto ospedaliero.

 

Modello 3

Provo ad escludere la variabile N.gravidanze, che pur essendo significativa, lo è meno delle altre, percui vale la pena vedere l’impatto sul modello.

Residui del Modello 3

Valore
Min -1138.76
1Q -182.09
Median -17.88
3Q 162.77
Max 2624.15

Coefficienti del Modello 3

term estimate std.error statistic p.value significance
(Intercept) -6651.068 135.520 -49.078 < 2e-16 ***
Fumatrici -26.362 27.601 -0.955 0.3396 ns
Gestazione 31.480 3.792 8.302 < 2e-16 ***
Lunghezza 10.192 0.301 33.859 < 2e-16 ***
Cranio 10.669 0.424 25.135 < 2e-16 ***
Sesso 79.278 11.213 7.070 2.00e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 3

Residual standard error: 275 on 2494 degrees of freedom

Multiple R-squared: 0.7262, Adjusted R-squared: 0.7256

F-statistic: 1322.9 on 5 and 2494 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
Fumatrici 1.004
Gestazione 1.659
Lunghezza 2.074
Cranio 1.606
Sesso 1.039
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

L’esclusione della variabile N.gravidanze ha comportato una riduzione trascurabile dell’Adjusted R-squared (da 0.7265 a 0.7256) permettendo di ottenere un modello ancora più snello, mantenendo inalterata la significatività delle variabili principali. Per questo motivo si considera accettabile l’eliminazione di tale predittore, in linea con il principio di parsimonia.

 

Osservazioni sui modelli analizzati fino ad ora

Vedendo che con questi modelli, passando dal modello 1 al modello 3, i miglioramenti sono stati marginali in termini di -Adjusted R-squared- ritengo opportuno esplorare potenziali effetti non lineari, nello specifico:

1. Gestazione vs Peso

Il grafico presenta una, con aumento rapido fino a circa 39 settimane e piattaforma dopo mostrando chiaramente una relazione non perfettamente lineare. proverò a testare Gestazione^2.

2. Anni.madre vs Peso

La relazione appare piatta o leggermente curva verso l’alto nella parte centrale. Proverò a testare Anni.madre^2.

3. Numero di gravidanze vs Peso

Si può intuire un effetto di saturazione dopo un certo livello. Proverò a testare N.gravidanze^2.

 

Modello 4

Introduco un termine quadratico per la durata della gestazione, al fine di modellare l’evidente curvatura osservata nella relazione con il peso neonatale.

Residui del Modello 4

Valore
Min -1133.42
1Q -182.06
Median -15.72
3Q 164.10
Max 2646.60

Coefficienti del Modello 4

term estimate std.error statistic p.value significance
(Intercept) -4659.725 899.703 -5.179 2.41e-07 ***
Fumatrici -25.130 27.584 -0.911 0.3624 ns
Gestazione -79.696 49.803 -1.600 0.1097 ns
I(Gestazione^2) 1.484 0.663 2.239 0.0253 *
Lunghezza 10.295 0.304 33.834 < 2e-16 ***
Cranio 10.764 0.426 25.253 < 2e-16 ***
Sesso 77.119 11.246 6.858 8.80e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 4

Residual standard error: 274.8 on 2493 degrees of freedom

Multiple R-squared: 0.7267, Adjusted R-squared: 0.7261

F-statistic: 1105.1 on 6 and 2493 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
Fumatrici 1.004
Gestazione 286.635
I(Gestazione^2) 279.859
Lunghezza 2.123
Cranio 1.622
Sesso 1.047
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

Inserendo Gestazione^2 conferma l’esistenza di una relazione non lineare significativa con p.vlaue = 0.0253. Notiamo però che Gestazione non risulta ancora significativo probabilmente a causa di forte collinearità tra Gestazione e Gestazione^2.

 

Modello 5

Con l’obiettivo di valutare se l’età contribuisca significativamente alla spiegazione della variabilità del peso, soprattutto in presenza di una possibile curvatura centrale osservata nei grafici esplorativi, estendo il modello includendo Anni.madre e Anni.madre^2

Residui del Modello 5

Valore
Min -1130.55
1Q -182.69
Median -13.30
3Q 161.46
Max 2638.58

Coefficienti del Modello 5

term estimate std.error statistic p.value significance
(Intercept) -4843.612 906.344 -5.344 9.91e-08 ***
Fumatrici -25.455 27.566 -0.923 0.3559 ns
Gestazione -80.177 49.792 -1.610 0.1075 ns
I(Gestazione^2) 1.501 0.663 2.264 0.0237 *
Anni.madre 12.407 7.334 1.692 0.0908 .
I(Anni.madre^2) -0.184 0.129 -1.428 0.1533 ns
Lunghezza 10.293 0.304 33.824 < 2e-16 ***
Cranio 10.703 0.427 25.041 < 2e-16 ***
Sesso 77.190 11.248 6.863 8.50e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 5

Residual standard error: 274.6 on 2491 degrees of freedom

Multiple R-squared: 0.7274, Adjusted R-squared: 0.7265

F-statistic: 830.8 on 8 and 2491 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
Fumatrici 1.005
Gestazione 286.943
I(Gestazione^2) 280.367
Anni.madre 49.578
I(Anni.madre^2) 49.714
Lunghezza 2.126
Cranio 1.634
Sesso 1.049
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

L’aggiunta dell’età materna e del suo termine quadratico non ha apportato miglioramenti sostanziali al modello, mostrando collinearità elevata e nessuna significatività chiara, mentre la curvatura della gestazione si conferma rilevante.

 

Modello 6

Aggiungo anche il numero di gravidanze e il relativo termine quadratico, per valutare un possibile effetto di saturazione sulla variabile dipendente.

Residui del Modello 6

Valore
Min -1129.40
1Q -181.73
Median -11.33
3Q 162.97
Max 2652.78

Coefficienti del Modello 6

term estimate std.error statistic p.value significance
(Intercept) -4742.228 907.066 -5.228 1.86e-07 ***
Fumatrici -31.737 27.590 -1.150 0.2501 ns
Gestazione -84.912 49.804 -1.705 0.0883 .
I(Gestazione^2) 1.578 0.663 2.379 0.0174 *
Anni.madre 12.230 7.335 1.667 0.0955 .
I(Anni.madre^2) -0.204 0.129 -1.586 0.1128 ns
N.gravidanze 25.998 8.505 3.057 0.0023 **
I(N.gravidanze^2) -2.614 1.318 -1.984 0.0474 *
Lunghezza 10.317 0.304 33.928 < 2e-16 ***
Cranio 10.580 0.428 24.695 < 2e-16 ***
Sesso 76.599 11.232 6.819 1.14e-11 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello 6

Residual standard error: 274.1 on 2489 degrees of freedom

Multiple R-squared: 0.7285, Adjusted R-squared: 0.7274

F-statistic: 667.9 on 10 and 2489 DF, p-value: < 2e-16

 

Variance Inflation Factor (VIF) per valutare la multicollinearità

Variabile VIF
Fumatrici 1.010
Gestazione 288.057
I(Gestazione^2) 281.643
Anni.madre 49.756
I(Anni.madre^2) 50.152
N.gravidanze 3.945
I(N.gravidanze^2) 3.577
Lunghezza 2.130
Cranio 1.647
Sesso 1.049
Legenda VIF:
  • VIF ≤ 2.5 → Assenza di collinearità
  • 2.5 < VIF ≤ 5 → Potenziale collinearità
  • VIF > 5 → Collinearità significativa

L’introduzione dei termini quadratici per il numero di gravidanze ha migliorato significativamente il modello, confermando un effetto curvilineo. Il modello 6 rappresenta i risultati migliori. Questo modello può essere considerato una solida base da cui partire per eventuali semplificazioni successive, valutando se eliminare predittori non significativi o ridurre la complessità.

 

Selezione del modello ottimale con stepwise

Faccio delle ulteriori verifiche per accertarmi di trovare il modello più parsimonioso ma che mantenga un’ottima interpretabilità.

 

Formula del modello selezionato con stepwise

 Peso ~ Gestazione2 + N.gravidanze + Lunghezza + Cranio + Sesso 

 

Residui del Modello selezionato con stepwise

Valore
Min -1146.87
1Q -181.09
Median -15.12
3Q 165.40
Max 2643.89

Coefficienti del Modello selezionato con stepwise

term estimate std.error statistic p.value significance
(Intercept) -6100.641 123.545 -49.380 < 2e-16 ***
Gestazione2 0.438 0.051 8.667 < 2e-16 ***
N.gravidanze 12.554 4.338 2.894 0.0038 **
Lunghezza 10.261 0.299 34.358 < 2e-16 ***
Cranio 10.560 0.426 24.816 < 2e-16 ***
Sesso 77.329 11.198 6.906 6.32e-12 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello selezionato con stepwise

Residual standard error: 274.5 on 2494 degrees of freedom

Multiple R-squared: 0.7273, Adjusted R-squared: 0.7267

F-statistic: 1330.2 on 5 and 2494 DF, p-value: < 2e-16

 

Correzione del Modello selezionato con stepwise

L’algoritmo di selezione automatica basato su BIC ha escluso il termine lineare Gestazione, mantenendo solo il termine quadratico ma per garantire una corretta interpretazione della curva e coerenza teorica, ho reinserito Gestazione nel modello finale.

 

Residui del Modello selezionato con stepwise (Corretto)

Valore
Min -1144.11
1Q -181.17
Median -13.16
3Q 165.73
Max 2662.56

Coefficienti del Modello selezionato con stepwise (Corretto)

term estimate std.error statistic p.value significance
(Intercept) -4650.227 898.171 -5.177 2.43e-07 ***
Gestazione -81.049 49.713 -1.630 0.1032 ns
Gestazione2 1.514 0.662 2.287 0.0223 *
N.gravidanze 12.566 4.336 2.898 0.0038 **
Lunghezza 10.353 0.304 34.074 < 2e-16 ***
Cranio 10.636 0.428 24.854 < 2e-16 ***
Sesso 75.790 11.234 6.747 1.88e-11 ***
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello selezionato con stepwise (Corretto)

Residual standard error: 274.4 on 2493 degrees of freedom

Multiple R-squared: 0.7276, Adjusted R-squared: 0.7269

F-statistic: 1109.7 on 6 and 2493 DF, p-value: < 2e-16

 

Residui del Modello selezionato con stepwise (Rivisto)

Valore
Min -1145.00
1Q -180.96
Median -13.12
3Q 165.00
Max 2659.10

Coefficienti del Modello selezionato con stepwise (Rivisto)

term estimate std.error statistic p.value significance
(Intercept) -4669.103 898.325 -5.198 2.18e-07 ***
Gestazione -79.774 49.726 -1.604 0.1088 ns
Gestazione2 1.500 0.662 2.266 0.0235 *
N.gravidanze 12.799 4.342 2.948 0.0032 **
Lunghezza 10.339 0.304 33.989 < 2e-16 ***
Cranio 10.631 0.428 24.841 < 2e-16 ***
Sesso 75.981 11.235 6.763 1.68e-11 ***
Fumatrici -29.244 27.577 -1.060 0.2890 ns
Legenda significatività e colori
  • *** (p < 0.001) - Altamente significativo
  • ** (p < 0.01) - Molto significativo
  • * (p < 0.05) - Significativo
  • . (p < 0.1) - Tendenza
  • ns (p >= 0.1) - Non significativo

Statistiche del Modello selezionato con stepwise (Rivisto)

Residual standard error: 274.4 on 2492 degrees of freedom

Multiple R-squared: 0.7277, Adjusted R-squared: 0.7269

F-statistic: 951.4 on 7 and 2492 DF, p-value: < 2e-16

 

Confronto tra modelli: BIC e R² Adjusted

Modello DF BIC R² Adj
mod1 9 35233.81 0.7264
mod2 8 35226.7 0.7265
mod3 7 35227.45 0.7256
mod4 8 35230.26 0.7261
mod5 10 35240.12 0.7265
mod6 12 35245.33 0.7274
mod_bic 7 35217.52 0.7267
mod_bic_corrected 8 35222.68 0.7269
mod_bic_revisioned 9 35229.38 0.7269

 

Tra i modelli testati, quello con il BIC più basso escludeva il termine lineare della gestazione. Tuttavia, per rappresentare meglio l’andamento reale del peso neonatale rispetto alle settimane di gravidanza, è stato scelto un modello leggermente più completo mod_bic_corrected , che include anche la gestazione lineare. Questo modello mantiene ottime performance statistiche e risulta più coerente dal punto di vista clinico, offrendo una lettura più realistica e interpretabile dei dati, sia rispetto a mod2 che a mod_bic_corrected.

In base alle scelte fatte in precedenza decido di aggiungere al modello anche Fumatrici che pur non risultando rilevante nel nostro campione, lo è a livello di popolazione, percui decido di utilizzare un modello leggermente più complesso ma che possa essere più utile a spiegare le motivazione sulle previsoni del peso neonatale.

La scelta finale ricade sul modello mod_bic_revisioned.

 

Analisi della qualità del modello

Dopo aver valutato l’andamento dell’R² aggiustato nei vari modelli, passiamo all’analisi dei residui per verificare che le assunzioni del modello non siano violate: linearità, normalità, omoscedasticità, indipendenza, oltre alla presenza di outlier o osservazioni influenti.

Verifica della linearità e omoschedasticità

Il grafico “Residui vs Valori Predetti” evidenzia un pattern a funnel, suggerendo una possibile violazione dell’omoschedasticità e una lieve non linearità per i valori più bassi. Questo potrebbe dipendere da fattori clinici non inclusi nel modello, come gravidanze gemellari, patologie materne o variabilità legata alla prematurità. Tuttavia, trattandosi di casi specifici e limitati, il modello può essere comunque considerato valido nel complesso.

Verifica della normalità dei residui

Il grafico evidenzia una deviazione nelle code, segnalando una normalità approssimativa e la possibile presenza di outlier. Tuttavia, dato che la maggior parte dei residui segue la distribuzione attesa e le deviazioni si concentrano negli estremi, il modello può essere ritenuto adeguato per scopi predittivi.

Verifica della omoschedasticità

Il grafico mostra una diminuzione della varianza dei residui all’aumentare dei valori predetti, indicando eteroschedasticità. Tuttavia, trattandosi di una tendenza moderata e limitata ai valori più bassi, il modello resta valido per fini predittivi.

Verifica della presenza di osservazioni influenti

Il grafico evidenzia alcuni outlier con residui elevati e almeno un punto potenzialmente influente. Tuttavia, trattandosi di casi isolati, l’impatto complessivo sul modello è limitato e ne consente comunque un uso affidabile a fini predittivi.

Durbin-Watson test per l’autocorrelazione dei residui

TestModelloDWp-valueIpotesi alternativa
Durbin-Watsonmod_bic_revisioned1.95310.1203true autocorrelation is greater than 0

Il modello non presenta autocorrelazione positiva significativa tra i residui. Questo rafforza la validità inferenziale delle stime ottenute e conferma che l’ipotesi di indipendenza dei residui è ragionevolmente soddisfatta.

Shapiro-Wilk test per la verifica della normalità

TestModelloWp-valueIpotesi nulla
Shapiro-Wilkmod_bic_revisioned0.97365< 2.2e-16Normalità dei residui

Il test di Shapiro-Wilk valuta se i residui seguono una distribuzione normale. Un p-value molto basso indica una deviazione dalla normalità, violando così l’assunzione necessaria per l’affidabilità dei test statistici classici (come t-test e intervalli di confidenza) nel modello di regressione.

Test di Breusch-Pagan, test d’ipotesi di eteroschedasticità

TestModelloBPdfp-valueIpotesi nulla
Breusch-Paganmod_bic_revisioned95.2827< 2.2e-16Omogeneità della varianza (omoscedasticità)

Il test di Breusch-Pagan verifica se la varianza dei residui rimane costante al variare dei predittori. Un p-value molto basso indica che la varianza non è omogenea (cioè i residui presentano eteroscedasticità), violando così una delle assunzioni fondamentali della regressione lineare. Questo può influenzare l’affidabilità degli errori standard e dei test sui coefficienti.

Analisi visuale

Visto i risultati dei test di Shapiro-Wilk e di Breusch-Pagan, eseguo un’analisi visiva per approfondire la comprensione delle deviazioni dalle assunzioni del modello di regressione lineare.

Data la simmetria complessiva e l’assenza di distorsioni gravi, il modello può essere considerato adeguato per fini previsionali.

Il grafico mostra che solo poche osservazioni superano significativamente la soglia teorica di leverage, indicando potenziali influenze anomale sul modello, stampo in una tabella i valori più influenti per analizzarli.

Osservazioni con leverage > 0.032 (5 × soglia teorica)
osservazione leverage Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Sesso
1780 0.12810 25 2 0 25 900 325 253 0
2452 0.09377 28 0 0 26 930 345 245 0
310 0.06765 40 3 0 28 1560 420 379 0
2437 0.06683 28 1 0 27 980 320 265 1
2120 0.06669 32 0 0 27 1140 370 267 0
2175 0.05973 37 8 0 28 930 355 235 0
1551 0.05023 35 1 0 38 4370 315 374 0
928 0.04805 25 0 0 28 830 310 254 0
378 0.04734 27 0 0 28 1285 400 274 0
1429 0.04287 24 4 0 29 1280 390 355 0
1130 0.03552 33 11 0 43 3400 475 360 1

Tra le osservazioni con leverage molto elevato, i casi 1780, 2175, 1551 e 1130 mostrano anche valori clinicamente anomali (come peso molto basso o elevato, numero di gravidanze atipico o gestazione fuori norma), suggerendo una possibile influenza reale e giustificata sul modello.

Faccio delle ulteriori analisi per approfondire a partire dal grafico dei residui studentizzati che consente di individuare visivamente le osservazioni che si discostano in modo anomalo dal modello, aiutando a rilevare outlier che potrebbero influenzare l’accuratezza dell’inferenza.

Il grafico mostra che la maggior parte dei residui studentizzati rientra nell’intervallo ±2, con poche osservazioni potenzialmente anomale.

Osservazioni identificate come outlier dal test di Bonferroni
osservazione Residuo_studentizzato p-value (Bonferroni)
1551 10.1463 2.473e-20
155 5.0897 9.636e-04
1306 4.7773 4.700e-03

Le osservazioni 1551, 155, e 1306 presentano residui studentizzati molto elevati.

I rispettivi p-value corretti con Bonferroni sono estremamente piccoli, il che significa che la probabilità che tali scostamenti siano casuali è molto bassa.

Osservazioni outlier con residui anomali (test di Bonferroni)
osservazione Anni.madre N.gravidanze Fumatrici Gestazione Peso Lunghezza Cranio Sesso
1551 35 1 0 38 4370 315 374 0
155 30 0 0 36 3610 410 330 1
1306 23 0 0 41 4900 510 352 0

Calcoliamo ora la distanza di Cook dopo aver individuato gli outlier in modo da distinguere outlier influenti da outlier innocui, e poter decidere se tenerli, trattarli o rimuoverli.

Il grafico mostra una sola osservazione oltre la soglia di 0.5, su cui porrò la mia attenzione in quanto l’unica realmente anomala nel dataset, vediamo di quale osservazione si tratta.

Osservazioni con Cook’s Distance > 0.5
osservazione Cook’s Distance
1551 0.65388

L’osservazione 1551 presenta un peso e un diametro cranico superiori alla media, ed è influente sul modello secondo la distanza di Cook e il test di Bonferroni. Tuttavia, trattandosi di un caso clinicamente plausibile di macrosomia neonatale (7), decido di mantenerla nell’analisi.

 

In conclusione

Nonostante le violazioni delle assunzioni classiche (normalità ed eteroscedasticità dei residui), il modello mod_bic_revisioned mostra un comportamento stabile in termini di indipendenza dei residui e conserva una buona capacità predittiva. In contesti applicativi come quello clinico, la previsione accurata è spesso più rilevante della perfetta aderenza ai presupposti teorici. Pertanto, il modello può essere considerato valido per fini predittivi.

 

3. Previsioni e risultati

Ora userò il modello mod_bic_revisioned per predire il peso di una neonata, da una madre alla terza gravidanza e 39 settimane di gestazione.

Variabili richieste per la previsione del peso neonatale
Variabile Tipo Obbligatoria Come ricavarla se mancante
Gestazione Numerica (intera) ✅ sì Fornita nel caso d’esempio (39)
Gestazione2 Derivata ✅ sì Calcolata come Gestazione^2 = 1521
N.gravidanze Intera ✅ sì Fornita (es. 3)
Lunghezza Numerica ✅ sì Usata media del dataset (495 mm)
Cranio Numerica ✅ sì Usata media del dataset (340 mm)
Sesso Binaria (0 = F) ✅ sì Indicata nel caso: femmina = 0
Fumatrici Binaria (0/1) ✅ sì Assunta come 0 (non fumatrice)

Eseguo la previsione con i valori definiti nella tabella sovrastante.

Stima del peso neonatale con intervallo di confidenza al 95%
Stima.del.peso..g. Limite.inferiore..g. Limite.superiore..g.
3272 3248 3295

La stima del peso alla nascita per una neonata, figlia di una madre alla terza gravidanza che partorirà alla 39ª settimana, è pari a 3272 grammi, con un intervallo di confidenza al 95% compreso tra 3248 e 3295 grammi.

 

4. Visualizzazioni

 

Il grafico mostra una chiara relazione crescente tra le settimane di gestazione e il peso alla nascita. Tale andamento è coerente tra maschi e femmine, suggerendo che la durata della gestazione incide positivamente sul peso indipendentemente dal genere.

Stima dell’incremento del peso neonatale per ogni settimana di gestazione
Stima.incremento.medio..g.settimana. Errore.standard p.value CI.2.5. CI.97.5.
Estimate 166.27 4.53 <1e-04 157.39 175.16

Abbiamo un incremento medio del peso di circa 166g per ogni settima di gestione.

 

Il grafico suggerisce che i neonati di madri fumatrici tendono ad avere un peso alla nascita inferiore rispetto a quelli di non fumatrici a parità di settimane di gestazione, supportando l’inclusione di questa variabile nel modello predittivo.

Stima del peso neonatale per fumatrici e non fumatrici a 39 settimane
Abitudine.al.fumo Stima.del.peso..g. Limite.inferiore..g. Limite.superiore..g.
Non fumatrice 3269 3245 3293
Fumatrice 3240 3183 3296

 

Il grafico evidenzia una relazione fortemente positiva tra la lunghezza del neonato e il peso alla nascita, confermando l’elevata rilevanza predittiva di questa variabile all’interno del modello.

 

Il grafico mostra che i neonati maschi tendono ad avere un peso alla nascita maggiore rispetto alle femmine, evidenziando un impatto significativo del sesso nella distribuzione del peso neonatale.

 


 

NOTE

 

(1) Impatto del fumo durante la gravidanza sul peso neonatale:

 

(2) Valori medi di un neonato alla nascita:

ho trovato un documento del reparto pediatrico del Polincino Gemelli di Roma che si dimostra una fonte autorevole [FONTE: https://pspediatrico.policlinicogemelli.it/wp-content/uploads/pdfScaricabili-12-2017/2-Esame_obiettivo_neonatale.pdf] il quale riporta che in media un neonato normale ha:

  • un peso di 3100-3400 grammi
  • una lunghezza di 48-52 cm
  • una circonferenza cranica di 33-36 cm

il diametro del cranio dovrebbe essere tra 90 mm e 110 mm (9-11 cm), percui le misure presenti nel dataset si riferiscono alla circonferenza del cranio e non al diametro.

 

(3) Impatto del tipo di parto sul peso neonatale:

Studi suggeriscono che il tipo di parto (naturale o cesareo) non è un determinante diretto del peso del neonato. Il cesareo viene spesso eseguito per motivi indipendenti dal peso (ad esempio, posizione del feto, sofferenza fetale, condizioni materne), il che rende questa variabile non causalmente legata al peso alla nascita.

Fonti:

  • Kuhle et al., Cesarean Delivery Is Not Associated with Obesity in Childhood, The Journal of Pediatrics (2015).
  • H. Blustein et al., Association of caesarean delivery with offspring overweight and obesity: a systematic review and meta-analysis, International Journal of Obesity (2013).

 

(4) Impatto dell’ospedale sul peso neonatale:

Il peso neonatale è più influenzato da fattori materni e fetali (età della madre, durata della gestazione, fumo, condizioni mediche, ecc.) piuttosto che dal luogo di nascita. Le differenze tra ospedali sono spesso legate a differenze nella popolazione trattata o nei protocolli di assistenza, ma non rappresentano un fattore determinante diretto.

Fonti:

  • Kogan et al., The Role of Clinical Practices in Variation in Birth Weight Among US Hospitals, Maternal and Child Health Journal (2010).
  • Kramer et al., Determinants of low birth weight: Methodological assessment and meta-analysis, Bulletin of the World Health Organization (1987).

 

(5) Gravidanza in minorenni:

E’ possibile che una ragazza di 13 o 14 anni rimanga incinta. La fertilità femminile inizia con la prima mestruazione, che in media si verifica intorno ai 12 anni. [FONTE: https://www.ospedalebambinogesu.it/gravidanza-in-minorenni-96849]

 

(6) Gravidanza oltre i 40 anni:

Diventare mamma a 40 anni non è affatto strano, ma sta quasi diventando la normalità. [FONTE:https://imamma.it/gravidanza-a-40-anni-tutte-le-cose-da-sapere/?utm_source=chatgpt.com]

 

(7) Macrosomia neonatale:

 

Nella redazione del presente documento si è fatto uso di strumenti di assistenza alla scrittura basati su intelligenza artificiale, come ChatGPT, con l’obiettivo di migliorare la chiarezza espositiva, la coerenza linguistica e la resa visiva. Le decisioni sui contenuti e l’analisi scientifica sono state curate in modo autonomo e consapevole dall’autore.