| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso |
|---|---|---|---|---|---|---|---|---|---|
| 26 | 0 | 0 | 42 | 3380 | 490 | 325 | Nat | osp3 | M |
| 21 | 2 | 0 | 39 | 3150 | 490 | 345 | Nat | osp1 | F |
| 34 | 3 | 0 | 38 | 3640 | 500 | 375 | Nat | osp2 | M |
| 28 | 1 | 0 | 41 | 3690 | 515 | 365 | Nat | osp2 | M |
| 20 | 0 | 0 | 38 | 3700 | 480 | 335 | Nat | osp3 | F |
| 32 | 0 | 0 | 40 | 3200 | 495 | 340 | Nat | osp2 | F |
| 26 | 1 | 0 | 39 | 3100 | 480 | 345 | Nat | osp3 | F |
| 25 | 0 | 0 | 40 | 3580 | 510 | 349 | Nat | osp1 | M |
| 22 | 1 | 0 | 40 | 3670 | 500 | 335 | Ces | osp2 | F |
| 23 | 0 | 0 | 41 | 3700 | 510 | 362 | Ces | osp2 | F |
| Tipo | Esempi | |
|---|---|---|
| Anni.madre | integer | 26, 21, 34 |
| N.gravidanze | integer | 0, 2, 3 |
| Fumatrici | integer | 0, 0, 0 |
| Gestazione | integer | 42, 39, 38 |
| Peso | integer | 3380, 3150, 3640 |
| Lunghezza | integer | 490, 490, 500 |
| Cranio | integer | 325, 345, 375 |
| Tipo.parto | factor | Nat, Nat, Nat |
| Ospedale | factor | osp3, osp1, osp2 |
| Sesso | factor | M, F, M |
Età della madre (in anni)
Tipo: Quantitativa discreta in scala di rapporti
Quante gravidanze ha avuto la madre
teniamo conto che 0
indica che è alla prima gravidanza ma non ha mai partorito
prima
Tipo: Quantitativa discreta in scala di
rapporti
Se la mamma fuma (0=non fumatrice, 1=fumatrice)
Tipo: Qualitativa dicotomica
Durata della gravidanza (in settimane)
Tipo: Quantitativa continua in scala di rapporti
Peso del neonato (in grammi)
Tipo: Quantitativa continua in scala di rapporti
Lunghezza del neonato (in millimetri)
Tipo: Quantitativa continua in scala di rapporti
Circonferenza del cranio (in millimetri) e non diametro del
cranio
Tipo: Quantitativa continua in scala di
rapporti
Tipo di parto (Nat = Naturale, Ces = Cesareo)
Tipo: Qualitativa nominale
Ospedale di nascita (osp1, osp2, osp3)
Tipo: Qualitativa nominale
Sesso del neonato (M = Maschio, F = Femmina)
Tipo: Qualitativa dicotomica
| Misura | Valore |
|---|---|
| Min | 0 |
| Media | 28.164 |
| Max | 46 |
| Q1 | 25 |
| Mediana | 28 |
| Q3 | 32 |
| IQR | 7 |
| Limite Inf. IQR | 14.5 |
| Limite Sup. IQR | 42.5 |
| Skewness | 0.0428115004569053 |
| Kurtosis | 0.3804165222879 |
| Shapiro-Wilk W | 0.993080970998317 |
| Shapiro-Wilk p-value | 1.64e-09 |
| Numero Outlier | 13 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 1380 | 0 | 0 | 0 | 39 | 3060 | 490 | 330 | Nat | osp3 | M |
| 1152 | 1 | 1 | 0 | 41 | 3250 | 490 | 350 | Nat | osp2 | F |
| 138 | 13 | 0 | 0 | 38 | 2760 | 470 | 325 | Nat | osp2 | F |
| 1075 | 14 | 1 | 0 | 39 | 3510 | 490 | 365 | Nat | osp2 | M |
| 1532 | 14 | 0 | 0 | 39 | 3550 | 500 | 355 | Ces | osp1 | M |
| 335 | 44 | 0 | 1 | 38 | 3150 | 465 | 335 | Nat | osp3 | F |
| 2026 | 44 | 0 | 0 | 40 | 3050 | 505 | 345 | Nat | osp1 | M |
| 2098 | 44 | 5 | 0 | 38 | 3280 | 475 | 346 | Ces | osp1 | F |
| 205 | 45 | 2 | 0 | 38 | 3850 | 505 | 384 | Nat | osp3 | M |
| 1106 | 46 | 5 | 0 | 36 | 2710 | 470 | 347 | Nat | osp2 | M |
La variabile segue una distribuzione leggermenete assimmetrica con code meno pronucniate rispetto ad una distribuzione normale. Il testo di Shapiro-Wilk indica che la distribuzione non è normale, ma dall’istrogramma della distribuzione la forma ricorda la distribuzione normale percui potremmo per ora considerare la distribuzione come normale e fare ulteriori analisi successivamente per vedere l’influenza sul modello.
Analizzando gli outlier possiamo vedere valori molto bassi di 0, 1, 13, 14 anni e valori più alti di 44, 45, 46 anni.
I valori 0 e 1 sono valori chiaramente anomali dovuto quasi sicuramente a errori di inserimento.
I valori di 13 e 14 anni (5), sono valori plausibili anche se gravidanze a queste giovane età posso comportare maggiori rischi a causa di complicanze.
I valori di 44, 45 e 46 anni sono valori plausibili (6) e sta diventando sempre più anche grazie ai progressi della medicina riproduttiva.
Sulla base di questo decido di sostituire i valori 0 e 1 con la mediana delle età delle madri per evitare di elinminarli e perdere informazione e di tenere gli altri valori in quando plausibili e necessari per mantenere significativo il dataset.
| Misura | Valore |
|---|---|
| Min | 0 |
| Media | 0.9812 |
| Max | 12 |
| Q1 | 0 |
| Mediana | 1 |
| Q3 | 1 |
| IQR | 1 |
| Limite Inf. IQR | -1.5 |
| Limite Sup. IQR | 2.5 |
| Skewness | 2.51425407710076 |
| Kurtosis | 10.9894063615823 |
| Shapiro-Wilk W | 0.721249287971459 |
| Shapiro-Wilk p-value | < 2e-16 |
| Numero Outlier | 246 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 3 | 34 | 3 | 0 | 38 | 3640 | 500 | 375 | Nat | osp2 | M |
| 15 | 33 | 3 | 0 | 34 | 2400 | 470 | 298 | Ces | osp3 | M |
| 18 | 32 | 3 | 0 | 40 | 3030 | 490 | 335 | Ces | osp3 | M |
| 40 | 34 | 3 | 0 | 38 | 3050 | 460 | 336 | Nat | osp3 | F |
| 47 | 29 | 3 | 0 | 39 | 2680 | 450 | 346 | Nat | osp3 | F |
| 2221 | 35 | 10 | 0 | 39 | 2950 | 495 | 335 | Nat | osp1 | F |
| 2422 | 33 | 10 | 0 | 40 | 3090 | 485 | 353 | Nat | osp3 | M |
| 2471 | 34 | 10 | 0 | 38 | 2880 | 470 | 345 | Ces | osp2 | M |
| 1130 | 33 | 11 | 0 | 43 | 3400 | 475 | 360 | Nat | osp1 | M |
| 1219 | 38 | 12 | 0 | 39 | 3350 | 490 | 344 | Nat | osp2 | M |
La distribuzione è molto assimmetrica a desta con una coda lunga e con molti valori outlier, questo significa che meno di 3 gravidanze e un dato comune, invece più di 3 gravidanze sono casi piuttosto rari che rappresntano circa il 10% dei casi totali.
| Categoria | Frequenza | Percentuale |
|---|---|---|
| 0 | 2396 | 95.84 |
| 1 | 104 | 4.16 |
| Test | P_value |
|---|---|
| Chi-quadro | 0 |
| Test binomiale | 0 |
Nel nostro campione le madri Fumatrici rappresentano circa il 4% rendendo questa distribuzione molto sbilanciata e potrebbe non essere correttamente rappresentativa nel modello.
Ma considerando che la media sulla popolazione sarebbe intorno al 10% (1) questo permetterebbe di ottenere risultati più significativi e affidabili per il modello, indicando che probabilmente è il nostro campione a non essere perfettamente bilanciato.
| Misura | Valore |
|---|---|
| Min | 25 |
| Media | 38.9804 |
| Max | 43 |
| Q1 | 38 |
| Mediana | 39 |
| Q3 | 40 |
| IQR | 2 |
| Limite Inf. IQR | 35 |
| Limite Sup. IQR | 43 |
| Skewness | -2.06531325911714 |
| Kurtosis | 8.2581495549494 |
| Shapiro-Wilk W | 0.833276929649533 |
| Shapiro-Wilk p-value | < 2e-16 |
| Numero Outlier | 67 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 1780 | 25 | 2 | 0 | 25 | 900 | 325 | 253 | Nat | osp3 | F |
| 2452 | 28 | 0 | 0 | 26 | 930 | 345 | 245 | Ces | osp3 | F |
| 2120 | 32 | 0 | 0 | 27 | 1140 | 370 | 267 | Nat | osp3 | F |
| 2437 | 28 | 1 | 0 | 27 | 980 | 320 | 265 | Nat | osp1 | M |
| 310 | 40 | 3 | 0 | 28 | 1560 | 420 | 379 | Nat | osp3 | F |
| 1311 | 40 | 6 | 0 | 34 | 1840 | 430 | 305 | Nat | osp1 | F |
| 1400 | 22 | 0 | 0 | 34 | 2590 | 485 | 314 | Nat | osp2 | M |
| 1893 | 22 | 1 | 0 | 34 | 3030 | 470 | 312 | Nat | osp2 | F |
| 1977 | 39 | 4 | 0 | 34 | 2970 | 480 | 350 | Ces | osp2 | F |
| 2257 | 40 | 0 | 0 | 34 | 1580 | 400 | 300 | Nat | osp2 | F |
Le gravidanze durano dalle 25 alle 43 settimane, con un media di 39 settimane che si attesta vicino alla durata tipica di una gravidanza che è di 40 settimane. Sono presenti diversi outlier sopratutto sotto le 35 settimane che identificano i parti prematuri.
| Misura | Valore |
|---|---|
| Min | 830 |
| Media | 3284.0808 |
| Max | 4930 |
| Q1 | 2990 |
| Mediana | 3300 |
| Q3 | 3620 |
| IQR | 630 |
| Limite Inf. IQR | 2045 |
| Limite Sup. IQR | 4565 |
| Skewness | -0.647030832752079 |
| Kurtosis | 2.03153184511532 |
| Shapiro-Wilk W | 0.970657098407693 |
| Shapiro-Wilk p-value | < 2e-16 |
| Numero Outlier | 69 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 928 | 25 | 0 | 0 | 28 | 830 | 310 | 254 | Nat | osp1 | F |
| 1780 | 25 | 2 | 0 | 25 | 900 | 325 | 253 | Nat | osp3 | F |
| 2175 | 37 | 8 | 0 | 28 | 930 | 355 | 235 | Nat | osp1 | F |
| 2452 | 28 | 0 | 0 | 26 | 930 | 345 | 245 | Ces | osp3 | F |
| 2437 | 28 | 1 | 0 | 27 | 980 | 320 | 265 | Nat | osp1 | M |
| 2392 | 28 | 1 | 0 | 40 | 4720 | 540 | 355 | Nat | osp3 | M |
| 1639 | 39 | 3 | 0 | 40 | 4760 | 550 | 365 | Nat | osp2 | F |
| 1433 | 31 | 4 | 0 | 41 | 4810 | 530 | 364 | Ces | osp3 | M |
| 1306 | 23 | 0 | 0 | 41 | 4900 | 510 | 352 | Nat | osp2 | F |
| 1920 | 26 | 0 | 1 | 39 | 4930 | 550 | 350 | Ces | osp2 | F |
Siccome il peso medio e il peso mediano hanno valori abbastanza simili in generale la maggior parte dei neonati da un peso introno a questi valori ma con alcuni neonati che hanno peso significativamente più bassi che potrebbe dipendere da nascite premature o condiczione che influenzano la crescita del feto.
| Misura | Valore |
|---|---|
| Min | 310 |
| Media | 494.692 |
| Max | 565 |
| Q1 | 480 |
| Mediana | 500 |
| Q3 | 510 |
| IQR | 30 |
| Limite Inf. IQR | 435 |
| Limite Sup. IQR | 555 |
| Skewness | -1.51469914804306 |
| Kurtosis | 6.48717388620972 |
| Shapiro-Wilk W | 0.90940573211939 |
| Shapiro-Wilk p-value | < 2e-16 |
| Numero Outlier | 59 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 928 | 25 | 0 | 0 | 28 | 830 | 310 | 254 | Nat | osp1 | F |
| 1551 | 35 | 1 | 0 | 38 | 4370 | 315 | 374 | Nat | osp3 | F |
| 2437 | 28 | 1 | 0 | 27 | 980 | 320 | 265 | Nat | osp1 | M |
| 1780 | 25 | 2 | 0 | 25 | 900 | 325 | 253 | Nat | osp3 | F |
| 1619 | 31 | 0 | 0 | 31 | 990 | 340 | 278 | Ces | osp2 | F |
| 2359 | 25 | 6 | 0 | 33 | 2230 | 430 | 313 | Nat | osp3 | F |
| 2458 | 31 | 0 | 0 | 31 | 1730 | 430 | 300 | Nat | osp3 | F |
| 471 | 29 | 0 | 0 | 40 | 3680 | 560 | 346 | Nat | osp2 | M |
| 1513 | 25 | 0 | 0 | 40 | 4620 | 560 | 367 | Nat | osp2 | M |
| 2391 | 36 | 1 | 0 | 41 | 4400 | 565 | 366 | Nat | osp1 | F |
La distribuzione è assimetrica con prevalenza di valori più bassi. I valori più bassi si possono riferire ai parti prematuri, mentre quelli più alti potrebbero essere errori di muisurazione o casi particolari rari.
| Misura | Valore |
|---|---|
| Min | 235 |
| Media | 340.0292 |
| Max | 390 |
| Q1 | 330 |
| Mediana | 340 |
| Q3 | 350 |
| IQR | 20 |
| Limite Inf. IQR | 300 |
| Limite Sup. IQR | 380 |
| Skewness | -0.785052711819754 |
| Kurtosis | 2.94620625365155 |
| Shapiro-Wilk W | 0.963571337559393 |
| Shapiro-Wilk p-value | < 2e-16 |
| Numero Outlier | 48 |
| Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Tipo.parto | Ospedale | Sesso | |
|---|---|---|---|---|---|---|---|---|---|---|
| 2175 | 37 | 8 | 0 | 28 | 930 | 355 | 235 | Nat | osp1 | F |
| 2452 | 28 | 0 | 0 | 26 | 930 | 345 | 245 | Ces | osp3 | F |
| 1780 | 25 | 2 | 0 | 25 | 900 | 325 | 253 | Nat | osp3 | F |
| 928 | 25 | 0 | 0 | 28 | 830 | 310 | 254 | Nat | osp1 | F |
| 2437 | 28 | 1 | 0 | 27 | 980 | 320 | 265 | Nat | osp1 | M |
| 565 | 24 | 1 | 0 | 40 | 4250 | 520 | 386 | Nat | osp2 | F |
| 190 | 26 | 2 | 0 | 39 | 4050 | 525 | 390 | Nat | osp1 | M |
| 684 | 30 | 1 | 0 | 39 | 3000 | 475 | 390 | Ces | osp2 | F |
| 1356 | 32 | 1 | 0 | 40 | 4090 | 525 | 390 | Ces | osp3 | F |
| 1868 | 29 | 0 | 0 | 40 | 3470 | 525 | 390 | Nat | osp1 | M |
Si evidenzia una distribuzione tendenzialmente simmetrica ma con una leggera asimmetria negativa e la presenza di diversi outlier, confermata dal test di Shapiro-Wilk che indica una deviazione dalla normalità.
| Categoria | Frequenza | Percentuale |
|---|---|---|
| F | 1256 | 50.24 |
| M | 1244 | 49.76 |
| Test | P_value |
|---|---|
| Chi-quadro | 0.8103303 |
| Test binomiale | 0.8258766 |
L’analisi della distribuzione del sesso nel campione evidenzia un equilibrio tra maschi e femmine. I test statistici confermano l’assenza di differenze significative indicando che la variabile sesso risulta ben bilanciata e rappresentativa della popolazione di riferimento.
H₀ (ipotesi nulla): La frequenza di parti cesarei è uguale nei tre ospedali (Ospedale e Tipo di Parto sono indipendenti).
H₁ (ipotesi alternativa): La frequenza di cesarei varia tra gli ospedali (Ospedale e Tipo di Parto sono associati).
| Ces | Nat | |
|---|---|---|
| osp1 | 30 | 70 |
| osp2 | 30 | 70 |
| osp3 | 28 | 72 |
| Statistica | Gradi_libertà | P_value | |
|---|---|---|---|
| X-squared | 0.129 | 2 | 0.9377 |
Il test del Chi-Quadrato non evidenzia differenze significative nella frequenza dei parti cesarei tra i tre ospedali. Pertanto, non vi è evidenza di un’associazione tra ospedale e tipo di parto. Percui non rifiuto l’ipotesi nulla e posso indicare che ospedale e tipo parto sono indipendenti.
H₀ (nulla): La media del peso del campione è uguale alla media della popolazione (μ = μ₀)
H₁ (alternativa): La media del peso del campione è diversa da quella della popolazione (μ ≠ μ₀)
H₀ (nulla): La media della lunghezza del campione è uguale alla media della popolazione (μ = μ₀)
H₁ (alternativa): La media della lunghezza del campione è diversa da quella della popolazione (μ ≠ μ₀)
| Variabile | Media_Campionaria | Media_Popolazione | t_value | p_value |
|---|---|---|---|---|
| Peso alla nascita | 3284.1 | 3250 | 3.246 | 0.0012 |
| Lunghezza | 494.7 | 500 | -10.084 | 0.0000 |
Considerando puramente i risultati del test t questi indicano che sia la media del peso alla nascita che la media della lunghezza dei neonati del campione sono significativamente diverse dai valori teorici della popolazione (p-value < 0.05). Pertanto, la media del campione non è uguale a quella della popolazione per entrambe le variabili analizzate. Ma considerando la presenza di outliner (che rappresentano casi particolari) analizzando i valori del peso medio del campione 3284 su un media della popolazione di 3250 e i valori della lunghezza di 494,7 su una media della popolazione di 500 e considerando i valori medi (2) posso dichiarare che i valori del nostro campione sono significativamente uguali a quelli della popolazione.
H₀ (ipotesi nulla): La media è uguale tra maschi e femmine
H₁ (alternativa): La media è diversa tra maschi e femmine
| Variabile | t_value | p_value |
|---|---|---|
| Peso | -12.106 | < 2e-16 |
| Lunghezza | -9.582 | < 2e-16 |
| Cranio | -7.410 | < 2e-16 |
I neonati di sesso maschile mostrano valori medi superiori per tutte le variabili considerate rispetto alle femmine. Questa differenza risulta evidente sia dai test statistici (p-value < 0.0001) sia dalla disposizione delle mediane e dei box nei grafici.
Considerazioni:
Precedo alla realizzazione del primo modello, escludendo come detto precedentemente Tipo di parto e Ospedale.
| Valore | |
|---|---|
| Min | -1161.56 |
| 1Q | -181.19 |
| Median | -15.75 |
| 3Q | 163.70 |
| Max | 2630.75 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -6714.411 | 141.151 | -47.569 | < 2e-16 | *** |
| Anni.madre | 0.958 | 1.135 | 0.845 | 0.3984 | ns |
| N.gravidanze | 11.276 | 4.669 | 2.415 | 0.0158 | * |
| Fumatrici | -30.296 | 27.597 | -1.098 | 0.2724 | ns |
| Gestazione | 32.933 | 3.827 | 8.606 | < 2e-16 | *** |
| Lunghezza | 10.234 | 0.301 | 34.009 | < 2e-16 | *** |
| Cranio | 10.518 | 0.427 | 24.642 | < 2e-16 | *** |
| Sesso | 78.085 | 11.204 | 6.969 | 4.06e-12 | *** |
Residual standard error: 274.6 on 2492 degrees of freedom
Multiple R-squared: 0.7272, Adjusted R-squared: 0.7264
F-statistic: 949 on 7 and 2492 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| Anni.madre | 1.187 |
| N.gravidanze | 1.185 |
| Fumatrici | 1.007 |
| Gestazione | 1.695 |
| Lunghezza | 2.079 |
| Cranio | 1.629 |
| Sesso | 1.040 |
Dall’analisi dei coefficienti del Modello 1 risulta che la variabile Anni.madre non è statisticamente significativa, indicando che l’età materna non ha un effetto rilevante sul peso neonatale.
Nonostante la variabile Fumatrici non risulta statisticamente significativa nel nostro modello, potrebbe comunque avere un impatto indiretto sullo sviluppo fetale non catturato dai dati disponibili.
Inoltre, il valore del Variance Inflation Factor (VIF) per le variabili è ben al di sotto della soglia di 2.5, confermando l’assenza di multicollinearità e rendendo possibile una riduzione del modello senza compromettere la stabilità delle stime.
Provo ad escludere la variabile Anni.madre, con
l’obiettivo di ottenere un modello più parsimonioso ma altrettanto
informativo.
| Valore | |
|---|---|
| Min | -1150.32 |
| 1Q | -181.27 |
| Median | -15.70 |
| 3Q | 163.00 |
| Max | 2636.33 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -6681.671 | 135.718 | -49.232 | < 2e-16 | *** |
| N.gravidanze | 12.719 | 4.345 | 2.927 | 0.0035 | ** |
| Fumatrici | -30.463 | 27.595 | -1.104 | 0.2697 | ns |
| Gestazione | 32.591 | 3.805 | 8.565 | < 2e-16 | *** |
| Lunghezza | 10.234 | 0.301 | 34.011 | < 2e-16 | *** |
| Cranio | 10.536 | 0.426 | 24.718 | < 2e-16 | *** |
| Sesso | 78.171 | 11.203 | 6.978 | 3.83e-12 | *** |
Residual standard error: 274.6 on 2493 degrees of freedom
Multiple R-squared: 0.7271, Adjusted R-squared: 0.7265
F-statistic: 1107.2 on 6 and 2493 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| N.gravidanze | 1.026 |
| Fumatrici | 1.007 |
| Gestazione | 1.676 |
| Lunghezza | 2.079 |
| Cranio | 1.625 |
| Sesso | 1.040 |
Escludendo Anni.madre non ha compromesso la bontà del
modello: l’Adjusted R-squared resta infatti pressoché
invariato (0.7265 contro 0.7264 nel Modello 1), a conferma che l’età
materna non fornisce un contributo informativo rilevante.
I valori del Variance Inflation Factor (VIF) per
tutte le variabili risultano inferiori a 2.1, escludendo problemi di
multicollinearità. Le altre variabili — in particolare
Gestazione, Lunghezza, Cranio e
Sesso — si confermano altamente
significative.
Il Modello 2 rappresenta dunque una versione più parsimoniosa rispetto al modello iniziale, mantenendo però al suo interno variabili di rilevanza clinica per garantire una maggiore utilità applicativa in contesto ospedaliero.
Provo ad escludere la variabile N.gravidanze, che pur
essendo significativa, lo è meno delle altre, percui vale la pena vedere
l’impatto sul modello.
| Valore | |
|---|---|
| Min | -1138.76 |
| 1Q | -182.09 |
| Median | -17.88 |
| 3Q | 162.77 |
| Max | 2624.15 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -6651.068 | 135.520 | -49.078 | < 2e-16 | *** |
| Fumatrici | -26.362 | 27.601 | -0.955 | 0.3396 | ns |
| Gestazione | 31.480 | 3.792 | 8.302 | < 2e-16 | *** |
| Lunghezza | 10.192 | 0.301 | 33.859 | < 2e-16 | *** |
| Cranio | 10.669 | 0.424 | 25.135 | < 2e-16 | *** |
| Sesso | 79.278 | 11.213 | 7.070 | 2.00e-12 | *** |
Residual standard error: 275 on 2494 degrees of freedom
Multiple R-squared: 0.7262, Adjusted R-squared: 0.7256
F-statistic: 1322.9 on 5 and 2494 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| Fumatrici | 1.004 |
| Gestazione | 1.659 |
| Lunghezza | 2.074 |
| Cranio | 1.606 |
| Sesso | 1.039 |
L’esclusione della variabile N.gravidanze ha comportato
una riduzione trascurabile dell’Adjusted R-squared (da
0.7265 a 0.7256) permettendo di ottenere un modello ancora più snello,
mantenendo inalterata la significatività delle variabili principali. Per
questo motivo si considera accettabile l’eliminazione di tale
predittore, in linea con il principio di parsimonia.
Vedendo che con questi modelli, passando dal modello 1 al modello 3, i miglioramenti sono stati marginali in termini di -Adjusted R-squared- ritengo opportuno esplorare potenziali effetti non lineari, nello specifico:
1. Gestazione vs Peso
Il grafico presenta una, con aumento rapido fino a circa 39 settimane
e piattaforma dopo mostrando chiaramente una relazione non perfettamente
lineare. proverò a testare Gestazione^2.
2. Anni.madre vs Peso
La relazione appare piatta o leggermente curva verso l’alto nella
parte centrale. Proverò a testare Anni.madre^2.
3. Numero di gravidanze vs Peso
Si può intuire un effetto di saturazione dopo un certo livello.
Proverò a testare N.gravidanze^2.
Introduco un termine quadratico per la durata della gestazione, al fine di modellare l’evidente curvatura osservata nella relazione con il peso neonatale.
| Valore | |
|---|---|
| Min | -1133.42 |
| 1Q | -182.06 |
| Median | -15.72 |
| 3Q | 164.10 |
| Max | 2646.60 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -4659.725 | 899.703 | -5.179 | 2.41e-07 | *** |
| Fumatrici | -25.130 | 27.584 | -0.911 | 0.3624 | ns |
| Gestazione | -79.696 | 49.803 | -1.600 | 0.1097 | ns |
| I(Gestazione^2) | 1.484 | 0.663 | 2.239 | 0.0253 | * |
| Lunghezza | 10.295 | 0.304 | 33.834 | < 2e-16 | *** |
| Cranio | 10.764 | 0.426 | 25.253 | < 2e-16 | *** |
| Sesso | 77.119 | 11.246 | 6.858 | 8.80e-12 | *** |
Residual standard error: 274.8 on 2493 degrees of freedom
Multiple R-squared: 0.7267, Adjusted R-squared: 0.7261
F-statistic: 1105.1 on 6 and 2493 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| Fumatrici | 1.004 |
| Gestazione | 286.635 |
| I(Gestazione^2) | 279.859 |
| Lunghezza | 2.123 |
| Cranio | 1.622 |
| Sesso | 1.047 |
Inserendo Gestazione^2 conferma l’esistenza di una
relazione non lineare significativa con p.vlaue = 0.0253. Notiamo però
che Gestazione non risulta ancora significativo
probabilmente a causa di forte collinearità tra Gestazione
e Gestazione^2.
Con l’obiettivo di valutare se l’età contribuisca significativamente
alla spiegazione della variabilità del peso, soprattutto in presenza di
una possibile curvatura centrale osservata nei grafici esplorativi,
estendo il modello includendo Anni.madre e
Anni.madre^2
| Valore | |
|---|---|
| Min | -1130.55 |
| 1Q | -182.69 |
| Median | -13.30 |
| 3Q | 161.46 |
| Max | 2638.58 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -4843.612 | 906.344 | -5.344 | 9.91e-08 | *** |
| Fumatrici | -25.455 | 27.566 | -0.923 | 0.3559 | ns |
| Gestazione | -80.177 | 49.792 | -1.610 | 0.1075 | ns |
| I(Gestazione^2) | 1.501 | 0.663 | 2.264 | 0.0237 | * |
| Anni.madre | 12.407 | 7.334 | 1.692 | 0.0908 | . |
| I(Anni.madre^2) | -0.184 | 0.129 | -1.428 | 0.1533 | ns |
| Lunghezza | 10.293 | 0.304 | 33.824 | < 2e-16 | *** |
| Cranio | 10.703 | 0.427 | 25.041 | < 2e-16 | *** |
| Sesso | 77.190 | 11.248 | 6.863 | 8.50e-12 | *** |
Residual standard error: 274.6 on 2491 degrees of freedom
Multiple R-squared: 0.7274, Adjusted R-squared: 0.7265
F-statistic: 830.8 on 8 and 2491 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| Fumatrici | 1.005 |
| Gestazione | 286.943 |
| I(Gestazione^2) | 280.367 |
| Anni.madre | 49.578 |
| I(Anni.madre^2) | 49.714 |
| Lunghezza | 2.126 |
| Cranio | 1.634 |
| Sesso | 1.049 |
L’aggiunta dell’età materna e del suo termine quadratico non ha apportato miglioramenti sostanziali al modello, mostrando collinearità elevata e nessuna significatività chiara, mentre la curvatura della gestazione si conferma rilevante.
Aggiungo anche il numero di gravidanze e il relativo termine quadratico, per valutare un possibile effetto di saturazione sulla variabile dipendente.
| Valore | |
|---|---|
| Min | -1129.40 |
| 1Q | -181.73 |
| Median | -11.33 |
| 3Q | 162.97 |
| Max | 2652.78 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -4742.228 | 907.066 | -5.228 | 1.86e-07 | *** |
| Fumatrici | -31.737 | 27.590 | -1.150 | 0.2501 | ns |
| Gestazione | -84.912 | 49.804 | -1.705 | 0.0883 | . |
| I(Gestazione^2) | 1.578 | 0.663 | 2.379 | 0.0174 | * |
| Anni.madre | 12.230 | 7.335 | 1.667 | 0.0955 | . |
| I(Anni.madre^2) | -0.204 | 0.129 | -1.586 | 0.1128 | ns |
| N.gravidanze | 25.998 | 8.505 | 3.057 | 0.0023 | ** |
| I(N.gravidanze^2) | -2.614 | 1.318 | -1.984 | 0.0474 | * |
| Lunghezza | 10.317 | 0.304 | 33.928 | < 2e-16 | *** |
| Cranio | 10.580 | 0.428 | 24.695 | < 2e-16 | *** |
| Sesso | 76.599 | 11.232 | 6.819 | 1.14e-11 | *** |
Residual standard error: 274.1 on 2489 degrees of freedom
Multiple R-squared: 0.7285, Adjusted R-squared: 0.7274
F-statistic: 667.9 on 10 and 2489 DF, p-value: < 2e-16
| Variabile | VIF |
|---|---|
| Fumatrici | 1.010 |
| Gestazione | 288.057 |
| I(Gestazione^2) | 281.643 |
| Anni.madre | 49.756 |
| I(Anni.madre^2) | 50.152 |
| N.gravidanze | 3.945 |
| I(N.gravidanze^2) | 3.577 |
| Lunghezza | 2.130 |
| Cranio | 1.647 |
| Sesso | 1.049 |
L’introduzione dei termini quadratici per il numero di gravidanze ha migliorato significativamente il modello, confermando un effetto curvilineo. Il modello 6 rappresenta i risultati migliori. Questo modello può essere considerato una solida base da cui partire per eventuali semplificazioni successive, valutando se eliminare predittori non significativi o ridurre la complessità.
Faccio delle ulteriori verifiche per accertarmi di trovare il modello più parsimonioso ma che mantenga un’ottima interpretabilità.
Peso ~ Gestazione2 + N.gravidanze + Lunghezza + Cranio + Sesso
| Valore | |
|---|---|
| Min | -1146.87 |
| 1Q | -181.09 |
| Median | -15.12 |
| 3Q | 165.40 |
| Max | 2643.89 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -6100.641 | 123.545 | -49.380 | < 2e-16 | *** |
| Gestazione2 | 0.438 | 0.051 | 8.667 | < 2e-16 | *** |
| N.gravidanze | 12.554 | 4.338 | 2.894 | 0.0038 | ** |
| Lunghezza | 10.261 | 0.299 | 34.358 | < 2e-16 | *** |
| Cranio | 10.560 | 0.426 | 24.816 | < 2e-16 | *** |
| Sesso | 77.329 | 11.198 | 6.906 | 6.32e-12 | *** |
Residual standard error: 274.5 on 2494 degrees of freedom
Multiple R-squared: 0.7273, Adjusted R-squared: 0.7267
F-statistic: 1330.2 on 5 and 2494 DF, p-value: < 2e-16
L’algoritmo di selezione automatica basato su BIC ha escluso il termine lineare Gestazione, mantenendo solo il termine quadratico ma per garantire una corretta interpretazione della curva e coerenza teorica, ho reinserito Gestazione nel modello finale.
| Valore | |
|---|---|
| Min | -1144.11 |
| 1Q | -181.17 |
| Median | -13.16 |
| 3Q | 165.73 |
| Max | 2662.56 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -4650.227 | 898.171 | -5.177 | 2.43e-07 | *** |
| Gestazione | -81.049 | 49.713 | -1.630 | 0.1032 | ns |
| Gestazione2 | 1.514 | 0.662 | 2.287 | 0.0223 | * |
| N.gravidanze | 12.566 | 4.336 | 2.898 | 0.0038 | ** |
| Lunghezza | 10.353 | 0.304 | 34.074 | < 2e-16 | *** |
| Cranio | 10.636 | 0.428 | 24.854 | < 2e-16 | *** |
| Sesso | 75.790 | 11.234 | 6.747 | 1.88e-11 | *** |
Residual standard error: 274.4 on 2493 degrees of freedom
Multiple R-squared: 0.7276, Adjusted R-squared: 0.7269
F-statistic: 1109.7 on 6 and 2493 DF, p-value: < 2e-16
| Valore | |
|---|---|
| Min | -1145.00 |
| 1Q | -180.96 |
| Median | -13.12 |
| 3Q | 165.00 |
| Max | 2659.10 |
| term | estimate | std.error | statistic | p.value | significance |
|---|---|---|---|---|---|
| (Intercept) | -4669.103 | 898.325 | -5.198 | 2.18e-07 | *** |
| Gestazione | -79.774 | 49.726 | -1.604 | 0.1088 | ns |
| Gestazione2 | 1.500 | 0.662 | 2.266 | 0.0235 | * |
| N.gravidanze | 12.799 | 4.342 | 2.948 | 0.0032 | ** |
| Lunghezza | 10.339 | 0.304 | 33.989 | < 2e-16 | *** |
| Cranio | 10.631 | 0.428 | 24.841 | < 2e-16 | *** |
| Sesso | 75.981 | 11.235 | 6.763 | 1.68e-11 | *** |
| Fumatrici | -29.244 | 27.577 | -1.060 | 0.2890 | ns |
Residual standard error: 274.4 on 2492 degrees of freedom
Multiple R-squared: 0.7277, Adjusted R-squared: 0.7269
F-statistic: 951.4 on 7 and 2492 DF, p-value: < 2e-16
| Modello | DF | BIC | R² Adj |
|---|---|---|---|
| mod1 | 9 | 35233.81 | 0.7264 |
| mod2 | 8 | 35226.7 | 0.7265 |
| mod3 | 7 | 35227.45 | 0.7256 |
| mod4 | 8 | 35230.26 | 0.7261 |
| mod5 | 10 | 35240.12 | 0.7265 |
| mod6 | 12 | 35245.33 | 0.7274 |
| mod_bic | 7 | 35217.52 | 0.7267 |
| mod_bic_corrected | 8 | 35222.68 | 0.7269 |
| mod_bic_revisioned | 9 | 35229.38 | 0.7269 |
Tra i modelli testati, quello con il BIC più basso escludeva il
termine lineare della gestazione. Tuttavia, per rappresentare meglio
l’andamento reale del peso neonatale rispetto alle settimane di
gravidanza, è stato scelto un modello leggermente più completo
mod_bic_corrected , che include anche la gestazione
lineare. Questo modello mantiene ottime performance statistiche e
risulta più coerente dal punto di vista clinico, offrendo una lettura
più realistica e interpretabile dei dati, sia rispetto a
mod2 che a mod_bic_corrected.
In base alle scelte fatte in precedenza decido di aggiungere al modello anche Fumatrici che pur non risultando rilevante nel nostro campione, lo è a livello di popolazione, percui decido di utilizzare un modello leggermente più complesso ma che possa essere più utile a spiegare le motivazione sulle previsoni del peso neonatale.
La scelta finale ricade sul modello mod_bic_revisioned.
Dopo aver valutato l’andamento dell’R² aggiustato nei vari modelli, passiamo all’analisi dei residui per verificare che le assunzioni del modello non siano violate: linearità, normalità, omoscedasticità, indipendenza, oltre alla presenza di outlier o osservazioni influenti.
Verifica della linearità e omoschedasticità
Il grafico “Residui vs Valori Predetti” evidenzia un pattern a funnel, suggerendo una possibile violazione dell’omoschedasticità e una lieve non linearità per i valori più bassi. Questo potrebbe dipendere da fattori clinici non inclusi nel modello, come gravidanze gemellari, patologie materne o variabilità legata alla prematurità. Tuttavia, trattandosi di casi specifici e limitati, il modello può essere comunque considerato valido nel complesso.
Verifica della normalità dei residui
Il grafico evidenzia una deviazione nelle code, segnalando una normalità approssimativa e la possibile presenza di outlier. Tuttavia, dato che la maggior parte dei residui segue la distribuzione attesa e le deviazioni si concentrano negli estremi, il modello può essere ritenuto adeguato per scopi predittivi.
Verifica della omoschedasticità
Il grafico mostra una diminuzione della varianza dei residui all’aumentare dei valori predetti, indicando eteroschedasticità. Tuttavia, trattandosi di una tendenza moderata e limitata ai valori più bassi, il modello resta valido per fini predittivi.
Verifica della presenza di osservazioni influenti
Il grafico evidenzia alcuni outlier con residui elevati e almeno un punto potenzialmente influente. Tuttavia, trattandosi di casi isolati, l’impatto complessivo sul modello è limitato e ne consente comunque un uso affidabile a fini predittivi.
Durbin-Watson test per l’autocorrelazione dei residui
| Test | Modello | DW | p-value | Ipotesi alternativa |
|---|---|---|---|---|
| Durbin-Watson | mod_bic_revisioned | 1.9531 | 0.1203 | true autocorrelation is greater than 0 |
Il modello non presenta autocorrelazione positiva significativa tra i residui. Questo rafforza la validità inferenziale delle stime ottenute e conferma che l’ipotesi di indipendenza dei residui è ragionevolmente soddisfatta.
Shapiro-Wilk test per la verifica della normalità
| Test | Modello | W | p-value | Ipotesi nulla |
|---|---|---|---|---|
| Shapiro-Wilk | mod_bic_revisioned | 0.97365 | < 2.2e-16 | Normalità dei residui |
Il test di Shapiro-Wilk valuta se i residui seguono una distribuzione normale. Un p-value molto basso indica una deviazione dalla normalità, violando così l’assunzione necessaria per l’affidabilità dei test statistici classici (come t-test e intervalli di confidenza) nel modello di regressione.
Test di Breusch-Pagan, test d’ipotesi di eteroschedasticità
| Test | Modello | BP | df | p-value | Ipotesi nulla |
|---|---|---|---|---|---|
| Breusch-Pagan | mod_bic_revisioned | 95.282 | 7 | < 2.2e-16 | Omogeneità della varianza (omoscedasticità) |
Il test di Breusch-Pagan verifica se la varianza dei residui rimane costante al variare dei predittori. Un p-value molto basso indica che la varianza non è omogenea (cioè i residui presentano eteroscedasticità), violando così una delle assunzioni fondamentali della regressione lineare. Questo può influenzare l’affidabilità degli errori standard e dei test sui coefficienti.
Analisi visuale
Visto i risultati dei test di Shapiro-Wilk e di Breusch-Pagan, eseguo un’analisi visiva per approfondire la comprensione delle deviazioni dalle assunzioni del modello di regressione lineare.
Data la simmetria complessiva e l’assenza di distorsioni gravi, il modello può essere considerato adeguato per fini previsionali.
Il grafico mostra che solo poche osservazioni superano significativamente la soglia teorica di leverage, indicando potenziali influenze anomale sul modello, stampo in una tabella i valori più influenti per analizzarli.
| osservazione | leverage | Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Sesso |
|---|---|---|---|---|---|---|---|---|---|
| 1780 | 0.12810 | 25 | 2 | 0 | 25 | 900 | 325 | 253 | 0 |
| 2452 | 0.09377 | 28 | 0 | 0 | 26 | 930 | 345 | 245 | 0 |
| 310 | 0.06765 | 40 | 3 | 0 | 28 | 1560 | 420 | 379 | 0 |
| 2437 | 0.06683 | 28 | 1 | 0 | 27 | 980 | 320 | 265 | 1 |
| 2120 | 0.06669 | 32 | 0 | 0 | 27 | 1140 | 370 | 267 | 0 |
| 2175 | 0.05973 | 37 | 8 | 0 | 28 | 930 | 355 | 235 | 0 |
| 1551 | 0.05023 | 35 | 1 | 0 | 38 | 4370 | 315 | 374 | 0 |
| 928 | 0.04805 | 25 | 0 | 0 | 28 | 830 | 310 | 254 | 0 |
| 378 | 0.04734 | 27 | 0 | 0 | 28 | 1285 | 400 | 274 | 0 |
| 1429 | 0.04287 | 24 | 4 | 0 | 29 | 1280 | 390 | 355 | 0 |
| 1130 | 0.03552 | 33 | 11 | 0 | 43 | 3400 | 475 | 360 | 1 |
Tra le osservazioni con leverage molto elevato, i casi 1780, 2175, 1551 e 1130 mostrano anche valori clinicamente anomali (come peso molto basso o elevato, numero di gravidanze atipico o gestazione fuori norma), suggerendo una possibile influenza reale e giustificata sul modello.
Faccio delle ulteriori analisi per approfondire a partire dal grafico dei residui studentizzati che consente di individuare visivamente le osservazioni che si discostano in modo anomalo dal modello, aiutando a rilevare outlier che potrebbero influenzare l’accuratezza dell’inferenza.
Il grafico mostra che la maggior parte dei residui studentizzati rientra nell’intervallo ±2, con poche osservazioni potenzialmente anomale.
| osservazione | Residuo_studentizzato | p-value (Bonferroni) |
|---|---|---|
| 1551 | 10.1463 | 2.473e-20 |
| 155 | 5.0897 | 9.636e-04 |
| 1306 | 4.7773 | 4.700e-03 |
Le osservazioni 1551, 155, e 1306 presentano residui studentizzati molto elevati.
I rispettivi p-value corretti con Bonferroni sono estremamente piccoli, il che significa che la probabilità che tali scostamenti siano casuali è molto bassa.
| osservazione | Anni.madre | N.gravidanze | Fumatrici | Gestazione | Peso | Lunghezza | Cranio | Sesso |
|---|---|---|---|---|---|---|---|---|
| 1551 | 35 | 1 | 0 | 38 | 4370 | 315 | 374 | 0 |
| 155 | 30 | 0 | 0 | 36 | 3610 | 410 | 330 | 1 |
| 1306 | 23 | 0 | 0 | 41 | 4900 | 510 | 352 | 0 |
Calcoliamo ora la distanza di Cook dopo aver individuato gli outlier in modo da distinguere outlier influenti da outlier innocui, e poter decidere se tenerli, trattarli o rimuoverli.
Il grafico mostra una sola osservazione oltre la soglia di 0.5, su cui porrò la mia attenzione in quanto l’unica realmente anomala nel dataset, vediamo di quale osservazione si tratta.
| osservazione | Cook’s Distance |
|---|---|
| 1551 | 0.65388 |
L’osservazione 1551 presenta un peso e un diametro cranico superiori alla media, ed è influente sul modello secondo la distanza di Cook e il test di Bonferroni. Tuttavia, trattandosi di un caso clinicamente plausibile di macrosomia neonatale (7), decido di mantenerla nell’analisi.
In conclusione
Nonostante le violazioni delle assunzioni classiche (normalità ed eteroscedasticità dei residui), il modello mod_bic_revisioned mostra un comportamento stabile in termini di indipendenza dei residui e conserva una buona capacità predittiva. In contesti applicativi come quello clinico, la previsione accurata è spesso più rilevante della perfetta aderenza ai presupposti teorici. Pertanto, il modello può essere considerato valido per fini predittivi.
Ora userò il modello mod_bic_revisioned per predire il peso di una neonata, da una madre alla terza gravidanza e 39 settimane di gestazione.
| Variabile | Tipo | Obbligatoria | Come ricavarla se mancante |
|---|---|---|---|
| Gestazione | Numerica (intera) | ✅ sì | Fornita nel caso d’esempio (39) |
| Gestazione2 | Derivata | ✅ sì | Calcolata come Gestazione^2 = 1521 |
| N.gravidanze | Intera | ✅ sì | Fornita (es. 3) |
| Lunghezza | Numerica | ✅ sì | Usata media del dataset (495 mm) |
| Cranio | Numerica | ✅ sì | Usata media del dataset (340 mm) |
| Sesso | Binaria (0 = F) | ✅ sì | Indicata nel caso: femmina = 0 |
| Fumatrici | Binaria (0/1) | ✅ sì | Assunta come 0 (non fumatrice) |
Eseguo la previsione con i valori definiti nella tabella sovrastante.
| Stima.del.peso..g. | Limite.inferiore..g. | Limite.superiore..g. |
|---|---|---|
| 3272 | 3248 | 3295 |
La stima del peso alla nascita per una neonata, figlia di una madre alla terza gravidanza che partorirà alla 39ª settimana, è pari a 3272 grammi, con un intervallo di confidenza al 95% compreso tra 3248 e 3295 grammi.
Il grafico mostra una chiara relazione crescente tra le settimane di gestazione e il peso alla nascita. Tale andamento è coerente tra maschi e femmine, suggerendo che la durata della gestazione incide positivamente sul peso indipendentemente dal genere.
| Stima.incremento.medio..g.settimana. | Errore.standard | p.value | CI.2.5. | CI.97.5. | |
|---|---|---|---|---|---|
| Estimate | 166.27 | 4.53 | <1e-04 | 157.39 | 175.16 |
Abbiamo un incremento medio del peso di circa 166g per ogni settima di gestione.
Il grafico suggerisce che i neonati di madri fumatrici tendono ad avere un peso alla nascita inferiore rispetto a quelli di non fumatrici a parità di settimane di gestazione, supportando l’inclusione di questa variabile nel modello predittivo.
| Abitudine.al.fumo | Stima.del.peso..g. | Limite.inferiore..g. | Limite.superiore..g. |
|---|---|---|---|
| Non fumatrice | 3269 | 3245 | 3293 |
| Fumatrice | 3240 | 3183 | 3296 |
Il grafico evidenzia una relazione fortemente positiva tra la lunghezza del neonato e il peso alla nascita, confermando l’elevata rilevanza predittiva di questa variabile all’interno del modello.
Il grafico mostra che i neonati maschi tendono ad avere un peso alla nascita maggiore rispetto alle femmine, evidenziando un impatto significativo del sesso nella distribuzione del peso neonatale.
(1) Impatto del fumo durante la gravidanza sul peso neonatale:
(2) Valori medi di un neonato alla nascita:
ho trovato un documento del reparto pediatrico del Polincino Gemelli di Roma che si dimostra una fonte autorevole [FONTE: https://pspediatrico.policlinicogemelli.it/wp-content/uploads/pdfScaricabili-12-2017/2-Esame_obiettivo_neonatale.pdf] il quale riporta che in media un neonato normale ha:
il diametro del cranio dovrebbe essere tra 90 mm e 110 mm (9-11 cm), percui le misure presenti nel dataset si riferiscono alla circonferenza del cranio e non al diametro.
(3) Impatto del tipo di parto sul peso neonatale:
Studi suggeriscono che il tipo di parto (naturale o cesareo) non è un determinante diretto del peso del neonato. Il cesareo viene spesso eseguito per motivi indipendenti dal peso (ad esempio, posizione del feto, sofferenza fetale, condizioni materne), il che rende questa variabile non causalmente legata al peso alla nascita.
Fonti:
(4) Impatto dell’ospedale sul peso neonatale:
Il peso neonatale è più influenzato da fattori materni e fetali (età della madre, durata della gestazione, fumo, condizioni mediche, ecc.) piuttosto che dal luogo di nascita. Le differenze tra ospedali sono spesso legate a differenze nella popolazione trattata o nei protocolli di assistenza, ma non rappresentano un fattore determinante diretto.
Fonti:
(5) Gravidanza in minorenni:
E’ possibile che una ragazza di 13 o 14 anni rimanga incinta. La fertilità femminile inizia con la prima mestruazione, che in media si verifica intorno ai 12 anni. [FONTE: https://www.ospedalebambinogesu.it/gravidanza-in-minorenni-96849]
(6) Gravidanza oltre i 40 anni:
Diventare mamma a 40 anni non è affatto strano, ma sta quasi diventando la normalità. [FONTE:https://imamma.it/gravidanza-a-40-anni-tutte-le-cose-da-sapere/?utm_source=chatgpt.com]
(7) Macrosomia neonatale:
La macrosomia neonatale è definita come un peso alla nascita superiore a 4000 g. [FONTE:https://www.msdmanuals.com/it/professionale/pediatria/problemi-perinatali/neonato-grande-per-l-et%C3%A0-gestazionale?utm_source=chatgpt.com]
In alcuni casi, si parla di macrosomia severa quando il peso supera i 4500 g. [FONTE: https://it.wikipedia.org/wiki/Macrosomia_fetale?utm_source=chatgpt.com]
Un diametro cranico di 374 mm (equivalente a una circonferenza di circa 37,4 cm) è superiore alla media, ma può essere giustificato in un neonato macrosomico essendo di poco superiore alla media (2).
Nella redazione del presente documento si è fatto uso di strumenti di assistenza alla scrittura basati su intelligenza artificiale, come ChatGPT, con l’obiettivo di migliorare la chiarezza espositiva, la coerenza linguistica e la resa visiva. Le decisioni sui contenuti e l’analisi scientifica sono state curate in modo autonomo e consapevole dall’autore.