Metodología

Los datos se extraerán de una base de datos en la que se combinaron los datos de las ecografías realizadas prenatalmente con los datos de una ecocardiografía realizada en el momento del nacimiento.

En primer lugar se estudiará la distribución de la variable principal ‘tamaño del foramen oval (FO) del recién nacido’ para obtener sus medidas de tendencia central. Se analizarán gráficos de cuantiles y se aplicará un test de Kolmogorov-Smirnov (corrección de Lilliefors) para estudiar su normalidad.

Una vez verificada la distribución, se hará una primera inspección de los datos, estudiando la correlación individual de la variable principal con cada uno de los predictores así como las posibles relaciones de colinealidad entre éstos. La asociación con las variables cualitativas se estudiará mediante pruebas paramétricas y gráficos de cajas y bigotes.

A continuación se construirá un modelo de regresión lineal múltiple en el que, inicialmente, se introducirán todas las variables predictoras posibles. De este modelo se procederá a extraer las más significativas mediante un método en pasos tipo mixto basado en el cálculo del valor Akaike (AIC). Una vez seleccionadas las variables se procederá a la verificar la distribución de los residuos respecto a cada una de las variables seleccionadas, su normalidad y homoscedasticidad.

La colinealidad entre predictores se estudiará gráficamente mediante una matriz así como mediante el coeficiente de inflación de la varianza (VIF).

Finalmente se estudiará la presencia de valores atípicos mediante el análisis de residuos estudentizados.

La significación estadística del modelo quedará determinada por elvalor del test de la F de Schnedecor y su capacidad para explicar el modelo mediante el coeficiente de determinación ( \(R²\) ) ajustado por el número de predictores.

Para todos los cálculos se fijará el nivel de significación en el 5%.

Se empleará el programa estadístico RStudio Team (Integrated Develoment for R. RStudio Inc., Boston MA 2016), así como los paquetes ‘lmtest’,‘nortest’ ‘ggplot2’,‘ggpubr’, ‘Hmisc’,‘car’,‘psych’, ‘dplyr’ y ‘GGally’.

Media DE p_ks.test
2.361 1.162 0.331

Descripción inicial

Se seleccionaron 58 casos en los que la información era completa. El parámetro de estudio ‘Tamaño del foramen oval en el recién nacido’ sigue una distribución normal, con una media de 2.361 y una desviación estandar de 1.162

Correlación individual

Variables numéricas

Analizando cada variable por separado, se observa una débil correlación de la variable de estudio con las variables cuantitativas aorta, edad gestacional y tapse. Tan sólo se observa una correlación significativa con la variable Foramen Oval prenatal, edad gestacional y Arteria Pulmonar.

Se observa cierta correlación entre las medidas de la aorta y pulmonar fetales así como de ambas con la edad gestacional.

Variables Cualitativas

Asimismo,la variable de estudio se asoció significativamente con la presencia de asimetría de grandes vasos(0.8 vs 2.5, p<0.05). También se observó una fuerte asociación con la presencia de flap sin que llegara a ser significativa.

asimetriaGV size_FOPNN
no FOP_NN: Media= 2.529 SD= 1.08
si FOP_NN: Media= 0.897 SD= 0.788

Modelo de regresión lineal múltiple

##                    Estimate   Pr(>|t|)
## size_FOP       0.3202239353 0.04814208
## diasG          0.0002821236 0.98348381
## flap1si        1.4235511485 0.03071028
## asimetriaGVsi -1.1573368197 0.03975631
## aorta1        -0.3947995287 0.11998947
## pulmonar1      0.0372340794 0.83793278
## tapse1        -0.1584520608 0.04563159
## ipDV1         -0.4607077174 0.58624615
## istmoAoNN      0.1356254811 0.43977461
R2_Modelo1 R2_ajustada
0.3748688 0.2576567

Se construye un modelo inicial teniendo en cuenta todas las variables. Este modelo es significativo p<0.05), mostrando una R² ajustada de 25.766%. Resultaron significativas las variables: foramen oval y asimetría de GV.

Se procede a seleccionar las variables mediante un método de pasos mixto.

##                 Estimate   Pr(>|t|)
## size_FOP       0.3191388 0.03274182
## flap1si        1.2872232 0.03490616
## asimetriaGVsi -1.0732529 0.01965737
## aorta1        -0.3340223 0.07587765
## tapse1        -0.1599939 0.03537114
R2_Modelo2 R2_ajustado
0.3646789 0.3035904

En este modelo, permanecen los predictores: flap, foramen oval, asimetría de grandes vasos, aorta, y tapse. De esta manera podemos explicar, tras ajustar por el número de predictores, un 30.359% de la variación de la variable estudiada.

Estudio de los residuos.

La distribución de los residuos parece ajustarse a la normalidad pero se observa cierta agrupación de los datos en un extremo de la gráfica frente a valores ajustados. Por ello, procedemos a una transformación logarítmica de las variables cuantitativas.

La gráfica de residuos estudentizados muestra dos valores atípicos que distorsionan el modelo y que son excluidos del mismo.

Por último, un test de Breusch-Pagan confirma la homoscedasticidad de los residuos tal y como de muestra en las gráficas.

Se observó cierta agrupación de los residuos en un extremo de la gráfica por lo que se recurrió a una transformación logarítmica de las variables numéricas mejorando sustancialmente la precisión.

## 
##  studentized Breusch-Pagan test
## 
## data:  model2
## BP = 5.2414, df = 5, p-value = 0.3871
##                   Estimate    Pr(>|t|)
## log1p(size_FOP)  2.1304976 0.002270715
## asimetriaGVsi   -0.9878777 0.014544778
## flap1si          1.1295422 0.033796423
## log1p(tapse1)   -1.2746031 0.067533787
## log1p(aorta1)   -1.2112822 0.297713210
R2_Modelo3 R2_ajustado
0.4140934 0.3555027

Como vemos, el modelo logarítmico mejora la bondad del ajuste, explicando un 35.55% de la variablidad de la variable de estudio.

Colinealidad

Colinealidad: La colinealidad entre las variables aorta, tapse y foramen es muy débil y no parece influir en el modelo. El análisis de inflación de la varianza (VIF), confirma esta observación al no observarse valores muy altos

## log1p(size_FOP)   asimetriaGVsi         flap1si   log1p(tapse1) 
##        1.087141        1.151853        1.073846        1.057993 
##   log1p(aorta1) 
##        1.061586

Modelo final

\[Foramen= 2.13\times log{(FO.prenatal)}-1.21 \times log{(aorta)}-1.27 \times log{(tapse)}-0.98 \times asimetria GV + 1.21 \times flap\]

Intervalos de confianza de los coeficientes

##                       2.5 %      97.5 %
## log1p(size_FOP)  0.80051585  3.46047937
## asimetriaGVsi   -1.77166233 -0.20409313
## flap1si          0.09002575  2.16905873
## log1p(tapse1)   -2.64462883  0.09542259
## log1p(aorta1)   -3.52325777  1.10069338

Conclusiones

Con los datos de los que disponemos podemos decir lo siguiente:

1.- Los valores del Foramen Oval medidos después de nacer siguen una distribución normal ( \(\overline{x}\) = 2.361 \(\pm\) 1.162)

2.- De manera aislada, el FO en el neonato mostró una débil correlación con las diversas medidas ecográficas prenatales, siendo las más importante la observada con el foramen oval fetal (Indice=0.32, p=0.012), arteria pulmonar (IC= 0.36, p=0.004) y Edad gestacional (IC=0.27 p=0.04). También fue significativa la asociación con la asimetría de grandes vasos (2.5 vs 0.7, p<0.05).

3.- Cuando se trató de construir un modelo para predecir prenatalmente el tamaño del FO, el mejor modelo fue el que integraba las siguientes variables: FO, aorta, tapse, flap y asimetría de grandes vasos. La transformación logarítmica de las variables numéricas mejoró la bondad del modelo.

4.- El mejor modelo obtenido sólo consigue explicar un 35.55% de la variación de la variable de estudio por lo que es necesario incluir más casos en el estudio así como explorar otras posibles medidas ecográficas y/o clínicas.