Introducción

La estimación de la estatura a partir de huesos largos y extremidades es un procedimiento central dentro de la antropología forense, disciplina que busca aportar información científica para la identificación humana en contextos legales. En situaciones donde solo se recuperan restos óseos parciales o fragmentados, la capacidad de inferir características biológicas —como sexo, edad, afinidad poblacional y estatura— se vuelve fundamental para orientar procesos de identificación individual.

Dentro de estos indicadores, la estatura es uno de los rasgos más útiles, y su estimación se basa en la estrecha relación biomecánica y ontogenética entre la talla corporal y las dimensiones de los huesos largos. Por ello, medidas como la longitud de la tibia, el fémur, el húmero o segmentos corporales equivalentes ofrecen la posibilidad de desarrollar modelos predictivos que permitan aproximar con precisión la altura de un individuo, incluso cuando el esqueleto está incompleto.

En el ámbito forense, la precisión y la trazabilidad metodológica son esenciales: los modelos deben ser estadísticamente robustos, evaluados críticamente y aplicados únicamente dentro del rango de variación de la población de referencia. Además, la detección de valores atípicos o influyentes, así como la consideración de supuestos estadísticos, resulta indispensable para garantizar la validez del modelo en un contexto pericial.

En este estudio se emplearán distintos modelos de estimación de la estatura basados en la longitud de las extremidades y sus segmentos anatómicos. Se consideran medidas completas y parciales del miembro superior (longitud total del miembro, brazo, antebrazo y mano) así como del miembro inferior (longitud total del miembro, muslo, pierna y pie). La utilidad de estos segmentos radica en, en contextos forenses,aun cuando los restos de un un individuo se encuentran incompletos o fragmentados, es común recuperar al menos uno de estos segmentos o regiones anatómicas, lo que permite generar inferencias fiables sobre la estatura original del individuo. El análisis comparará el desempeño predictivo de algunos modelos, evaluando la fuerza de la asociación, la precisión de las estimaciones y la consistencia forense de los resultados, con el objetivo de determinar qué medidas aportan mayor valor en contextos reales de identificación humana.

En concreto se aplican herramientas estadísticas para explorar la relación entre la longitud de alguna extremidad o segmento y la estatura, evaluar posibles puntos influyentes y desarrollar ecuaciones predictivas justificadas que simulen el proceso aplicado en la antropología forense contemporánea.

Metodología

En el año 1969, los antropólogos Carlos Serrano, Sergio López y Zaid Lagunas levantaros información somatológica de poblablación juvenil en el valle de Cholula, Puebla, alguna estadísticas descriptivas y la base de datos fue publicada en el año 1997 por parte del Instituto de Investigaciones Antropológicas de la UNAM. En el año 2022 la entonces pasante de la licenciatura en Antropología Física Ursula Juárez Luna se dio a la tarea de crear la base de datos digitalizada con el objetivo de usar dicha información en su tesis de grado. La base consta de 339 observaciones y 13 variables, nueve de las cuales contienen la información de las mediciones de la estatura, cuatro de las extremidades superiores y cuatro de las extremidades inferiores.

En el cuadro 1 se presentan las medidas descriptivas de las variables mencionadas:

Cuadro 1. Medidas descriptivas de las variables antropométricas
Variable N válido Media Mediana SD CV
Estatura (mm) 339 1611.29 1608.0 59.31 0.037
Longitud miembro superior (mm) 337 722.33 722.0 32.11 0.044
Longitud del brazo (mm) 336 311.96 310.0 16.65 0.053
Longitud del antebrazo (mm) 334 221.84 221.0 13.75 0.062
Longitud de la mano (mm) 334 188.86 188.5 10.14 0.054
Longitud miembro inferior (mm) 339 901.67 896.0 45.20 0.050
Longitud del muslo (mm) 339 475.15 475.0 26.05 0.055
Longitud de la pierna (mm) 337 350.17 348.0 23.14 0.066
Longitud del pie (mm) 337 247.58 246.0 12.48 0.050

Preguntas de investigación

  1. ¿Existe correlación lineal de las magnitudes corporales consideradas con la estatura?

  2. ¿Es adecuado ajustar modelos de regresión para estimar la estatura a partir de algunas variables consideradas?

Resultados

Comenzaremos por indagar la correlación entre las estatura y las magnitudes consideradas mediante gráficas de dispersión y el cálculo del coeficiente de correlación.

Ahora generaremos un cuadro con las correlaciones de la estatura con cada una de las magnitudes encontradas.

Cuadro 2. Correlación de Pearson entre la Estatura y las magnitudes corporales
Variable r de Pearson p-valor Sig.
Longitud miembro superior (mm) 0.840 5.02e-91 ***
Longitud del brazo (mm) 0.735 2.45e-58 ***
Longitud del antebrazo (mm) 0.611 1.40e-35 ***
Longitud de la mano (mm) 0.561 4.90e-29 ***
Longitud miembro inferior (mm) 0.899 6.83e-123
Longitud del muslo (mm) 0.776 2.02e-69 ***
Longitud de la pierna (mm) 0.803 3.60e-77 ***
Longitud del pie (mm) 0.702 2.78e-51 ***

En conjunto, los resultados muestran que:

Todas las magnitudes analizadas se correlacionan significativamente con la estatura, lo cual valida su uso antropométrico.

El miembro inferior, seguido del miembro superior, son las estructuras que mejor predicen la estatura.

Las correlaciones observadas son consistentes con la literatura de antropología física y forense, donde los huesos largos son los mejores estimadores de talla.

En un caso pericial, la elección de la magnitud dependerá del estado de preservación del cuerpo, pero estas correlaciones permiten contar con múltiples alternativas válidas para la reconstrucción de la estatura.

Estimación de la edad a partir de longitud de la extremidad inferior

Comenzaremos ilustrando la regresión lineal mediante el ajuste del modelo de la estatura en función de la extremidad inferior, lo cual lo presentamos en la gráfica 9.

La Gráfica 9 muestra la relación entre la estatura y la longitud de la extremidad inferior para la población juvenil del valle de Cholula. En ella se aprecia una correlación positiva fuerte, lo que significa que a mayor longitud de la extremidad inferior tiende a observarse una estatura mayor. Los puntos se distribuyen alrededor de la línea de regresión, lo que visualmente confirma un ajuste lineal adecuado.

Veamos el resumen del modelo ajustado:

## 
## Call:
## lm(formula = X11 ~ X18, data = Cholula)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -112.55  -16.67   -1.31   15.67  106.19 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 547.5466    28.2615   19.37   <2e-16 ***
## X18           1.1798     0.0313   37.69   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 26.01 on 337 degrees of freedom
## Multiple R-squared:  0.8082, Adjusted R-squared:  0.8077 
## F-statistic:  1420 on 1 and 337 DF,  p-value: < 2.2e-16

A partir de la gráfica presentada y el resumen del modelo se puede inferir lo siguiente:

Los coeficientes indican que por cada milímetro adicional en la longitud de la extremidad inferior, la estatura aumenta en promedio 1.18 mm.El intercepto (547.55 mm), aunque no tiene un significado antropométrico directo, es un componente matemático necesario para definir la recta que mejor ajusta los datos. La pendiente elevada y la dispersión relativamente baja alrededor de la línea confirman que la extremidad inferior es un predictor altamente confiable de la estatura.

Los resultados cuantitativos indican que la pendiente del modelo es significativamente diferente de cero, por lo cual la longitud del segmento inferior es significativa en el modelo estimado. También se que en conjunto, de acuerdo con la prueba F, el modelo resulta significativo. El coeficiente de determinación nos permite inferir que el modelo estimado explica el 81% de la variabilidad total de la estatura, lo cual nos indica la adecuado del modelo.

Desde la perspectiva de la antropología forense, esta relación resulta de gran utilidad, pues permite estimar la estatura de individuos en situaciones donde solo se recuperan el miembro inferior.

Veamos ahora algunas medidas y gráficas que permiten evaluar la pertinencia del modelo ajustado.

Para evaluar la validez del modelo de regresión lineal entre la estatura y la longitud de la extremidad inferior se analizaron los principales supuestos estadísticos mediante las gráficas de diagnóstico estándar: Residuals vs Fitted, Normal Q-Q, Scale-Location y Residuals vs Leverage. En conjunto, los resultados indican que el modelo presenta un comportamiento adecuado y que las estimaciones pueden considerarse confiables.

En primer lugar, el supuesto de linealidad se cumple satisfactoriamente. La gráfica Residuals vs Fitted muestra que los residuos se distribuyen de manera aproximadamente aleatoria alrededor de la línea horizontal, sin evidencias de patrones curvos o sistemáticos. Esto sugiere que la relación entre las variables mantiene una forma lineal y que el modelo capta adecuadamente su tendencia general.

Respecto al supuesto de normalidad de los residuos, el gráfico Q-Q Residuals exhibe una adecuada correspondencia entre los cuantiles teóricos y los observados. Aunque se identifican ligeras desviaciones en las colas, estas no representan una violación sustantiva del supuesto, especialmente considerando el tamaño de la muestra. La distribución residual puede considerarse aproximadamente normal.

En cuanto a la homocedasticidad, la gráfica Scale-Location muestra una leve variación en la dispersión de los residuos a lo largo de los valores ajustados. A pesar de ello, la tendencia general permanece relativamente estable, lo que sugiere que la varianza de los residuos es razonablemente constante.

Finalmente, la gráfica Residuals vs Leverage permitió identificar algunas observaciones con valores residuales elevados o con mayor influencia potencial. No obstante, ninguna de ellas supera los umbrales críticos establecidos por la distancia de Cook, por lo que no representan puntos que distorsionen de manera sustancial los coeficientes estimados. El modelo, por tanto, no se encuentra afectado por observaciones altamente influyentes.

En conjunto, los diagnósticos sugieren que el modelo cumple adecuadamente con los supuestos fundamentales de la regresión lineal. A pesar de ligeras desviaciones en normalidad y homocedasticidad, éstas no comprometen la validez de los resultados. Así, las estimaciones obtenidas son buenas y permiten sostener inferencias de manera confiable.

A continación realizaremos pruebas formales para analizar el cumplimiento de los supuestos del modelo ajustado.

## 
## --- Prueba de Shapiro–Wilk (normalidad) ---
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.98185, p-value = 0.0002814
## 
## --- Prueba de Breusch–Pagan ---
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 0.46976, df = 1, p-value = 0.4931
## 
## --- Prueba de Durbin–Watson (autocorrelación) ---
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.8769, p-value = 0.1248
## alternative hypothesis: true autocorrelation is greater than 0
## 
## --- Distancia de Cook (resumen) ---
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 8.000e-08 2.524e-04 9.496e-04 3.139e-03 2.696e-03 8.891e-02
## 
## Valores recomendados: 4/n para observaciones influyentes.
## Umbral = 0.01179941
## Observaciones influyentes: 5 30 96 161 194 224 230 250 253 254 269 273 278 308 310 334 335

Para evaluar la validez del modelo ajustado, se realizaron pruebas formales sobre los supuestos clásicos de regresión. En primer lugar, la prueba de Shapiro–Wilk indicó una desviación estadísticamente significativa respecto a la normalidad de los residuos (p < 0.001), lo que sugiere que éstos no siguen una distribución normal; no obstante, este resultado es común en muestras grandes y no necesariamente compromete la consistencia de los estimadores, aunque puede afectar las inferencias basadas en ellos. En cuanto a la homocedasticidad, la prueba de Breusch–Pagan no mostró evidencia de heterocedasticidad (p = 0.493), lo que respalda la suposición de varianza constante de los errores. Por su parte, el estadístico de Durbin–Watson tampoco detectó autocorrelación positiva entre los residuos (p = 0.125), por lo que el supuesto de independencia se considera satisfecho. Finalmente, el análisis de la distancia de Cook reveló la presencia de varias observaciones influyentes que superan el umbral convencional de 4/n; si bien estos casos no invalidan el modelo, requieren una revisión detallada para determinar si corresponden a valores extremos legítimos o errores en los datos.

En conjunto, los resultados muestran que el modelo cumple adecuadamente los supuestos de homocedasticidad e independencia, aunque la falta de normalidad y la existencia de observaciones influyentes deben ser consideradas en la interpretación de los resultados.

Conclusiones generales del modelo ajustado

En términos generales, el modelo de regresión lineal que relaciona la estatura con la longitud de la extremidad inferior muestra un desempeño sólido y estadísticamente robusto. La alta correlación entre ambas variables, junto con un coeficiente de determinación superior al 80%, indica que la longitud del miembro inferior es un predictor altamente confiable de la estatura en la población juvenil del valle de Cholula. La pendiente significativa confirma la validez antropométrica del modelo, mientras que las pruebas de significancia global demuestran que la relación estimada no es producto del azar. Por otro lado, el análisis gráfico y formal de los supuestos revela un cumplimiento adecuado de la linealidad, homocedasticidad e independencia de los residuos, lo que respalda la estabilidad de los coeficientes. Si bien se identifican desviaciones de la normalidad y la presencia de algunas observaciones influyentes, estas no comprometen de manera sustantiva la validez del modelo, aunque sí sugieren la necesidad de un examen detallado en estudios posteriores. En conjunto, el modelo puede considerarse pertinente y suficientemente robusto para fines de estimación antropométrica, particularmente en contextos forenses donde la reconstrucción de la estatura a partir de restos óseos es una tarea fundamental.

Tareas pendientes para la estimación de la estatura con las demás variables

A partir del análisis detallado realizado para el modelo que vincula la estatura con la longitud del miembro inferior, es necesario replicar de manera sistemática el mismo procedimiento para cada una de las variables restantes con potencial predictivo. En primer lugar, se requiere ajustar un modelo de regresión lineal simple para cada segmento corporal —miembro superior, brazo, antebrazo, mano, muslo, pierna y pie— con el fin de obtener los coeficientes estimados, los errores estándar, la significancia estadística y el coeficiente de determinación. Posteriormente, será indispensable elaborar las gráficas diagnósticas estándar (Residuals vs Fitted, Normal Q–Q, Scale–Location y Residuals vs Leverage) para evaluar visualmente el cumplimiento de los supuestos de linealidad, normalidad, homocedasticidad e influencia. De manera complementaria, deberán aplicarse pruebas formales para verificar cada supuesto, incluyendo Shapiro–Wilk para normalidad, Breusch–Pagan para heterocedasticidad, Durbin–Watson para autocorrelación y el cálculo de la distancia de Cook para identificar observaciones influyentes. Finalmente, con base en los resultados obtenidos en cada modelo, será necesario comparar su capacidad predictiva, precisión y pertinencia forense con el fin de determinar cuáles segmentos anatómicos ofrecen mejores estimaciones de la estatura y bajo qué condiciones pueden ser aplicados en contextos reales de identificación humana.