El estudio del suelo es fundamental en cualquier proyecto de construcción, ya que conocer sus características permite prevenir fallos en obras civiles. En este informe se utilizará el conjunto de datos Soils, disponible en el paquete carData de R, el cual proporciona información sobre variables como la densidad, el pH y la presencia de minerales, con el objetivo de examinar las relaciones entre ellas.
Se emplearán modelos de regresión lineal, tanto simple como múltiple, para estimar el comportamiento del suelo y determinar cuál modelo estadístico ofrece mejores resultados. El análisis comenzará con una exploración visual y cuantitativa de los datos, utilizando gráficos y medidas de correlación, para luego proceder al ajuste y evaluación de los modelos.
Este trabajo no solo permite afianzar los conocimientos en estadística aplicada, sino que también evidencia su importancia práctica dentro de la ingeniería civil, facilitando la toma de decisiones técnicas basadas en datos reales.
El conjunto de datos Soils, incluido en el paquete carData de R, proporciona información sobre características físico-químicas de muestras de suelo, las cuales son esenciales para su análisis y aplicación en el ámbito de la ingeniería civil.
Soils (carData) y su importancia
en ingeniería civilEl conjunto de datos Soils, disponible en el paquete carData de R, reúne información detallada sobre diversas propiedades físico-químicas de muestras de suelo. Estas características son de gran importancia en el análisis y desarrollo de proyectos relacionados con la ingeniería civil, ya que influyen directamente en el comportamiento mecánico del terreno y en la toma de decisiones para el diseño y construcción de infraestructuras. A continuación, se presenta una descripción de cada una de las variables incluidas en este conjunto de datos, con el fin de facilitar su comprensión y análisis posterior.
A continuación, se describen las variables más relevantes del dataset Soils, destacando tanto su definición técnica como su relevancia en contextos aplicados de la ingeniería civil:
pH
Representa el nivel de acidez o alcalinidad del suelo, medido en una escala que va de 0 a 14. Un valor de 7 indica neutralidad, mientras que cifras menores corresponden a suelos ácidos y valores mayores a suelos alcalinos.
Relevancia en ingeniería civil:
Un pH ácido (por debajo de 5) puede acelerar procesos de corrosión en estructuras metálicas subterráneas o enterradas, comprometiendo su durabilidad.
Un pH elevado (superior a 8.5) puede afectar negativamente la resistencia y vida útil de materiales como el concreto, reduciendo su eficacia estructural.
Densidad (g/cm³)
Se refiere a la densidad aparente del suelo, es decir, la relación entre la masa del suelo seco y su volumen total, incluyendo tanto partículas sólidas como vacíos.
Relevancia en ingeniería civil:
Suelos con alta densidad (mayor a 1.6 g/cm³) suelen presentar buena capacidad de soporte, siendo favorables para cimentaciones y estructuras pesadas.
Una densidad baja puede indicar la necesidad de procesos de compactación adicionales para asegurar la estabilidad del terreno antes de iniciar una obra.
Porosidad(%)
Expresa el porcentaje del volumen total del suelo que está ocupado por poros o espacios vacíos. Esta propiedad influye en la circulación de aire y agua dentro del suelo.
Relevancia en ingeniería civil:
Una porosidad elevada implica mayor permeabilidad, lo que puede favorecer el drenaje pero también aumentar el riesgo de asentamientos o pérdida de capacidad portante.
Por el contrario, una baja porosidad suele asociarse con suelos más estables y compactos, ideales para soportar estructuras superficiales como pavimentos y edificaciones.
| Variable | Rango | Uso |
|---|---|---|
| Arcilla | <0.002 mm | Cohesión pero expansiva |
| Limo | 0.002-0.05 mm | Baja capacidad portante |
| Arena | 0.05-2 mm | Buena estabilidad |
Conductividad (dS/m):
- Indica salinidad, afecta corrosión de aceros
Carbono (%):
- Alto contenido → Suelos orgánicos menos estables
Minerales:
- Presencia de arcillas expansivas (ej. montmorillonita) requiere
tratamientos especiales
Densidad + Arcilla para elegir entre zapatas o
pilotesPorosidad +
Conductividad predicen riesgo de erosiónArena >50%) son ideales para bases## Group Contour Depth Gp Block pH N Dens P Ca Mg K Na Conduc
## 1 1 Top 0-10 T0 1 5.40 0.188 0.92 215 16.35 7.65 0.72 1.14 1.09
## 2 1 Top 0-10 T0 2 5.65 0.165 1.04 208 12.25 5.15 0.71 0.94 1.35
## 3 1 Top 0-10 T0 3 5.14 0.260 0.95 300 13.02 5.68 0.68 0.60 1.41
## 4 1 Top 0-10 T0 4 5.14 0.169 1.10 248 11.92 7.88 1.09 1.01 1.64
## 5 2 Top 10-30 T1 1 5.14 0.164 1.12 174 14.17 8.12 0.70 2.17 1.85
## 6 2 Top 10-30 T1 2 5.10 0.094 1.22 129 8.55 6.92 0.81 2.67 3.18
## Group Contour Depth Gp Block pH
## 1 : 4 Depression:16 0-10 :12 D0 : 4 1:12 Min. :3.740
## 2 : 4 Slope :16 10-30:12 D1 : 4 2:12 1st Qu.:4.058
## 3 : 4 Top :16 30-60:12 D3 : 4 3:12 Median :4.545
## 4 : 4 60-90:12 D6 : 4 4:12 Mean :4.669
## 5 : 4 S0 : 4 3rd Qu.:5.140
## 6 : 4 S1 : 4 Max. :6.670
## (Other):24 (Other):24
## N Dens P Ca
## Min. :0.03000 Min. :0.780 Min. : 79.0 Min. : 3.820
## 1st Qu.:0.05075 1st Qu.:1.127 1st Qu.:108.8 1st Qu.: 5.040
## Median :0.08450 Median :1.400 Median :131.0 Median : 7.305
## Mean :0.10194 Mean :1.316 Mean :166.2 Mean : 8.029
## 3rd Qu.:0.12925 3rd Qu.:1.502 3rd Qu.:214.2 3rd Qu.: 9.735
## Max. :0.29800 Max. :1.600 Max. :445.0 Max. :16.350
##
## Mg K Na Conduc
## Min. : 5.150 Min. :0.1400 Min. : 0.600 Min. : 0.670
## 1st Qu.: 7.537 1st Qu.:0.2750 1st Qu.: 2.545 1st Qu.: 2.790
## Median : 8.515 Median :0.4250 Median : 5.520 Median : 6.635
## Mean : 8.465 Mean :0.4662 Mean : 5.600 Mean : 6.589
## 3rd Qu.: 9.648 3rd Qu.:0.6425 3rd Qu.: 8.355 3rd Qu.: 9.852
## Max. :10.960 Max. :1.0900 Max. :11.040 Max. :13.320
##
| Parámetro | Valor | Implicación |
|---|---|---|
| Densidad máxima | 0.75 | Concentración de muestras en rango medio |
| Asimetría | Moderada (cola izquierda) | Posible presencia de suelos ácidos |
| Rango óptimo | 6.0-8.0 | Condiciones ideales para construcción |
| Rango problemático | <5.5 (ácido) o >8.5 (alcalino) | Riesgo de corrosión o deterioro |
| Característica | Valor | Significado |
|---|---|---|
| Densidad máxima | 0.12 | Menor concentración que el pH |
| Forma | Plana con cola derecha | Presencia de valores atípicos salinos |
| Nivel seguro | <2 dS/m | Suelos no salinos |
| Nivel crítico | >4 dS/m | Riesgo de deterioro acelerado |
| Variable | Distribución | Valor.crítico | Acción.recomendada | Materiales.afectados |
|---|---|---|---|---|
| pH | Asimétrica con cola izquierda | pH <5.5 | Encalado | Estructuras metálicas |
| Conductividad | Plana con cola derecha | Conduc >4 dS/m | Sistemas de drenaje | Concreto y acero |
El control del pH es esencial en proyectos de ingeniería civil, ya que valores extremos pueden comprometer tanto los materiales utilizados como la estabilidad estructural del terreno. A continuación, se presentan algunas estrategias comúnmente aplicadas para corregir o mitigar los efectos de suelos con pH no óptimo:
Neutralización con carbonato de calcio (CaCO₃): En suelos con tendencia ácida, la adición de cal agrícola (principalmente CaCO₃) permite elevar el pH hacia niveles más neutros, reduciendo así la agresividad del medio hacia materiales metálicos y mejorando la disponibilidad de nutrientes si el suelo es destinado a usos combinados con vegetación.
Incorporación de aditivos anticorrosivos en mezclas de concreto: Cuando se prevé la exposición del concreto a suelos altamente ácidos o alcalinos, se recomienda el uso de aditivos que mejoren la resistencia química del material, aumentando su durabilidad y disminuyendo la velocidad de degradación.
Instalación de barreras geotextiles: En casos donde no es viable modificar las condiciones del suelo, se puede optar por la colocación de geotextiles como elementos de separación y protección. Estos materiales actúan como barreras físicas que aíslan estructuras sensibles del contacto directo con suelos agresivos, prolongando su vida útil.
Para manejo de salinidad:
## - Lavado de sales con sistemas de drenaje (requiere pendiente >2%)
##
## - Uso de cementos tipo HS (alta resistencia a sulfatos)
##
## - Recubrimientos epóxicos para estructuras metálicas
Medidas complementarias: - Muestreo adicional cada 6 meses en zonas críticas - Pruebas de velocidad de corrosión (ASTM G1) - Monitorización continua con sensores de pH/salinidad
Relación pH-Conductividad en suelos
| Variable1 | Variable2 | Correlación | Interpretación |
|---|---|---|---|
| pH | Conduc | -0.7648104 | Relación significativa entre variables |
| Dens | Conduc | 0.7625652 | Relación significativa entre variables |
| pH | Ca | 0.8086293 | El calcio disminuye en suelos alcalinos |
| Dens | Ca | -0.7914376 | Relación significativa entre variables |
| Conduc | Ca | -0.8320952 | Relación significativa entre variables |
| Situación | Solución | Materiales |
|---|---|---|
| pH bajo (<5.5) | Encalado con CaCO3 (2-5 ton/ha) | Cal agrícola, yeso |
| Alta conductividad (>4 dS/m) | Drenaje y lavado de sales | Geodrenes, membranas HDPE |
| Alta densidad (>1.6 g/cm³) | Aireación mecánica + materia orgánica | Turba, compost, vermiculita |
Análisis de Correlaciones Significativas A partir del análisis estadístico de correlación entre variables fisicoquímicas del suelo contenidas en el dataset Soils, se identificaron relaciones relevantes desde el punto de vista ingenieril y agronómico. A continuación, se describen las más destacadas:
pH vs Conductividad eléctrica (r = -0.76) Se observa una correlación negativa fuerte entre el pH del suelo y su conductividad eléctrica. Esto indica que a medida que el pH aumenta (ambiente más alcalino), disminuye la presencia de sales solubles.
Implicación práctica: Los suelos alcalinos tienden a ser menos salinos, lo cual puede influir en la selección de materiales y en la planificación del drenaje.
Densidad vs Conductividad eléctrica (r = 0.76) Existe una correlación positiva considerable entre la densidad aparente del suelo y su conductividad.
Interpretación: Suelos más compactos pueden favorecer la acumulación de sales en las capas superficiales, posiblemente por una menor capacidad de lixiviación.
pH vs Calcio (r = 0.81) Se identificó una relación directa significativa entre el pH y la concentración de calcio en el suelo.
Explicación técnica: En ambientes alcalinos, el calcio se vuelve más móvil y disponible, lo que puede ser efecto de prácticas de encalado con carbonato de calcio, más que una condición natural del suelo.
Densidad vs Calcio (r = -0.79) Esta correlación negativa sugiere que los suelos con menor densidad presentan mayores niveles de calcio.
Posible causa: El calcio podría encontrarse asociado a suelos con estructuras porosas, como los agregados arcillosos, que facilitan su retención y movilidad.
Conductividad eléctrica vs Calcio (r = -0.83) Se establece una fuerte relación inversa entre la salinidad del suelo y su contenido de calcio.
Importancia agronómica: El calcio tiende a desplazar al sodio en el complejo de intercambio catiónico, reduciendo la toxicidad por salinidad y mejorando la estructura del suelo.
Recomendaciones Técnicas Priorizadas A partir de los resultados obtenidos en el análisis, se proponen las siguientes acciones técnicas para el manejo de suelos con características problemáticas:
Para suelos ácidos (pH < 5.5):
Acción correctiva inmediata: Aplicar entre 3 y 4 toneladas por hectárea de carbonato de calcio (CaCO₃).
Beneficio esperado: Esta enmienda neutraliza la acidez del suelo y mejora la disponibilidad de nutrientes esenciales.
Recomendación avanzada: Se sugiere combinar cal agrícola con yeso agrícola (CaSO₄·2H₂O) para suministrar calcio en forma más soluble y mejorar la estructura del suelo.
Instalar drenes subsuperficiales cada 10m (pendiente 1-2%).
Aplicar riegos de lavado (20% por encima de capacidad de campo).
Materiales óptimos: Tubos de drenaje envueltos en geotextil no tejido.
##
## Call:
## lm(formula = Conduc ~ Na, data = Soils)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.29260 -0.70832 0.04578 0.43814 2.13464
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.01291 0.27008 -0.048 0.962
## Na 1.17892 0.04170 28.271 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9403 on 46 degrees of freedom
## Multiple R-squared: 0.9456, Adjusted R-squared: 0.9444
## F-statistic: 799.3 on 1 and 46 DF, p-value: < 2.2e-16
## [1] "Group" "Contour" "Depth" "Gp" "Block" "pH" "N"
## [8] "Dens" "P" "Ca" "Mg" "K" "Na" "Conduc"
## pH Dens Conduc
## Min. :3.740 Min. :0.780 Min. : 0.670
## 1st Qu.:4.058 1st Qu.:1.127 1st Qu.: 2.790
## Median :4.545 Median :1.400 Median : 6.635
## Mean :4.669 Mean :1.316 Mean : 6.589
## 3rd Qu.:5.140 3rd Qu.:1.502 3rd Qu.: 9.852
## Max. :6.670 Max. :1.600 Max. :13.320
Conduc = -0.01291 + 1.17892*Na
Intercepto (-0.01291): Cuando Na = 0, el modelo predice una conductividad de -0.01291 dS/m (prácticamente 0, no significativamente diferente de cero)
Pendiente (1.17892): Por cada aumento de 1 unidad en Na, la conductividad (Conduc) aumenta en 1.17892 dS/m
Na (p < 2e-16): Extremadamente significativo (***)
El valor-p es mucho menor que 0.001, confirmando que Na es un excelente predictor de Conduc
Intercepto (p = 0.962): No significativo (p > 0.05)
Podríamos considerar un modelo sin intercepto si tiene sentido teórico
R² múltiple = 0.9456: El 94.56% de la variabilidad en Conduc es explicada por Na
R² ajustado = 0.9444: Similar al R² múltiple, confirmando que el modelo no está sobreajustado
***Error estándar residual = 0.9403: La desviación típica de los residuos es 0.9403 dS/mv
Rango de residuos: [-2.29, 2.13]
Mediana cerca de 0 (0.04578): Sugiere simetría en la distribución de residuos
1Q (-0.708) y 3Q (0.438): 50% central de residuos se encuentra entre -0.71 y 0.44
F-statistic = 799.3 (p < 2.2e-16): El modelo es altamente significativo en su conjunto
Implicaciones Prácticas Relación fuerte positiva: Na explica casi perfectamente (94.6%) la conductividad
Aplicación predictiva: P ara un suelo con Na = 5: Conduc = -0.01291 + 1.17892*5 ≈ 5.88 dS/m Control de salinidad: Reducir Na disminuirá proporcionalmente la conductividad
## Start: AIC=-23.77
## Conduc ~ pH + N + Dens + P + Ca + Mg + K + Na
##
## Df Sum of Sq RSS AIC
## - P 1 0.040 20.145 -25.675
## - Ca 1 0.132 20.237 -25.458
## <none> 20.105 -23.771
## - Dens 1 0.900 21.005 -23.668
## - N 1 0.988 21.093 -23.469
## - Mg 1 1.364 21.469 -22.619
## - K 1 3.787 23.892 -17.487
## - pH 1 4.164 24.269 -16.736
## - Na 1 112.490 132.595 64.773
##
## Step: AIC=-25.68
## Conduc ~ pH + N + Dens + Ca + Mg + K + Na
##
## Df Sum of Sq RSS AIC
## - Ca 1 0.100 20.245 -27.437
## <none> 20.145 -25.675
## - N 1 1.037 21.183 -25.265
## - Dens 1 1.122 21.267 -25.073
## - Mg 1 1.393 21.539 -24.465
## + P 1 0.040 20.105 -23.771
## - K 1 3.749 23.895 -19.483
## - pH 1 4.590 24.736 -17.822
## - Na 1 124.693 144.838 67.012
##
## Step: AIC=-27.44
## Conduc ~ pH + N + Dens + Mg + K + Na
##
## Df Sum of Sq RSS AIC
## <none> 20.245 -27.437
## - N 1 0.953 21.199 -27.229
## - Dens 1 1.266 21.511 -26.526
## - Mg 1 1.551 21.797 -25.894
## + Ca 1 0.100 20.145 -25.675
## + P 1 0.009 20.237 -25.458
## - K 1 4.249 24.495 -20.292
## - pH 1 8.638 28.883 -12.382
## - Na 1 125.443 145.688 65.293
##
## Call:
## lm(formula = Conduc ~ pH + N + Dens + Mg + K + Na, data = Soils)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.20385 -0.52459 -0.00915 0.40134 1.50754
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.04020 2.05533 2.452 0.018542 *
## pH -0.91000 0.21758 -4.182 0.000148 ***
## N 4.93184 3.54947 1.389 0.172194
## Dens 1.53105 0.95619 1.601 0.117012
## Mg -0.16353 0.09226 -1.772 0.083748 .
## K -2.00285 0.68274 -2.934 0.005465 **
## Na 0.99974 0.06272 15.939 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7027 on 41 degrees of freedom
## Multiple R-squared: 0.9729, Adjusted R-squared: 0.9689
## F-statistic: 245.4 on 6 and 41 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = Conduc ~ pH + N + Dens + Mg + K + Na, data = Soils)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.20385 -0.52459 -0.00915 0.40134 1.50754
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.04020 2.05533 2.452 0.018542 *
## pH -0.91000 0.21758 -4.182 0.000148 ***
## N 4.93184 3.54947 1.389 0.172194
## Dens 1.53105 0.95619 1.601 0.117012
## Mg -0.16353 0.09226 -1.772 0.083748 .
## K -2.00285 0.68274 -2.934 0.005465 **
## Na 0.99974 0.06272 15.939 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7027 on 41 degrees of freedom
## Multiple R-squared: 0.9729, Adjusted R-squared: 0.9689
## F-statistic: 245.4 on 6 and 41 DF, p-value: < 2.2e-16
El modelo final incluye las siguientes variables predictoras: pH, N, Dens, Mg, K y Na. El valor de R-cuadrado ajustado es de”, round(summary(modelo_final)\(adj.r.squared, 4), ", lo que indica que el modelo explica aproximadamente el", round(summary(modelo_final)\)adj.r.squared * 100, 2), “% de la variabilidad en la conductividad eléctrica del suelo.
Entre las variables más significativas se encuentran: (“- Na (p < 0.001): tiene un efecto positivo fuerte sobre la conductividad.”- pH (p < 0.001): tiene un efecto negativo significativo. “- K (p < 0.01): también tiene un efecto negativo relevante. Las variables N, Dens y Mg tienen menor significancia estadística, pero fueron retenidas en el modelo por su aporte conjunto al ajuste.
El modelo final determinado mediante la función stepAIC() considera como variable dependiente la conductividad eléctrica del suelo (Conduc) y selecciona como predictores cuantitativos a: pH, N, Dens, Mg, K y Na. Estas variables fueron retenidas debido a su capacidad combinada para explicar de forma eficiente la variabilidad en la conductividad, minimizando el criterio de información de Akaike (AIC).
Durante el proceso de selección, las variables P y Ca fueron descartadas por no aportar mejoras significativas al ajuste del modelo, lo que indica que su contribución predictiva no es relevante una vez consideradas las demás variables explicativas.
Interpretación del modelo: Na presenta una relación positiva muy fuerte con la conductividad eléctrica, siendo altamente significativa (p < 0.001), lo que sugiere que suelos con mayor contenido de sodio tienden a ser más salinos.
pH muestra una influencia negativa significativa (p < 0.001), lo cual implica que a medida que el suelo es más ácido, la conductividad aumenta, probablemente por una mayor solubilidad de sales en ambientes ácidos.
K también tiene un efecto negativo y significativo (p < 0.01), aunque de menor magnitud.
Mg, Dens y N, si bien no resultan altamente significativas de forma individual, contribuyen al modelo como parte del conjunto predictivo.
Desempeño del modelo: El R-cuadrado ajustado obtenido es de aproximadamente 0.969, lo que significa que el modelo logra explicar cerca del 97% de la variabilidad en la conductividad eléctrica del suelo. Este nivel de ajuste sugiere un modelo altamente confiable y útil desde el punto de vista predictivo.
Aplicación en contextos ingenieriles: Desde una perspectiva aplicada, el modelo representa una herramienta valiosa tanto en ingeniería civil como en agronomía, ya que permite anticipar condiciones de salinidad a partir de variables fácilmente medibles. Esto facilita el diagnóstico de calidad del suelo, el diseño de tratamientos correctivos, y la toma de decisiones más informadas en obras o manejos agrícolas donde la composición química del terreno es un factor crítico.
Mediante el análisis de regresión lineal múltiple aplicado al dataset Soils, se identificó que la conductividad eléctrica del suelo está significativamente condicionada por variables como la concentración de sodio (Na), el nivel de acidez (pH) y el contenido de potasio (K). Estas asociaciones reflejan cómo los atributos físico-químicos del suelo se combinan para influir en su capacidad de conducción de corriente eléctrica, revelando patrones útiles para la caracterización del terreno.
La regresión múltiple se consolida así como una herramienta fundamental en la toma de decisiones dentro de la ingeniería civil y la agronomía, al permitir modelar el efecto conjunto de múltiples variables explicativas sobre un fenómeno específico. En este caso, el modelo permite estimar la conductividad del suelo a partir de mediciones relativamente sencillas, lo cual tiene implicaciones directas para el diseño de sistemas de riego, la planificación de fertilización o la evaluación de estabilidad en terrenos constructivos.
Por otra parte, la incorporación del criterio de información de Akaike (AIC) en el proceso de selección de variables aporta una ventaja frente al uso exclusivo del coeficiente de determinación (R²). El AIC no solo evalúa la calidad del ajuste del modelo, sino que también penaliza la complejidad innecesaria, promoviendo modelos más simples pero eficientes, con mejor capacidad de generalización y menor riesgo de sobreajuste.
En síntesis, la implementación de un modelo de regresión múltiple junto con la selección de variables por medio de stepAIC() permitió identificar un conjunto óptimo de predictores con los que se logra explicar, con elevada precisión, la variabilidad en la conductividad eléctrica del suelo. Esto subraya la relevancia de aplicar metodologías estadísticas apropiadas para la construcción de modelos predictivos sólidos, con aplicación directa en entornos técnicos y profesionales.