Resistencia a la Compresión del Concreto:

El conjunto de datos Concrete Compressive Strength se centra en la predicción de la resistencia a la compresión del concreto, una propiedad fundamental en la ingeniería civil. Esta resistencia depende de varios factores, incluyendo la composición de los materiales y el tiempo de curado.

Este conjunto de datos es ideal para aplicar técnicas de regresión y análisis predictivo, ya que busca modelar una variable continua (resistencia a la compresión) en función de múltiples variables independientes.

La resistencia a la compresión del concreto es una de las propiedades más importantes en el diseño estructural, ya que determina la capacidad del material para soportar cargas sin fallar. Esta resistencia no depende solo del tipo y cantidad de cemento utilizado, sino también de otros componentes como escoria de alto horno, ceniza volante, agua, aditivos (superplastificantes), y agregados finos y gruesos. Además, el tiempo de curado (edad del concreto) tiene un impacto crucial, ya que la resistencia aumenta con el tiempo.

Este conjunto de datos fue desarrollado a partir de experimentos de laboratorio reales y busca modelar la resistencia final del concreto como una función de su composición química y tiempo de curado. Su uso es común en estudios de:

Una de las características valiosas de este conjunto de datos es que contiene solo variables numéricas, lo cual permite aplicar directamente modelos de regresión lineal, regresión no lineal, árboles de decisión, redes neuronales, y otros enfoques cuantitativos.

Este dataset también es un excelente ejemplo para demostrar cómo un fenómeno físico y químico puede ser modelado estadísticamente usando herramientas matemáticas, lo cual es fundamental en áreas como la ingeniería civil, ciencia de materiales y análisis predictivo.

Datos:

El conjunto de datos contiene 1.030 observaciones y 9 variables. Las primeras ocho son variables independientes que representan las cantidades de diferentes componentes utilizados en la mezcla de concreto, y la última es la variable dependiente que representa la resistencia a la compresión del concreto.

A continuación, se detallan las variables:

  1. Cement (kg/m³): Cantidad de cemento en la mezcla.

  2. Blast Furnace Slag (kg/m³): Cantidad de escoria de alto horno

  3. Fly Ash (kg/m³): Cantidad de ceniza volante.

  4. Water (kg/m³): Cantidad de agua.

  5. Superplasticizer (kg/m³): Cantidad de superplastificante.

  6. Coarse Aggregate (kg/m³): Cantidad de agregado grueso.

  7. Fine Aggregate (kg/m³): Cantidad de agregado fino.

  8. Age (days): Edad del concreto en días.

  9. Concrete Compressive Strength (MPa): Resistencia a la compresión del concreto.

Tipos de variables:

  • Variables Independientes (X): Variables numéricas continuas.

  • Variable Dependiente (Y): Variable numérica continua.

## [1] 1030    9
## tibble [1,030 × 9] (S3: tbl_df/tbl/data.frame)
##  $ Cement (component 1)(kg in a m^3 mixture)            : num [1:1030] 540 540 332 332 199 ...
##  $ Blast Furnace Slag (component 2)(kg in a m^3 mixture): num [1:1030] 0 0 142 142 132 ...
##  $ Fly Ash (component 3)(kg in a m^3 mixture)           : num [1:1030] 0 0 0 0 0 0 0 0 0 0 ...
##  $ Water  (component 4)(kg in a m^3 mixture)            : num [1:1030] 162 162 228 228 192 228 228 228 228 228 ...
##  $ Superplasticizer (component 5)(kg in a m^3 mixture)  : num [1:1030] 2.5 2.5 0 0 0 0 0 0 0 0 ...
##  $ Coarse Aggregate  (component 6)(kg in a m^3 mixture) : num [1:1030] 1040 1055 932 932 978 ...
##  $ Fine Aggregate (component 7)(kg in a m^3 mixture)    : num [1:1030] 676 676 594 594 826 ...
##  $ Age (day)                                            : num [1:1030] 28 28 270 365 360 90 365 28 28 28 ...
##  $ Concrete compressive strength(MPa, megapascals)      : num [1:1030] 80 61.9 40.3 41.1 44.3 ...
##  Cement (component 1)(kg in a m^3 mixture)
##  Min.   :102.0                            
##  1st Qu.:192.4                            
##  Median :272.9                            
##  Mean   :281.2                            
##  3rd Qu.:350.0                            
##  Max.   :540.0                            
##  Blast Furnace Slag (component 2)(kg in a m^3 mixture)
##  Min.   :  0.0                                        
##  1st Qu.:  0.0                                        
##  Median : 22.0                                        
##  Mean   : 73.9                                        
##  3rd Qu.:142.9                                        
##  Max.   :359.4                                        
##  Fly Ash (component 3)(kg in a m^3 mixture)
##  Min.   :  0.00                            
##  1st Qu.:  0.00                            
##  Median :  0.00                            
##  Mean   : 54.19                            
##  3rd Qu.:118.27                            
##  Max.   :200.10                            
##  Water  (component 4)(kg in a m^3 mixture)
##  Min.   :121.8                            
##  1st Qu.:164.9                            
##  Median :185.0                            
##  Mean   :181.6                            
##  3rd Qu.:192.0                            
##  Max.   :247.0                            
##  Superplasticizer (component 5)(kg in a m^3 mixture)
##  Min.   : 0.000                                     
##  1st Qu.: 0.000                                     
##  Median : 6.350                                     
##  Mean   : 6.203                                     
##  3rd Qu.:10.160                                     
##  Max.   :32.200                                     
##  Coarse Aggregate  (component 6)(kg in a m^3 mixture)
##  Min.   : 801.0                                      
##  1st Qu.: 932.0                                      
##  Median : 968.0                                      
##  Mean   : 972.9                                      
##  3rd Qu.:1029.4                                      
##  Max.   :1145.0                                      
##  Fine Aggregate (component 7)(kg in a m^3 mixture)   Age (day)     
##  Min.   :594.0                                     Min.   :  1.00  
##  1st Qu.:731.0                                     1st Qu.:  7.00  
##  Median :779.5                                     Median : 28.00  
##  Mean   :773.6                                     Mean   : 45.66  
##  3rd Qu.:824.0                                     3rd Qu.: 56.00  
##  Max.   :992.6                                     Max.   :365.00  
##  Concrete compressive strength(MPa, megapascals)
##  Min.   : 2.332                                 
##  1st Qu.:23.707                                 
##  Median :34.443                                 
##  Mean   :35.818                                 
##  3rd Qu.:46.136                                 
##  Max.   :82.599
## # A tibble: 6 × 9
##   Cement (component 1)(kg in a m…¹ Blast Furnace Slag (…² Fly Ash (component 3…³
##                              <dbl>                  <dbl>                  <dbl>
## 1                             540                      0                       0
## 2                             540                      0                       0
## 3                             332.                   142.                      0
## 4                             332.                   142.                      0
## 5                             199.                   132.                      0
## 6                             266                    114                       0
## # ℹ abbreviated names: ¹​`Cement (component 1)(kg in a m^3 mixture)`,
## #   ²​`Blast Furnace Slag (component 2)(kg in a m^3 mixture)`,
## #   ³​`Fly Ash (component 3)(kg in a m^3 mixture)`
## # ℹ 6 more variables: `Water  (component 4)(kg in a m^3 mixture)` <dbl>,
## #   `Superplasticizer (component 5)(kg in a m^3 mixture)` <dbl>,
## #   `Coarse Aggregate  (component 6)(kg in a m^3 mixture)` <dbl>,
## #   `Fine Aggregate (component 7)(kg in a m^3 mixture)` <dbl>, …

Problema estadístico:

En el campo de la ingeniería uno de los desafíos más importantes es optimizar la mezcla del concreto para obtener la mayor resistencia posible sin incurrir en costos innecesarios. La resistencia a la compresión del concreto es una medida crítica de su desempeño estructural y durabilidad, y depende de múltiples factores: proporciones de materiales (cemento, escoria, agua, agregados, aditivos), así como del tiempo de curado.

Todos los integrantes del grupo somos estudiantes de ingeniería por lo que esta base de datos captó nuestra atención. Por lo tanto, hemos decidido optar por esta pregunta para nuestro problema estadístico:

¿Qué combinación de materiales y qué tiempo de curado maximizan la resistencia a la compresión del concreto?

Este problema tiene un enfoque claramente predictivo y analítico: se desea construir un modelo que relacione variables explicativas continuas con una variable respuesta también continua. Por lo tanto, se aplicarán técnicas de regresión estadística y análisis multivariable para:

  • Evaluar la influencia individual de cada componente de la mezcla en la resistencia.

  • Analizar el impacto del tiempo de curado (age) como variable de control.

  • Identificar posibles interacciones entre los componentes.

Este análisis permitirá optimizar la receta del concreto en función de la resistencia deseada, aportando valor tanto en términos económicos como de seguridad estructural. A través del modelo propuesto, se podrán realizar simulaciones y predicciones de resistencia para mezclas nuevas o alternativas, sin necesidad de ensayos físicos preliminares.

Metodología:

Dado que el objetivo es predecir y analizar la resistencia a la compresión del concreto a partir de ocho variables continuas, se optará por un enfoque de modelado estadístico mediante regresión múltiple. Este enfoque permite estimar el efecto de cada variable sobre la variable respuesta, controlar posibles relaciones espurias, e interpretar coeficientes como medidas de sensibilidad.

La metodología seguida incluirá las siguientes etapas:

1. Análisis exploratorio de los datos

  • Se evaluarán estadísticas descriptivas (mínimo, máximo, media, cuartiles) para cada variable.

  • Se identificarán posibles valores atípicos y correlaciones entre variables mediante matrices de dispersión y correlación.

  • Se verificarán relaciones no lineales entre predictores y la variable de respuesta (Concrete compressive strength).

2. Modelado mediante regresión lineal múltiple

  • Se ajustará un modelo de regresión lineal de la forma:

    Y= B0+B1X1+B2X2+…+B8X8 + e

donde Y es la resistencia a la compresión, y los Xi son las variables explicativas (componentes de la mezcla y edad)

  • Se evaluará la bondad de ajuste usando el R^2, el error cuadrático medio (RMSE) y análisis de residuos.

  • Se revisará la significancia de los coeficientes y la colinealidad entre variables (VIF).

3. Evaluación y diagnóstico del modelo

  • Se realizarán pruebas de supuestos (linealidad, normalidad de residuos, homocedasticidad).

    Si se detectan problemas, se considerarán transformaciones logarítmicas o modelos alternativos (e.g., regresión no lineal, random forest).

4. Validación del modelo

  • Se aplicará validación cruzada o división en conjunto de entrenamiento/prueba (por ejemplo, 70%/30%) para estimar el error de generalización.

  • Se visualizarán predicciones vs. valores reales.

Herramientas

  • Todo el análisis se desarrollará en R, utilizando paquetes como ggplot2, dplyr, caret, GGally, car, y stats.