Cargamos los paquetes

library(readxl)
library(tidyverse)
library(lmtest)
MAIZ_FERTILIZANTE <- read_csv("MAIZ_FERTILIZANTE.csv")
head(MAIZ_FERTILIZANTE)
## # A tibble: 6 × 2
##   DOSIS_N DIAMETRO_TALLO
##     <dbl>          <dbl>
## 1       0           8.37
## 2       0          11.5 
## 3       0          10.4 
## 4       0           7.74
## 5       0           9.13
## 6       0          12.5
glimpse(MAIZ_FERTILIZANTE)
## Rows: 50
## Columns: 2
## $ DOSIS_N        <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 50, 50, 50, 50, 50, 50, 5…
## $ DIAMETRO_TALLO <dbl> 8.371554, 11.496018, 10.424468, 7.740558, 9.132100, 12.…

Gráfico de dispersión

ggplot(MAIZ_FERTILIZANTE, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  labs(title = "Relación entre DIAMETRO DEL TALLO y DOSIS DE N") +
  theme_minimal()

Modelo Lineal

# Modelado
MODELO_lineal <- lm(DIAMETRO_TALLO ~ DOSIS_N, data = MAIZ_FERTILIZANTE)
summary(MODELO_lineal)
## 
## Call:
## lm(formula = DIAMETRO_TALLO ~ DOSIS_N, data = MAIZ_FERTILIZANTE)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.5481 -1.5960  0.2347  1.4300  4.3449 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.908075   0.598242  19.905  < 2e-16 ***
## DOSIS_N      0.041118   0.004885   8.418 5.18e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.442 on 48 degrees of freedom
## Multiple R-squared:  0.5962, Adjusted R-squared:  0.5878 
## F-statistic: 70.86 on 1 and 48 DF,  p-value: 5.182e-11
# Visualización
ggplot(MAIZ_FERTILIZANTE, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "blue") +
  labs(title = "Modelo lineal",
       x= "dosis N",
       y= "Diámetro tallo") +
  theme_minimal()

Ecuación del modelo de Regresión lineal

\[DIAMETRO\_TALLO = 11.91 + 0.041⋅DOSIS\]

Interpretación de los coeficientes:

- Intercepto (11.91 mm): cuando la dosis de nitrógeno es 0 kg/ha, el diámetro estimado del tallo es de aproximadamente 11.91 mm.

- Pendiente (0.041 mm/kg): por cada kg/ha adicional de nitrógeno, el diámetro del tallo aumenta en promedio 0.041 mm.

- R² ajustado: 0.5878. El modelo explica aproximadamente el 58.8% de la variabilidad del diámetro del tallo.

- p-valor: 5.18e-11. El efecto de la dosis de N es altamente significativo (***), lo que indica una fuerte relación entre la dosis aplicada y el crecimiento del tallo.

Modelo Cuadrático

# Modelado
MODELO_cuad <- lm(DIAMETRO_TALLO ~ DOSIS_N + I(DOSIS_N^2), data = MAIZ_FERTILIZANTE)
summary(MODELO_cuad)
## 
## Call:
## lm(formula = DIAMETRO_TALLO ~ DOSIS_N + I(DOSIS_N^2), data = MAIZ_FERTILIZANTE)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.2288 -1.1872 -0.1897  1.3319  3.3898 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   9.9979513  0.5467262  18.287  < 2e-16 ***
## DOSIS_N       0.1175233  0.0129528   9.073 6.71e-12 ***
## I(DOSIS_N^2) -0.0003820  0.0000621  -6.151 1.59e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.837 on 47 degrees of freedom
## Multiple R-squared:  0.7763, Adjusted R-squared:  0.7668 
## F-statistic: 81.54 on 2 and 47 DF,  p-value: 5.224e-16
# Visualización
ggplot(MAIZ_FERTILIZANTE, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  stat_smooth(method = "lm", formula = y ~ x + I(x^2), se = FALSE, color = "red") +
  labs(title = "Modelo cuadrático",
       x = "DOSIS N",
       y = "Diámetro TALLO") +
  theme_minimal()

Ecuación del modelo de Regresión Cuadrática

Ecuación del modelo:

\[ DIAMETRO\_TALLO = 9.99 + 0.12 \cdot DOSIS - 0.00038 \cdot DOSIS^2 \]

Interpretación de los coeficientes:

- Intercepto (9.998): es el diámetro estimado del tallo cuando la dosis de nitrógeno es 0 kg/ha.

- Coeficiente lineal (0.118): inicialmente, por cada kg/ha adicional de N, el diámetro aumenta 0.118 mm.

- Coeficiente cuadrático (-0.000382): este valor negativo indica que la relación es una parábola cóncava hacia abajo, es decir, el diámetro aumenta con la dosis hasta cierto punto, pero luego comienza a disminuir.

- R² ajustado: 0.7668

Comparación de modelos

Criterio de Información de Akaike (AIC)

AIC(MODELO_lineal, MODELO_cuad)
##               df      AIC
## MODELO_lineal  3 235.1473
## MODELO_cuad    4 207.6167

Criterio de Información Bayesiano (BIC)

BIC(MODELO_lineal, MODELO_cuad)
##               df      BIC
## MODELO_lineal  3 240.8834
## MODELO_cuad    4 215.2648

Comparación de indicadores de ajuste para los tres modelos

Modelo R² Ajustado AIC BIC
Lineal 0.588 235 240
Cuadrático 0.767 207 215

Conclusión: El modelo cuadrático ajusta mucho mejor los datos que el modelo lineal. La relación entre dosis de N y diámetro del tallo no es puramente lineal; hay un punto de máxima respuesta, a partir del cual el diámetro comienza a decrecer.

Comparación gráfica de modelo lineal y cuadrático

ggplot(MAIZ_FERTILIZANTE, aes(DOSIS_N, DIAMETRO_TALLO)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "blue", size = 0.8 ) +
  geom_smooth(method = "lm", formula = y ~ x + I(x^2), se = FALSE, color = "red", size = 0.8) +
  labs(title = "Modelo lineal vs Modelo Cuadrático",
       x = "Peso",
       y = "Diámetro ecuatorial") +
  theme_minimal()

Predicción de la variable respuesta

¿Cuál sería el diámetro estimado para una dosis de 125 kg/ha, según cada modelo?

# Peso a predecir
dosis <- 125

# Modelo Lineal
DIAMETRO_MODELO_lineal <- 11.91 + 0.041*dosis
DIAMETRO_MODELO_lineal
## [1] 17.035
# Modelo Cuadrático
DIAMETRO_MODELO_cuadratico <- 9.99 + 0.12 * dosis -0.00038 * dosis^2
DIAMETRO_MODELO_cuadratico
## [1] 19.0525