Cargamos los paquetes

library(readxl)
library(tidyverse)
library(lmtest)

Cargamos la base de datos

MAIZ <- read_csv("E:/Para D/diplo R/modulo 6/Modulo 6/MAIZ_FERTILIZANTE.csv")
MAIZ
## # A tibble: 50 × 2
##    DOSIS_N DIAMETRO_TALLO
##      <dbl>          <dbl>
##  1       0           8.37
##  2       0          11.5 
##  3       0          10.4 
##  4       0           7.74
##  5       0           9.13
##  6       0          12.5 
##  7       0           6.36
##  8       0           9.36
##  9       0          11.9 
## 10       0           8.70
## # ℹ 40 more rows

A. Exploración de la base de datos

A.2. Estructura de la base de datos

library(tidyverse)

# Ver las primeras filas
head(MAIZ)
## # A tibble: 6 × 2
##   DOSIS_N DIAMETRO_TALLO
##     <dbl>          <dbl>
## 1       0           8.37
## 2       0          11.5 
## 3       0          10.4 
## 4       0           7.74
## 5       0           9.13
## 6       0          12.5
# Estructura compacta (tipo de cada variable)
glimpse(MAIZ)
## Rows: 50
## Columns: 2
## $ DOSIS_N        <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 50, 50, 50, 50, 50, 50, 5…
## $ DIAMETRO_TALLO <dbl> 8.371554, 11.496018, 10.424468, 7.740558, 9.132100, 12.…
# Resumen estadístico de todas las variables numéricas
summary(MAIZ)
##     DOSIS_N    DIAMETRO_TALLO 
##  Min.   :  0   Min.   : 6.36  
##  1st Qu.: 50   1st Qu.:14.34  
##  Median :100   Median :16.92  
##  Mean   :100   Mean   :16.02  
##  3rd Qu.:150   3rd Qu.:18.71  
##  Max.   :200   Max.   :21.59
# Nombres de columnas
names(MAIZ)
## [1] "DOSIS_N"        "DIAMETRO_TALLO"
# Conteo de filas y columnas
dim(MAIZ)
## [1] 50  2
# Tipo de objeto
class(MAIZ)
## [1] "spec_tbl_df" "tbl_df"      "tbl"         "data.frame"

Gráfico de dispersión

ggplot(MAIZ, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  labs(title = "Relación entre DOSIS_N y DIÁMETRO_TALLO") +
  theme_minimal()

###Descripción del gráfico de dispersión: Se observa que los valores menores de diámetro de tallo corresponden al tratamiento testigo. Los tratamienttos de 50, 100, 150 y 200 tienen valores de mediana superiores al testigo , los valores de mediana son mayores y similares para los tratamientos 100, 150 y 200. Teniendo en cuenta toda la dispersión de puntos la tendencia es curvilínea positiva. Entre cada categoría (dosis) la distribución es de amplitud similar visualmente.

B. Ajuste del Modelo

Modelo de Regresión lineal simple

# Modelado
MODELO_lineal <- lm(DIAMETRO_TALLO ~ DOSIS_N, data = MAIZ)
summary(MODELO_lineal)
## 
## Call:
## lm(formula = DIAMETRO_TALLO ~ DOSIS_N, data = MAIZ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.5481 -1.5960  0.2347  1.4300  4.3449 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.908075   0.598242  19.905  < 2e-16 ***
## DOSIS_N      0.041118   0.004885   8.418 5.18e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.442 on 48 degrees of freedom
## Multiple R-squared:  0.5962, Adjusted R-squared:  0.5878 
## F-statistic: 70.86 on 1 and 48 DF,  p-value: 5.182e-11
# Visualización
ggplot(MODELO_lineal, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "green") +
  labs(title = "Modelo lineal",
       x= "Dosis de Nitrógeno",
       y= "Diámetro de Tallo de Maiz") +
  theme_minimal()

Ecuación del modelo de Regresión lineal

La interpretación de los coeficientes que constituyen el modelo es, que el intercepto indica que para un valor de 0 dosis de fertilizante el maíz tiene un diámetro estimado de 11,91 mm. En el caso del valor de pendiente de la recta indica que por cada unidad de incremento de la dosis de fertilizante, el diámetro de tallo incrementa en 0,041 unidades.

Ecuación del modelo:

\[DIÁMETRO.TALLO = 11.91 + 0.041⋅DOSIS.N\] ### Modelo cuadrático

# Modelado
MODELO_cuad <- lm(DIAMETRO_TALLO ~ DOSIS_N + I(DOSIS_N^2), data = MAIZ)
summary(MODELO_cuad)
## 
## Call:
## lm(formula = DIAMETRO_TALLO ~ DOSIS_N + I(DOSIS_N^2), data = MAIZ)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.2288 -1.1872 -0.1897  1.3319  3.3898 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   9.9979513  0.5467262  18.287  < 2e-16 ***
## DOSIS_N       0.1175233  0.0129528   9.073 6.71e-12 ***
## I(DOSIS_N^2) -0.0003820  0.0000621  -6.151 1.59e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.837 on 47 degrees of freedom
## Multiple R-squared:  0.7763, Adjusted R-squared:  0.7668 
## F-statistic: 81.54 on 2 and 47 DF,  p-value: 5.224e-16
# Visualización
ggplot(MAIZ, aes(x = DOSIS_N, y = DIAMETRO_TALLO)) +
  geom_point() +
  stat_smooth(method = "lm", formula = y ~ x + I(x^2), se = FALSE, color = "red") +
  labs(title = "Modelo cuadrático para diámetro de tallo a partir de dosis de N",
       x = "Dosis de Nitrógeno",
       y = "Diámetro de Tallo de Maíz") +
  theme_minimal()

Ecuación del modelo de Regresión Cuadrática

La interpretación de los coeficientes que constituyen el modelo es, que el intercepto indica que para un valor de 0 dosis de fertilizante el maíz tiene un diámetro medio estimado de 1 mm. En el caso del valor Intercepto, el diámetro del tallo estimado cuando la dosis de nitrógeno es 0 es 1 mm. El coeficiente lineal (0.117), indica que, inicialmente, al aumentar la dosis, el diámetro crece a razón de 0.117 unidades por unidad de nitrógeno, si el término cuadrático fuera nulo.El coeficiente cuadrático (0.00038): describe la curvatura de la relación, que en este caso es positivo, por lo tanto efecto del nitrógeno se acelera a medida que aumenta la dosis.

Ecuación del modelo:

\[ DIAMETRO.DE.TALLO = 1 + 0.117 \cdot DOSIS.N - 0.00038 \cdot DOSIS.N ^2 \] ## C. Comparación de modelos

Criterio de Información de Akaike (AIC)

AIC(MODELO_lineal, MODELO_cuad)
##               df      AIC
## MODELO_lineal  3 235.1473
## MODELO_cuad    4 207.6167

Criterio de Información Bayesiano (BIC)

BIC(MODELO_lineal, MODELO_cuad)
##               df      BIC
## MODELO_lineal  3 240.8834
## MODELO_cuad    4 215.2648

Comparación de indicadores de ajuste para los tres modelos

Modelo R² Ajustado AIC BIC
Lineal 0.5878 235.15 240.88
Cuadrático 0.7668 207.62 215.26

Conclusiones

D. Interpretación y Predicción

7.Gráfico y descripción

ggplot(MAIZ, aes(DOSIS_N, DIAMETRO_TALLO)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, color = "blue", size = 0.8 ) +
  geom_smooth(method = "lm", formula = y ~ x + I(x^2), se = FALSE, color = "red", size = 0.8) +
  labs(title = "Modelo lineal vs Modelo Cuadrático de Fertilización en Maíz",
       x = "Dosis Nitrógeno",
       y = "Diámetro de Tallo de Maíz") +
  theme_minimal()

El gráfico comparativo de ambos modelos muestra el mejor ajuste de la curva del modelo cuadrático (en color rojo) con respecto a la recta del modelo lineal (en color azul).

8. Predicción de valores de diametro de tallo de maíz.

# Peso a predecir
nitrógeno <- 125

# Modelo Lineal
DIAMETRO_MODELO_lineal <- 11.91 + 0.041 * nitrógeno
DIAMETRO_MODELO_lineal
## [1] 17.035
# Modelo Cuadrático
DIAMETRO_MODELO_cuadratico <- 1 + 0.117 * nitrógeno - 0.00038 * nitrógeno^2
DIAMETRO_MODELO_cuadratico
## [1] 9.6875

Respuesta: el modelo de regresión lineal cuadrático estima que para una dosis de fertilizante de 125 kg/ha de N, el diámetro de tallo de maíz será de 17,035 mm, mientras que el modelo cuadrático estima un valor de diámetro de 9,6875.