A. Exploración de Datos.

1. Cargar la base de datos.

2. Explorar la estructura de los datos

NITROGENO <- read_excel("NITROGENO.xlsx")
head(NITROGENO)
## # A tibble: 6 × 3
##   REPETICION PROFUNDIDAD NITROGENO
##        <dbl>       <dbl>     <dbl>
## 1          1          20      0.09
## 2          2          20      0.08
## 3          3          20      0.13
## 4          4          20      0.11
## 5          1          40      0.06
## 6          2          40      0.08
glimpse(NITROGENO)
## Rows: 12
## Columns: 3
## $ REPETICION  <dbl> 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4
## $ PROFUNDIDAD <dbl> 20, 20, 20, 20, 40, 40, 40, 40, 60, 60, 60, 60
## $ NITROGENO   <dbl> 0.09, 0.08, 0.13, 0.11, 0.06, 0.08, 0.09, 0.09, 0.04, 0.05…

3. Graficar la relación entre profundidad y nitrógeno ¿Se observa una tendencia?

nitro <- NITROGENO %>% 
  mutate(REPETICION = as.factor(REPETICION))
ggplot(nitro, aes(PROFUNDIDAD, NITROGENO, colour = REPETICION)) +
  geom_point(shape = 16, size= 3, alpha= 1.5)


A simple vista se observa una fuerte tendencia lineal y negativa. A mayor profundidad, menor contenido de nitrógeno.

B. Análisis de Correlación

4. Calcular el coeficiente de correlación de Pearson entre PROFUNDIDAD Y NITROGENO.

¿Cuál es el valor del coeficiente?

¿Qué indica su signo?

¿Qué tan fuerte es la relación?

shapiro.test(nitro$NITROGENO)
## 
##  Shapiro-Wilk normality test
## 
## data:  nitro$NITROGENO
## W = 0.94544, p-value = 0.5716

Hipótesis nula (H₀): ρ = 0 → No hay correlación lineal entre profundidad y nitrógeno.

Hipótesis alternativa (H₁): ρ ≠ 0 → Existe una correlación lineal (positiva o negativa) entre profundidad y nitrógeno.

cor.test(nitro$PROFUNDIDAD, 
         nitro$NITROGENO, 
         method = "pearson", 
         conf.level = 0.99)
## 
##  Pearson's product-moment correlation
## 
## data:  nitro$PROFUNDIDAD and nitro$NITROGENO
## t = -5.0034, df = 10, p-value = 0.0005346
## alternative hypothesis: true correlation is not equal to 0
## 99 percent confidence interval:
##  -0.9703433 -0.3635037
## sample estimates:
##        cor 
## -0.8453206

El valor del coeficiente de correlación de Pearson es de -0,84, lo cual afirma que es una correlación lineal y negativa. Es decir, al aumentar una variable (PROFUNDIDAD) la otra variable (NITROGENO) disminuye. A su vez indica que la relación es FUERTE NEGATIVA.

El valor de p es bastante menor a 0,05, por lo tanto rechazamos la hipótesis nula y decimos que hay evidencia significativa para afirmar una correlación lineal entre profundidad del suelo y contenido de nitrógeno.

C. Ajuste del Modelo de Regresión Lineal Simple.

6. Ajustar un modelo de regresión lineal simple. ¿Cuál es la ecuación de la recta?

7. Interpretar los coeficientes del modelo:

- ¿Qué significa el intercepto?

- ¿Qué indica el coeficiente de pendiente?

- ¿Qué implicancias agronómicas tienen los resultados?

REGRESION_nitro <- lm(nitro$NITROGENO ~ nitro$PROFUNDIDAD)
REGRESION_nitro
## 
## Call:
## lm(formula = nitro$NITROGENO ~ nitro$PROFUNDIDAD)
## 
## Coefficients:
##       (Intercept)  nitro$PROFUNDIDAD  
##          0.131667          -0.001375

Ecuación de la recta: y = 0,1317 -0,001375X

Es decir: NITROGENO = 0,1317 -0,001375 * PROFUNDIDAD

Intercepto (β₀ = 0.1317): a PROFUNDIDAD cero, el modelo estima un contenido de Nitrógeno de 0,13.

Pendiente (-0.001375): Por cada centímetro de profundidad, el contenido de nitrógeno disminuye en 0,00137.

Implicancias Agronómicas: Simplemente me está mostrando que la disponibilidad de Nitrógeno en este caso es cada vez menor cunado aumenta la profundidad. Podría ser por un buen contenido de materia orgánica en superficie tal vez. Pero el volumen de datos y la indormación del caso es escasa para sacar más conclusiones.

8. Evaluar la significancia estadística del coeficiente de la pendiente (β) .

9. Interpretar el coeficiente de determinación (R2).

H₀ (hipótesis nula): β₁ = 0 → No hay relación lineal entre profundidad y nitrógeno.

H₁ (hipótesis alternativa): β₁ ≠ 0 → Hay una relación lineal significativa entre profundidad y nitrógeno.

summary(REGRESION_nitro)
## 
## Call:
## lm(formula = nitro$NITROGENO ~ nitro$PROFUNDIDAD)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.024167 -0.010417  0.002083  0.011458  0.025833 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        0.1316667  0.0118732  11.089 6.11e-07 ***
## nitro$PROFUNDIDAD -0.0013750  0.0002748  -5.003 0.000535 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.01555 on 10 degrees of freedom
## Multiple R-squared:  0.7146, Adjusted R-squared:  0.686 
## F-statistic: 25.03 on 1 and 10 DF,  p-value: 0.0005346

Se rechaza la Hipótesis nula. La significancia estadística del coeficiente de la pendiente (β = -0,001375) está explicada por el vapor p = 0,000535 el cual da evidencia suficiente para afirmar que la profundidad del suelo influye en el contenido de nitrógeno.

El valor de R² = 0,7146 indica que aproximadamente el 71,46% de la variabilidad observada en el contenido de nitrógeno del suelo puede ser explicada por la profundidad.

10.Representar gráficamente el modelo sobre los datos observados.

ggplot(nitro, aes(x = PROFUNDIDAD, y = NITROGENO)) +
  geom_point(size = 2.5, alpha = 0.6) +
  geom_smooth(method = "lm", se = FALSE, color = "blue") +
  geom_text(x = 45, y = 0.11, label = "y = 0.1317 - 0.001375 x", size = 5)

D. Diagnóstico del Modelo

10.Analizar los residuos del modelo

11.¿Cumple el modelo los supuestos básicos de regresión?

Comprobamos graficamente los supuestos

#Usamos la función plot
par(mfrow=c(2,2)) # permite visualizar los gráficos de residuos en una sola imagen
plot(REGRESION_nitro)

Pruebas formales para los supuestos

Normalidad

H0: los residuos tienen distribución normal.

H1: los residuos NO tienen distribución normal.

shapiro.test(residuals(REGRESION_nitro))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(REGRESION_nitro)
## W = 0.97087, p-value = 0.9197

Homocedasticidad

H0: Se cumple el supuesto de homocedasticidad

H1: No se cumple el supuesto de homocedasticidad

bptest(nitro$PROFUNDIDAD~nitro$NITROGENO, data = nitro)
## 
##  studentized Breusch-Pagan test
## 
## data:  nitro$PROFUNDIDAD ~ nitro$NITROGENO
## BP = 0.18172, df = 1, p-value = 0.6699

Los resultados del test de Shapiro-Wilk (p = 0.9197) y del test de Breusch-Pagan (p = 0.6699) indican que los residuos del modelo presentan distribución normal y varianza constante, respectivamente. Por lo tanto, se confirma que se cumplen los supuestos básicos asociados a los residuos en la regresión lineal simple.

E. Predicción

12.¿Cuál sería el contenido de Nitrógeno esperado para una profundidad de suelo de 50 cm, según el modelo?

nitro_50cm <- 0.1317 - (0.001375 * 50)
nitro_50cm
## [1] 0.06295

El contenido de nitrógeno esperado para una profundidad de 50 cm es de aproximadamente 0,063%.

Gráfico de dispersión con recta de Regresión y predicción

ggplot(nitro, aes(PROFUNDIDAD, NITROGENO)) +
  geom_point(size = 2.5, alpha = 0.6, color = "red") +
  geom_smooth(method = "lm", se = TRUE, color = "black") +
  geom_text(x = 45, y = 0.11, label = "NITROGENO = 0,1317 -0,001375 * PROFUNDIDAD", size = 4) +
  geom_point(aes(x = 50, y = 0.06392), color = "yellow", size = 4) +
  labs(
    title = "Relación entre Profundidad del Suelo y Nitrógeno",
    x = "Profundidad (cm)",
    y = "Contenido de Nitrógeno (%)"
  ) +
  theme_minimal(base_size = 14)