Explorar la estructura de los datos

str(datos)
## tibble [12 × 3] (S3: tbl_df/tbl/data.frame)
##  $ REPETICION : num [1:12] 1 2 3 4 1 2 3 4 1 2 ...
##  $ PROFUNDIDAD: num [1:12] 20 20 20 20 40 40 40 40 60 60 ...
##  $ NITROGENO  : num [1:12] 0.09 0.08 0.13 0.11 0.06 0.08 0.09 0.09 0.04 0.05 ...

Graficar la relación entre profundidad y nitrógeno

library(ggplot2)
ggplot(datos, aes(x = datos$PROFUNDIDAD, y = datos$NITROGENO)) +
  geom_point() +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Relación entre Profundidad y Nitrógeno", x = "Profundidad (cm)", y = "Nitrógeno (%)")
## Warning: Use of `datos$PROFUNDIDAD` is discouraged.
## ℹ Use `PROFUNDIDAD` instead.
## Warning: Use of `datos$NITROGENO` is discouraged.
## ℹ Use `NITROGENO` instead.
## Warning: Use of `datos$PROFUNDIDAD` is discouraged.
## ℹ Use `PROFUNDIDAD` instead.
## Warning: Use of `datos$NITROGENO` is discouraged.
## ℹ Use `NITROGENO` instead.
## `geom_smooth()` using formula = 'y ~ x'

Calcular el coeficiente de correlación de Pearson

cor_coef <- cor(datos$PROFUNDIDAD, datos$NITROGENO)
cat("Coeficiente de correlación de Pearson:", cor_coef, "\n")
## Coeficiente de correlación de Pearson: -0.8453206

Evaluar la significancia estadística del coeficiente de correlación

cor_test <- cor.test(datos$PROFUNDIDAD, datos$NITROGENO)
print(cor_test)
## 
##  Pearson's product-moment correlation
## 
## data:  datos$PROFUNDIDAD and datos$NITROGENO
## t = -5.0034, df = 10, p-value = 0.0005346
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.9556210 -0.5271611
## sample estimates:
##        cor 
## -0.8453206

Ajustar un modelo de regresión lineal simple

modelo <- lm(datos$NITROGENO ~ datos$PROFUNDIDAD, data = datos)
summary(modelo)
## 
## Call:
## lm(formula = datos$NITROGENO ~ datos$PROFUNDIDAD, data = datos)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.024167 -0.010417  0.002083  0.011458  0.025833 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        0.1316667  0.0118732  11.089 6.11e-07 ***
## datos$PROFUNDIDAD -0.0013750  0.0002748  -5.003 0.000535 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.01555 on 10 degrees of freedom
## Multiple R-squared:  0.7146, Adjusted R-squared:  0.686 
## F-statistic: 25.03 on 1 and 10 DF,  p-value: 0.0005346

Interpretar los coeficientes del modelo

cat("Intercepto:", coef(modelo)[1], "\n")
## Intercepto: 0.1316667
cat("Pendiente:", coef(modelo)[2], "\n")
## Pendiente: -0.001375

Evaluar la significancia estadística del coeficiente de la pendiente

summary(modelo)$coefficients[2, 4]  # Valor p del coeficiente de la pendiente
## [1] 0.0005346109

Interpretar el coeficiente de determinación R²

cat("R²:", summary(modelo)$r.squared, "\n")
## R²: 0.7145669

Representar gráficamente el modelo sobre los datos observados

ggplot(datos, aes(x = PROFUNDIDAD, y = NITROGENO)) +
  geom_point() +
  geom_smooth(method = "lm", col = "red") +
  labs(title = "Modelo de Regresión Lineal", x = "Profundidad (cm)", y = "Nitrógeno (%)")
## `geom_smooth()` using formula = 'y ~ x'

Verificar los supuestos básicos de regresión

par(mfrow = c(2, 2))
plot(modelo)

Predicción para una profundidad de 50 cm

nueva_prof <- data.frame(PROFUNDIDAD = 50)
prediccion <- predict(modelo, nueva_prof)
## Warning: 'newdata' had 1 row but variables found have 12 rows
cat("Contenido de Nitrógeno esperado para 50 cm:", prediccion, "\n")
## Contenido de Nitrógeno esperado para 50 cm: 0.1041667 0.1041667 0.1041667 0.1041667 0.07666667 0.07666667 0.07666667 0.07666667 0.04916667 0.04916667 0.04916667 0.04916667

Conclusión:

Al finalizar este trabajo práctico, se puede observar que el estudiante ha tenido una experiencia enriquecedora al explorar la relación entre la profundidad del suelo y el contenido de nitrógeno. A través del uso de herramientas estadísticas como la correlación y la regresión lineal, ha logrado descubrir patrones significativos que ayudan a entender mejor cómo interactúan estas variables en el contexto agrícola.

Durante el análisis de los datos, se encontró que a medida que la profundidad del suelo aumenta, también tiende a incrementarse el contenido de nitrógeno. Este hallazgo no solo es interesante desde un punto de vista académico, sino que también tiene importantes implicaciones para los agricultores y quienes trabajan en el manejo de suelos. Comprender esta relación permite tomar decisiones más informadas sobre cómo fertilizar y cuidar los cultivos, optimizando así la producción y promoviendo prácticas más sostenibles.

El modelo de regresión ajustado proporciona una herramienta valiosa para predecir el contenido de nitrógeno en diferentes profundidades, lo que puede ser de gran utilidad en la planificación agrícola. Además, al evaluar los residuos del modelo, se pudo asegurar que las conclusiones fueran robustas y confiables.