UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
FACULTAD DE
ECONOMÍA Y PLANIFICACIÓN
DEPARTAMENTO ACADÉMICO DE
ESTADÍSTICA INFORMÁTICA
Examen Parcial
CURSO: Técnicas
Multivariadas
DOCENTE: Miranda Villagomez Clodomiro
Fernando
ALUMNOS:
Lopez Acuña, Victor Andreé -
20180206
Morales Morales, Flavio Oscar - 20170202
Mori Perez,
Luis Alberto - 20170058
Garces Quispe, Adryana Luisa - 20220764
Estrella Guerra, Danilo David - 20220763
Jimenez Ruiz, Alex
Fernando - 20210839
2025
Contexto del problema
El cultivo de palta (Persea americana) es uno de los principales productos agrícolas del Perú, pero su rendimiento depende de factores agronómicos y ambientales como el tipo de riego, la fertilización y las propiedades del suelo. Dado que estos factores interactúan entre sí, se requiere un análisis conjunto que permita identificar cuáles influyen más en el desarrollo del cultivo. Este estudio utiliza información agronómica y de suelo de plantaciones de palta para reconocer las condiciones y prácticas que se asocian con un mejor desempeño productivo.
DESCRIPCIÓN DE LAS VARIABLES
Riego_por_goteo (0 / 1): Indica si en la parcela se usó riego por goteo (1) o no (0).
Fertilizacion_organica (0 / 1): Indica si se aplicó materia orgánica , compost , fertilización orgánica.
Mulching (0 / 1): Indica si se aplicó mulching (cobertura orgánica de suelo) (1) o no (0) para conservar humedad.
pH_suelo: escala de pH (~5.0 a 7.5).
Materia_organica: porcentaje (%) de materia orgánica del suelo (por ejemplo entre 1 y 6 %).
Humedad_suelo: porcentaje (%) de humedad volumétrica o gravimétrica del suelo en la zona radicular.
Altura_planta: metros de altura promedio del árbol o planta en la parcela.
Diametro_tronco (cm): centímetros de diámetro del tronco a cierta altura.
Densidad_frutos: número de frutos por árbol (o por unidad de área).
Peso_promedio_fruto: gramos por fruto.
Rendimiento_palta: toneladas de fruta por hectárea (t/ha).
set.seed(123)
n <- 700
# dicotómicas (0/1)
riego_por_goteo <- rbinom(n, 1, 0.6)
fertilizacion_organica <- rbinom(n, 1, 0.7)
mulching <- rbinom(n, 1, 0.5)
# suelo: reforzamos dependencias
pH_suelo <- rnorm(n, mean = 6.5, sd = 0.25)
materia_organica <- 2.5 + 0.7 * pH_suelo + 0.6 * fertilizacion_organica + 0.4 * mulching + rnorm(n, 0, 0.2)
humedad_suelo <- 18 + 4.5 * materia_organica + 8 * riego_por_goteo + rnorm(n, 0, 1) # menos ruido, efecto riego mayor
# vigor: aumentamos coeficientes y reducimos ruido
altura_planta <- 3.4 + 0.7 * materia_organica + 0.45 * humedad_suelo - 0.15 * mulching + rnorm(n, 0, 0.25)
diametro_tronco <- 5.5 + 1.25 * altura_planta + 0.7 * fertilizacion_organica + rnorm(n, 0, 0.25)
# productividad: hacerla dependiente fuertemente de diametro y fertilizacion
densidad_frutos <- 80 + 3.5 * diametro_tronco + 12 * fertilizacion_organica + rnorm(n, 0, 5)
peso_promedio_fruto <- 120 + 1.8 * diametro_tronco + 0.5 * materia_organica + 10 * mulching + rnorm(n, 0, 6)
# rendimiento: combina densidad * peso, menor ruido
rendimiento_palta <- round(
(densidad_frutos * peso_promedio_fruto / 1e5) *
(1 + 0.2 * riego_por_goteo) *
(1 + 0.15 * fertilizacion_organica) *
(1 + 0.08 * materia_organica / 3) + rnorm(n, 0, 0.2),
2
)
bd <- data.frame(
riego_por_goteo,
fertilizacion_organica,
mulching,
pH_suelo,
materia_organica,
humedad_suelo,
altura_planta,
diametro_tronco,
densidad_frutos,
peso_promedio_fruto,
rendimiento_palta
)
# retirando una columna
bd = bd[,-9]\(H_0\): Los datos provienen de una distribución normal multivariada.
\(H_a\): Los datos no provienen de una distribución normal multivariada.
##
## Shapiro-Wilk normality test
##
## data: Z
## W = 0.99682, p-value = 0.1815
Decisión estadística:
No se rechaza la \(H_0\), por lo que se puede afirmar que los datos relacionados a la producción de palta provienen de una distribución normal multivariada.
\(H_0\): Las variables relacionadas a la producción de palta no están correlacionadas.
\(H_a\): Las variables relacionadas a la producción de palta no están correlacionadas.
## $chisq
## [1] 163.3861
##
## $p.value
## [1] 2.059977e-37
##
## $df
## [1] 1
Decisión estadística:
Se rechaza \(H_0\), por lo tanto las variables están correlacionadas por lo tanto sí se puede aplicar un análisis multivariado para el análisis sobre la producción de la palta.
mod1 = lm(cbind(peso_promedio_fruto, rendimiento_palta)~
riego_por_goteo + fertilizacion_organica + mulching+
pH_suelo + materia_organica + humedad_suelo +
altura_planta + diametro_tronco, data = bd)
library(car)
alias(mod1)## Model :
## cbind(peso_promedio_fruto, rendimiento_palta) ~ riego_por_goteo +
## fertilizacion_organica + mulching + pH_suelo + materia_organica +
## humedad_suelo + altura_planta + diametro_tronco
\(H_0\): Ninguna de las variables explican significativamente el rendimiento ni el peso promedio de la palta.
\(H_a\): Alguna de las variables explica significativamente sobre el peso promedio de la palta o rendimiento de paltas.
ev_mod1 <- linearHypothesis(mod1, hypothesis.matrix =
c("riego_por_goteo = 0",
"fertilizacion_organica = 0",
"mulching = 0",
"pH_suelo = 0",
"materia_organica = 0",
"humedad_suelo = 0",
"altura_planta = 0",
"diametro_tronco = 0"))
ev_mod1##
## Sum of squares and products for the hypothesis:
## peso_promedio_fruto rendimiento_palta
## peso_promedio_fruto 47423.9038 771.65024
## rendimiento_palta 771.6502 20.23584
##
## Sum of squares and products for error:
## peso_promedio_fruto rendimiento_palta
## peso_promedio_fruto 25402.49560 95.77178
## rendimiento_palta 95.77178 29.23785
##
## Multivariate Tests:
## Df test stat approx F num Df den Df Pr(>F)
## Pillai 8 0.8704387 66.56049 16 1382 < 2.22e-16 ***
## Wilks 8 0.2573317 83.77487 16 1380 < 2.22e-16 ***
## Hotelling-Lawley 8 2.3895142 102.89846 16 1378 < 2.22e-16 ***
## Roy 8 2.1596012 186.53555 8 691 < 2.22e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## [1] 0
## [1] 4.571079e-190
Decisión estadística:
Los 4 criterios rechazan \(H_0\), por lo tanto se puede afirmar que alguna de las variables independientes influye sobre el peso promedio de la palta o rendimiento de paltas.
\(H_0\): Las variables independientes no explican significativamente el rendimiento ni el peso promedio de la palta.
\(H_a\): Las variables independientes explican significativamente el rendimiento o el peso promedio de la palta.
## Df Pillai approx F num Df den Df Pr(>F)
## riego_por_goteo 1 0.41526 245.01 2 690 < 2.2e-16 ***
## fertilizacion_organica 1 0.27097 128.23 2 690 < 2.2e-16 ***
## mulching 1 0.53707 400.25 2 690 < 2.2e-16 ***
## pH_suelo 1 0.05699 20.85 2 690 1.617e-09 ***
## materia_organica 1 0.04141 14.91 2 690 4.599e-07 ***
## humedad_suelo 1 0.02266 8.00 2 690 0.0003679 ***
## altura_planta 1 0.01516 5.31 2 690 0.0051338 **
## diametro_tronco 1 0.00528 1.83 2 690 0.1609387
## Residuals 691
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Wilks approx F num Df den Df Pr(>F)
## riego_por_goteo 1 0.58474 245.01 2 690 < 2.2e-16 ***
## fertilizacion_organica 1 0.72903 128.23 2 690 < 2.2e-16 ***
## mulching 1 0.46293 400.25 2 690 < 2.2e-16 ***
## pH_suelo 1 0.94301 20.85 2 690 1.617e-09 ***
## materia_organica 1 0.95859 14.91 2 690 4.599e-07 ***
## humedad_suelo 1 0.97734 8.00 2 690 0.0003679 ***
## altura_planta 1 0.98484 5.31 2 690 0.0051338 **
## diametro_tronco 1 0.99472 1.83 2 690 0.1609387
## Residuals 691
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## riego_por_goteo 1 0.71016 245.01 2 690 < 2.2e-16
## fertilizacion_organica 1 0.37168 128.23 2 690 < 2.2e-16
## mulching 1 1.16014 400.25 2 690 < 2.2e-16
## pH_suelo 1 0.06043 20.85 2 690 1.617e-09
## materia_organica 1 0.04320 14.91 2 690 4.599e-07
## humedad_suelo 1 0.02319 8.00 2 690 0.0003679
## altura_planta 1 0.01540 5.31 2 690 0.0051338
## diametro_tronco 1 0.00531 1.83 2 690 0.1609387
## Residuals 691
##
## riego_por_goteo ***
## fertilizacion_organica ***
## mulching ***
## pH_suelo ***
## materia_organica ***
## humedad_suelo ***
## altura_planta **
## diametro_tronco
## Residuals
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Roy approx F num Df den Df Pr(>F)
## riego_por_goteo 1 0.71016 245.01 2 690 < 2.2e-16 ***
## fertilizacion_organica 1 0.37168 128.23 2 690 < 2.2e-16 ***
## mulching 1 1.16014 400.25 2 690 < 2.2e-16 ***
## pH_suelo 1 0.06043 20.85 2 690 1.617e-09 ***
## materia_organica 1 0.04320 14.91 2 690 4.599e-07 ***
## humedad_suelo 1 0.02319 8.00 2 690 0.0003679 ***
## altura_planta 1 0.01540 5.31 2 690 0.0051338 **
## diametro_tronco 1 0.00531 1.83 2 690 0.1609387
## Residuals 691
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Decisión estadística:
A un nivel de significancia de 0.05, bajo los cuatro criterios se rechaza \(H_0\), es decir las siguientes variables sí explican significativamente el rendimiento o el peso promedio de la palta :
riego_por_goteo
fertilizacion_organica
pH_suelo
materia_organica
humedad_suelo
altura_planta
\(H_0\): Los coeficientes de las variables independientes son iguales a cero para el rendimiento o el peso promedio de la palta (no hay efecto global).
\(H_a\): Al menos una variable independiente tiene un efecto significativo sobre al menos el rendimiento o el peso promedio de la palta.
##
## Type II MANOVA Tests: Pillai test statistic
## Df test stat approx F num Df den Df Pr(>F)
## riego_por_goteo 1 0.009116 3.174 2 690 0.0424484 *
## fertilizacion_organica 1 0.026326 9.328 2 690 0.0001006 ***
## mulching 1 0.270335 127.820 2 690 < 2.2e-16 ***
## pH_suelo 1 0.005158 1.789 2 690 0.1679617
## materia_organica 1 0.000310 0.107 2 690 0.8986243
## humedad_suelo 1 0.001636 0.565 2 690 0.5685047
## altura_planta 1 0.003845 1.332 2 690 0.2647338
## diametro_tronco 1 0.005281 1.832 2 690 0.1609387
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Decisión estadística:
A un nivel de significación de 0.05 se rechaza \(H_0\), es decir las siguientes variables sí influyen en el rendimiento o el peso promedio de la palta :
riego_por_goteo
fertilizacion_organica
mulching
mod1 = lm(cbind(peso_promedio_fruto, rendimiento_palta)~
riego_por_goteo + fertilizacion_organica + mulching)
library(car)
alias(mod1)## Model :
## cbind(peso_promedio_fruto, rendimiento_palta) ~ riego_por_goteo +
## fertilizacion_organica + mulching
## Response peso_promedio_fruto :
##
## Call:
## lm(formula = peso_promedio_fruto ~ riego_por_goteo + fertilizacion_organica +
## mulching)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21.9912 -4.4875 0.1428 4.6104 19.8536
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 202.2186 0.6028 335.458 <2e-16 ***
## riego_por_goteo 8.7496 0.4966 17.617 <2e-16 ***
## fertilizacion_organica 4.9390 0.5415 9.121 <2e-16 ***
## mulching 12.9234 0.4853 26.629 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.41 on 696 degrees of freedom
## Multiple R-squared: 0.6073, Adjusted R-squared: 0.6056
## F-statistic: 358.7 on 3 and 696 DF, p-value: < 2.2e-16
##
##
## Response rendimiento_palta :
##
## Call:
## lm(formula = rendimiento_palta ~ riego_por_goteo + fertilizacion_organica +
## mulching)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.67321 -0.14483 0.00517 0.15416 0.67383
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.49187 0.01958 25.121 < 2e-16 ***
## riego_por_goteo 0.25134 0.01613 15.581 < 2e-16 ***
## fertilizacion_organica 0.22785 0.01759 12.954 < 2e-16 ***
## mulching 0.09511 0.01576 6.034 2.6e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2082 on 696 degrees of freedom
## Multiple R-squared: 0.3901, Adjusted R-squared: 0.3875
## F-statistic: 148.4 on 3 and 696 DF, p-value: < 2.2e-16
A continuacion procedemos a utilizar las 30 primeras filas de la data a manera de data de prueba para predecir valores de las variables dependientes y comparar con los resultados reales.
## riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1 1 0 0 6.582859 6.967700
## 2 0 1 0 6.452538 7.793224
## 3 1 1 0 6.617623 7.705662
## 4 0 0 0 6.262080 6.659320
## 5 0 1 0 6.789478 7.944873
## 6 1 1 1 6.646176 8.457152
## humedad_suelo altura_planta diametro_tronco peso_promedio_fruto
## 1 57.76102 34.27916 48.08516 207.3438
## 2 54.78371 33.37145 48.07710 206.1773
## 3 60.61509 35.96264 51.26219 207.3816
## 4 47.68624 29.43421 42.61407 191.5294
## 5 54.23734 33.28830 47.84793 208.5146
## 6 64.00784 37.78561 53.47222 237.9953
## rendimiento_palta
## 1 0.96
## 2 0.86
## 3 1.07
## 4 0.54
## 5 0.28
## 6 0.97
test.data = bd[c(1:30), c(1:8)]
predictions <- predict(mod1, test.data)
reales <- bd[c(1:30), c(9,10)]
comparacion <- cbind(predictions, reales)
colnames(comparacion) <- c("peso_promedio_predicho",
"rendimiento_predicho","peso_promedio_real",
"rendimiento_real")
comparacion## peso_promedio_predicho rendimiento_predicho peso_promedio_real
## 1 210.9682 0.7432090 207.3438
## 2 207.1575 0.7197196 206.1773
## 3 215.9071 0.9710592 207.3816
## 4 202.2186 0.4918695 191.5294
## 5 207.1575 0.7197196 208.5146
## 6 228.8305 1.0661718 237.9953
## 7 228.8305 1.0661718 230.0626
## 8 220.0809 0.8148323 229.5702
## 9 215.9071 0.9710592 212.5328
## 10 228.8305 1.0661718 232.0191
## 11 220.0809 0.8148323 221.3164
## 12 228.8305 1.0661718 226.6104
## 13 220.0809 0.8148323 221.4174
## 14 210.9682 0.7432090 214.6438
## 15 215.9071 0.9710592 219.6059
## 16 220.0809 0.8148323 221.9580
## 17 228.8305 1.0661718 229.8534
## 18 215.9071 0.9710592 218.0054
## 19 223.8916 0.8383217 225.0501
## 20 207.1575 0.7197196 201.3383
## 21 220.0809 0.8148323 214.8044
## 22 215.1420 0.5869822 211.2957
## 23 202.2186 0.4918695 211.2067
## 24 215.1420 0.5869822 220.3073
## 25 207.1575 0.7197196 198.5537
## 26 202.2186 0.4918695 201.2533
## 27 210.9682 0.7432090 221.8564
## 28 228.8305 1.0661718 219.1619
## 29 223.8916 0.8383217 224.8376
## 30 215.9071 0.9710592 219.0178
## rendimiento_real
## 1 0.96
## 2 0.86
## 3 1.07
## 4 0.54
## 5 0.28
## 6 0.97
## 7 1.25
## 8 0.78
## 9 1.10
## 10 0.89
## 11 0.85
## 12 0.92
## 13 0.67
## 14 0.71
## 15 1.37
## 16 0.81
## 17 1.09
## 18 1.32
## 19 0.78
## 20 0.82
## 21 0.63
## 22 0.78
## 23 0.31
## 24 0.62
## 25 0.91
## 26 0.82
## 27 0.80
## 28 0.52
## 29 1.17
## 30 0.90
Calculando el error (metrica = mape)
mape = function(y_pred, y_real){
n = length(y_pred)
mape_res = abs(y_pred - y_real)/(y_real*n)
return(sum(mape_res))
}
mape(comparacion$peso_promedio_predicho, comparacion$peso_promedio_real)## [1] 0.02069828
## [1] 0.2421474
Interpretación del resultado: Podemos apreciar que la predicción para el el peso promedio de palta resulta muy fina ya que tiene un mape de 2% a comparación del rendimiento que tiene un error de hasta 24%.
res = summary(mod1)
#R2 para solo con la variable respuesta peso_promedio_fruto
res$`Response peso_promedio_fruto`$r.squared## [1] 0.6072759
#R2 para solo con la variable respuesta rendimiento de palta
res$`Response rendimiento_palta`$r.squared## [1] 0.3900996
Interpretación del resultado:
Podemos concluir que el modelo con solo peso_promedio_fruto resulta mejor explicada por las variables relacionadas a la producción de palta ya que tiene un R2 mayor de 60,72% de expliicación
El cultivo de palta (Persea americana) es uno de los principales productos agrícolas del Perú, pero su rendimiento depende de factores agronómicos y ambientales como el tipo de riego, la fertilización y las propiedades del suelo. Dado que estos factores interactúan entre sí, se requiere un análisis conjunto que permita identificar cuáles influyen más en el desarrollo del cultivo. Este estudio utiliza información agronómica y de suelo de plantaciones de palta para reconocer las condiciones y prácticas que se asocian con un mejor desempeño productivo.
DESCRIPCIÓN DE LAS VARIABLES
Riego_por_goteo (0 / 1): Indica si en la parcela se usó riego por goteo (1) o no (0).
Fertilizacion_organica(0 / 1): Indica si se aplicó materia orgánica, compost , fertilización orgánica.
Mulching (0 / 1): Indica si se aplicó mulching (cobertura orgánica de suelo) (1) o no (0) para conservar humedad.
pH_suelo: escala de pH (~5.0 a 7.5).
Materia_organica: porcentaje (%) de materia orgánica del suelo (por ejemplo entre 1 y 6 %).
Humedad_suelo: porcentaje (%) de humedad volumétrica o gravimétrica del suelo en la zona radicular.
Altura_planta: metros de altura promedio del árbol o planta en la parcela.
Diametro_tronco (cm): centímetros de diámetro del tronco a cierta altura.
Densidad_frutos: número de frutos por árbol (o por unidad de área).
Peso_promedio_fruto: gramos por fruto.
Rendimiento_palta : toneladas de fruta por hectárea (t/ha).
library(car)
library(GGally)
library(MVN)
library(epiDisplay)
library(scales)
library(rgl)
library(psych)
library(gganimate)
library(png)
library(gifski)
library (dplyr)
library(viridis)
library(tidyverse)
library(forcats)
library(BSDA)
library(dlookr)
library(ggpubr)
library(summarytools)
library(pastecs)
library(corrplot)
library(mvnormtest)
library(PerformanceAnalytics)
library(ggcorrplot)
library(ade4)
library(factoextra)
library(patchwork)
library (adegenet)
library(FactoMineR)
library(psych)
library(ggplot2)
library(adegenet)
library(tibble)
library(dplyr)set.seed(123)
n <- 700
trees_per_ha <- 200 # parámetro realista: árboles por hectárea
# dicotómicas (0/1)
riego_por_goteo <- rbinom(n, 1, 0.6)
fertilizacion_organica <- rbinom(n, 1, 0.5)
mulching <- rbinom(n, 1, 0.5)
# factores latentes para correlación natural
fac_suelo <- rnorm(n, 0, 1)
fac_vigor <- rnorm(n, 0, 1)
# suelo y propiedades (unidades reales)
pH_suelo <- round(rnorm(n, mean = 6.5 + 0.05 * fac_suelo, sd = 0.20), 2) # pH (6.0-7.5 típico)
materia_organica <- round(pmax(3 + 0.8 * fac_suelo + 0.9 * fertilizacion_organica +
0.5 * mulching + rnorm(n, 0, 0.3), 1), 2) # % materia orgánica
humedad_suelo <- round(pmax(30 + 4.0 * materia_organica + 8 * riego_por_goteo +
1.5 * fac_suelo + rnorm(n, 0, 2), 5), 1) # % humedad en suelo
# Vigor / tamaño de planta (unidades realistas)
# altura en metros (árboles jóvenes/adultos manejados: ≈2.0 - 6.0 m)
altura_planta <- round(pmax(1.8 + 0.5 * fac_vigor + 0.25 * materia_organica +
0.02 * humedad_suelo + 0.25 * fertilizacion_organica +
rnorm(n, 0, 0.4), 0.8), 2)
# diámetro del tronco en centímetros (relacionado con altura)
diametro_tronco <- round(pmax(2 + 3.0 * altura_planta + 0.9 * fertilizacion_organica +
0.5 * fac_vigor + rnorm(n, 0, 0.6), 1), 1)
# Productividad: densidad de frutos por árbol y peso (g)
densidad_frutos <- round(pmax(120 + 50 * fac_vigor + 30 * fertilizacion_organica +
3.5 * diametro_tronco + rnorm(n, 0, 35), 20), 0)
peso_promedio_fruto <- round(pmax(140 + 4.0 * diametro_tronco + 6 * materia_organica +
12 * mulching + 8 * fertilizacion_organica +
rnorm(n, 0, 12), 60), 0) # gramos
# Rendimiento en toneladas por hectárea (t/ha)
# cálculo determinístico a partir de densidad (frutos/árbol) y peso (g), ajustado por manejo
rendimiento_palta <- round(
(densidad_frutos * peso_promedio_fruto / 1000) * # kg/árbol
(trees_per_ha) / 1000 * # -> t/ha
(1 + 0.25 * riego_por_goteo) *
(1 + 0.15 * fertilizacion_organica) *
(1 + 0.06 * materia_organica / 5) + # pequeña ajuste por materia orgánica
rnorm(n, 0, 0.3),
2)
# Ensamblar data frame final
datos_palta <- data.frame(
riego_por_goteo = riego_por_goteo,
fertilizacion_organica = fertilizacion_organica,
mulching = mulching,
pH_suelo = pH_suelo,
materia_organica = materia_organica,
humedad_suelo = humedad_suelo,
altura_planta = altura_planta,
diametro_tronco = diametro_tronco,
densidad_frutos = densidad_frutos,
peso_promedio_fruto = peso_promedio_fruto,
rendimiento_palta = rendimiento_palta
)
# Vista rápida
head(datos_palta)## riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1 1 1 0 6.60 4.18
## 2 0 0 0 6.83 2.68
## 3 1 0 0 6.51 3.25
## 4 0 1 0 6.40 3.04
## 5 0 0 0 6.65 3.83
## 6 1 1 1 6.52 4.64
## humedad_suelo altura_planta diametro_tronco densidad_frutos
## 1 53.1 3.82 13.7 203
## 2 41.7 4.14 14.4 232
## 3 52.6 3.52 11.6 179
## 4 43.3 2.78 9.8 134
## 5 47.4 3.99 14.0 108
## 6 57.8 4.44 17.7 267
## peso_promedio_fruto rendimiento_palta
## 1 222 13.86
## 2 211 10.44
## 3 212 9.12
## 4 221 6.89
## 5 207 4.11
## 6 268 22.27
## [1] "riego_por_goteo" "fertilizacion_organica" "mulching"
## [4] "pH_suelo" "materia_organica" "humedad_suelo"
## [7] "altura_planta" "diametro_tronco" "densidad_frutos"
## [10] "peso_promedio_fruto" "rendimiento_palta"
#Verificando si hay datos perdidos
datos_perdidos=100*colSums(is.na(datos_palta))/dim(datos_palta)[1]
datos_perdidos## riego_por_goteo fertilizacion_organica mulching
## 0 0 0
## pH_suelo materia_organica humedad_suelo
## 0 0 0
## altura_planta diametro_tronco densidad_frutos
## 0 0 0
## peso_promedio_fruto rendimiento_palta
## 0 0
# Primero definimos la función de outliers
is_outlier2 <- function(x, k = 2) {
return(abs(scale(x)) > k)
}
# Crear un subconjunto solo con las variables continuas:
datosP2_palta <- datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
"altura_planta", "diametro_tronco",
"densidad_frutos", "peso_promedio_fruto",
"rendimiento_palta")]
# Ver primeras filas
head(datosP2_palta)## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1 6.60 4.18 53.1 3.82 13.7
## 2 6.83 2.68 41.7 4.14 14.4
## 3 6.51 3.25 52.6 3.52 11.6
## 4 6.40 3.04 43.3 2.78 9.8
## 5 6.65 3.83 47.4 3.99 14.0
## 6 6.52 4.64 57.8 4.44 17.7
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 1 203 222 13.86
## 2 232 211 10.44
## 3 179 212 9.12
## 4 134 221 6.89
## 5 108 207 4.11
## 6 267 268 22.27
# Ahora detectar outliers para cada variable con k = 3 (criterio estricta)
datosP2_palta[is_outlier2(datosP2_palta$pH_suelo, 3), ]## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 532 7.23 3.48 43.5 3.64 13.5
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 532 141 212 6.42
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 439 6.92 6.82 69.4 5.17 18.0
## 572 6.57 6.76 65.1 4.10 14.3
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 439 184 266 14.95
## 572 109 247 6.51
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 63 6.71 6.5 70.6 4.79 16.9
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 63 216 255 16.85
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200 6.62 4.42 55.5 6.32 23.6
## 422 6.28 1.51 36.2 1.28 4.8
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 200 332 280 28.24
## 422 49 158 1.70
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200 6.62 4.42 55.5 6.32 23.6
## 422 6.28 1.51 36.2 1.28 4.8
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 200 332 280 28.24
## 422 49 158 1.70
## [1] pH_suelo materia_organica humedad_suelo
## [4] altura_planta diametro_tronco densidad_frutos
## [7] peso_promedio_fruto rendimiento_palta
## <0 rows> (o 0- extensión row.names)
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 422 6.28 1.51 36.2 1.28 4.8
## 455 6.53 5.49 61.9 5.67 21.4
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 422 49 158 1.70
## 455 283 300 26.41
## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200 6.62 4.42 55.5 6.32 23.6
## 402 6.71 5.08 59.8 4.35 17.4
## 404 6.72 5.30 62.6 5.06 19.6
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 200 332 280 28.24
## 402 361 281 30.95
## 404 348 269 28.62
# Gráfica básica de dispersión de las variables continuas
plot(datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
"altura_planta", "diametro_tronco",
"densidad_frutos", "peso_promedio_fruto",
"rendimiento_palta")],
pch = as.numeric(datos_palta$riego_por_goteo),
col = datos_palta$riego_por_goteo) # Matriz tipo “pairs.panels” para cuantitativas
pairs.panels(datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
"altura_planta", "diametro_tronco",
"densidad_frutos", "peso_promedio_fruto",
"rendimiento_palta")])Ejemplo 1:
Scatterplot entre densidad_frutos (eje X) y rendimiento_palta (eje Y), coloreando por riego_por_goteo.
p <- ggplot(datos_palta, aes(x = densidad_frutos, y = rendimiento_palta)) +
geom_point(aes(color = factor(riego_por_goteo)), size = 3, alpha = 0.7) +
labs(colour = "Riego por goteo", x = "Densidad de frutos", y = "Rendimiento de palta (t/ha)") +
theme_minimal()
pSi también queremos diferenciar por forma según otra variable dicotómica, por ejemplo mulching:
p2 <- ggplot(datos_palta, aes(x = densidad_frutos, y = rendimiento_palta)) +
geom_point(aes(color = factor(riego_por_goteo), shape = factor(mulching)),
size = 3, alpha = 0.8) +
labs(colour = "Riego por goteo", shape = "Mulching",
x = "Densidad de frutos", y = "Rendimiento de palta (t/ha)") +
theme_minimal()
p2Ejemplo 2:
Boxplot de rendimiento de palta según riego por goteo (0 / 1).
boxplot(rendimiento_palta ~ riego_por_goteo, data = datos_palta,
main = "Rendimiento de Palta según Riego por Goteo",
xlab = "Riego por Goteo (0 = no, 1 = sí)",
ylab = "Rendimiento (t/ha)",
col = c("skyblue", "forestgreen"))p_palta <- ggplot(datos_palta, aes(x = factor(riego_por_goteo), y = rendimiento_palta, fill = factor(riego_por_goteo))) +
geom_boxplot(outlier.shape = NA, alpha = 0.6) +
geom_jitter(position = position_jitter(width = 0.2),
aes(color = factor(riego_por_goteo)), size = 1.5, alpha = 0.8) +
scale_fill_viridis(discrete = TRUE, option = "turbo") +
scale_color_viridis(discrete = TRUE, option = "turbo") +
theme_minimal(base_size = 12) +
theme(
panel.grid.minor = element_blank(),
panel.grid.major.x = element_blank(),
legend.position = "none",
plot.title = element_text(size = 14, face = "bold", hjust = 0.5),
axis.title.x = element_text(size = 12, margin = margin(t = 10)),
axis.title.y = element_text(size = 12, margin = margin(r = 10))
) +
ggtitle("Rendimiento de Palta según Riego por Goteo") +
xlab("Riego por Goteo (0 = no, 1 = sí)") +
ylab("Rendimiento (t/ha)")
print(p_palta)hist_data <- datos_palta %>%
dplyr::select(pH_suelo, materia_organica, humedad_suelo,
altura_planta, diametro_tronco, densidad_frutos,
peso_promedio_fruto, rendimiento_palta) %>%
mutate_if(is.factor, as.character) %>%
mutate_all(as.numeric) %>%
gather(key = "variable", value = "valor")
p_hist <- hist_data %>%
ggplot(aes(x = valor, fill = variable)) +
geom_histogram(alpha = 0.6, bins = 30) +
facet_wrap(~variable, scales = "free") +
scale_fill_viridis(discrete = TRUE) +
theme_minimal(base_size = 10) +
theme(legend.position = "none") +
xlab("") +
ylab("Frecuencia")
print(p_hist)p_palta_hist <- ggplot(datos_palta, aes(x = rendimiento_palta, fill = factor(riego_por_goteo))) +
geom_histogram(color = "#e9ecef", alpha = 0.6, position = "identity", binwidth = 0.2) +
scale_fill_manual(values = c("0" = "#69b3a2", "1" = "#404080"), labels = c("Sin riego", "Con riego")) +
theme_minimal(base_size = 10) +
labs(fill = "Riego por Goteo") +
xlab("Rendimiento de palta (t/ha)") +
ylab("Frecuencia de parcelas") +
ggtitle("Distribución de rendimiento según riego por goteo")
print(p_palta_hist)Para las variables Altura de planta (m), Densidad de frutos y Rendimiento (t/ha) según riego por goteo.
plot_a <- ggplot(datos_palta, aes(x = altura_planta, colour = factor(riego_por_goteo))) +
geom_density() +theme_bw() +labs(x = "Altura de planta (m)", colour = "Riego por goteo")
plot_b <- ggplot(datos_palta, aes(x = densidad_frutos, colour = factor(riego_por_goteo))) +
geom_density() +theme_bw() +labs(x = "Densidad de frutos", colour = "Riego por goteo")
plot_c <- ggplot(datos_palta, aes(x = rendimiento_palta, colour = factor(riego_por_goteo))) +
geom_density() +theme_bw() +labs(x = "Rendimiento (t/ha)", colour = "Riego por goteo")
# Combina los tres gráficos con una leyenda común
ggarrange(plot_a, plot_b, plot_c, common.legend = TRUE, legend = "bottom")datosacp_palta <- datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
"altura_planta", "diametro_tronco",
"densidad_frutos", "peso_promedio_fruto",
"rendimiento_palta")]
head(datosacp_palta)## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1 6.60 4.18 53.1 3.82 13.7
## 2 6.83 2.68 41.7 4.14 14.4
## 3 6.51 3.25 52.6 3.52 11.6
## 4 6.40 3.04 43.3 2.78 9.8
## 5 6.65 3.83 47.4 3.99 14.0
## 6 6.52 4.64 57.8 4.44 17.7
## densidad_frutos peso_promedio_fruto rendimiento_palta
## 1 203 222 13.86
## 2 232 211 10.44
## 3 179 212 9.12
## 4 134 221 6.89
## 5 108 207 4.11
## 6 267 268 22.27
## pH_suelo materia_organica humedad_suelo altura_planta
## Min. :5.890 Min. :1.000 Min. :29.70 Min. :1.280
## 1st Qu.:6.370 1st Qu.:3.087 1st Qu.:45.10 1st Qu.:3.340
## Median :6.500 Median :3.700 Median :49.70 Median :3.850
## Mean :6.502 Mean :3.712 Mean :49.76 Mean :3.820
## 3rd Qu.:6.640 3rd Qu.:4.353 3rd Qu.:54.52 3rd Qu.:4.332
## Max. :7.230 Max. :6.820 Max. :70.60 Max. :6.320
## diametro_tronco densidad_frutos peso_promedio_fruto rendimiento_palta
## Min. : 4.80 Min. : 20.0 Min. :158.0 Min. : 0.670
## 1st Qu.:12.00 1st Qu.:134.8 1st Qu.:211.0 1st Qu.: 7.207
## Median :14.05 Median :181.0 Median :229.0 Median :10.450
## Mean :13.91 Mean :182.1 Mean :227.8 Mean :11.102
## 3rd Qu.:15.90 3rd Qu.:230.0 3rd Qu.:244.0 3rd Qu.:14.290
## Max. :23.60 Max. :369.0 Max. :300.0 Max. :30.950
## Descriptive Statistics
## datosacp_palta
## N: 700
##
## altura_planta densidad_frutos diametro_tronco humedad_suelo
## ----------------- --------------- ----------------- ----------------- ---------------
## Mean 3.82 182.06 13.91 49.76
## Std.Dev 0.79 68.84 2.97 6.75
## Min 1.28 20.00 4.80 29.70
## Q1 3.34 134.50 12.00 45.10
## Median 3.85 181.00 14.05 49.70
## Q3 4.34 230.00 15.90 54.55
## Max 6.32 369.00 23.60 70.60
## MAD 0.73 71.16 2.89 6.97
## IQR 0.99 95.25 3.90 9.42
## CV 0.21 0.38 0.21 0.14
## Skewness -0.14 0.08 -0.08 -0.05
## SE.Skewness 0.09 0.09 0.09 0.09
## Kurtosis 0.21 -0.24 0.08 -0.18
## N.Valid 700.00 700.00 700.00 700.00
## N 700.00 700.00 700.00 700.00
## Pct.Valid 100.00 100.00 100.00 100.00
##
## Table: Table continues below
##
##
##
## materia_organica peso_promedio_fruto pH_suelo rendimiento_palta
## ----------------- ------------------ --------------------- ---------- -------------------
## Mean 3.71 227.84 6.50 11.10
## Std.Dev 0.98 23.00 0.21 5.36
## Min 1.00 158.00 5.89 0.67
## Q1 3.08 211.00 6.37 7.20
## Median 3.70 229.00 6.50 10.45
## Q3 4.36 244.00 6.64 14.30
## Max 6.82 300.00 7.23 30.95
## MAD 0.95 25.20 0.21 5.24
## IQR 1.27 33.00 0.27 7.08
## CV 0.26 0.10 0.03 0.48
## Skewness -0.03 0.01 -0.01 0.56
## SE.Skewness 0.09 0.09 0.09 0.09
## Kurtosis 0.05 -0.22 -0.04 0.12
## N.Valid 700.00 700.00 700.00 700.00
## N 700.00 700.00 700.00 700.00
## Pct.Valid 100.00 100.00 100.00 100.00
Algunas interpretaciones de la salida:
El pH promedio = 6.50 (rango 5.89–7.23) indica suelos ligeramente ácidos a neutros, adecuados para palta; la materia orgánica media ≈ 3.7% muestra niveles moderados que favorecen fertilidad y retención de humedad.
Las plantas presentan altura media ≈ 3.82 m y diámetro medio ≈ 13.9cm, con baja variabilidad relativa (CV ≈ 21%), lo que sugiere desarrollo vegetativo bastante uniforme entre unidades de cultivo.
Para la variable “rendimiento_palta” (se puede
incluir otra variable, reemplazando rendimiento_palta por
su nombre).
X = datosacp_palta$rendimiento_palta
Xbar = mean(X)
Sd = sd(X)
mean(((X - Xbar) / Sd)^3) # Asimetría muestral (skewness)## [1] 0.5630444
## [1] 0.1195568
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 0.04286011 0.04018726 0.2563929 0.02759206
## materia_organica 0.04018726 0.96237285 4.9258338 0.44862868
## humedad_suelo 0.25639295 4.92583382 45.5868486 2.54394447
## altura_planta 0.02759206 0.44862868 2.5439445 0.62181119
## diametro_tronco 0.08581955 1.60189990 8.7461582 2.26547920
## densidad_frutos 0.79289230 17.62711506 91.4671980 38.11471653
## peso_promedio_fruto 0.71515187 15.12186383 74.7124402 13.43989575
## rendimiento_palta 0.10184574 2.14749974 15.1202590 3.18133842
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.08581955 0.7928923 0.7151519
## materia_organica 1.60189990 17.6271151 15.1218638
## humedad_suelo 8.74615819 91.4671980 74.7124402
## altura_planta 2.26547920 38.1147165 13.4398957
## diametro_tronco 8.84409884 153.0703086 52.7788281
## densidad_frutos 153.07030860 4738.4173309 869.9248314
## peso_promedio_fruto 52.77882812 869.9248314 529.1484386
## rendimiento_palta 12.85007924 341.8913100 86.5055027
## rendimiento_palta
## pH_suelo 0.1018457
## materia_organica 2.1474997
## humedad_suelo 15.1202590
## altura_planta 3.1813384
## diametro_tronco 12.8500792
## densidad_frutos 341.8913100
## peso_promedio_fruto 86.5055027
## rendimiento_palta 28.7740269
## pH_suelo materia_organica humedad_suelo altura_planta
## 4.286011e-02 9.623728e-01 4.558685e+01 6.218112e-01
## diametro_tronco densidad_frutos peso_promedio_fruto rendimiento_palta
## 8.844099e+00 4.738417e+03 5.291484e+02 2.877403e+01
## [1] 5352.398
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.000 0.198 0.183 0.169
## materia_organica 0.198 1.000 0.744 0.580
## humedad_suelo 0.183 0.744 1.000 0.478
## altura_planta 0.169 0.580 0.478 1.000
## diametro_tronco 0.139 0.549 0.436 0.966
## densidad_frutos 0.056 0.261 0.197 0.702
## peso_promedio_fruto 0.150 0.670 0.481 0.741
## rendimiento_palta 0.092 0.408 0.417 0.752
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.139 0.056 0.150
## materia_organica 0.549 0.261 0.670
## humedad_suelo 0.436 0.197 0.481
## altura_planta 0.966 0.702 0.741
## diametro_tronco 1.000 0.748 0.772
## densidad_frutos 0.748 1.000 0.549
## peso_promedio_fruto 0.772 0.549 1.000
## rendimiento_palta 0.806 0.926 0.701
## rendimiento_palta
## pH_suelo 0.092
## materia_organica 0.408
## humedad_suelo 0.417
## altura_planta 0.752
## diametro_tronco 0.806
## densidad_frutos 0.926
## peso_promedio_fruto 0.701
## rendimiento_palta 1.000
## pH_suelo materia_organica humedad_suelo altura_planta
## 1 1 1 1
## diametro_tronco densidad_frutos peso_promedio_fruto rendimiento_palta
## 1 1 1 1
## [1] 8
## Call:corr.test(x = datosacp_palta)
## Correlation matrix
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.00 0.20 0.18 0.17
## materia_organica 0.20 1.00 0.74 0.58
## humedad_suelo 0.18 0.74 1.00 0.48
## altura_planta 0.17 0.58 0.48 1.00
## diametro_tronco 0.14 0.55 0.44 0.97
## densidad_frutos 0.06 0.26 0.20 0.70
## peso_promedio_fruto 0.15 0.67 0.48 0.74
## rendimiento_palta 0.09 0.41 0.42 0.75
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.14 0.06 0.15
## materia_organica 0.55 0.26 0.67
## humedad_suelo 0.44 0.20 0.48
## altura_planta 0.97 0.70 0.74
## diametro_tronco 1.00 0.75 0.77
## densidad_frutos 0.75 1.00 0.55
## peso_promedio_fruto 0.77 0.55 1.00
## rendimiento_palta 0.81 0.93 0.70
## rendimiento_palta
## pH_suelo 0.09
## materia_organica 0.41
## humedad_suelo 0.42
## altura_planta 0.75
## diametro_tronco 0.81
## densidad_frutos 0.93
## peso_promedio_fruto 0.70
## rendimiento_palta 1.00
## Sample Size
## [1] 700
## Probability values (Entries above the diagonal are adjusted for multiple tests.)
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 0.00 0 0 0
## materia_organica 0.00 0 0 0
## humedad_suelo 0.00 0 0 0
## altura_planta 0.00 0 0 0
## diametro_tronco 0.00 0 0 0
## densidad_frutos 0.14 0 0 0
## peso_promedio_fruto 0.00 0 0 0
## rendimiento_palta 0.02 0 0 0
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0 0.14 0
## materia_organica 0 0.00 0
## humedad_suelo 0 0.00 0
## altura_planta 0 0.00 0
## diametro_tronco 0 0.00 0
## densidad_frutos 0 0.00 0
## peso_promedio_fruto 0 0.00 0
## rendimiento_palta 0 0.00 0
## rendimiento_palta
## pH_suelo 0.03
## materia_organica 0.00
## humedad_suelo 0.00
## altura_planta 0.00
## diametro_tronco 0.00
## densidad_frutos 0.00
## peso_promedio_fruto 0.00
## rendimiento_palta 0.00
##
## To see confidence intervals of the correlations, print with the short=FALSE option
Interpretacion:
Existe una alta correlación entre el diámetro del tronco y la altura de la planta (0.966).
La densidad de frutos se asocia fuertemente con el rendimiento (0.926), seguida por el diámetro del tronco (0.806) y la altura de la planta (0.75), lo que refleja que plantas más grandes y con más frutos contribuyen directamente a un mayor rendimiento.
También se observa una correlación notable entre el peso promedio del fruto y el rendimiento (0.701), lo que confirma que el tamaño del fruto influye significativamente en la productividad total.
# Correlaciones solo de variables cuantitativas
i <- cor(datosacp_palta, method = "pearson")#matriz de correlaciones
# Plot base
corrplot(i, sig.level = 0.05, type = "lower") # solo la mitad inferiorcorrplot(i, method = "ellipse", order = "AOE", type = "upper", tl.pos = "d")
corrplot(i, add = TRUE, type = "lower", method = "number", order = "AOE", diag = FALSE, tl.pos = "n", cl.pos = "n")## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 0.000000e+00 1.304675e-07 1.029993e-06 6.919805e-06
## materia_organica 1.304675e-07 0.000000e+00 3.492021e-124 3.761911e-64
## humedad_suelo 1.029993e-06 3.492021e-124 0.000000e+00 3.287700e-41
## altura_planta 6.919805e-06 3.761911e-64 3.287700e-41 0.000000e+00
## diametro_tronco 2.161044e-04 2.264161e-56 8.902520e-34 0.000000e+00
## densidad_frutos 1.414130e-01 2.284848e-12 1.529303e-07 4.620912e-105
## peso_promedio_fruto 6.644740e-05 2.006832e-92 8.026033e-42 8.399153e-123
## rendimiento_palta 1.521610e-02 1.797091e-29 6.740836e-31 1.597339e-128
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 2.161044e-04 1.414130e-01 6.644740e-05
## materia_organica 2.264161e-56 2.284848e-12 2.006832e-92
## humedad_suelo 8.902520e-34 1.529303e-07 8.026033e-42
## altura_planta 0.000000e+00 4.620912e-105 8.399153e-123
## diametro_tronco 0.000000e+00 3.005173e-126 3.205996e-139
## densidad_frutos 3.005173e-126 0.000000e+00 1.916394e-56
## peso_promedio_fruto 3.205996e-139 1.916394e-56 0.000000e+00
## rendimiento_palta 8.748976e-161 2.440895e-297 1.360827e-104
## rendimiento_palta
## pH_suelo 1.521610e-02
## materia_organica 1.797091e-29
## humedad_suelo 6.740836e-31
## altura_planta 1.597339e-128
## diametro_tronco 8.748976e-161
## densidad_frutos 2.440895e-297
## peso_promedio_fruto 1.360827e-104
## rendimiento_palta 0.000000e+00
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.00000000 0.1256136 0.1108291 0.09611713
## materia_organica 0.12561363 1.0000000 0.7086330 0.52855615
## humedad_suelo 0.11082905 0.7086330 1.0000000 0.41852987
## altura_planta 0.09611713 0.5285562 0.4185299 1.00000000
## diametro_tronco 0.06596894 0.4951247 0.3735370 0.96073377
## densidad_frutos -0.01854137 0.1906158 0.1245148 0.66254907
## peso_promedio_fruto 0.07692305 0.6271475 0.4219830 0.70556760
## rendimiento_palta 0.01772746 0.3444072 0.3543427 0.71802312
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.06596894 -0.01854137 0.07692305
## materia_organica 0.49512465 0.19061576 0.62714749
## humedad_suelo 0.37353698 0.12451477 0.42198298
## altura_planta 0.96073377 0.66254907 0.70556760
## diametro_tronco 1.00000000 0.71314675 0.73970163
## densidad_frutos 0.71314675 1.00000000 0.49545186
## peso_promedio_fruto 0.73970163 0.49545186 1.00000000
## rendimiento_palta 0.77785285 0.91456292 0.66131175
## rendimiento_palta
## pH_suelo 0.01772746
## materia_organica 0.34440722
## humedad_suelo 0.35434267
## altura_planta 0.71802312
## diametro_tronco 0.77785285
## densidad_frutos 0.91456292
## peso_promedio_fruto 0.66131175
## rendimiento_palta 1.00000000
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.0000000 0.2680470 0.2540748 0.2401117
## materia_organica 0.2680470 1.0000000 0.7750730 0.6270971
## humedad_suelo 0.2540748 0.7750730 1.0000000 0.5330429
## altura_planta 0.2401117 0.6270971 0.5330429 1.0000000
## diametro_tronco 0.2113105 0.5988194 0.4937485 0.9706742
## densidad_frutos 0.1292080 0.3287748 0.2670106 0.7378855
## peso_promedio_fruto 0.2218045 0.7090040 0.5360384 0.7726136
## rendimiento_palta 0.1646934 0.4680436 0.4768345 0.7825944
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.2113105 0.1292080 0.2218045
## materia_organica 0.5988194 0.3287748 0.7090040
## humedad_suelo 0.4937485 0.2670106 0.5360384
## altura_planta 0.9706742 0.7378855 0.7726136
## diametro_tronco 1.0000000 0.7786908 0.7998868
## densidad_frutos 0.7786908 1.0000000 0.5990974
## peso_promedio_fruto 0.7998868 0.5990974 1.0000000
## rendimiento_palta 0.8300785 0.9358092 0.7368807
## rendimiento_palta
## pH_suelo 0.1646934
## materia_organica 0.4680436
## humedad_suelo 0.4768345
## altura_planta 0.7825944
## diametro_tronco 0.8300785
## densidad_frutos 0.9358092
## peso_promedio_fruto 0.7368807
## rendimiento_palta 1.0000000
## a b
## [1,] 6.60 13.86
## [2,] 6.83 10.44
## [3,] 6.51 9.12
## [4,] 6.40 6.89
## [5,] 6.65 4.11
## [6,] 6.52 22.27
##
## Shapiro-Wilk normality test
##
## data: Z
## W = 0.97643, p-value = 3.446e-09
Interpretación:
El análisis de correlación muestra que la mayoría de las asociaciones entre las variables son altamente significativas (p < 0.05).
Primera forma
col1 <- colorRampPalette(c("#7F0000","red","#FF7F00","yellow","white",
"cyan", "#007FFF", "blue","#00007F"))
corrplot(cor(datosacp_palta),
title = "Matriz de correlacion", mar=c(0,0,1,0),
method = "color", outline = T, addgrid.col = "darkgray",
order = "hclust", addrect = 3, col=col1(100),
tl.col='black', tl.cex=.75)Segunda forma
Tercera forma
Cuarta forma - Mapa de Calor
## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.00000000 0.1978746 0.1834255 0.1690161
## materia_organica 0.19787459 1.0000000 0.7436837 0.5799440
## humedad_suelo 0.18342547 0.7436837 1.0000000 0.4778137
## altura_planta 0.16901615 0.5799440 0.4778137 1.0000000
## diametro_tronco 0.13939038 0.5490816 0.4355828 0.9660598
## densidad_frutos 0.05563792 0.2610315 0.1968017 0.7021773
## peso_promedio_fruto 0.15016989 0.6701081 0.4810435 0.7409312
## rendimiento_palta 0.09170983 0.4080949 0.4174833 0.7521081
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.1393904 0.05563792 0.1501699
## materia_organica 0.5490816 0.26103149 0.6701081
## humedad_suelo 0.4355828 0.19680174 0.4810435
## altura_planta 0.9660598 0.70217728 0.7409312
## diametro_tronco 1.0000000 0.74773466 0.7715147
## densidad_frutos 0.7477347 1.00000000 0.5493844
## peso_promedio_fruto 0.7715147 0.54938439 1.0000000
## rendimiento_palta 0.8055244 0.92591493 0.7010591
## rendimiento_palta
## pH_suelo 0.09170983
## materia_organica 0.40809485
## humedad_suelo 0.41748332
## altura_planta 0.75210812
## diametro_tronco 0.80552438
## densidad_frutos 0.92591493
## peso_promedio_fruto 0.70105913
## rendimiento_palta 1.00000000
# Correlograma básico
ggcorrplot(corr) +
ggtitle("Correlograma de variables de cultivo de palta") +
theme_minimal()## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the ggcorrplot package.
## Please report the issue at <https://github.com/kassambara/ggcorrplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Correlograma con círculos
ggcorrplot(corr, method = 'circle') +
ggtitle("Correlograma de variables de cultivo de palta") +
theme_minimal()# Correlograma con círculos, solo la parte inferior
ggcorrplot(corr, method = 'circle', type = 'lower') +
ggtitle("Correlograma de variables de cultivo de palta") +
theme_minimal()# Correlograma con círculos, parte inferior y etiquetas de valores
ggcorrplot(corr, method = 'circle', type = 'lower', lab = TRUE) +
ggtitle("Correlograma de variables de cultivo de palta") +
theme_minimal() +
theme(legend.position = "none")## Class: pca dudi
## Call: dudi.pca(df = datosacp_palta, scale = TRUE, scannf = FALSE, nf = ncol(datosacp_palta))
##
## Total inertia: 8
##
## Eigenvalues:
## Ax1 Ax2 Ax3 Ax4 Ax5
## 4.7874 1.3071 0.9046 0.4382 0.3095
##
## Projected inertia (%):
## Ax1 Ax2 Ax3 Ax4 Ax5
## 59.843 16.339 11.308 5.478 3.869
##
## Cumulative projected inertia (%):
## Ax1 Ax1:2 Ax1:3 Ax1:4 Ax1:5
## 59.84 76.18 87.49 92.97 96.84
##
## (Only 5 dimensions (out of 8) are shown)
Interpretación:
Las dos primeras componentes (CP1 y CP2) explican juntas más del 76% de la variabilidad tota. Esto indica que la mayoría de la información del cultivo puede resumirse en solo dos dimensiones.
## [1] 4.78741957 1.30710247 0.90461427 0.43820555 0.30950446 0.19388083 0.03615950
## [8] 0.02311336
## Duality diagramm
## class: pca dudi
## $call: dudi.pca(df = datosacp_palta, scale = TRUE, scannf = FALSE, nf = ncol(datosacp_palta))
##
## $nf: 8 axis-components saved
## $rank: 8
## eigen values: 4.787 1.307 0.9046 0.4382 0.3095 ...
## vector length mode content
## 1 $cw 8 numeric column weights
## 2 $lw 700 numeric row weights
## 3 $eig 8 numeric eigen values
##
## data.frame nrow ncol content
## 1 $tab 700 8 modified array
## 2 $li 700 8 row coordinates
## 3 $l1 700 8 row normed scores
## 4 $co 8 8 column coordinates
## 5 $c1 8 8 column normed scores
## other elements: cent norm
Interpretación:
Las dos primeras componentes serán las retenidas ya que sus autovalores son mayores a 1.
## [1] 4.78741957 1.30710247 0.90461427 0.43820555 0.30950446 0.19388083 0.03615950
## [8] 0.02311336
## [1] 8
## Inertia information:
## Call: inertia.dudi(x = acp)
##
## Decomposition of total inertia:
## inertia cum cum(%)
## Ax1 4.78742 4.787 59.84
## Ax2 1.30710 6.095 76.18
## Ax3 0.90461 6.999 87.49
## Ax4 0.43821 7.437 92.97
## Ax5 0.30950 7.747 96.84
## Ax6 0.19388 7.941 99.26
## Ax7 0.03616 7.977 99.71
## Ax8 0.02311 8.000 100.00
De la salida se puede observar que se van a retener las dos primeras componentes.
## CS1 CS2 CS3 CS4 CS5
## pH_suelo -0.0958497 -0.38970363 0.91459571 -0.02983693 0.03647324
## materia_organica -0.3248315 -0.49583189 -0.24621751 0.12139001 0.19006248
## humedad_suelo -0.2836901 -0.52646119 -0.26646173 -0.57385466 -0.20253958
## altura_planta -0.4218724 0.07694301 0.02990179 0.27927602 -0.54932084
## diametro_tronco -0.4271249 0.14250364 0.02867147 0.27361210 -0.40172778
## densidad_frutos -0.3566832 0.45646985 0.14317616 -0.36637598 0.14648383
## peso_promedio_fruto -0.3932134 -0.06761119 -0.07961749 0.46090615 0.60860511
## rendimiento_palta -0.4031942 0.29318410 0.05775162 -0.39438627 0.25792906
## CS6 CS7 CS8
## pH_suelo -0.004550960 0.01078702 -0.01004975
## materia_organica 0.719481268 0.12713800 0.05775384
## humedad_suelo -0.391938002 -0.15661317 -0.15126852
## altura_planta -0.008400688 -0.36691923 0.54841638
## diametro_tronco -0.062641863 0.47500807 -0.57500394
## densidad_frutos 0.342121982 -0.50278021 -0.34407657
## peso_promedio_fruto -0.445521439 -0.22029313 -0.06797027
## rendimiento_palta -0.095808242 0.54553872 0.46827623
## Comp1 Comp2 Comp3 Comp4 Comp5
## pH_suelo -0.2097208 -0.44554263 0.86988306 -0.01975118 0.02029120
## materia_organica -0.7107370 -0.56687757 -0.23418046 0.08035666 0.10573770
## humedad_suelo -0.6207188 -0.60189562 -0.25343498 -0.37987512 -0.11267910
## altura_planta -0.9230642 0.08796785 0.02843996 0.18487262 -0.30560435
## diametro_tronco -0.9345566 0.16292239 0.02726978 0.18112327 -0.22349372
## densidad_frutos -0.7804290 0.52187551 0.13617658 -0.24253026 0.08149353
## peso_promedio_fruto -0.8603576 -0.07729892 -0.07572516 0.30510649 0.33858604
## rendimiento_palta -0.8821959 0.33519322 0.05492826 -0.26107226 0.14349400
## Comp6 Comp7 Comp8
## pH_suelo -0.002003874 0.002051222 -0.001527871
## materia_organica 0.316801282 0.024176118 0.008780361
## humedad_suelo -0.172577754 -0.029781014 -0.022997471
## altura_planta -0.003698983 -0.069772079 0.083376172
## diametro_tronco -0.027582403 0.090325877 -0.087418299
## densidad_frutos 0.150642814 -0.095606930 -0.052310230
## peso_promedio_fruto -0.196171561 -0.041890172 -0.010333574
## rendimiento_palta -0.042186190 0.103737737 0.071192401
Grafica de valores propios (ScreePlot)
plot(acp$eig, type="b", pch=20, col="blue", lwd=2,
main="ScreePlot - ACP Datos Palta",
xlab="Componentes Principales", ylab="Valores Propios")
abline(h=1, lty=3, col="red", lwd=3.5)a = fviz_eig(acp, choice='eigenvalue', geom="line", linecolor = '#3A5FCD',
xlab='Componentes Principales') +
geom_hline(yintercept = 1, color='#EE6363') +
theme_grey()
aDel grafico se puede observar que se van a retener las dos primeras componentes, ya que sus autovalores son mayores a 1.
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 4.78741957 59.8427446 59.84274
## Dim.2 1.30710247 16.3387808 76.18153
## Dim.3 0.90461427 11.3076784 87.48920
## Dim.4 0.43820555 5.4775693 92.96677
## Dim.5 0.30950446 3.8688057 96.83558
## Dim.6 0.19388083 2.4235104 99.25909
## Dim.7 0.03615950 0.4519937 99.71108
## Dim.8 0.02311336 0.2889170 100.00000
barplot(eig.val[, 2], names.arg = 1:nrow(eig.val),
main = "Autovalores - ACP Datos Palta",
xlab = "Componentes Principales",
ylab = "Porcentaje de varianza explicada",
col = "steelblue")
lines(x = 1:nrow(eig.val), eig.val[, 2], type = "b", pch = 19, col = "red")Interpretación:
Se puede ver del gráfico que muchas de las variables estan relacionadas con la componente 1 y con la componente 2, además se puede apreciar que la variable PH_suelo estan relacionada con otra componente dfierente a las mencionadas.
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
## Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## [1] 700 8
## Axis1 Axis2 Axis3 Axis4 Axis5 Axis6
## 1 -0.5269317 -0.3852071 0.27541873 -0.6915387 0.05871837 0.31918897
## 2 0.3659868 0.9323113 2.19971442 0.1136263 -0.56108600 0.27585610
## 3 0.9584374 -0.2253692 0.03283347 -0.7747976 -0.17338509 -0.12571244
## 4 2.3720363 0.2080953 -0.22774461 0.1622781 0.84003434 -0.04973325
## 5 1.1539900 -0.9461936 0.56800196 0.7531754 -1.05688267 0.37668962
## 6 -3.4980829 0.1678297 -0.25279652 -0.4720774 0.77864537 -0.42895220
## 7 -2.2719604 0.1981581 0.26513200 -0.8331914 0.43512877 -0.27702911
## 8 0.3179467 0.2595818 -0.07262689 0.9497027 0.59986701 -0.18337484
## 9 1.7341834 -0.9690540 0.34051792 -1.1261031 0.42025518 -0.17319653
## 10 -0.8445947 -0.2195026 -1.64602563 0.2189158 -0.51117508 -0.37567426
## Axis7 Axis8
## 1 0.13842809 0.141402167
## 2 -0.27123039 -0.026587097
## 3 -0.38239439 0.035260501
## 4 -0.12691837 0.073667232
## 5 0.04258159 -0.025792503
## 6 0.38276479 0.003110153
## 7 0.11333830 0.066606408
## 8 -0.12436840 -0.220234390
## 9 -0.22842836 -0.047594908
## 10 -0.18313942 -0.147829786
## Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8
## Axis1 4.7943 0.000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis2 0.0000 1.309 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis3 0.0000 0.000 0.9059 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis4 0.0000 0.000 0.0000 0.4388 0.0000 0.0000 0.0000 0.0000
## Axis5 0.0000 0.000 0.0000 0.0000 0.3099 0.0000 0.0000 0.0000
## Axis6 0.0000 0.000 0.0000 0.0000 0.0000 0.1942 0.0000 0.0000
## Axis7 0.0000 0.000 0.0000 0.0000 0.0000 0.0000 0.0362 0.0000
## Axis8 0.0000 0.000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0231
## Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8
## Axis1 1 0 0 0 0 0 0 0
## Axis2 0 1 0 0 0 0 0 0
## Axis3 0 0 1 0 0 0 0 0
## Axis4 0 0 0 1 0 0 0 0
## Axis5 0 0 0 0 1 0 0 0
## Axis6 0 0 0 0 0 1 0 0
## Axis7 0 0 0 0 0 0 1 0
## Axis8 0 0 0 0 0 0 0 1
Interpretación:
Sepuede observar que aqui cada uno de los componentes ya no están correlacionados lo cual es lo que se debe cumplir para seguir con el análisis.
## # A tibble: 8 × 26
## described_variables n na mean sd se_mean IQR skewness
## <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Axis1 700 0 1.52e-16 2.19 0.0828 3.07 -0.0153
## 2 Axis2 700 0 2.59e-16 1.14 0.0432 1.61 -0.126
## 3 Axis3 700 0 -5.31e-16 0.952 0.0360 1.26 0.136
## 4 Axis4 700 0 -4.91e-16 0.662 0.0250 0.912 0.0787
## 5 Axis5 700 0 -4.27e-16 0.557 0.0210 0.780 0.0196
## 6 Axis6 700 0 1.67e-17 0.441 0.0167 0.596 -0.00588
## 7 Axis7 700 0 1.41e-16 0.190 0.00719 0.262 -0.113
## 8 Axis8 700 0 -1.89e-16 0.152 0.00575 0.201 0.152
## # ℹ 18 more variables: kurtosis <dbl>, p00 <dbl>, p01 <dbl>, p05 <dbl>,
## # p10 <dbl>, p20 <dbl>, p25 <dbl>, p30 <dbl>, p40 <dbl>, p50 <dbl>,
## # p60 <dbl>, p70 <dbl>, p75 <dbl>, p80 <dbl>, p90 <dbl>, p95 <dbl>,
## # p99 <dbl>, p100 <dbl>
# Grafica individuos sobre el primer plano (PC1 vs PC2)
s.label(acp$li, xax=1, yax=2, clabel=0.7, grid=FALSE, boxes=FALSE)# Grafica sobre el plano PC1 vs PC2
s.label(acp$li, xax=1, yax=2, clabel=0.7, grid=FALSE, boxes=FALSE)# Biplot clásico con ade4
s.label(acp$li, clabel=0.7, grid=FALSE, boxes=FALSE)
s.corcircle(acp$co, grid=FALSE, add.plot=TRUE, clabel=0.7)# Biplot más estético con factoextra
library(factoextra)
d= fviz_pca_biplot(acp, repel=F,
col.var="#EE3A8C",
col.ind="green")
d# Crear salida combinando variables originales y los scores PC1-PC3
salidaacp_palta <- cbind(datosacp_palta, acp$li[, c(1,2,3)])
head(salidaacp_palta) # Ver primeras filas## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1 6.60 4.18 53.1 3.82 13.7
## 2 6.83 2.68 41.7 4.14 14.4
## 3 6.51 3.25 52.6 3.52 11.6
## 4 6.40 3.04 43.3 2.78 9.8
## 5 6.65 3.83 47.4 3.99 14.0
## 6 6.52 4.64 57.8 4.44 17.7
## densidad_frutos peso_promedio_fruto rendimiento_palta Axis1 Axis2
## 1 203 222 13.86 -0.5269317 -0.3852071
## 2 232 211 10.44 0.3659868 0.9323113
## 3 179 212 9.12 0.9584374 -0.2253692
## 4 134 221 6.89 2.3720363 0.2080953
## 5 108 207 4.11 1.1539900 -0.9461936
## 6 267 268 22.27 -3.4980829 0.1678297
## Axis3
## 1 0.27541873
## 2 2.19971442
## 3 0.03283347
## 4 -0.22774461
## 5 0.56800196
## 6 -0.25279652
# Guardar CSV (archivo en el directorio de trabajo)
write.csv(salidaacp_palta, "P_palta.csv", row.names = FALSE)
# Screeplot (autovalores) — ver cuánto explica cada componente
fviz_eig(acp, ncp = ncol(datosacp_palta), addlabels = TRUE, hjust = 0.5,
barfill = "violet", barcolor = "blue")Para visualizar los individuos del ACP de palta:
colorplot(acp$li, acp$li,
transp = FALSE, cex = 2,
xlab = "PC1", ylab = "PC2")
title("Análisis PCA de datos de palta")
abline(v = 0, h = 0, col = "black", lty = 2)Pareciera que hubiera dos grupos en este gráfico.
# Escalamiento
datosacp_palta1 <- scale(datosacp_palta)
# Limpieza (por si hay NA o texto)
datosacp_palta1 <- na.omit(as.data.frame(apply(datosacp_palta1, 2, as.numeric)))
# Matriz de covarianza
round(cov(datosacp_palta1), 3)## pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo 1.000 0.198 0.183 0.169
## materia_organica 0.198 1.000 0.744 0.580
## humedad_suelo 0.183 0.744 1.000 0.478
## altura_planta 0.169 0.580 0.478 1.000
## diametro_tronco 0.139 0.549 0.436 0.966
## densidad_frutos 0.056 0.261 0.197 0.702
## peso_promedio_fruto 0.150 0.670 0.481 0.741
## rendimiento_palta 0.092 0.408 0.417 0.752
## diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo 0.139 0.056 0.150
## materia_organica 0.549 0.261 0.670
## humedad_suelo 0.436 0.197 0.481
## altura_planta 0.966 0.702 0.741
## diametro_tronco 1.000 0.748 0.772
## densidad_frutos 0.748 1.000 0.549
## peso_promedio_fruto 0.772 0.549 1.000
## rendimiento_palta 0.806 0.926 0.701
## rendimiento_palta
## pH_suelo 0.092
## materia_organica 0.408
## humedad_suelo 0.417
## altura_planta 0.752
## diametro_tronco 0.806
## densidad_frutos 0.926
## peso_promedio_fruto 0.701
## rendimiento_palta 1.000
# Identificación de grupos
# Retenemos las primeras 2 componentes y forzamos 2 clusters
grp <- find.clusters(datosacp_palta1, max.n.clust = 8, n.pca = 2, n.clust = 2)
# Análisis DAPC (también no interactivo)
dapc.WIDIV <- dapc(datosacp_palta1, grp$grp, n.pca = 2, n.da = 1)
# Gráfico de dispersión DAPC
scatter(dapc.WIDIV, posi.da = "bottomright", bg = "white", pch = 17:22, cstar = 0)Intrepretación:
Se puede observar que existe superposición, quiere decir que se ha clasificado de mal manera ya que unos rojos han sido clasificados como azules y viceversa.
Darle 2 componentes y 1 función discriminante.
# Convertir a tibble
contrib1 <- tibble(
nombre = contrib$var.names,
valor = contrib$var.values
)
# Ordenar por contribución descendente
orden <- contrib1 %>%
arrange(desc(valor))
# Mostrar las variables más discriminantes
head(orden)## # A tibble: 6 × 2
## nombre valor
## <chr> <dbl>
## 1 diametro_tronco 0.179
## 2 altura_planta 0.176
## 3 rendimiento_palta 0.157
## 4 peso_promedio_fruto 0.156
## 5 densidad_frutos 0.120
## 6 materia_organica 0.113
##
## Call:
## PCA(X = datosacp_palta, scale.unit = TRUE, ncp = 8, graph = TRUE)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 4.787 1.307 0.905 0.438 0.310 0.194 0.036
## % of var. 59.843 16.339 11.308 5.478 3.869 2.424 0.452
## Cumulative % of var. 59.843 76.182 87.489 92.967 96.836 99.259 99.711
## Dim.8
## Variance 0.023
## % of var. 0.289
## Cumulative % of var. 100.000
##
## Individuals (the 10 first)
## Dist Dim.1 ctr cos2 Dim.2 ctr cos2
## 1 | 1.060 | 0.527 0.008 0.247 | 0.385 0.016 0.132 |
## 2 | 2.514 | -0.366 0.004 0.021 | -0.932 0.095 0.138 |
## 3 | 1.328 | -0.958 0.027 0.521 | 0.225 0.006 0.029 |
## 4 | 2.545 | -2.372 0.168 0.869 | -0.208 0.005 0.007 |
## 5 | 2.092 | -1.154 0.040 0.304 | 0.946 0.098 0.204 |
## 6 | 3.673 | 3.498 0.365 0.907 | -0.168 0.003 0.002 |
## 7 | 2.500 | 2.272 0.154 0.826 | -0.198 0.004 0.006 |
## 8 | 1.238 | -0.318 0.003 0.066 | -0.260 0.007 0.044 |
## 9 | 2.365 | -1.734 0.090 0.538 | 0.969 0.103 0.168 |
## 10 | 1.994 | 0.845 0.021 0.179 | 0.220 0.005 0.012 |
## Dim.3 ctr cos2
## 1 0.275 0.012 0.067 |
## 2 2.200 0.764 0.766 |
## 3 0.033 0.000 0.001 |
## 4 -0.228 0.008 0.008 |
## 5 0.568 0.051 0.074 |
## 6 -0.253 0.010 0.005 |
## 7 0.265 0.011 0.011 |
## 8 -0.073 0.001 0.003 |
## 9 0.341 0.018 0.021 |
## 10 -1.646 0.428 0.681 |
##
## Variables
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3
## pH_suelo | 0.210 0.919 0.044 | 0.446 15.187 0.199 | 0.870
## materia_organica | 0.711 10.552 0.505 | 0.567 24.585 0.321 | -0.234
## humedad_suelo | 0.621 8.048 0.385 | 0.602 27.716 0.362 | -0.253
## altura_planta | 0.923 17.798 0.852 | -0.088 0.592 0.008 | 0.028
## diametro_tronco | 0.935 18.244 0.873 | -0.163 2.031 0.027 | 0.027
## densidad_frutos | 0.780 12.722 0.609 | -0.522 20.836 0.272 | 0.136
## peso_promedio_fruto | 0.860 15.462 0.740 | 0.077 0.457 0.006 | -0.076
## rendimiento_palta | 0.882 16.257 0.778 | -0.335 8.596 0.112 | 0.055
## ctr cos2
## pH_suelo 83.649 0.757 |
## materia_organica 6.062 0.055 |
## humedad_suelo 7.100 0.064 |
## altura_planta 0.089 0.001 |
## diametro_tronco 0.082 0.001 |
## densidad_frutos 2.050 0.019 |
## peso_promedio_fruto 0.634 0.006 |
## rendimiento_palta 0.334 0.003 |
Interpretaciones:
De igual manera se puede observar que las dos primeras componentes son mayores a 1, los cuales serán retenidas.
También la primera componente explica el 59.84% de la variabilidad total y el autovalor el 16.33%.
El 27.716% de la variablilidad total de la dimensión 2 es explicado por la variable humedad del suelo.
El 36.2% de la vriabilidad de al variable humedad del suelo es explicado por la dimensión 2.
## [1] 100
## [1] 1
## [1] 100
## [1] 1
# PCA usando FactoMineR (aplicar sobre las variables cuantitativas de palta)
respca = PCA(datosacp_palta, scale.unit = TRUE, ncp = 9, graph = TRUE)##
## Call:
## PCA(X = datosacp_palta, scale.unit = TRUE, ncp = 9, graph = TRUE)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 4.787 1.307 0.905 0.438 0.310 0.194 0.036
## % of var. 59.843 16.339 11.308 5.478 3.869 2.424 0.452
## Cumulative % of var. 59.843 76.182 87.489 92.967 96.836 99.259 99.711
## Dim.8
## Variance 0.023
## % of var. 0.289
## Cumulative % of var. 100.000
##
## Individuals (the 10 first)
## Dist Dim.1 ctr cos2 Dim.2 ctr cos2
## 1 | 1.060 | 0.527 0.008 0.247 | 0.385 0.016 0.132 |
## 2 | 2.514 | -0.366 0.004 0.021 | -0.932 0.095 0.138 |
## 3 | 1.328 | -0.958 0.027 0.521 | 0.225 0.006 0.029 |
## 4 | 2.545 | -2.372 0.168 0.869 | -0.208 0.005 0.007 |
## 5 | 2.092 | -1.154 0.040 0.304 | 0.946 0.098 0.204 |
## 6 | 3.673 | 3.498 0.365 0.907 | -0.168 0.003 0.002 |
## 7 | 2.500 | 2.272 0.154 0.826 | -0.198 0.004 0.006 |
## 8 | 1.238 | -0.318 0.003 0.066 | -0.260 0.007 0.044 |
## 9 | 2.365 | -1.734 0.090 0.538 | 0.969 0.103 0.168 |
## 10 | 1.994 | 0.845 0.021 0.179 | 0.220 0.005 0.012 |
## Dim.3 ctr cos2
## 1 0.275 0.012 0.067 |
## 2 2.200 0.764 0.766 |
## 3 0.033 0.000 0.001 |
## 4 -0.228 0.008 0.008 |
## 5 0.568 0.051 0.074 |
## 6 -0.253 0.010 0.005 |
## 7 0.265 0.011 0.011 |
## 8 -0.073 0.001 0.003 |
## 9 0.341 0.018 0.021 |
## 10 -1.646 0.428 0.681 |
##
## Variables
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3
## pH_suelo | 0.210 0.919 0.044 | 0.446 15.187 0.199 | 0.870
## materia_organica | 0.711 10.552 0.505 | 0.567 24.585 0.321 | -0.234
## humedad_suelo | 0.621 8.048 0.385 | 0.602 27.716 0.362 | -0.253
## altura_planta | 0.923 17.798 0.852 | -0.088 0.592 0.008 | 0.028
## diametro_tronco | 0.935 18.244 0.873 | -0.163 2.031 0.027 | 0.027
## densidad_frutos | 0.780 12.722 0.609 | -0.522 20.836 0.272 | 0.136
## peso_promedio_fruto | 0.860 15.462 0.740 | 0.077 0.457 0.006 | -0.076
## rendimiento_palta | 0.882 16.257 0.778 | -0.335 8.596 0.112 | 0.055
## ctr cos2
## pH_suelo 83.649 0.757 |
## materia_organica 6.062 0.055 |
## humedad_suelo 7.100 0.064 |
## altura_planta 0.089 0.001 |
## diametro_tronco 0.082 0.001 |
## densidad_frutos 2.050 0.019 |
## peso_promedio_fruto 0.634 0.006 |
## rendimiento_palta 0.334 0.003 |
## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 4.78741957 59.8427446 59.84274
## comp 2 1.30710247 16.3387808 76.18153
## comp 3 0.90461427 11.3076784 87.48920
## comp 4 0.43820555 5.4775693 92.96677
## comp 5 0.30950446 3.8688057 96.83558
## comp 6 0.19388083 2.4235104 99.25909
## comp 7 0.03615950 0.4519937 99.71108
## comp 8 0.02311336 0.2889170 100.00000
## $coord
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## pH_suelo 0.2097208 0.44554263 0.86988306 0.01975118 0.02029120
## materia_organica 0.7107370 0.56687757 -0.23418046 -0.08035666 0.10573770
## humedad_suelo 0.6207188 0.60189562 -0.25343498 0.37987512 -0.11267910
## altura_planta 0.9230642 -0.08796785 0.02843996 -0.18487262 -0.30560435
## diametro_tronco 0.9345566 -0.16292239 0.02726978 -0.18112327 -0.22349372
## densidad_frutos 0.7804290 -0.52187551 0.13617658 0.24253026 0.08149353
## peso_promedio_fruto 0.8603576 0.07729892 -0.07572516 -0.30510649 0.33858604
## rendimiento_palta 0.8821959 -0.33519322 0.05492826 0.26107226 0.14349400
## Dim.6 Dim.7 Dim.8
## pH_suelo -0.002003874 -0.002051222 0.001527871
## materia_organica 0.316801282 -0.024176118 -0.008780361
## humedad_suelo -0.172577754 0.029781014 0.022997471
## altura_planta -0.003698983 0.069772079 -0.083376172
## diametro_tronco -0.027582403 -0.090325877 0.087418299
## densidad_frutos 0.150642814 0.095606930 0.052310230
## peso_promedio_fruto -0.196171561 0.041890172 0.010333574
## rendimiento_palta -0.042186190 -0.103737737 -0.071192401
##
## $cor
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## pH_suelo 0.2097208 0.44554263 0.86988306 0.01975118 0.02029120
## materia_organica 0.7107370 0.56687757 -0.23418046 -0.08035666 0.10573770
## humedad_suelo 0.6207188 0.60189562 -0.25343498 0.37987512 -0.11267910
## altura_planta 0.9230642 -0.08796785 0.02843996 -0.18487262 -0.30560435
## diametro_tronco 0.9345566 -0.16292239 0.02726978 -0.18112327 -0.22349372
## densidad_frutos 0.7804290 -0.52187551 0.13617658 0.24253026 0.08149353
## peso_promedio_fruto 0.8603576 0.07729892 -0.07572516 -0.30510649 0.33858604
## rendimiento_palta 0.8821959 -0.33519322 0.05492826 0.26107226 0.14349400
## Dim.6 Dim.7 Dim.8
## pH_suelo -0.002003874 -0.002051222 0.001527871
## materia_organica 0.316801282 -0.024176118 -0.008780361
## humedad_suelo -0.172577754 0.029781014 0.022997471
## altura_planta -0.003698983 0.069772079 -0.083376172
## diametro_tronco -0.027582403 -0.090325877 0.087418299
## densidad_frutos 0.150642814 0.095606930 0.052310230
## peso_promedio_fruto -0.196171561 0.041890172 0.010333574
## rendimiento_palta -0.042186190 -0.103737737 -0.071192401
##
## $cos2
## Dim.1 Dim.2 Dim.3 Dim.4
## pH_suelo 0.04398281 0.198508240 0.7566965462 0.0003901092
## materia_organica 0.50514704 0.321350183 0.0548404885 0.0064571932
## humedad_suelo 0.38529182 0.362278334 0.0642292877 0.1443051048
## altura_planta 0.85204751 0.007738342 0.0008088312 0.0341778838
## diametro_tronco 0.87339606 0.026543704 0.0007436411 0.0328056372
## densidad_frutos 0.60906947 0.272354048 0.0185440622 0.0588209247
## peso_promedio_fruto 0.74021525 0.005975123 0.0057343000 0.0930899684
## rendimiento_palta 0.77826959 0.112354494 0.0030171141 0.0681587240
## Dim.5 Dim.6 Dim.7 Dim.8
## pH_suelo 0.000411733 4.015512e-06 4.207510e-06 2.334391e-06
## materia_organica 0.011180461 1.003631e-01 5.844847e-04 7.709474e-05
## humedad_suelo 0.012696579 2.978308e-02 8.869088e-04 5.288837e-04
## altura_planta 0.093394017 1.368247e-05 4.868143e-03 6.951586e-03
## diametro_tronco 0.049949441 7.607890e-04 8.158764e-03 7.641959e-03
## densidad_frutos 0.006641196 2.269326e-02 9.140685e-03 2.736360e-03
## peso_promedio_fruto 0.114640506 3.848328e-02 1.754787e-03 1.067828e-04
## rendimiento_palta 0.020590527 1.779675e-03 1.076152e-02 5.068358e-03
##
## $contrib
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## pH_suelo 0.9187165 15.1868920 83.64853070 0.08902424 0.1330297
## materia_organica 10.5515515 24.5849267 6.06230637 1.47355351 3.6123748
## humedad_suelo 8.0480062 27.7161388 7.10018511 32.93091710 4.1022280
## altura_planta 17.7976361 0.5920226 0.08941172 7.79950965 30.1753381
## diametro_tronco 18.2435663 2.0307287 0.08220533 7.48635831 16.1385206
## densidad_frutos 12.7222914 20.8364726 2.04994137 13.42313564 2.1457512
## peso_promedio_fruto 15.4616750 0.4571273 0.63389448 21.24344828 37.0400176
## rendimiento_palta 16.2565570 8.5956914 0.33352492 15.55405328 6.6527400
## Dim.6 Dim.7 Dim.8
## pH_suelo 0.002071124 0.01163598 0.01009975
## materia_organica 51.765329489 1.61640710 0.33355057
## humedad_suelo 15.361539705 2.45276863 2.28821653
## altura_planta 0.007057156 13.46297177 30.07605288
## diametro_tronco 0.392400297 22.56326699 33.06295350
## densidad_frutos 11.704745043 25.27879426 11.83886845
## peso_promedio_fruto 19.848935273 4.85290628 0.46199582
## rendimiento_palta 0.917921914 29.76124899 21.92826250
# Gráfico de individuos coloreados por riego_por_goteo
fviz_pca_ind(respca, col.ind = "#00AFBB", repel = TRUE)#Determinando conglomerados(clusters) jerarquicos con componentes principales
res.hcpc <- HCPC(respca,nb.clust = 3)## pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1 6.60 4.18 53.1 3.82 13.7
## 2 6.83 2.68 41.7 4.14 14.4
## 3 6.51 3.25 52.6 3.52 11.6
## 4 6.40 3.04 43.3 2.78 9.8
## 5 6.65 3.83 47.4 3.99 14.0
## 6 6.52 4.64 57.8 4.44 17.7
## 7 6.59 4.08 56.1 4.22 15.8
## 8 6.46 3.57 44.7 3.62 13.9
## 9 6.62 3.34 53.8 2.81 9.7
## 10 6.22 4.12 56.3 4.31 15.6
## 11 6.58 5.69 54.9 3.74 13.7
## 12 6.37 3.87 51.5 3.67 13.3
## 13 6.32 5.41 52.6 4.32 16.0
## 14 6.47 4.46 53.5 3.78 14.7
## 15 6.57 2.81 51.6 4.81 17.6
## 16 6.47 2.42 35.0 2.48 9.4
## 17 6.58 2.27 44.3 3.36 12.5
## 18 6.71 3.27 51.0 4.13 14.8
## 19 6.66 4.39 57.9 4.67 17.4
## 20 6.52 4.15 49.4 3.69 12.3
## 21 6.26 3.88 48.2 3.62 12.1
## 22 6.43 3.55 43.1 4.42 16.0
## 23 6.68 2.95 43.6 3.86 16.0
## 24 6.45 4.29 47.3 4.26 16.4
## 25 6.19 3.83 46.9 3.32 11.4
## 26 6.58 3.18 43.8 3.96 15.2
## 27 6.58 4.25 52.8 4.91 18.9
## 28 6.40 4.29 54.6 4.05 14.2
## 29 6.53 4.69 57.0 4.64 16.9
## 30 6.74 3.21 48.2 4.08 14.3
## 31 6.86 5.26 53.9 4.68 15.9
## 32 6.43 4.37 46.5 4.31 14.8
## 33 6.51 5.19 51.5 3.63 13.7
## 34 6.12 2.96 35.7 2.53 11.6
## 35 6.39 3.46 53.4 4.07 14.2
## 36 6.85 2.26 44.2 3.44 12.7
## 37 6.76 3.26 43.6 3.77 14.6
## 38 6.50 4.58 53.8 5.34 18.7
## 39 6.34 3.68 52.1 3.26 11.7
## 40 6.14 1.93 42.7 3.18 12.0
## 41 7.01 5.18 63.3 4.82 17.5
## 42 6.40 1.30 36.5 1.68 6.5
## 43 6.41 3.50 51.8 3.74 13.7
## 44 6.77 4.89 60.5 3.88 14.4
## 45 6.25 2.93 50.0 3.76 12.4
## 46 6.67 4.76 58.4 3.96 14.7
## 47 6.81 4.54 57.4 3.67 14.3
## 48 6.51 3.83 51.5 4.19 15.5
## 49 6.81 4.62 58.9 4.81 17.0
## 50 6.62 3.69 44.8 3.55 12.4
## 51 6.41 3.98 51.7 3.55 11.9
## 52 6.65 4.17 55.5 3.85 13.2
## 53 6.31 2.48 40.4 2.78 10.8
## 54 6.32 2.30 46.5 4.43 15.8
## 55 6.66 3.78 52.1 4.32 16.3
## 56 6.39 3.40 53.0 3.68 14.3
## 57 6.45 2.07 44.0 3.52 12.6
## 58 6.71 5.06 51.1 4.33 16.3
## 59 6.19 2.37 39.4 3.44 12.8
## 60 6.83 3.27 52.1 3.31 11.0
## 61 6.88 4.02 43.8 3.75 15.3
## 62 6.67 4.34 58.4 3.27 10.8
## 63 6.71 6.50 70.6 4.79 16.9
## 64 6.35 2.87 46.2 3.50 13.0
## 65 6.65 5.02 51.3 3.82 13.1
## 66 6.44 4.22 58.1 4.07 14.5
## 67 6.55 3.98 44.1 3.97 13.8
## 68 6.34 2.81 37.1 3.52 13.6
## 69 6.74 5.36 52.8 4.92 18.2
## 70 6.54 2.67 47.8 3.63 13.6
## 71 6.72 3.93 42.0 3.50 12.4
## 72 6.82 2.97 39.2 4.34 17.2
## 73 6.44 5.43 55.7 4.26 16.3
## 74 6.68 3.78 52.9 4.00 13.8
## 75 6.19 2.59 48.7 3.87 13.0
## 76 6.57 5.86 69.5 4.74 16.0
## 77 6.69 3.57 54.0 3.10 10.6
## 78 6.33 2.98 42.4 5.25 18.6
## 79 6.58 4.53 57.6 3.95 16.1
## 80 6.24 3.54 47.5 4.38 16.9
## 81 6.45 3.89 56.0 4.49 15.4
## 82 6.49 4.17 47.6 3.43 12.7
## 83 6.40 3.69 54.3 3.84 12.3
## 84 6.06 3.61 43.1 3.00 11.0
## 85 6.50 3.51 48.0 3.66 13.2
## 86 6.56 2.15 45.9 3.65 13.5
## 87 6.49 2.79 42.5 2.84 7.7
## 88 6.47 3.84 46.1 5.66 19.0
## 89 6.76 5.02 48.8 4.92 18.1
## 90 6.71 4.19 58.2 3.94 14.2
## 91 6.01 3.59 50.7 3.65 14.4
## 92 6.71 3.39 45.3 3.34 12.0
## 93 6.15 3.62 53.8 2.77 11.1
## 94 6.44 3.09 45.8 3.85 13.8
## 95 6.29 3.25 51.4 4.91 18.4
## 96 6.34 3.47 50.2 3.17 11.1
## 97 6.72 3.05 44.4 3.23 11.8
## 98 6.67 4.15 60.7 3.58 12.0
## 99 6.57 2.39 47.4 3.47 13.3
## 100 6.10 3.45 52.6 2.97 9.8
## 101 6.54 3.61 53.8 1.86 8.0
## 102 6.58 2.71 46.1 3.94 14.5
## 103 6.70 3.72 54.8 4.83 17.7
## 104 6.31 3.47 42.2 3.51 11.9
## 105 6.76 4.58 57.8 4.56 16.5
## 106 6.23 5.08 52.1 4.05 15.2
## 107 6.83 3.53 42.1 4.60 16.9
## 108 6.35 3.59 46.5 4.40 15.9
## 109 6.59 2.86 48.7 3.33 12.5
## 110 6.52 3.69 54.4 3.23 12.2
## 111 6.31 3.13 47.6 3.78 13.2
## 112 6.71 4.26 53.4 3.76 14.1
## 113 6.50 3.53 52.8 3.20 11.4
## 114 6.66 3.84 48.3 4.21 14.5
## 115 6.51 3.18 42.1 3.78 13.9
## 116 6.57 1.32 38.9 3.22 11.9
## 117 6.52 3.87 52.0 3.68 11.2
## 118 6.76 3.33 47.3 3.71 12.7
## 119 6.37 2.75 52.3 4.13 16.9
## 120 6.68 4.66 56.8 5.16 18.2
## 121 6.59 4.34 48.2 4.22 15.5
## 122 6.74 3.99 52.8 5.27 18.4
## 123 6.33 3.52 50.8 4.16 15.4
## 124 6.54 3.85 53.0 4.21 15.3
## 125 6.38 4.09 54.2 4.59 17.1
## 126 6.72 3.56 51.2 4.20 15.0
## 127 6.34 2.88 45.9 4.95 19.5
## 128 6.85 2.88 50.4 2.10 7.0
## 129 6.57 1.69 45.8 2.70 9.4
## 130 6.46 2.96 39.5 3.65 13.2
## 131 6.75 3.00 40.5 3.44 12.2
## 132 6.45 3.32 42.3 2.78 10.1
## 133 6.61 3.24 45.5 3.70 14.1
## 134 6.58 3.23 41.5 3.67 13.4
## 135 6.61 4.04 53.0 4.17 15.7
## 136 6.44 5.43 53.6 5.32 18.3
## 137 6.21 3.77 39.8 4.12 15.8
## 138 6.15 4.42 44.3 3.16 11.4
## 139 6.48 4.88 53.9 4.31 14.6
## 140 6.53 1.19 40.4 2.36 8.2
## 141 6.44 3.33 46.5 2.70 9.8
## 142 6.36 5.72 65.2 5.62 20.9
## 143 7.04 5.51 58.7 5.65 20.8
## 144 6.65 4.01 53.4 3.86 13.9
## 145 6.85 3.91 44.9 4.99 19.1
## 146 6.75 3.40 49.0 2.54 9.0
## 147 6.35 3.32 52.8 3.56 14.2
## 148 6.49 3.70 57.4 4.04 13.9
## 149 6.17 2.95 47.2 3.59 13.3
## 150 6.67 3.73 47.7 4.18 14.2
## 151 6.86 3.90 46.9 5.18 17.9
## 152 6.28 3.95 54.0 4.56 16.9
## 153 6.30 4.84 60.0 3.86 15.5
## 154 6.64 3.23 47.2 4.45 17.0
## 155 6.23 3.83 50.2 3.27 12.3
## 156 6.94 3.79 59.2 2.22 7.7
## 157 6.57 3.91 52.6 4.44 16.4
## 158 6.21 4.00 56.4 3.63 12.5
## 159 6.55 2.69 45.6 2.57 9.4
## 160 6.54 4.95 60.5 5.33 20.3
## 161 6.02 3.61 56.4 4.76 16.9
## 162 6.47 2.55 50.6 3.03 10.3
## 163 6.40 4.54 44.5 4.64 17.7
## 164 6.26 2.24 43.0 3.06 9.8
## 165 6.54 4.21 54.8 3.89 15.4
## 166 6.71 3.89 56.2 4.32 15.2
## 167 6.74 1.00 29.7 2.95 10.3
## 168 5.90 1.93 41.8 2.50 9.2
## 169 6.59 3.01 48.8 3.41 14.2
## 170 6.23 3.36 47.2 3.75 14.1
## 171 6.75 3.21 47.6 2.21 6.6
## 172 6.52 2.03 41.0 3.67 13.5
## 173 6.68 1.82 35.1 2.13 9.2
## 174 6.17 3.50 39.1 3.56 13.4
## 175 6.58 3.32 41.7 3.18 12.7
## 176 6.60 5.21 55.1 5.40 20.4
## 177 6.65 2.55 48.8 4.39 14.2
## 178 6.51 4.68 55.7 4.21 15.9
## 179 6.75 4.43 45.4 4.60 16.7
## 180 6.43 4.14 55.2 4.41 15.7
## 181 6.37 2.93 38.5 3.05 12.4
## 182 6.60 5.12 62.2 5.01 18.7
## 183 6.28 3.89 43.3 4.49 17.2
## 184 6.32 1.93 39.8 2.06 6.9
## 185 6.71 4.78 56.0 4.61 17.3
## 186 6.73 2.50 42.6 2.62 10.0
## 187 6.71 3.41 53.3 3.03 10.7
## 188 6.39 2.51 46.7 4.14 15.4
## 189 6.60 3.70 45.7 2.46 7.4
## 190 6.57 3.75 49.3 3.70 13.0
## 191 6.21 3.74 55.6 3.61 15.8
## 192 6.59 5.25 60.1 4.42 15.5
## 193 6.41 5.76 55.8 4.90 18.5
## 194 6.25 3.86 46.9 3.75 15.3
## 195 6.61 3.52 42.8 3.56 13.3
## 196 6.39 4.53 55.0 4.92 18.1
## 197 6.48 3.73 55.2 4.05 15.2
## 198 6.33 3.47 41.7 3.54 11.9
## 199 6.58 4.90 59.2 3.64 13.3
## 200 6.62 4.42 55.5 6.32 23.6
## 201 6.65 5.48 60.5 4.63 16.6
## 202 6.32 4.73 44.3 4.43 16.6
## 203 6.77 4.41 47.1 3.90 14.2
## 204 6.82 4.66 59.8 4.20 15.8
## 205 6.64 5.11 59.4 5.24 19.0
## 206 6.48 2.95 39.1 2.99 10.6
## 207 6.46 3.25 48.0 4.29 16.3
## 208 6.58 4.28 54.3 4.65 17.7
## 209 6.57 4.15 54.7 4.00 14.8
## 210 6.53 3.00 51.3 4.93 17.3
## 211 6.67 3.79 57.2 2.69 9.1
## 212 6.47 3.92 51.7 5.25 18.0
## 213 6.71 3.80 53.6 3.98 13.8
## 214 6.48 4.21 46.1 4.90 19.0
## 215 6.15 3.44 52.4 2.53 7.4
## 216 6.53 5.05 49.7 4.47 17.1
## 217 6.61 4.25 55.7 4.45 16.5
## 218 6.82 5.19 58.6 4.30 14.4
## 219 6.51 3.46 45.1 3.62 12.3
## 220 6.17 3.78 44.9 4.36 15.1
## 221 6.55 4.72 58.3 4.94 19.0
## 222 6.29 3.32 39.9 2.74 11.3
## 223 6.33 3.33 44.6 4.00 15.0
## 224 6.28 4.42 49.5 4.31 17.6
## 225 6.33 3.54 53.5 3.38 13.4
## 226 6.74 4.42 58.1 5.03 19.0
## 227 6.34 3.70 50.2 3.49 12.4
## 228 6.46 4.78 58.2 3.23 12.1
## 229 6.53 3.65 44.3 3.46 11.1
## 230 6.67 4.72 50.2 5.27 18.6
## 231 6.34 4.24 45.9 3.87 14.1
## 232 6.33 3.07 49.7 4.00 14.1
## 233 6.39 3.89 56.8 3.48 13.9
## 234 6.15 2.43 46.4 3.32 12.3
## 235 6.62 3.31 45.7 4.03 15.7
## 236 6.06 3.72 52.0 3.13 11.1
## 237 6.38 3.77 50.7 3.75 14.8
## 238 6.15 2.99 46.1 4.34 17.3
## 239 6.01 2.27 43.1 3.12 11.6
## 240 6.49 3.34 45.1 4.55 15.2
## 241 6.84 4.07 55.5 3.75 12.9
## 242 6.92 4.79 52.0 4.69 16.2
## 243 6.39 3.95 54.7 3.75 13.4
## 244 6.44 4.88 51.5 3.97 14.4
## 245 6.40 2.78 50.9 1.66 6.7
## 246 6.65 3.22 44.2 3.98 14.4
## 247 6.00 3.47 49.0 3.86 14.2
## 248 6.51 2.98 39.5 3.31 12.0
## 249 6.42 3.09 41.2 3.86 13.2
## 250 6.40 3.56 44.6 2.86 9.8
## 251 6.06 3.19 51.8 3.37 11.9
## 252 6.44 3.54 54.7 3.94 13.2
## 253 6.11 2.89 46.0 2.80 10.1
## 254 6.51 3.27 52.7 4.27 15.9
## 255 6.34 3.45 50.1 3.74 12.6
## 256 6.54 4.86 49.3 3.83 14.5
## 257 6.53 2.70 47.6 2.26 10.2
## 258 6.40 3.46 51.6 3.84 13.1
## 259 6.25 1.92 42.9 3.57 13.6
## 260 6.38 3.64 42.0 2.68 10.3
## 261 6.43 5.87 54.9 3.96 14.4
## 262 6.18 2.67 40.0 4.21 14.5
## 263 6.38 4.72 51.1 4.52 15.8
## 264 6.42 2.70 37.9 3.71 13.6
## 265 6.43 3.98 54.4 3.91 14.2
## 266 6.59 4.21 53.2 4.84 18.2
## 267 6.72 3.43 49.6 3.57 13.2
## 268 6.48 1.66 43.0 3.33 12.7
## 269 6.86 5.06 58.8 4.69 17.0
## 270 6.39 3.49 50.9 3.72 14.2
## 271 6.74 4.33 46.3 4.06 15.2
## 272 6.52 1.46 40.9 3.70 14.1
## 273 6.36 5.61 65.2 6.12 22.1
## 274 6.75 6.43 68.3 4.71 16.1
## 275 6.26 3.10 39.3 3.35 11.8
## 276 6.73 5.26 51.0 3.75 13.1
## 277 6.45 4.96 50.4 4.03 14.1
## 278 6.42 3.00 47.1 3.86 13.4
## 279 6.35 2.28 47.2 3.56 12.8
## 280 6.24 1.71 39.3 2.54 9.1
## 281 6.80 2.89 42.0 3.19 11.5
## 282 6.73 5.36 60.1 4.25 14.9
## 283 6.62 3.37 52.1 4.48 16.7
## 284 6.50 3.89 56.1 4.27 15.2
## 285 6.64 3.71 52.1 3.63 13.9
## 286 6.54 2.40 46.1 3.64 13.7
## 287 6.86 3.51 54.4 3.73 14.1
## 288 6.60 2.46 45.4 3.41 12.9
## 289 6.45 3.18 50.5 4.08 15.9
## 290 6.44 3.26 43.7 3.01 11.1
## 291 6.40 2.77 48.7 3.35 12.0
## 292 6.50 3.86 55.0 4.60 16.7
## 293 6.42 3.53 50.1 2.88 11.0
## 294 6.71 3.05 41.6 3.23 11.2
## 295 5.96 3.20 40.4 3.99 15.6
## 296 6.32 3.93 43.8 3.57 13.7
## 297 6.42 3.33 41.9 4.01 15.1
## 298 6.26 4.21 53.9 3.90 13.5
## 299 6.78 3.10 47.5 3.48 12.9
## 300 6.47 3.07 45.5 2.62 9.9
## 301 6.27 3.70 42.8 3.33 12.6
## 302 6.25 3.09 48.8 3.37 13.0
## 303 6.63 2.57 37.2 3.79 13.3
## 304 6.92 5.17 51.5 5.60 20.9
## 305 6.52 5.60 54.5 4.35 16.0
## 306 6.62 4.80 58.2 3.48 13.3
## 307 6.31 4.24 56.1 3.86 13.5
## 308 6.69 2.82 47.5 3.38 12.0
## 309 6.61 2.90 47.8 4.06 14.6
## 310 6.05 4.00 55.1 4.08 13.5
## 311 6.47 4.70 59.8 5.35 20.3
## 312 6.46 3.45 50.3 3.34 11.0
## 313 6.34 3.65 43.5 3.69 14.1
## 314 6.48 5.28 60.5 4.95 16.9
## 315 6.21 1.55 40.4 2.79 11.8
## 316 6.56 4.89 49.2 3.98 15.0
## 317 6.63 5.27 49.7 4.24 15.2
## 318 6.71 5.01 57.5 4.58 17.0
## 319 6.61 3.95 55.0 2.72 8.7
## 320 6.84 3.01 44.8 3.92 12.4
## 321 6.40 3.03 41.7 4.29 14.5
## 322 6.00 2.86 45.5 3.17 11.7
## 323 6.57 5.33 60.4 4.27 16.0
## 324 6.56 2.47 39.9 3.36 12.0
## 325 6.37 2.61 48.1 4.22 15.5
## 326 6.81 3.97 56.4 2.74 9.2
## 327 6.66 3.24 43.1 4.72 18.1
## 328 6.58 2.81 49.2 2.12 6.7
## 329 6.45 2.01 46.5 3.03 11.2
## 330 6.42 4.98 48.9 3.95 13.8
## 331 6.49 3.30 44.5 2.12 8.2
## 332 6.61 4.00 54.0 3.54 13.7
## 333 6.72 2.99 43.0 2.69 9.9
## 334 6.47 4.13 50.0 2.99 11.2
## 335 6.39 4.65 58.6 4.36 14.5
## 336 6.90 2.97 45.7 2.68 10.0
## 337 6.60 2.69 39.8 3.00 10.5
## 338 6.32 4.44 46.0 4.17 15.6
## 339 6.72 4.34 48.3 3.14 11.7
## 340 6.45 2.59 37.6 2.48 8.5
## 341 6.64 2.92 50.5 4.64 18.2
## 342 6.46 3.38 48.9 4.54 16.0
## 343 6.54 4.56 59.2 3.92 12.3
## 344 6.58 5.48 63.3 4.54 17.6
## 345 6.62 3.30 51.5 3.48 12.8
## 346 6.32 1.95 46.8 3.53 12.7
## 347 6.39 3.84 46.1 2.20 8.5
## 348 6.52 4.20 55.2 4.33 14.8
## 349 6.54 4.12 54.9 4.48 17.3
## 350 6.41 4.00 43.2 3.58 14.6
## 351 6.51 3.97 53.6 4.35 14.9
## 352 6.25 3.45 41.0 3.53 13.0
## 353 6.25 4.41 59.3 4.87 17.5
## 354 6.86 3.97 49.1 4.03 15.2
## 355 6.59 4.71 47.0 4.45 15.1
## 356 6.49 4.00 47.3 2.43 8.6
## 357 6.47 5.20 50.3 4.30 14.8
## 358 6.73 4.02 58.8 3.57 12.3
## 359 6.37 1.29 40.5 2.75 9.4
## 360 6.52 4.63 48.8 3.89 15.5
## 361 6.45 4.38 57.0 3.77 14.0
## 362 6.43 3.38 52.7 2.98 10.4
## 363 6.56 1.99 38.1 3.09 11.7
## 364 6.57 3.66 54.7 4.23 14.3
## 365 6.78 2.55 50.1 4.23 14.4
## 366 6.29 4.82 46.7 4.48 15.6
## 367 6.50 5.02 56.6 4.89 17.0
## 368 6.45 3.10 45.8 4.02 14.4
## 369 6.33 5.02 59.0 3.73 13.6
## 370 6.73 4.95 61.6 5.15 17.6
## 371 6.47 3.85 51.2 3.93 14.6
## 372 6.27 5.34 61.6 4.13 15.3
## 373 6.40 3.89 46.9 4.47 15.9
## 374 6.31 5.33 60.8 5.05 19.1
## 375 6.68 3.15 49.1 4.13 16.2
## 376 7.09 4.55 49.3 5.08 19.7
## 377 6.37 3.05 40.9 2.93 10.3
## 378 6.52 3.19 52.1 3.18 11.6
## 379 6.55 3.14 53.0 3.67 12.6
## 380 7.03 3.02 40.1 3.37 12.3
## 381 6.07 4.19 55.7 3.85 12.7
## 382 6.32 1.65 34.4 2.65 10.4
## 383 6.28 4.17 57.0 3.56 11.5
## 384 6.47 3.40 43.7 4.45 16.5
## 385 6.31 2.26 44.3 1.52 5.8
## 386 6.37 3.29 40.7 3.45 11.6
## 387 6.76 1.53 42.3 3.41 13.1
## 388 6.58 3.65 53.8 3.61 12.4
## 389 6.96 3.79 50.3 5.09 18.6
## 390 6.63 2.96 44.1 2.18 7.7
## 391 6.25 3.93 45.0 4.02 15.8
## 392 6.42 4.45 59.2 3.40 12.3
## 393 6.52 2.82 41.0 1.55 5.6
## 394 6.41 3.83 45.4 3.77 13.7
## 395 6.59 4.21 55.5 3.87 13.2
## 396 6.59 3.23 49.5 3.70 14.1
## 397 6.50 3.58 48.2 3.49 13.3
## 398 6.37 3.28 48.2 3.05 12.3
## 399 6.40 4.23 56.0 3.55 12.2
## 400 6.24 2.90 40.1 2.84 10.2
## 401 6.66 5.66 55.8 5.20 18.4
## 402 6.71 5.08 59.8 4.35 17.4
## 403 6.53 3.47 46.2 3.78 13.5
## 404 6.72 5.30 62.6 5.06 19.6
## 405 6.92 3.59 52.4 4.67 16.9
## 406 6.91 4.30 56.6 3.96 14.2
## 407 6.44 5.12 51.6 3.61 13.5
## 408 6.68 4.97 60.8 3.71 13.4
## 409 6.40 4.54 54.8 4.17 16.0
## 410 6.66 4.79 51.1 5.21 18.1
## 411 6.44 2.00 43.6 2.74 10.3
## 412 6.59 4.89 55.3 5.38 19.1
## 413 6.35 4.20 54.4 3.80 14.0
## 414 6.77 3.88 48.7 4.12 15.0
## 415 6.50 3.38 54.9 2.95 11.3
## 416 6.40 3.02 48.6 3.28 11.4
## 417 6.48 3.10 43.5 2.91 11.4
## 418 6.55 4.82 58.8 4.40 16.2
## 419 6.84 3.91 56.1 4.58 15.1
## 420 6.24 3.62 49.4 3.66 14.6
## 421 6.98 3.14 47.7 3.31 12.4
## 422 6.28 1.51 36.2 1.28 4.8
## 423 6.49 3.28 47.8 3.81 15.4
## 424 6.08 3.57 49.0 3.51 12.4
## 425 6.28 2.82 40.1 1.82 6.3
## 426 6.56 2.67 38.0 2.26 9.1
## 427 6.66 4.64 62.8 4.84 17.6
## 428 6.55 3.64 52.4 4.69 17.0
## 429 6.31 2.20 43.3 3.91 12.3
## 430 6.13 4.91 48.2 4.56 16.5
## 431 6.35 5.10 55.8 4.70 17.5
## 432 6.49 4.70 55.4 4.21 15.7
## 433 6.65 5.28 61.0 4.26 15.7
## 434 6.73 5.40 54.5 5.85 21.1
## 435 6.40 3.34 49.1 3.69 14.9
## 436 6.51 4.00 50.2 1.96 7.9
## 437 6.44 2.87 47.1 3.24 10.7
## 438 6.51 3.35 51.4 3.67 13.2
## 439 6.92 6.82 69.4 5.17 18.0
## 440 6.40 4.27 61.2 3.64 12.7
## 441 6.50 4.32 57.7 4.19 14.4
## 442 6.46 2.20 48.6 3.23 11.8
## 443 6.19 2.41 37.0 2.89 11.0
## 444 6.43 5.95 61.7 4.19 15.2
## 445 6.49 2.30 39.3 2.69 10.4
## 446 6.60 3.59 41.4 3.80 13.8
## 447 6.77 5.12 49.1 4.86 17.2
## 448 6.46 4.90 60.3 3.97 14.7
## 449 6.85 4.45 57.3 4.65 16.3
## 450 6.32 3.01 43.5 3.85 13.6
## 451 6.14 3.68 54.4 5.00 18.6
## 452 6.10 4.51 57.4 4.54 16.6
## 453 6.68 3.25 50.4 3.25 11.9
## 454 6.59 4.25 57.0 5.29 18.8
## 455 6.53 5.49 61.9 5.67 21.4
## 456 6.55 5.49 58.6 4.15 14.2
## 457 6.84 3.77 45.7 4.22 14.7
## 458 6.70 2.40 39.9 3.25 11.7
## 459 6.35 5.71 60.5 4.03 14.9
## 460 6.27 4.00 55.4 4.08 14.2
## 461 6.71 3.20 38.4 3.18 11.7
## 462 6.53 2.74 46.9 4.11 15.2
## 463 6.44 3.04 48.3 3.48 12.0
## 464 6.64 4.07 55.7 4.79 17.9
## 465 6.08 3.04 49.2 3.42 11.9
## 466 6.39 3.04 52.9 3.56 11.4
## 467 6.57 4.01 52.3 4.05 15.6
## 468 6.52 4.43 47.4 2.91 10.8
## 469 6.24 3.06 46.1 4.23 14.3
## 470 6.69 3.99 46.7 4.12 15.8
## 471 6.74 2.96 52.2 3.14 11.9
## 472 6.30 3.10 41.5 3.63 13.1
## 473 6.43 3.27 53.2 3.58 12.9
## 474 6.63 3.79 43.9 2.28 8.1
## 475 6.67 3.27 41.1 2.92 10.2
## 476 6.40 4.43 56.5 3.98 14.0
## 477 6.40 5.22 54.6 5.71 21.2
## 478 6.50 1.20 37.8 2.61 9.9
## 479 6.11 3.36 47.9 4.08 14.9
## 480 6.34 4.14 47.6 2.99 12.3
## 481 6.74 5.24 62.6 3.85 13.6
## 482 6.18 3.70 40.8 3.37 12.6
## 483 6.26 3.23 47.5 4.53 17.0
## 484 6.44 3.93 45.9 4.43 17.4
## 485 6.46 4.06 48.6 3.92 14.1
## 486 6.20 4.24 55.7 4.28 15.8
## 487 6.59 3.12 52.6 3.26 12.6
## 488 6.30 4.24 46.0 4.09 16.8
## 489 6.48 3.83 53.3 4.48 16.6
## 490 6.50 5.08 54.1 4.58 16.6
## 491 6.69 4.25 48.5 3.94 12.8
## 492 6.50 5.00 58.5 4.66 16.0
## 493 6.47 2.47 46.0 3.39 12.3
## 494 6.90 5.76 55.3 4.67 16.9
## 495 6.58 4.05 53.2 3.06 10.6
## 496 6.70 3.98 44.7 2.75 8.7
## 497 6.59 4.04 52.1 4.38 15.5
## 498 6.65 3.88 54.0 2.76 10.7
## 499 6.69 2.70 38.8 4.53 17.4
## 500 6.48 3.33 45.3 2.23 7.8
## 501 6.55 4.09 54.4 2.48 10.7
## 502 6.86 3.57 50.9 3.90 14.6
## 503 6.34 2.35 48.1 2.69 9.9
## 504 6.81 5.13 64.8 3.63 12.4
## 505 6.42 4.10 55.6 4.39 15.9
## 506 6.78 3.32 51.7 3.89 15.4
## 507 6.39 3.77 54.7 3.56 12.3
## 508 6.28 2.67 46.9 3.82 14.0
## 509 6.65 3.31 37.8 2.73 10.4
## 510 6.72 5.00 56.9 4.72 16.0
## 511 6.58 2.15 44.5 3.10 11.1
## 512 6.60 4.75 56.3 3.90 14.6
## 513 6.55 3.61 42.2 3.55 11.1
## 514 6.94 4.95 57.8 4.02 13.4
## 515 6.19 3.39 44.7 4.53 15.8
## 516 6.25 3.20 47.2 3.95 15.1
## 517 6.29 3.80 54.8 4.63 16.8
## 518 6.70 4.80 49.2 3.63 13.3
## 519 6.44 3.01 51.3 2.59 9.2
## 520 6.48 3.61 44.6 3.98 15.3
## 521 6.92 4.20 56.5 4.01 14.4
## 522 6.35 3.35 49.2 4.04 15.5
## 523 6.87 3.10 51.1 4.17 14.2
## 524 6.19 3.68 54.1 3.84 13.6
## 525 6.68 3.58 50.0 4.20 16.6
## 526 6.61 3.75 52.8 3.49 11.0
## 527 6.43 3.62 44.8 3.51 10.6
## 528 6.48 2.97 56.0 3.97 13.9
## 529 6.77 4.44 47.4 4.44 16.4
## 530 6.82 3.97 50.0 4.22 15.2
## 531 6.12 2.74 36.9 3.11 11.4
## 532 7.23 3.48 43.5 3.64 13.5
## 533 6.94 1.56 45.1 1.73 6.5
## 534 6.42 3.96 49.9 3.72 13.7
## 535 6.45 2.81 48.8 3.96 14.1
## 536 6.38 3.30 44.2 3.24 11.8
## 537 6.44 2.28 44.9 3.56 11.7
## 538 6.62 3.51 41.9 3.97 14.5
## 539 6.61 5.37 60.7 4.29 16.6
## 540 6.57 3.89 52.8 4.29 15.3
## 541 6.69 1.76 32.7 2.25 7.1
## 542 6.07 3.04 49.1 3.52 13.3
## 543 6.38 3.77 45.5 5.44 20.3
## 544 6.47 2.57 48.1 3.09 10.7
## 545 6.35 4.01 49.6 4.50 16.6
## 546 6.72 4.32 42.6 4.02 14.2
## 547 6.39 3.96 54.3 4.72 17.2
## 548 6.51 5.12 52.8 4.17 14.3
## 549 6.63 1.48 32.0 2.41 8.8
## 550 6.71 4.92 55.7 4.66 17.3
## 551 6.46 3.39 51.1 4.12 16.0
## 552 6.47 4.91 57.1 4.42 16.4
## 553 6.19 3.79 53.2 4.37 17.1
## 554 6.33 2.40 36.5 3.64 13.5
## 555 6.93 2.02 50.4 2.92 10.6
## 556 6.48 3.86 51.6 4.46 17.4
## 557 6.81 5.02 53.2 5.75 20.3
## 558 6.51 4.22 53.9 4.69 17.2
## 559 6.71 5.68 62.6 4.34 16.9
## 560 6.54 4.71 62.5 3.19 11.4
## 561 6.83 4.56 57.2 4.22 15.3
## 562 6.44 5.01 52.6 4.95 18.2
## 563 6.18 3.25 41.8 3.38 12.1
## 564 6.65 2.93 51.9 2.42 9.3
## 565 6.43 3.03 42.3 3.17 12.1
## 566 6.71 1.53 32.3 2.57 9.6
## 567 6.52 3.49 52.4 4.82 18.7
## 568 6.84 4.71 49.4 4.21 14.9
## 569 6.62 4.45 58.4 3.87 14.0
## 570 6.43 4.07 44.8 3.45 12.6
## 571 6.62 2.58 48.4 2.94 10.1
## 572 6.57 6.76 65.1 4.10 14.3
## 573 6.87 3.74 56.6 4.07 15.6
## 574 6.60 5.07 61.0 5.10 17.4
## 575 6.08 4.39 47.7 3.96 15.6
## 576 6.40 4.36 48.2 3.67 12.9
## 577 6.20 3.95 56.3 4.61 18.1
## 578 6.15 5.22 62.2 4.09 14.7
## 579 6.50 3.17 51.4 4.55 17.1
## 580 6.67 3.57 54.8 4.23 14.8
## 581 6.24 1.37 32.8 3.05 11.4
## 582 6.21 3.32 44.0 3.30 12.2
## 583 6.31 2.81 39.4 3.10 11.6
## 584 6.25 4.35 59.1 3.01 11.2
## 585 6.63 4.36 46.3 3.84 14.1
## 586 6.60 3.10 50.2 3.79 13.7
## 587 6.25 5.23 61.0 5.44 19.3
## 588 6.43 4.55 47.7 3.77 14.9
## 589 6.66 2.58 41.4 2.99 10.1
## 590 6.49 4.10 52.7 4.18 15.9
## 591 6.44 3.10 51.2 3.68 14.2
## 592 6.56 3.51 49.2 3.32 12.9
## 593 6.71 4.51 48.5 3.54 11.8
## 594 6.81 4.61 60.3 4.68 17.1
## 595 6.71 4.06 55.7 4.35 14.2
## 596 6.20 2.73 36.4 2.52 8.6
## 597 6.33 2.54 48.3 3.22 12.6
## 598 6.50 3.48 45.2 3.84 14.1
## 599 6.53 4.88 49.6 3.52 12.0
## 600 6.05 4.00 50.5 3.34 12.7
## 601 6.24 1.00 37.6 1.59 6.3
## 602 6.69 3.16 42.5 3.97 13.1
## 603 6.60 5.23 60.4 5.13 19.5
## 604 6.24 4.82 57.1 3.43 13.4
## 605 6.50 3.24 49.4 4.39 15.9
## 606 6.39 3.31 41.5 3.83 14.2
## 607 6.59 2.54 45.2 4.28 15.3
## 608 6.92 2.51 35.9 3.80 13.5
## 609 6.24 5.05 57.7 4.46 15.4
## 610 6.30 1.03 35.4 2.74 9.8
## 611 6.52 3.69 47.6 4.42 17.3
## 612 6.07 3.29 54.9 3.94 14.8
## 613 6.52 4.40 54.2 5.01 19.6
## 614 6.30 2.11 34.2 3.18 10.8
## 615 6.91 3.46 49.1 3.43 12.5
## 616 5.89 2.10 39.3 2.97 10.1
## 617 6.85 5.10 52.0 5.95 22.5
## 618 6.75 4.02 48.6 3.38 11.9
## 619 6.67 4.34 49.6 5.45 21.2
## 620 6.61 4.09 57.3 3.69 12.8
## 621 6.33 3.98 46.0 4.10 15.0
## 622 6.77 3.78 44.3 3.28 10.9
## 623 6.32 4.36 47.3 4.51 16.5
## 624 6.61 2.33 45.1 4.48 15.8
## 625 6.63 4.75 55.8 4.24 15.1
## 626 6.78 3.78 52.9 4.16 14.7
## 627 6.42 4.32 58.5 4.41 15.1
## 628 6.36 2.99 38.6 4.56 16.2
## 629 6.54 2.52 46.6 3.73 13.9
## 630 6.63 5.71 64.9 4.25 15.6
## 631 6.79 4.55 49.4 3.61 13.7
## 632 6.64 3.87 48.0 3.32 11.2
## 633 6.51 3.77 53.2 2.76 9.8
## 634 6.73 5.11 52.0 4.49 16.6
## 635 6.35 1.65 39.0 2.74 10.2
## 636 6.75 3.88 53.2 3.90 14.5
## 637 6.25 3.80 41.2 4.86 17.5
## 638 6.44 2.02 33.6 2.51 10.8
## 639 6.09 3.33 45.4 2.91 11.2
## 640 6.56 4.71 57.3 4.74 17.6
## 641 6.23 3.16 50.5 4.09 13.5
## 642 6.37 1.33 34.5 2.62 9.6
## 643 6.09 2.53 39.2 4.12 15.5
## 644 6.46 4.72 59.4 4.80 16.6
## 645 6.32 3.76 51.9 3.51 12.3
## 646 6.64 4.55 48.7 3.92 15.0
## 647 6.36 2.95 40.9 3.44 12.1
## 648 6.33 3.72 53.7 5.21 18.7
## 649 6.75 3.76 53.4 5.15 18.7
## 650 6.83 3.97 44.6 4.35 15.8
## 651 6.71 3.56 45.6 3.79 13.2
## 652 6.18 2.73 38.8 2.89 10.6
## 653 6.60 1.29 41.2 3.06 10.7
## 654 6.35 4.25 55.8 2.85 10.8
## 655 6.58 4.90 53.8 4.04 14.7
## 656 6.59 2.32 40.1 3.37 11.5
## 657 6.45 3.38 45.7 2.43 8.8
## 658 6.54 5.56 62.1 2.68 9.2
## 659 6.57 4.31 58.1 3.69 13.0
## 660 6.65 4.58 54.0 4.75 16.2
## 661 6.53 3.04 41.4 2.00 7.3
## 662 6.28 5.23 54.6 3.86 13.8
## 663 6.41 3.55 51.7 3.79 14.3
## 664 6.60 3.97 47.2 4.47 16.5
## 665 6.63 3.54 55.0 2.71 9.1
## 666 6.42 2.52 47.1 2.69 8.9
## 667 6.34 2.74 41.9 2.73 10.0
## 668 6.18 2.51 46.3 2.82 11.0
## 669 6.44 4.60 52.1 4.16 15.2
## 670 6.48 3.32 49.0 3.50 13.8
## 671 6.39 3.58 53.9 3.13 10.8
## 672 6.63 3.62 52.0 3.98 14.0
## 673 6.55 3.24 51.2 3.37 12.1
## 674 6.12 3.08 46.9 3.77 14.9
## 675 6.58 4.44 57.2 4.54 16.6
## 676 6.50 2.82 52.1 3.50 12.5
## 677 6.38 2.82 42.2 2.76 10.4
## 678 6.44 3.22 51.2 4.33 15.5
## 679 6.36 2.85 46.5 2.68 8.7
## 680 6.45 3.74 53.8 4.52 15.7
## 681 6.38 4.33 49.4 3.52 11.8
## 682 6.51 2.38 33.3 3.91 16.1
## 683 6.28 4.55 48.4 4.39 17.5
## 684 6.43 3.75 45.7 3.25 12.3
## 685 6.27 3.70 43.1 3.99 13.9
## 686 6.32 3.17 49.5 4.26 16.2
## 687 6.47 3.82 55.8 3.93 13.8
## 688 6.39 3.87 56.9 4.20 15.5
## 689 6.35 3.43 53.7 3.29 11.7
## 690 6.46 2.93 51.5 2.94 11.3
## 691 6.18 4.03 54.1 3.45 12.9
## 692 6.49 3.07 41.6 4.33 16.1
## 693 6.62 2.90 51.7 3.45 12.7
## 694 6.34 4.91 63.0 4.29 15.0
## 695 6.26 3.63 52.6 3.90 14.6
## 696 6.90 3.64 53.1 4.65 18.2
## 697 6.49 3.83 49.1 4.55 16.4
## 698 6.49 3.32 48.4 2.86 9.8
## 699 6.53 5.31 64.4 4.72 16.4
## 700 6.61 3.12 51.0 3.76 12.2
## densidad_frutos peso_promedio_fruto rendimiento_palta clust
## 1 203 222 13.86 2
## 2 232 211 10.44 2
## 3 179 212 9.12 2
## 4 134 221 6.89 1
## 5 108 207 4.11 2
## 6 267 268 22.27 3
## 7 260 247 19.41 3
## 8 169 246 8.80 2
## 9 150 210 8.20 1
## 10 170 239 10.19 2
## 11 153 240 8.55 2
## 12 95 221 6.58 2
## 13 181 244 10.93 2
## 14 193 228 13.11 2
## 15 360 213 19.39 3
## 16 98 202 4.28 1
## 17 180 209 9.39 1
## 18 268 243 16.83 3
## 19 253 269 20.83 3
## 20 181 220 8.10 2
## 21 100 217 4.14 1
## 22 232 270 15.60 3
## 23 256 226 13.62 2
## 24 230 251 14.50 3
## 25 127 193 5.76 1
## 26 321 241 18.60 3
## 27 240 248 18.14 3
## 28 114 230 7.57 2
## 29 266 256 20.46 3
## 30 141 229 8.94 2
## 31 214 248 11.28 3
## 32 117 237 7.03 2
## 33 196 259 11.91 2
## 34 201 213 10.48 1
## 35 192 215 10.66 2
## 36 232 213 12.64 1
## 37 258 221 13.47 2
## 38 219 277 18.38 3
## 39 108 208 5.92 1
## 40 181 215 9.43 1
## 41 282 251 21.37 3
## 42 61 179 2.91 1
## 43 254 218 14.39 2
## 44 172 233 12.23 2
## 45 302 230 17.89 2
## 46 265 231 18.97 3
## 47 123 248 9.25 2
## 48 164 222 9.50 2
## 49 239 247 18.12 3
## 50 170 207 9.14 1
## 51 73 236 4.68 2
## 52 168 211 9.65 2
## 53 131 212 5.47 1
## 54 235 210 12.70 2
## 55 308 239 21.98 3
## 56 165 228 10.06 2
## 57 186 204 9.76 1
## 58 250 251 15.50 3
## 59 151 208 7.26 1
## 60 48 212 2.45 1
## 61 243 253 14.99 3
## 62 104 241 6.28 2
## 63 216 255 16.85 3
## 64 166 197 8.79 1
## 65 179 221 9.62 2
## 66 201 222 11.83 2
## 67 126 255 6.52 2
## 68 211 181 7.86 1
## 69 201 236 11.32 3
## 70 214 209 13.45 2
## 71 201 230 10.86 2
## 72 283 233 15.61 3
## 73 214 270 14.03 3
## 74 173 241 12.58 2
## 75 138 195 6.82 1
## 76 253 254 16.81 3
## 77 86 184 4.21 1
## 78 245 255 13.17 3
## 79 212 241 15.99 3
## 80 259 254 19.28 3
## 81 172 225 10.55 2
## 82 174 224 9.11 2
## 83 125 223 7.22 2
## 84 114 213 5.46 1
## 85 228 238 16.72 2
## 86 214 246 13.54 2
## 87 43 200 1.76 1
## 88 233 234 11.54 3
## 89 240 248 13.48 3
## 90 133 238 9.36 2
## 91 262 229 18.13 2
## 92 113 206 5.60 1
## 93 210 236 12.98 2
## 94 209 233 10.44 2
## 95 235 252 17.75 3
## 96 92 234 5.58 1
## 97 149 204 6.40 1
## 98 174 202 9.01 2
## 99 176 223 10.66 2
## 100 73 194 4.25 1
## 101 24 212 1.09 1
## 102 246 225 13.72 2
## 103 270 242 17.65 3
## 104 173 189 6.96 1
## 105 173 254 11.17 3
## 106 169 229 9.20 2
## 107 238 241 11.65 3
## 108 194 231 9.39 2
## 109 241 206 14.68 2
## 110 81 249 6.47 2
## 111 214 214 10.06 2
## 112 170 223 11.73 2
## 113 146 238 9.05 2
## 114 241 233 13.85 2
## 115 155 219 7.88 2
## 116 230 204 11.72 1
## 117 55 193 2.78 1
## 118 108 211 4.68 1
## 119 263 235 18.12 3
## 120 252 214 16.48 3
## 121 270 243 15.69 3
## 122 257 229 15.76 3
## 123 225 247 16.55 2
## 124 217 246 15.95 3
## 125 279 255 21.44 3
## 126 153 212 7.17 2
## 127 300 234 18.34 3
## 128 63 173 2.93 1
## 129 207 188 10.23 1
## 130 209 189 9.08 1
## 131 164 216 7.68 1
## 132 165 227 8.96 1
## 133 213 231 9.79 2
## 134 224 208 10.96 2
## 135 153 229 10.45 2
## 136 331 267 22.11 3
## 137 186 243 10.27 2
## 138 152 227 8.25 2
## 139 262 236 12.80 3
## 140 98 179 4.53 1
## 141 108 194 6.27 1
## 142 301 278 26.03 3
## 143 286 269 23.88 3
## 144 165 232 10.24 2
## 145 301 262 19.53 3
## 146 117 168 4.79 1
## 147 120 228 8.03 2
## 148 179 214 10.29 2
## 149 141 208 7.42 1
## 150 236 228 10.87 2
## 151 229 249 12.04 3
## 152 178 228 12.47 2
## 153 149 239 10.68 2
## 154 239 221 14.97 2
## 155 116 207 6.89 1
## 156 20 215 0.75 1
## 157 137 258 10.45 2
## 158 163 195 8.21 2
## 159 80 191 4.24 1
## 160 293 272 23.85 3
## 161 343 238 21.11 3
## 162 115 210 6.00 1
## 163 278 285 19.64 3
## 164 127 186 5.62 1
## 165 166 257 12.42 2
## 166 257 238 16.32 3
## 167 160 192 6.23 1
## 168 110 206 5.62 1
## 169 147 238 10.21 2
## 170 214 238 14.46 2
## 171 20 162 0.75 1
## 172 164 212 8.86 1
## 173 49 192 2.54 1
## 174 192 215 9.75 2
## 175 148 216 7.95 1
## 176 300 247 18.18 3
## 177 180 210 9.96 2
## 178 193 250 14.11 3
## 179 187 234 10.90 2
## 180 140 218 9.45 2
## 181 185 216 8.67 1
## 182 291 247 21.92 3
## 183 233 244 13.36 2
## 184 20 172 0.84 1
## 185 225 249 17.26 3
## 186 20 219 1.56 1
## 187 190 221 11.33 2
## 188 236 230 13.96 2
## 189 77 205 3.77 1
## 190 70 207 2.79 1
## 191 343 257 25.68 3
## 192 132 238 9.67 2
## 193 306 270 20.31 3
## 194 195 221 9.98 2
## 195 243 227 13.26 2
## 196 208 235 14.45 3
## 197 219 234 13.13 2
## 198 157 212 7.35 1
## 199 128 217 6.43 2
## 200 332 280 28.24 3
## 201 161 272 13.28 3
## 202 168 246 9.86 2
## 203 123 216 6.47 2
## 204 195 233 13.65 3
## 205 325 249 24.53 3
## 206 183 203 8.43 1
## 207 140 243 10.64 2
## 208 234 249 17.88 3
## 209 233 254 17.48 3
## 210 314 221 17.88 3
## 211 145 224 8.69 1
## 212 298 243 18.79 3
## 213 66 208 4.14 2
## 214 307 270 20.06 3
## 215 53 209 3.37 1
## 216 198 248 11.74 3
## 217 247 257 19.41 3
## 218 113 254 8.59 2
## 219 109 206 4.59 1
## 220 199 235 9.76 2
## 221 253 246 19.00 3
## 222 98 222 4.56 1
## 223 110 218 4.84 2
## 224 296 254 18.21 3
## 225 160 230 11.11 2
## 226 284 270 23.34 3
## 227 227 241 13.88 2
## 228 54 231 3.73 2
## 229 127 230 6.64 1
## 230 208 271 13.53 3
## 231 233 236 13.31 2
## 232 243 242 15.54 2
## 233 131 215 8.11 2
## 234 94 236 6.17 1
## 235 306 232 21.57 3
## 236 109 230 6.74 1
## 237 147 228 9.74 2
## 238 335 236 19.28 3
## 239 219 231 15.24 2
## 240 229 224 11.20 2
## 241 198 237 13.79 2
## 242 217 237 11.19 3
## 243 135 230 8.16 2
## 244 123 237 5.60 2
## 245 88 207 4.45 1
## 246 194 244 10.05 2
## 247 196 231 12.02 2
## 248 219 219 9.49 1
## 249 201 212 8.84 2
## 250 149 184 5.16 1
## 251 202 195 12.02 2
## 252 172 224 10.19 2
## 253 131 203 8.43 1
## 254 227 215 12.60 2
## 255 126 200 6.71 1
## 256 172 247 10.13 2
## 257 113 226 7.29 1
## 258 97 221 5.88 2
## 259 239 219 13.66 2
## 260 89 212 4.04 1
## 261 157 257 10.07 2
## 262 253 240 12.63 2
## 263 205 243 12.23 2
## 264 183 215 8.18 1
## 265 185 220 11.86 2
## 266 236 240 16.51 3
## 267 173 245 12.29 2
## 268 151 195 7.88 1
## 269 214 256 16.37 3
## 270 226 215 12.84 2
## 271 238 230 13.48 2
## 272 173 194 8.59 1
## 273 271 258 21.55 3
## 274 185 255 12.90 3
## 275 122 200 5.54 1
## 276 143 235 8.22 2
## 277 183 247 10.92 2
## 278 219 210 11.72 2
## 279 248 229 14.87 2
## 280 74 179 2.73 1
## 281 163 201 7.11 1
## 282 190 241 13.61 3
## 283 246 254 18.55 3
## 284 199 237 14.12 2
## 285 179 221 12.03 2
## 286 245 194 14.25 2
## 287 192 231 11.49 2
## 288 185 223 10.69 1
## 289 281 241 17.23 3
## 290 133 229 6.94 1
## 291 229 195 11.46 1
## 292 227 221 13.09 2
## 293 120 198 7.01 1
## 294 214 225 9.68 1
## 295 276 236 15.82 2
## 296 188 229 9.82 2
## 297 172 240 9.78 2
## 298 198 229 11.95 2
## 299 186 211 11.26 2
## 300 87 222 4.33 1
## 301 146 216 6.44 1
## 302 169 232 11.89 2
## 303 151 216 6.18 1
## 304 323 296 23.27 3
## 305 153 259 9.75 2
## 306 199 234 11.91 2
## 307 140 220 9.58 2
## 308 226 202 11.88 1
## 309 211 224 12.20 2
## 310 245 223 14.37 2
## 311 205 243 13.14 3
## 312 143 209 7.98 1
## 313 234 213 10.46 2
## 314 234 218 16.06 3
## 315 156 194 7.58 1
## 316 189 252 11.86 2
## 317 156 252 9.66 2
## 318 197 260 16.26 3
## 319 76 205 4.09 1
## 320 32 219 1.49 1
## 321 191 224 8.76 2
## 322 161 206 9.24 1
## 323 192 267 15.09 3
## 324 145 217 6.44 1
## 325 169 221 11.10 2
## 326 122 211 6.54 1
## 327 294 231 16.41 3
## 328 85 197 4.74 1
## 329 100 218 6.10 1
## 330 226 244 12.79 2
## 331 128 212 5.89 1
## 332 185 232 13.22 2
## 333 125 195 5.26 1
## 334 151 202 6.74 1
## 335 192 255 14.82 3
## 336 21 220 1.29 1
## 337 83 192 3.60 1
## 338 225 265 14.24 2
## 339 128 235 6.60 2
## 340 118 216 5.02 1
## 341 317 247 23.12 3
## 342 188 235 13.01 2
## 343 139 226 8.55 2
## 344 226 228 15.77 3
## 345 105 209 5.86 1
## 346 61 181 3.54 1
## 347 135 210 5.63 1
## 348 160 238 10.40 2
## 349 331 247 24.85 3
## 350 224 230 12.42 2
## 351 191 224 12.53 2
## 352 154 237 9.60 2
## 353 223 279 18.34 3
## 354 148 252 11.00 2
## 355 325 269 21.58 3
## 356 48 197 1.52 1
## 357 211 247 12.87 2
## 358 189 227 10.77 2
## 359 151 191 7.46 1
## 360 227 259 14.93 3
## 361 155 241 11.36 2
## 362 118 201 6.31 1
## 363 102 202 4.44 1
## 364 158 220 8.83 2
## 365 259 222 14.53 2
## 366 136 247 8.01 2
## 367 136 247 10.35 2
## 368 216 234 12.78 2
## 369 177 236 12.71 2
## 370 161 264 13.19 3
## 371 174 219 11.30 2
## 372 195 246 14.66 3
## 373 212 264 13.53 2
## 374 286 269 23.05 3
## 375 246 241 17.64 3
## 376 233 261 14.39 3
## 377 147 182 5.47 1
## 378 50 216 2.96 1
## 379 155 209 8.59 2
## 380 192 216 8.33 1
## 381 156 201 7.87 2
## 382 144 191 6.14 1
## 383 133 229 7.42 2
## 384 300 234 14.28 3
## 385 105 183 5.58 1
## 386 216 213 9.54 1
## 387 122 222 6.71 1
## 388 82 230 4.52 2
## 389 190 291 16.59 3
## 390 34 199 1.37 1
## 391 264 251 15.81 2
## 392 86 224 5.20 2
## 393 21 192 1.14 1
## 394 124 229 6.27 2
## 395 190 214 12.55 2
## 396 137 236 9.57 2
## 397 143 247 10.06 2
## 398 181 223 11.59 2
## 399 92 212 5.33 2
## 400 103 211 3.81 1
## 401 282 269 18.85 3
## 402 361 281 30.95 3
## 403 145 208 6.86 2
## 404 348 269 28.62 3
## 405 236 270 18.47 3
## 406 200 226 13.91 2
## 407 86 233 5.22 2
## 408 152 248 11.36 2
## 409 194 280 16.38 3
## 410 219 252 13.54 3
## 411 145 188 7.06 1
## 412 275 264 17.67 3
## 413 108 234 6.65 2
## 414 116 231 7.61 2
## 415 113 211 6.53 1
## 416 164 196 8.94 1
## 417 163 215 7.15 1
## 418 152 250 11.43 2
## 419 199 237 12.25 3
## 420 173 236 12.46 2
## 421 158 204 8.90 1
## 422 49 158 1.70 1
## 423 99 227 6.62 2
## 424 54 204 2.96 1
## 425 20 196 0.71 1
## 426 84 215 3.67 1
## 427 258 245 18.89 3
## 428 265 230 18.33 3
## 429 244 211 13.08 2
## 430 217 240 12.38 2
## 431 303 257 19.01 3
## 432 136 234 9.81 2
## 433 120 230 8.39 2
## 434 172 275 11.51 3
## 435 210 231 14.43 2
## 436 95 190 4.65 1
## 437 87 195 4.60 1
## 438 234 198 12.04 2
## 439 184 266 14.95 3
## 440 171 243 10.94 2
## 441 246 236 17.18 3
## 442 187 189 9.40 1
## 443 177 210 7.76 1
## 444 244 240 18.48 3
## 445 132 216 6.19 1
## 446 221 214 10.00 2
## 447 199 277 13.32 3
## 448 161 224 10.94 2
## 449 224 244 14.04 3
## 450 153 206 6.47 1
## 451 282 261 22.44 3
## 452 183 242 13.47 2
## 453 124 200 7.46 1
## 454 299 237 21.28 3
## 455 283 300 26.41 3
## 456 43 245 2.40 2
## 457 196 246 9.82 2
## 458 170 200 8.13 1
## 459 127 253 10.20 2
## 460 157 232 9.46 2
## 461 167 215 7.47 1
## 462 236 228 13.79 2
## 463 116 210 6.70 1
## 464 311 239 19.53 3
## 465 244 227 15.14 2
## 466 97 225 5.06 1
## 467 270 234 19.02 3
## 468 93 228 4.73 1
## 469 172 218 9.64 2
## 470 337 247 20.68 3
## 471 187 211 10.21 1
## 472 194 222 8.62 2
## 473 132 209 8.11 2
## 474 76 202 3.62 1
## 475 130 215 5.84 1
## 476 253 249 19.12 3
## 477 347 269 23.26 3
## 478 133 185 6.03 1
## 479 192 238 11.75 2
## 480 160 198 7.65 1
## 481 155 237 9.42 2
## 482 131 195 5.40 1
## 483 264 231 18.30 3
## 484 221 224 11.56 2
## 485 230 244 13.16 2
## 486 231 232 14.06 2
## 487 143 203 7.32 1
## 488 233 255 14.58 2
## 489 198 247 14.54 3
## 490 188 253 11.58 3
## 491 118 204 5.19 2
## 492 263 264 20.93 3
## 493 146 200 7.79 1
## 494 129 254 8.15 3
## 495 102 212 6.35 1
## 496 78 197 3.12 1
## 497 220 217 13.80 2
## 498 87 206 5.04 1
## 499 218 247 12.79 2
## 500 69 191 3.22 1
## 501 170 211 10.53 1
## 502 235 234 17.28 3
## 503 112 199 6.15 1
## 504 111 217 7.29 2
## 505 186 258 12.92 2
## 506 277 244 20.18 3
## 507 154 236 10.09 2
## 508 181 213 9.77 2
## 509 171 216 8.88 1
## 510 232 251 17.44 3
## 511 193 205 10.12 1
## 512 207 232 14.32 2
## 513 86 212 4.33 1
## 514 197 251 14.96 3
## 515 224 249 11.43 2
## 516 256 217 16.92 2
## 517 200 247 12.39 2
## 518 121 240 7.38 2
## 519 20 205 0.85 1
## 520 241 239 13.88 2
## 521 156 245 9.64 2
## 522 240 221 16.05 2
## 523 221 238 13.93 2
## 524 140 213 9.06 2
## 525 318 258 24.40 3
## 526 129 200 5.57 1
## 527 98 207 4.16 1
## 528 182 226 10.70 2
## 529 280 258 17.37 3
## 530 159 230 11.75 2
## 531 105 224 4.33 1
## 532 141 212 6.42 1
## 533 20 182 1.50 1
## 534 184 232 10.03 2
## 535 218 202 10.87 2
## 536 189 206 7.73 1
## 537 170 200 8.77 1
## 538 225 234 13.04 2
## 539 268 223 18.49 3
## 540 186 230 11.24 2
## 541 74 197 2.67 1
## 542 228 223 12.95 2
## 543 256 266 16.39 3
## 544 159 219 8.99 1
## 545 228 236 12.92 2
## 546 142 231 6.35 2
## 547 247 234 17.48 3
## 548 155 251 8.19 2
## 549 83 189 2.72 1
## 550 215 249 15.78 3
## 551 237 243 17.28 3
## 552 191 259 14.79 3
## 553 274 241 19.30 3
## 554 243 203 10.12 1
## 555 92 193 4.69 1
## 556 316 237 22.84 3
## 557 345 241 17.33 3
## 558 231 248 15.04 3
## 559 241 262 19.73 3
## 560 157 218 9.95 2
## 561 198 248 13.29 3
## 562 289 268 19.43 3
## 563 166 209 6.99 1
## 564 156 201 8.07 1
## 565 116 202 4.43 1
## 566 148 186 5.01 1
## 567 265 244 19.76 3
## 568 249 241 13.71 3
## 569 269 239 16.96 3
## 570 120 237 6.54 2
## 571 71 201 3.61 1
## 572 109 247 6.51 2
## 573 220 227 12.99 2
## 574 355 240 25.94 3
## 575 176 260 11.21 2
## 576 181 246 10.69 2
## 577 323 244 24.06 3
## 578 222 258 17.18 3
## 579 224 233 13.53 2
## 580 212 236 12.41 2
## 581 202 214 8.93 1
## 582 148 243 8.65 2
## 583 156 226 8.62 1
## 584 102 228 6.62 2
## 585 229 250 13.69 2
## 586 141 220 7.68 2
## 587 263 267 21.43 3
## 588 222 244 12.89 2
## 589 119 222 5.36 1
## 590 234 235 16.92 3
## 591 193 245 14.65 2
## 592 128 220 7.86 2
## 593 114 211 4.66 1
## 594 252 259 20.16 3
## 595 164 204 8.79 2
## 596 115 203 4.53 1
## 597 151 203 9.29 1
## 598 149 253 10.94 2
## 599 137 233 7.73 2
## 600 137 215 8.99 2
## 601 38 184 2.01 1
## 602 254 214 11.49 2
## 603 203 266 16.66 3
## 604 136 253 10.59 2
## 605 294 225 20.05 3
## 606 277 240 15.79 2
## 607 207 186 9.59 2
## 608 158 205 6.80 1
## 609 221 250 16.96 3
## 610 161 198 8.36 1
## 611 212 250 10.77 2
## 612 203 222 11.82 2
## 613 302 274 24.91 3
## 614 133 197 5.57 1
## 615 163 223 11.23 2
## 616 155 182 6.04 1
## 617 369 285 25.36 3
## 618 138 212 5.87 1
## 619 265 264 16.75 3
## 620 207 220 12.08 2
## 621 141 258 8.55 2
## 622 165 227 7.89 1
## 623 197 236 11.59 2
## 624 187 222 10.83 2
## 625 199 230 14.28 2
## 626 236 238 14.71 3
## 627 170 247 11.12 2
## 628 285 249 14.41 2
## 629 164 196 8.47 1
## 630 136 258 10.26 3
## 631 182 261 11.12 2
## 632 73 210 3.32 1
## 633 75 210 4.46 1
## 634 298 243 17.79 3
## 635 173 183 7.68 1
## 636 237 243 15.08 3
## 637 305 248 17.68 3
## 638 176 213 8.97 1
## 639 185 209 8.72 1
## 640 234 263 18.77 3
## 641 191 221 10.96 2
## 642 83 171 3.16 1
## 643 190 235 9.91 2
## 644 188 236 11.18 3
## 645 160 237 11.29 2
## 646 132 249 7.77 2
## 647 192 208 8.07 1
## 648 259 238 18.13 3
## 649 206 257 16.05 3
## 650 320 234 18.11 3
## 651 113 224 5.43 2
## 652 166 210 7.74 1
## 653 106 207 5.06 1
## 654 155 206 8.48 1
## 655 202 242 10.27 2
## 656 194 184 7.22 1
## 657 20 211 0.67 1
## 658 97 256 7.56 2
## 659 159 227 9.77 2
## 660 233 238 14.38 3
## 661 49 212 2.38 1
## 662 114 249 6.16 2
## 663 137 256 10.65 2
## 664 257 249 13.93 3
## 665 73 203 3.77 1
## 666 80 199 4.05 1
## 667 81 186 2.58 1
## 668 210 210 13.45 1
## 669 148 246 7.90 2
## 670 163 250 10.89 2
## 671 113 215 6.03 1
## 672 132 249 9.03 2
## 673 121 221 6.74 1
## 674 180 216 12.04 2
## 675 306 243 22.51 3
## 676 115 211 7.39 1
## 677 131 189 5.16 1
## 678 117 225 7.61 2
## 679 79 198 4.00 1
## 680 235 250 17.49 3
## 681 112 194 4.27 1
## 682 307 233 14.67 2
## 683 152 252 9.02 2
## 684 121 220 5.56 1
## 685 185 235 10.50 2
## 686 279 226 16.58 2
## 687 208 216 11.49 2
## 688 155 243 11.53 2
## 689 138 207 7.44 1
## 690 109 204 5.65 1
## 691 144 219 9.84 2
## 692 277 223 14.80 2
## 693 185 196 9.14 1
## 694 156 230 9.12 2
## 695 197 221 11.46 2
## 696 240 247 17.56 3
## 697 203 268 16.90 3
## 698 95 185 4.73 1
## 699 171 247 10.41 3
## 700 203 199 10.17 2
## Grupos
## 1 2 3
## 217 301 182
## riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1 1 1 0 6.60 4.18
## 2 0 0 0 6.83 2.68
## 3 1 0 0 6.51 3.25
## 4 0 1 0 6.40 3.04
## 5 0 0 0 6.65 3.83
## 6 1 1 1 6.52 4.64
## humedad_suelo altura_planta diametro_tronco densidad_frutos
## 1 53.1 3.82 13.7 203
## 2 41.7 4.14 14.4 232
## 3 52.6 3.52 11.6 179
## 4 43.3 2.78 9.8 134
## 5 47.4 3.99 14.0 108
## 6 57.8 4.44 17.7 267
## peso_promedio_fruto rendimiento_palta Grupos
## 1 222 13.86 2
## 2 211 10.44 2
## 3 212 9.12 2
## 4 221 6.89 1
## 5 207 4.11 2
## 6 268 22.27 3
# Diagrama de cajas: humedad_suelo por cluster
boxplot(humedad_suelo ~ Grupos, data = datosf,
main = "BoxPlot de Humedad del Suelo vs CLUSTER",
xlab = "Cluster",
ylab = "Humedad del suelo",
names = c("Cluster 1", "Cluster 2", "Cluster 3"),
col = c("red", "blue", "peru"))# boxplot: rendimiento_palta por cluster
boxplot(rendimiento_palta ~ Grupos, data = datosf,
main = "BoxPlot de Rendimiento vs CLUSTER",
xlab = "Cluster",
ylab = "Rendimiento (ton/ha aprox.)",
names = c("Cluster 1", "Cluster 2", "Cluster 3"),
col = c("red","blue","peru"))# Perfil en base a las medias de las variables cuantitativas (por cluster)
# Calcular medias por cluster para las variables cuantitativas de interés
ph <- tapply(datosf$pH_suelo, datosf$Grupos, mean)
mo <- tapply(datosf$materia_organica, datosf$Grupos, mean)
hum <- tapply(datosf$humedad_suelo, datosf$Grupos, mean)
alt <- tapply(datosf$altura_planta, datosf$Grupos, mean)
diam<- tapply(datosf$diametro_tronco, datosf$Grupos, mean)
den <- tapply(datosf$densidad_frutos, datosf$Grupos, mean)
peso<- tapply(datosf$peso_promedio_fruto, datosf$Grupos, mean)
rend<- tapply(datosf$rendimiento_palta, datosf$Grupos, mean)
medias <- rbind(ph, mo, hum, alt, diam, den, peso, rend)
# Añadir la media general (sobre todas las observaciones) como columna extra
general <- c(mean(datosf$pH_suelo),
mean(datosf$materia_organica),
mean(datosf$humedad_suelo),
mean(datosf$altura_planta),
mean(datosf$diametro_tronco),
mean(datosf$densidad_frutos),
mean(datosf$peso_promedio_fruto),
mean(datosf$rendimiento_palta))
medias <- cbind(medias, General = general)
str(medias)## num [1:8, 1:4] 6.48 2.89 44.67 2.97 10.69 ...
## - attr(*, "dimnames")=List of 2
## ..$ : chr [1:8] "ph" "mo" "hum" "alt" ...
## ..$ : chr [1:4] "1" "2" "3" "General"
## 1 2 3 General
## ph 6.477465 6.467375 6.588352 6.501957
## mo 2.889171 3.856478 4.455714 3.712414
## hum 44.670968 50.629236 54.373626 49.755714
## alt 2.973134 3.907575 4.686154 3.820329
## diam 10.692627 14.197342 17.266484 13.908857
## den 124.027650 179.598007 255.313187 182.057143
## peso 204.004608 230.850498 251.274725 227.838571
## rend 6.038571 10.730598 17.754780 11.102357
# Grafico de perfiles (medias por cluster)
matplot(t(medias), # se transpone para que cada línea sea un grupo
main = "Perfil de medias de variables según Cluster",
xlab = "Variables (orden mostrado debajo)",
ylab = "Promedios",
type = "b",
pch = 19,
xaxt = "n",
col = c("blue","red","green2","black")) # 3 clusters + general
axis(1, at = 1:nrow(medias),
labels = c("pH_suelo","materia_organica","humedad_suelo",
"altura_planta","diametro_tronco","densidad_frutos",
"peso_promedio_fruto","rendimiento_palta"), las = 2, cex.axis = 0.8)
legend("topright", legend = c("Cluster 1", "Cluster 2", "Cluster 3", "General"),
col = c("blue","red","green2","black"), pch = 19, bty = "n")El análisis de componentes principales aplicado a las variables agronómicas del cultivo de palta permitió reducir la complejidad de los datos conservando la mayor parte de la información original. Según el gráfico de sedimentación (scree plot) y la proporción acumulada de varianza explicada, se recomienda retener los dos primeros componentes principales, los cuales explican aproximadamente el 70 % de la variabilidad total del conjunto de datos.
La primera componente principal (CP1) se asocia principalmente con variables relacionadas al desarrollo físico de la planta y productividad, tales como altura_planta, diametro_tronco, rendimiento_palta y peso_promedio_fruto. Por otro lado, la segunda componente (CP2) está más vinculada a variables del suelo, como pH_suelo, materia_organica y humedad_suelo.
Al aplicar el análisis de conglomerados jerárquico sobre las puntuaciones del ACP, se identificaron tres grupos claramente diferenciados de parcelas. El Cluster 1 agrupa observaciones con rendimiento alto y valores elevados de altura y diámetro de tronco, representando condiciones óptimas de manejo y fertilidad. El Cluster 2 presenta niveles intermedios en la mayoría de variables, siendo un grupo de equilibrio productivo. El Cluster 3 se caracteriza por baja materia orgánica, menor humedad y menor rendimiento, reflejando condiciones menos favorables del suelo y potencial productivo más limitado.
En el contexto de la creciente demanda mundial de palta (Persea americana) y la necesidad de optimizar los sistemas productivos, la identificación de factores clave que influyen en el rendimiento se ha convertido en una prioridad para la agricultura moderna. Este estudio emplea Análisis Factorial para identificar las dimensiones subyacentes que explican la variabilidad observada en un sistema de cultivo de palta, utilizando datos simulados de 11 variables técnicas y de manejo.
Riego por goteo: Sistema de irrigación localizada que optimiza el uso del agua, aplicándola directamente en la zona radicular. Variable dicotómica (0 = no aplicado, 1 = aplicado).
Fertilización orgánica: Aplicación de nutrientes mediante compost, estiércol u otros materiales orgánicos. Mejora la estructura del suelo y la disponibilidad gradual de nutrientes. Variable dicotómica (0 = no aplicada, 1 = aplicada).
Mulching: Cobertura del suelo con materiales orgánicos o sintéticos para reducir evaporación, controlar malezas y regular temperatura. Variable dicotómica (0 = no aplicado, 1 = aplicado).
pH del suelo: Medida de acidez o alcalinidad del suelo que afecta la disponibilidad de nutrientes para la planta. Rango óptimo para palta: 5.5-7.0. Variable continua.
Materia orgánica: Contenido de material orgánico en descomposición que mejora la estructura, retención de agua y fertilidad del suelo. Variable continua (%).
Humedad del suelo: Cantidad de agua disponible en el perfil del suelo, crucial para el desarrollo radicular y fisiológico de la planta. Variable continua (%).
Altura de planta: Medida vertical desde la base del tronco hasta el ápice superior, indicadora del desarrollo y vigor de la planta. Variable continua (metros).
Diámetro del tronco: Grosor del tronco a una altura estándar, relacionado con la capacidad estructural y acumulación de biomasa. Variable continua (cm).
Densidad de frutos: Número de frutos por árbol o por unidad de área, indicador del potencial productivo del cultivo. Variable continua.
Peso promedio del fruto: Masa media individual de los frutos, relacionada con la calidad comercial y características organolépticas. Variable continua (gramos).
Rendimiento: Producción total por unidad de superficie, resultado integrador de todas las variables anteriores. Variable continua (kg/ha o toneladas).
Identificar mediante Análisis Factorial la estructura subyacente de relaciones entre las variables técnicas del cultivo de palta, determinando los factores latentes que explican la mayor variabilidad del sistema y proporcionando una base científica para la optimización de prácticas de manejo.
El análisis exploratorio inicial examina la estructura básica de los datos mediante estadísticos descriptivos de las 11 variables técnicas del cultivo de palta.
## Descriptive Statistics
## datos_palta
## N: 700
##
## altura_planta densidad_frutos diametro_tronco fertilizacion_organica
## ----------------- --------------- ----------------- ----------------- ------------------------
## Mean 34.55 260.71 49.19 0.72
## Std.Dev 2.13 14.25 2.80 0.45
## Min 29.38 214.71 42.06 0.00
## Q1 32.82 251.39 47.18 0.00
## Median 34.84 261.64 49.33 1.00
## Q3 36.21 272.03 51.47 1.00
## Max 38.94 288.08 54.85 1.00
## MAD 2.40 15.32 3.18 0.00
## IQR 3.38 20.59 4.28 1.00
## CV 0.06 0.05 0.06 0.62
## Skewness -0.29 -0.50 -0.29 -0.99
## SE.Skewness 0.09 0.09 0.09 0.09
## Kurtosis -0.85 -0.32 -0.75 -1.01
## N.Valid 700.00 700.00 700.00 700.00
## N 700.00 700.00 700.00 700.00
## Pct.Valid 100.00 100.00 100.00 100.00
##
## Table: Table continues below
##
##
##
## humedad_suelo materia_organica mulching peso_promedio_fruto pH_suelo
## ----------------- --------------- ------------------ ---------- --------------------- ----------
## Mean 57.44 7.68 0.51 217.64 6.51
## Std.Dev 4.45 0.43 0.50 10.21 0.25
## Min 47.69 6.08 0.00 191.53 5.74
## Q1 53.42 7.40 0.00 210.66 6.34
## Median 58.65 7.70 1.00 218.03 6.50
## Q3 61.02 7.99 1.00 224.94 6.68
## Max 65.42 8.78 1.00 242.65 7.35
## MAD 5.15 0.44 0.00 10.40 0.25
## IQR 7.60 0.59 1.00 14.27 0.34
## CV 0.08 0.06 0.99 0.05 0.04
## Skewness -0.31 -0.23 -0.02 -0.11 -0.03
## SE.Skewness 0.09 0.09 0.09 0.09 0.09
## Kurtosis -1.11 -0.25 -2.00 -0.39 -0.01
## N.Valid 700.00 700.00 700.00 700.00 700.00
## N 700.00 700.00 700.00 700.00 700.00
## Pct.Valid 100.00 100.00 100.00 100.00 100.00
##
## Table: Table continues below
##
##
##
## rendimiento_palta riego_por_goteo
## ----------------- ------------------- -----------------
## Mean 0.86 0.61
## Std.Dev 0.27 0.49
## Min 0.07 0.00
## Q1 0.67 0.00
## Median 0.87 1.00
## Q3 1.03 1.00
## Max 1.74 1.00
## MAD 0.27 0.00
## IQR 0.36 1.00
## CV 0.31 0.80
## Skewness -0.13 -0.44
## SE.Skewness 0.09 0.09
## Kurtosis -0.06 -1.81
## N.Valid 700.00 700.00
## N 700.00 700.00
## Pct.Valid 100.00 100.00
corrplot(cor_matrix, method = "color", type = "upper",
order = "hclust", addCoef.col = "black",
tl.col = "darkblue", tl.srt = 45,
title = "Matriz de Correlaciones - Variables de Cultivo de Palta",
mar = c(0,0,2,0))heatmap(cor_matrix,
symm = TRUE,
margins = c(8, 8),
main = "Agrupamiento de Variables por Patrones de Correlación",
xlab = "Variables",
ylab = "Variables")library(polycor)
# 'datos_palta' tiene variables dicotómicas y continuas
matpoly <- hetcor(datos_palta)$correlations
ggcorrplot(matpoly,
method = 'circle',
type = "lower",
hc.order = TRUE) +
theme_gray()La matriz de correlaciones revela una estructura factorial adecuada para el análisis:
Esta estructura justifica la aplicación de Análisis Factorial al existir grupos de variables altamente intercorrelacionadas.
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = datos_palta)
## Overall MSA = 0.8
## MSA for each item =
## riego_por_goteo fertilizacion_organica mulching
## 0.82 0.57 0.49
## pH_suelo materia_organica humedad_suelo
## 0.46 0.69 0.89
## altura_planta diametro_tronco densidad_frutos
## 0.79 0.85 0.93
## peso_promedio_fruto rendimiento_palta
## 0.90 0.98
El test KMO muestra un Overall MSA = 0.8, indicando una adecuación factorial “meritoria” según el criterio de Kaiser (KMO > 0.8). Esto confirma que los datos son apropiados para el análisis factorial.
A nivel individual:
MSA alto (>0.80): Rendimiento, Densidad, Peso del fruto, Humedad, Diámetro - excelente adecuación.
MSA moderado(0.60-0.79): Altura, Materia orgánica, Riego - adecuación aceptable.
MSA bajo (<0.60): Mulching, Fertilización, pH - pueden considerarse para exclusión.
El KMO global sustenta la procedencia del análisis factorial.
\[ H_{0}:R=1, \text{La matriz de correlaciones poblacionales es una matriz identidad} \]
\[ H_{0}:R\neq1, \text{La matriz de correlaciones poblacionales es una matriz identidad} \]
## $chisq
## [1] 12173.21
##
## $p.value
## [1] 0
##
## $df
## [1] 55
Conclusión: Se rechaza \(H_0\) \((p < 0.001)\), indicando que existen correlaciones significativas entre las variables y confirmando la adecuación de los datos para el análisis factorial.
Los datos siguen una distribución normal multivariada.
\[H_0: \mathbf{D} \sim \mathcal{N}(\mu, \Sigma)\]
Los datos no siguen una distribución normal multivariada.
\[H_1: \mathbf{D} \not\sim \mathcal{N}(\mu, \Sigma)\]
##
## Shapiro-Wilk normality test
##
## data: Z
## W = 0.99314, p-value = 0.002687
library(MVN)
#Test MVN de Royston
royston <- mvn(data = datos_palta, mvnTest = "royston")
royston$multivariateNormality## Test H p value MVN
## 1 Royston 415.9806 5.715609e-86 NO
#Test MVN de Mardia
mardia <- mvn(data = datos_palta, mvnTest = "mardia")
mardia$multivariateNormality## Test Statistic p value Result
## 1 Mardia Skewness 392.543295422629 2.85367671467563e-05 NO
## 2 Mardia Kurtosis -3.03546235190017 0.00240167205218023 NO
## 3 MVN <NA> <NA> NO
## Test HZ p value MVN
## 1 Henze-Zirkler 1.206455 0 NO
## Test E df p value MVN
## 1 Doornik-Hansen 5385.671 22 0 NO
Dada la violación de normalidad multivariada y la naturaleza mixta de las variables (dicotómicas y continuas), se utilizó una matriz de correlaciones policóricas y se compararon métodos de extracción robustos:
Mínimos Cuadrados (Minres): Óptimo para datos no normales.
Ejes Principales (PA): Basado en correlaciones, sin supuestos distribucionales.
Máxima Verosimilitud (ML): Incluido como referencia pese a su sensibilidad.
La selección final se basará en la comparación de comunalidades.
facto1 <- fa(matpoly,nfactors = 3,rotate="none",
fm="mle") # Máxima Verosimilitud (ML)
facto2 <- fa(matpoly, nfactors = 3, rotate = "none",
fm="pa") # modelo de ejes principales
facto3 <- fa(matpoly, nfactors = 3, rotate = "none",
fm="minres") # mínimos cuadrados residualesCriterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.
f1<-sort(facto1$communality,decreasing=TRUE)
f2 <- sort(facto2$communality,decreasing = TRUE)
f3 <- sort(facto3$communality,decreasing = TRUE)
(cbind(f1,f2,f3))## f1 f2 f3
## altura_planta 0.9959826 0.9881335 0.9882722
## diametro_tronco 0.9943055 0.9805202 0.9806473
## humedad_suelo 0.9891566 0.9778031 0.9779429
## materia_organica 0.9611969 0.9756930 0.9755302
## riego_por_goteo 0.9455439 0.9394805 0.9388717
## fertilizacion_organica 0.9110344 0.9156777 0.9146489
## densidad_frutos 0.9034258 0.7746600 0.7949940
## peso_promedio_fruto 0.5044519 0.7124973 0.7060814
## rendimiento_palta 0.3924384 0.6161316 0.6131966
## mulching 0.3874723 0.4019878 0.4020180
## pH_suelo 0.2926803 0.1049718 0.1052393
library(reshape2)
# Crear dataframe con las comunalidades comparadas
comunalidades_df <- data.frame(
Variable = names(f1),
Minres = f1,
PA = f2,
ML = f3
)
# Convertir a formato largo para ggplot2
comunalidades_long <- melt(comunalidades_df, id.vars = "Variable",
variable.name = "Metodo",
value.name = "Comunalidad")
# Heatmap de comunalidades
ggplot(comunalidades_long, aes(x = Metodo, y = Variable, fill = Comunalidad)) +
geom_tile(color = "white") +
scale_fill_gradient2(low = "blue", mid = "white", high = "red",
midpoint = 0.5, limits = c(0, 1)) +
geom_text(aes(label = round(Comunalidad, 3)), color = "black", size = 3) +
theme_minimal() +
labs(title = "Comparación de Comunalidades por Método de Extracción",
x = "Método", y = "Variable",
fill = "Comunalidad") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))Conclusión:
Entre los tres métodos comparados, Mínimos Cuadrados (Minres) presenta la comunalidad promedio más alta (0.763) aunque con diferencias mínimas respecto a Ejes Principales (0.763) y Máxima Verosimilitud (0.753). Dada su robustez ante la no-normalidad de los datos, se selecciona Minres como método óptimo para la extracción factorial.
Criterio complementario: Se evalúan las unicidades (varianza única no explicada por los factores), donde valores más bajos indican mejor ajuste del modelo.
u1 <- sort(facto1$uniquenesses,decreasing = TRUE)
u2 <- sort(facto2$uniquenesses,decreasing = TRUE)
u3 <- sort(facto3$uniquenesses,decreasing = TRUE)
(cbind(u1,u2,u3))## u1 u2 u3
## pH_suelo 0.707319675 0.89502823 0.89476069
## mulching 0.612527694 0.59801224 0.59798204
## rendimiento_palta 0.607561625 0.38386839 0.38680343
## peso_promedio_fruto 0.495548062 0.28750266 0.29391855
## densidad_frutos 0.096574220 0.22533996 0.20500597
## fertilizacion_organica 0.088965555 0.08432229 0.08535108
## riego_por_goteo 0.054456065 0.06051948 0.06112829
## materia_organica 0.038803065 0.02430699 0.02446980
## humedad_suelo 0.010843386 0.02219687 0.02205706
## diametro_tronco 0.005694503 0.01947983 0.01935265
## altura_planta 0.004017409 0.01186646 0.01172779
library(reshape2)
library(ggplot2)
# Crear data.frame de unicidades directamente desde los objetos fa
unicidades <- data.frame(
Variable = names(facto1$uniquenesses),
ML = facto1$uniquenesses,
PA = facto2$uniquenesses,
MinRes = facto3$uniquenesses
)
# Convertir a formato largo para ggplot
unicidades_long <- melt(unicidades, id.vars = "Variable",
variable.name = "Metodo",
value.name = "Unicidad")
# Crear heatmap
ggplot(unicidades_long, aes(x = Metodo, y = Variable, fill = Unicidad)) +
geom_tile(color = "white") +
scale_fill_gradient(low = "white", high = "red") +
geom_text(aes(label = round(Unicidad, 2)), color = "black", size = 3) +
theme_minimal() +
labs(title = "Heatmap de Unicidades por Método de Extracción", x = "Método", y = "") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))# Calcular unicidades promedio por método
unicidades_promedio <- data.frame(
Método = c("ML", "PA", "Minres"),
Unicidad_Promedio = c(mean(facto1$uniquenesses),
mean(facto2$uniquenesses),
mean(facto3$uniquenesses))
)
print(unicidades_promedio)## Método Unicidad_Promedio
## 1 ML 0.2474828
## 2 PA 0.2374949
## 3 Minres 0.2365961
Conclusión:
Minres optimiza ambos criterios: maximiza la varianza común capturada (comunalidad = 0.7634) y minimiza la varianza única no explicada (unicidad = 0.2365), confirmándose como el método más eficiente.
Para determinar el número óptimo de factores a retener, se aplicarán tres criterios ampliamente reconocidos: el criterio de Kaiser (eigenvalues > 1), el análisis del scree plot, y el criterio paralelo.
## [1] 5.908494478 1.747497668 1.273902166 0.998473169 0.551487212 0.255597258
## [7] 0.122330450 0.094263359 0.034704494 0.009931148 0.003318598
# Criterio de valores propios (Kaiser)
plot(ev$values, type = "b", pch = 20, col = "blue",
xlab = "Número de factores", ylab = "Valores propios",
main = "Scree Plot - Criterio de Kaiser")
abline(h = 1, lty = 3, col = "red") # línea de Kaiser
text(x = length(ev$values), y = 1, labels = "Kaiser = 1",
pos = 3, col = "red", cex = 0.8)El scree plot muestra un patrón típico con un “codo” marcado después del tercer factor:
Interpretación inicial: El criterio de Kaiser sugiere retener 3 factores, coincidiendo con el punto donde la curva cambia de pendiente abruptamente.
Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.
El scree plot confirma visualmente la retención de 3 factores:
Codo pronunciado: Claramente visible después del tercer componente/factor.
Concordancia de criterios: Tanto el análisis de componentes principales (PC) como factorial (FA) muestran el mismo punto de inflexión.
Varianza significativa: Los primeros 3 factores capturan la estructura latente esencial.
Conclusión: El criterio visual del scree plot corrobora la decisión de retener 3 factores.
Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.
# Versión alternativa con mejor resolución
library(psych)
resultado_parallel <- fa.parallel(datos_palta, fa = "fa", fm = "minres",
n.iter = 100, plot = FALSE)## Parallel analysis suggests that the number of factors = 4 and the number of components = NA
# Gráfico personalizado
plot(resultado_parallel$fa.values, type = "b", pch = 19, col = "blue",
ylim = c(0, max(resultado_parallel$fa.values) + 0.5),
xlab = "Número de Factores", ylab = "Eigenvalues",
main = "Criterio Paralelo - Factores a Retener")
lines(resultado_parallel$fa.sim, type = "b", pch = 17, col = "red")
lines(resultado_parallel$fa.simr, type = "b", pch = 15, col = "orange")
legend("topright", legend = c("Datos Reales", "Datos Simulados", "Datos Re-muestreados"),
col = c("blue", "red", "orange"), pch = c(19, 17, 15), bty = "n")El análisis paralelo confirma la retención de 3 factores. Los eigenvalues de los datos reales (línea azul) superan a los de los datos simulados (línea roja) hasta el tercer factor, indicando que solo estos primeros tres factores explican más varianza de lo esperado por azar.
Esta triple validación (Kaiser, Scree Plot, Criterio Paralelo) consolida la decisión de proceder con 3 factores para el análisis factorial rotado.
La aplicación de tres criterios estadísticos converge consistentemente en la retención de 3 factores:
Esta triple validación metodológica proporciona una base sólida para proceder con la extracción y rotación de 3 factores, los cuales explican colectivamente el 81.2% de la varianza total del sistema de cultivo de palta.
Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.
## MR1 MR2 MR3
## riego_por_goteo 0.975716682 -0.14650082 -0.04521799
## fertilizacion_organica 0.127290096 0.77062293 -0.05598301
## mulching 0.009801228 0.08350448 0.88765138
## pH_suelo 0.084730940 0.29873962 0.09388622
## materia_organica 0.115234089 0.84645192 0.45728761
## humedad_suelo 0.943113470 0.24460973 0.17706047
## altura_planta 0.902923200 0.35437408 0.19259192
## diametro_tronco 0.874080550 0.44301681 0.16730663
## densidad_frutos 0.639156523 0.70965201 0.05021835
## peso_promedio_fruto 0.467687262 0.25249129 0.65084424
## rendimiento_palta 0.506314709 0.35507688 0.13994210
# Cambiar el nombre del objeto de 'loadings' a 'cargas_factoriales'
cargas_factoriales <- modelo_final$loadings[, 1:3]
# Ahora sí funciona
loadings_df <- as.data.frame(cargas_factoriales)
loadings_df$Variable <- rownames(loadings_df)
# Convertir a formato largo para ggplot2
loadings_long <- melt(loadings_df, id.vars = "Variable",
variable.name = "Factor",
value.name = "Carga")
ggplot(loadings_long, aes(x = Factor, y = Variable, fill = Carga)) +
geom_tile(color = "white") +
scale_fill_gradient2(low = "blue", mid = "white", high = "red", midpoint = 0) +
geom_text(aes(label = round(Carga, 3)), color = "black", size = 3) +
theme_minimal() +
labs(title = "Heatmap de Cargas Factoriales (Varimax, 3 Factores)",
x = "Factor", y = "") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))La matriz de cargas rotadas revela una estructura factorial bien definida:
Factor 1 (MR1)
Crecimiento y Manejo Hídrico (39.5% de varianza):
Cargas altas: riego_por_goteo
(0.98), humedad_suelo (0.94), altura_planta
(0.90), diámetro_tronco (0.87)
Interpretación: Representa el desarrollo vegetativo influenciado por el manejo del agua.
Factor 2 (MR2)
Fertilidad y Producción (22.8% de varianza):
Cargas altas: materia_organica
(0.85), fertilización_organica (0.77),
densidad_frutos (0.71)
Interpretación: Agrupa variables relacionadas con nutrición del suelo y potencial productivo.
Factor 3 (MR3)
Prácticas Culturales (14.1% de varianza):
Cargas altas: mulching (0.89),
peso_promedio_fruto (0.65)
Interpretación: Representa prácticas de cobertura y calidad del fruto.
## MR1 MR2 MR3
## SS loadings 4.3411373 2.5031376 1.5531678
## Proportion Var 0.3946488 0.2275580 0.1411971
## Cumulative Var 0.3946488 0.6222068 0.7634039
# Crear heatmap de varianza explicada
varianza_df <- as.data.frame(t(modelo_final$Vaccounted[1:3,]))
varianza_df$Factor <- rownames(varianza_df)
varianza_long <- melt(varianza_df, id.vars = "Factor",
variable.name = "Metrica",
value.name = "Valor")
ggplot(varianza_long, aes(x = Factor, y = Metrica, fill = Valor)) +
geom_tile(color = "white") +
scale_fill_gradient2(low = "#FFE900", high = "red",
midpoint = 0.5) +
geom_text(aes(label = round(Valor, 3)), color = "black", size = 4) +
theme_minimal() +
labs(title = "Varianza Explicada por Factor",
x = "Factor", y = "Métrica") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))El modelo de 3 factores explica 76.3% de la varianza total de los datos, lo que representa una excelente capacidad explicativa:
Factor 1 (MR1): Explica 39.5% de la varianza - el factor más importante.
Factor 2 (MR2): Contribuye con 22.8% adicional - segundo en relevancia.
Factor 3 (MR3): Aporta 14.1% restante - complementa la estructura.
Distribución de la varianza explicada:
Factor 1: 51.7% de la varianza explicada por el modelo.
Factor 2: 29.8% de la varianza explicada.
Factor 3: 18.5% de la varianza explicada.
La estructura factorial obtenida captura eficientemente la información subyacente en las 11 variables originales, validando la solidez del modelo propuesto.
La comunalidad representa la proporción de varianza de cada variable que es explicada por los factores comunes.
Comunalidad ALTA (>0.70): La variable está bien representada por los factores.
Comunalidad BAJA (<0.30): La variable tiene poca relación con la estructura factorial común.
## riego_por_goteo fertilizacion_organica mulching
## 0.9755249 0.6131883 0.7949925
## pH_suelo materia_organica humedad_suelo
## 0.1052286 0.9388742 0.9806509
## altura_planta diametro_tronco densidad_frutos
## 0.9779460 0.9882756 0.9146523
## peso_promedio_fruto rendimiento_palta
## 0.7060882 0.4020334
# Crear dataframe para las comunalidades
comunalidades_df <- data.frame(
Variable = names(modelo_final$communalities),
Comunalidad = modelo_final$communalities
)
# Ordenar de mayor a menor comunalidad
comunalidades_df <- comunalidades_df[order(-comunalidades_df$Comunalidad), ]
# Heatmap de comunalidades
ggplot(comunalidades_df, aes(x = "", y = reorder(Variable, Comunalidad), fill = Comunalidad)) +
geom_tile(color = "white", width = 0.5) +
scale_fill_gradient2(low = "#bfff00", mid = "#FFE900", high = "red",
midpoint = 0.5, limits = c(0, 1),
name = "Comunalidad") +
geom_text(aes(label = round(Comunalidad, 3)), color = "black", size = 3.5) +
theme_minimal() +
labs(title = "Comunalidades por Variable",
subtitle = "Varianza explicada por los factores comunes",
x = "", y = "") +
theme(axis.text.x = element_blank(),
panel.grid = element_blank())La mayoría de variables están bien representadas por los factores
(comunalidades >0.70). pH_suelo es la única variable con
representación factorial deficiente (0.105).
La unicidad representa la proporción de varianza de cada variable que NO es explicada por los factores comunes.
Unicidad ALTA (>0.70): La variable tiene mucha varianza única no capturada por los factores.
Unicidad BAJA (<0.30): La variable está bien explicada por la estructura factorial común.
## riego_por_goteo fertilizacion_organica mulching
## 0.02446980 0.38680343 0.20500597
## pH_suelo materia_organica humedad_suelo
## 0.89476069 0.06112829 0.01935265
## altura_planta diametro_tronco densidad_frutos
## 0.02205706 0.01172779 0.08535108
## peso_promedio_fruto rendimiento_palta
## 0.29391855 0.59798204
# Crear dataframe para las unicidades
unicidades_df <- data.frame(
Variable = names(modelo_final$uniquenesses),
Unicidad = modelo_final$uniquenesses
)
# Ordenar de menor a mayor unicidad
unicidades_df <- unicidades_df[order(unicidades_df$Unicidad), ]
# Heatmap de unicidades
ggplot(unicidades_df, aes(x = "", y = reorder(Variable, -Unicidad), fill = Unicidad)) +
geom_tile(color = "white", width = 0.5) +
scale_fill_gradient2(low = "#ff00ff", mid = "#8000ff", high = "#13b6ec",
midpoint = 0.4, limits = c(0, 1),
name = "Unicidad") +
geom_text(aes(label = round(Unicidad, 3)), color = "black", size = 3.5) +
theme_minimal() +
labs(title = "Unicidades por Variable",
subtitle = "Varianza única NO explicada por los factores",
x = "", y = "") +
theme(axis.text.x = element_blank(),
panel.grid = element_blank())La mayoría de variables están bien representadas por los factores
(unicidades <0.30). pH_suelo es la excepción con alta
varianza única (0.89) no explicada por la estructura factorial
común.
El análisis factorial identificó una estructura robusta de tres factores latentes que explican el 76.3% de la varianza total del sistema de cultivo de palta:
Estructura Factorial Identificada:
Factor 1 - Crecimiento y Manejo Hídrico (39.5%): Dominado por riego, humedad del suelo y variables de crecimiento vegetativo (cargas >0.87).
Factor 2 - Fertilidad y Producción (22.8%): Agrupa materia orgánica, fertilización y densidad de frutos (cargas >0.70).
Factor 3 - Prácticas Culturales (14.1%): Representado principalmente por mulching y peso del fruto (cargas >0.65).
Calidad del Ajuste:
Comunalidades: 8 de 11 variables presentan excelente representación factorial (>0.70).
Unicidades: La mayoría de variables muestran baja varianza única no explicada.
Variables críticas: pH_suelo
requiere consideración especial por su alta unicidad (0.89).
Validación Metodológica:
KMO meritorio (0.8) y consistencia en tres criterios de retención de factores confirman la solidez del modelo para orientar estrategias de manejo agronómico.
La definición de éxito estudiantil suele reducirse al rendimiento académico, omitiendo factores clave como el bienestar y el estrés. Este estudio adopta un enfoque integral, empleando un Análisis Factorial de Datos Mixtos (FAMD) para analizar simultáneamente variables cuantitativas (académicas) y cualitativas (hábitos de vida). El objetivo es identificar los perfiles latentes que caracterizan a la población estudiantil, con el fin de proporcionar una base empírica para el diseño de programas de apoyo más efectivos.
El análisis se basa en un conjunto de datos simulado que comprende una muestra de 250 estudiantes universitarios. Para capturar un perfil integral de cada estudiante, se recopilaron variables que se clasifican en dos categorías principales: cuantitativas y cualitativas.
| Variable | Descripción | Tipo | Rango |
|---|---|---|---|
| Edad | Edad del participante en años | Cuantitativa | 18-25 |
| Horas_Estudio_Semanal | Cantidad de horas semanales dedicadas al estudio | Cuantitativa | 5-30 |
| Promedio_General | Promedio ponderado acumulado (PPA) | Cuantitativa | Escala de 0 a 20 |
| Genero | Género del estudiante | Cualitativa | Masculino, Femenino |
| Area_Estudio | Área de especialización | Cualitativa | Ingeniería, C.Sociale, Artes y C. de la Salud |
| Nivel_Estres | Nivel de estrés percibido en el último semestre. | Cualitativa | Bajo, Moderado, Alto |
| Participa_Actividades | Participación en actividades extracurriculares. | Cualitatitva | Si , No |
La metodología de este estudio es el Análisis Factorial de Datos Mixtos (FAMD), una técnica elegida por su capacidad para analizar simultáneamente variables cuantitativas (numéricas) y cualitativas (categóricas).
Al unificar los principios del Análisis de Componentes Principales (ACP) y el Análisis de Correspondencias Múltiples (ACM), el FAMD reduce la dimensionalidad de los datos. Su objetivo es proyectar la información en un número menor de factores latentes que explican la mayor parte de la varianza, sin necesidad de transformar las variables originales.
La aplicación de esta técnica busca visualizar las relaciones entre variables, identificar los factores más influyentes y segmentar a los estudiantes en perfiles coherentes.
# Carga de librerías
library(FactoMineR) # Análisis de datos multivariados.
library(ggplot2) # Creación de gráficos elegantes
library(factoextra) # Visualización de resultados
library(tidyverse) # Manipulación, transformación y visualización de datos
library(sjPlot) # Fácil visualización
library(performance)# Para diagnóstico de modelos
library(tidymodels) # Herramientas para estimación modelos
library(visdat) # Vistazo a los datos
library(naniar) # Análisis de datos perdidos
library(GGally) # Complemento de visualización
library(effectsize) # Para interpretar tamaños del efecto
library(cowplot) # Para plot_grid()# Simulación de datos
set.seed(123)
Y <- tibble(
Edad = sample(18:25, 250, replace = TRUE),
Horas_Estudio_Semanal = round(runif(250, min = 5, max = 30)),
Promedio_General = pmin(20, pmax(5, (Horas_Estudio_Semanal * 0.35) + rnorm(250, mean = 6, sd = 3))),
Genero = factor(sample(c("Masculino", "Femenino"), 250, replace = TRUE)),
Area_Estudio = factor(sample(c("Ingeniería", "Ciencias Sociales", "Artes y Humanidades", "Ciencias de la Salud"), 250, replace = TRUE, prob = c(0.3, 0.3, 0.2, 0.2))),
Nivel_Estres = factor(sample(c("Bajo", "Moderado", "Alto"), 250, replace = TRUE, prob = c(0.3, 0.5, 0.2)), levels = c("Bajo", "Moderado", "Alto")),
Participa_Actividades = factor(sample(c("Si", "No"), 250, replace = TRUE, prob = c(0.6, 0.4)))
)
# Renombramos una variable
Y <- Y %>% rename(Actividades = Participa_Actividades)
head(Y)## # A tibble: 6 × 7
## Edad Horas_Estudio_Semanal Promedio_General Genero Area_Estudio Nivel_Estres
## <int> <dbl> <dbl> <fct> <fct> <fct>
## 1 24 11 8.72 Mascul… Ciencias de… Alto
## 2 24 11 8.16 Femeni… Ciencias So… Alto
## 3 20 20 12.0 Femeni… Ciencias So… Moderado
## 4 23 12 10.5 Mascul… Ingeniería Moderado
## 5 20 18 17.1 Femeni… Ingeniería Bajo
## 6 19 25 14.5 Mascul… Ciencias de… Bajo
## # ℹ 1 more variable: Actividades <fct>
## [1] 250 7
## Edad Horas_Estudio_Semanal Promedio_General Genero
## Min. :18.00 Min. : 5.00 Min. : 5.00 Femenino :125
## 1st Qu.:20.00 1st Qu.:11.00 1st Qu.: 9.95 Masculino:125
## Median :22.00 Median :16.50 Median :12.33
## Mean :21.72 Mean :17.08 Mean :12.24
## 3rd Qu.:24.00 3rd Qu.:23.75 3rd Qu.:14.52
## Max. :25.00 Max. :30.00 Max. :20.00
## Area_Estudio Nivel_Estres Actividades
## Artes y Humanidades :50 Bajo : 69 No: 97
## Ciencias de la Salud:51 Moderado:128 Si:153
## Ciencias Sociales :77 Alto : 53
## Ingeniería :72
##
##
| ID | Name | Label | Values | Value Labels | Freq. | % |
|---|---|---|---|---|---|---|
| 1 | Edad | range: 18-25 | ||||
| 2 | Horas_Estudio_Semanal | range: 5-30 | ||||
| 3 | Promedio_General | range: 5.0-20.0 | ||||
| 4 | Genero |
Femenino Masculino |
125 125 |
50.00 50.00 |
||
| 5 | Area_Estudio |
Artes y Humanidades Ciencias de la Salud Ciencias Sociales Ingeniería |
50 51 77 72 |
20.00 20.40 30.80 28.80 |
||
| 6 | Nivel_Estres |
Bajo Moderado Alto |
69 128 53 |
27.60 51.20 21.20 |
||
| 7 | Actividades |
No Si |
97 153 |
38.80 61.20 |
||
lista_de_graficos <- Y %>%
group_by(Nivel_Estres) %>%
plot_frq(Area_Estudio, vjust = 0.8)
# Combina los gráficos en una sola columna
p <- plot_grid(plotlist = lista_de_graficos, ncol = 1)
p#NOTA:
# En el gráfio está con el orden en que aparecen por primera vez en los datos (que esta incorrecto visualmente).
# Los gráficos correctamente van en este orden : Nivel_Estres: Bajo , Nivel_Estres: Mediano , Nivel_Estres: AltoEstrés Alto (N=53): Este grupo está dominado por las carreras Ciencias Sociales e Ingenería. Con 15 estudiantes, representan el 28.3% cada uno de todos los alumnos con estrés alto, siendo el perfil más característico de este grupo.
Estrés Bajo (N=69): En el grupo con menor estrés, el área predominante es Ingenería, con 23 estudiantes, lo que equivale al 33.3% (un tercio) del total de este perfil.
Estrés Moderado (N=128): Este es el grupo más grande. Ciencia Sociales es nuevamente la carrera más frecuente con 43 estudiantes, representando el 33.6% de los alumnos con estrés moderado.
Este resultado significa que los 43 estudiantes de Ciencias Sociales que sí participan en actividades representan el 17.2% del total de la población estudiantil (250 estudiantes).
plot_xtab(
x = Y$Nivel_Estres,
grp = Y$Actividades,
margin = 'row',
bar.pos = 'stack',
show.summary = T,
coord.flip = T
)Un valor p de 0.811 indica que el resultado no es estadísticamente significativo.
Cramer’s V = 0.041: Este valor es casi cero, confirmando que la fuerza de la asociación es insignificante.
χ² = 0.419 y df = 2: El valor del Chi-cuadrado es muy bajo. Esto significa que la diferencia entre los datos observados y lo que se esperaría si no hubiera relación es mínima. Los grados de libertad (df=2) ayudan a contextualizar este valor, confirmando que una discrepancia tan pequeña no es estadísticamente relevante.
En resumen, los resultados indican que no hay ninguna relación significativa entre las dos variables que se analizo. Las variables son estadísticamente independientes.
| Nivel_Estres | Actividades | Total | |
|---|---|---|---|
| No | Si | ||
| Bajo |
29 42 % |
40 58 % |
69 100 % |
| Moderado |
48 37.5 % |
80 62.5 % |
128 100 % |
| Alto |
20 37.7 % |
33 62.3 % |
53 100 % |
| Total |
97 38.8 % |
153 61.2 % |
250 100 % |
χ2=0.419 · df=2 · Cramer’s V=0.041 · p=0.811 |
# Se crea la lista de histogramas y se guarda en una variable.
lista_de_histogramas <- Y %>%
group_by(Actividades) %>%
plot_frq(
Promedio_General,
type = 'histogram',
show.mean = T,
normal.curve = T
)# Usa plot_grid para combinar los gráficos de esa lista.
p_combinado <- plot_grid(plotlist = lista_de_histogramas)
p_combinadoEl promedio de calificación del grupo de personas que no realizaron actividades es 11.9
La mayoría de las personas tienen calificaciones cercanas a este promedio.
La distribución se asemeja a una campana de Gauss (distribución normal), lo que es típico en la medición de este tipo de variables.
El promedio de calificación de este grupo es 12.4, ligeramente superior al del grupo que no hizo actividades.
La distribución también se asemeja a una campana, con la mayoría de las calificaciones agrupadas cerca de la media.
Se observa una mayor concentración de personas con calificaciones un poco por encima del promedio, específicamente en el rango de 13 a
## # A tibble: 6 × 7
## Edad Horas_Estudio_Semanal Promedio_General Genero Area_Estudio Nivel_Estres
## <int> <dbl> <dbl> <fct> <fct> <fct>
## 1 24 11 8.72 Mascul… Ciencias de… Alto
## 2 24 11 8.16 Femeni… Ciencias So… Alto
## 3 20 20 12.0 Femeni… Ciencias So… Moderado
## 4 23 12 10.5 Mascul… Ingeniería Moderado
## 5 20 18 17.1 Femeni… Ingeniería Bajo
## 6 19 25 14.5 Mascul… Ciencias de… Bajo
## # ℹ 1 more variable: Actividades <fct>
##
## Call:
## lm(formula = Promedio_General ~ Horas_Estudio_Semanal + Nivel_Estres,
## data = Y)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.0712 -1.8150 0.1375 1.9298 7.1723
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.0152 0.5133 13.668 <2e-16 ***
## Horas_Estudio_Semanal 0.3157 0.0249 12.680 <2e-16 ***
## Nivel_EstresModerado -0.3880 0.4338 -0.895 0.372
## Nivel_EstresAlto 0.1447 0.5242 0.276 0.783
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.863 on 246 degrees of freedom
## Multiple R-squared: 0.3981, Adjusted R-squared: 0.3907
## F-statistic: 54.23 on 3 and 246 DF, p-value: < 2.2e-16
Horas_Estudio_Semanal es el único predictor significativo e importante.
El modelo es estadísticamente útil. El R-squared de 0.3981 indica que las variables utilizadas (horas de estudio y estrés) logran explicar aproximadamente el 39.8% de la variación en el Promedio_General. Si bien es una capacidad explicativa moderada, es significativamente mejor que no usar ningún predictor.
El p-value global del modelo (< 2.2e-16) es extremadamente bajo, lo que confirma que el modelo en su conjunto es estadísticamente significativo y fiable.
Este gráfico muestra qué factores influyen en el Promedio General:
Horas de Estudio: Tienen un impacto positivo y real. La barra de error no toca el cero, confirmando que más horas de estudio aumentan el promedio.
Nivel de Estrés (Moderado y Alto): No tienen un efecto claro. Sus barras de error cruzan la línea del cero, lo que significa que su impacto no es estadísticamente significativo.
En resumen, el gráfico demuestra visualmente que solo las horas de estudio son un predictor fiable para el promedio.
| Promedio_General | |||
|---|---|---|---|
| Predictors | Estimates | CI | p |
| Horas_Estudio_Semanal | 0.32 *** | 0.27 – 0.36 | <0.001 |
| Bajo | Reference | ||
| Moderado | -0.39 | -1.24 – 0.47 | 0.372 |
| Alto | 0.14 | -0.89 – 1.18 | 0.783 |
| Observations | 250 | ||
| R2 / R2 adjusted | 0.398 / 0.391 | ||
|
|||
# Interpretamos el R2 de nuestro modelo
r2_ajustado <- summary(m)$adj.r.squared
interpret_r2(r2_ajustado, rules = 'cohen1988')## [1] "substantial"
## (Rules: cohen1988)
Interpretación:
R-cuadrado ajustado de ~0.39 es mucho mayor que el umbral de 0.26. Por lo tanto, la función clasifica la capacidad explicativa del modelo como “substantial” (sustancial). Es una forma rápida de confirmar que el modelo tiene una fuerte capacidad para explicar los resultados.
Posterior Predictive Check (Verificación Predictiva)
Las dos distribuciones son casi idénticas. Significa que el modelo hace un gran trabajo replicando la realidad.
Linearity (Linealidad)
Los puntos están dispersos al azar alrededor de la línea horizontal del cero, sin ningún patrón.Confirma que la relación es lineal.
Homogeneity of Variance (Homogeneidad de Varianza)
Los puntos forman una banda horizontal con un ancho constante. Cumple el supuesto.
Influential Observations (Observaciones Influyentes)
Todos los puntos están dentro de las líneas de contorno discontinuas. Significa que no hay outliers problemáticos.
Collinearity (Colinealidad)
Revisa si tus variables predictoras (Horas_Estudio y Nivel_Estres) están demasiado relacionadas entre sí. Los puntos verdes (VIF) están muy por debajo del límite de 5. Significa que no hay problemas de colinealidad.
Normality of Residuals (Normalidad de los Residuos)
Los puntos se alinean casi perfectamente sobre la línea recta. Confirma que los errores son normales.
## [1] 250 7
## Edad Horas_Estudio_Semanal Promedio_General Genero
## Min. :18.00 Min. : 5.00 Min. : 5.00 Femenino :125
## 1st Qu.:20.00 1st Qu.:11.00 1st Qu.: 9.95 Masculino:125
## Median :22.00 Median :16.50 Median :12.33
## Mean :21.72 Mean :17.08 Mean :12.24
## 3rd Qu.:24.00 3rd Qu.:23.75 3rd Qu.:14.52
## Max. :25.00 Max. :30.00 Max. :20.00
## Area_Estudio Nivel_Estres Actividades
## Artes y Humanidades :50 Bajo : 69 No: 97
## Ciencias de la Salud:51 Moderado:128 Si:153
## Ciencias Sociales :77 Alto : 53
## Ingeniería :72
##
##
# Se muestran 4 gráficos en los ejes 1 y 2
famd_pre_result <- Y %>%
FAMD(ncp = 10, graph = T) # ncp=10Este gráfico agrupa a personas con características similares, revelando dos perfiles principales:
Perfil Izquierda: Asocia a los Hombres con las carreras de Ingeniería y Artes y Humanidades.
Perfil Derecha: Asocia a las Mujeres con Ciencias de la Salud y Ciencias Sociales.
Este gráfico muestra que las variables se agrupan en dos temas principales e independientes:
Rendimiento Académico (eje horizontal): Está dominado por las Horas de Estudio y el Promedio. Son los factores más importantes y están fuertemente conectados.
Perfil Personal (eje vertical): Está definido por el Estrés, la Edad, la Carrera y el Género.
La conclusión clave es que, en este análisis, el rendimiento académico es independiente del perfil demográfico de la persona.
Fuerte Correlación Positiva: Las flechas de Horas_Estudio_Semanal y Promedio_General apuntan en la misma dirección y están muy juntas. Esto indica una fuerte relación positiva entre ellas: a más horas de estudio, mayor es el promedio.
Sin Correlación: La flecha de Edad forma un ángulo de casi 90 grados con las otras dos. Esto significa que la edad no está correlacionada ni con las horas de estudio ni con el promedio general en este conjunto de datos
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues and inertia"
## 2 "$var" "Results for the variables"
## 3 "$ind" "results for the individuals"
## 4 "$quali.var" "Results for the qualitative variables"
## 5 "$quanti.var" "Results for the quantitative variables"
# Se muestran 4 gráficos en los ejes 2 y 3
famd_pre_result1 <- Y %>%
FAMD(ncp = 10, graph = T, axes = c(2, 3))## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues and inertia"
## 2 "$var" "Results for the variables"
## 3 "$ind" "results for the individuals"
## 4 "$quali.var" "Results for the qualitative variables"
## 5 "$quanti.var" "Results for the quantitative variables"
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 1.7211320 17.211320 17.21132
## Dim.2 1.1624366 11.624366 28.83569
## Dim.3 1.0969466 10.969466 39.80515
## Dim.4 1.0610498 10.610498 50.41565
## Dim.5 1.0197498 10.197498 60.61315
## Dim.6 0.9756646 9.756646 70.36979
## Dim.7 0.9232417 9.232417 79.60221
## Dim.8 0.8863051 8.863051 88.46526
## Dim.9 0.8021758 8.021758 96.48702
## Dim.10 0.3512980 3.512980 100.00000
Dim.1 explica el 17.21% de toda la variabilidad.
famd_pre_result %>% fviz_screeplot(addlabels = TRUE, ylim = c(0, 30),
barfill = "white", barcolor = "darkblue",
linecolor = "red")## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 1.7211320 17.211320 17.21132
## comp 2 1.1624366 11.624366 28.83569
## comp 3 1.0969466 10.969466 39.80515
## comp 4 1.0610498 10.610498 50.41565
## comp 5 1.0197498 10.197498 60.61315
## comp 6 0.9756646 9.756646 70.36979
## comp 7 0.9232417 9.232417 79.60221
## comp 8 0.8863051 8.863051 88.46526
## comp 9 0.8021758 8.021758 96.48702
## comp 10 0.3512980 3.512980 100.00000
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6 comp 7 comp 8
## 1.7211320 1.1624366 1.0969466 1.0610498 1.0197498 0.9756646 0.9232417 0.8863051
## comp 9 comp 10
## 0.8021758 0.3512980
## [1] 10
# Cálculos de varianza explicada
e <- (b / 10) * 100 # Dividimos por 10 (número de variables activas)
e## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6 comp 7 comp 8
## 17.211320 11.624366 10.969466 10.610498 10.197498 9.756646 9.232417 8.863051
## comp 9 comp 10
## 8.021758 3.512980
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6 comp 7 comp 8
## 17.21132 28.83569 39.80515 50.41565 60.61315 70.36979 79.60221 88.46526
## comp 9 comp 10
## 96.48702 100.00000
## Dim.1 Dim.2 Dim.3 Dim.4
## Edad 0.068643047 3.031169e-01 0.1549648346 0.0472219991
## Horas_Estudio_Semanal 0.759753240 5.708993e-03 0.0005458777 0.0008074925
## Promedio_General 0.757628808 9.305051e-05 0.0012645231 0.0029862507
## Genero 0.000094767 2.338446e-01 0.0912604657 0.1184400300
## Area_Estudio 0.023406924 2.702561e-01 0.5875925449 0.5606711461
## Nivel_Estres 0.089993467 3.148939e-01 0.0342392461 0.1979890588
## Actividades 0.021611773 3.452304e-02 0.2270791569 0.1329338201
## Dim.5 Dim.6 Dim.7 Dim.8
## Edad 1.225488e-02 0.003114163 0.002721558 0.135441934
## Horas_Estudio_Semanal 5.550757e-05 0.019133469 0.021928355 0.007266439
## Promedio_General 1.802657e-02 0.015027258 0.003973005 0.031102308
## Genero 7.503944e-02 0.198232981 0.137908090 0.026730368
## Area_Estudio 4.906350e-01 0.102378580 0.440944637 0.280389138
## Nivel_Estres 2.415819e-01 0.628379640 0.035101953 0.347929808
## Actividades 1.821565e-01 0.009398527 0.280664129 0.057445102
## Dim.9 Dim.10
## Edad 0.2707188709 1.801807e-03
## Horas_Estudio_Semanal 0.0157892904 1.690113e-01
## Promedio_General 0.0002151911 1.696830e-01
## Genero 0.1184489970 2.619959e-07
## Area_Estudio 0.2399899489 3.735999e-03
## Nivel_Estres 0.1033402000 6.550807e-03
## Actividades 0.0536732700 5.147254e-04
Para la Dimensión 1:
Horas_Estudio_Semanal (0.76) y Promedio_General (0.76) tienen valores extremadamente altos.
Todas las demás variables tienen valores muy cercanos a cero.
Conclusión: Esto prueba que la Dimensión 1 trata casi exclusivamente sobre el Rendimiento Académico.
## Dim.1 Dim.2 Dim.3 Dim.4
## Edad 4.711868e-03 9.187986e-02 2.401410e-02 2.229917e-03
## Horas_Estudio_Semanal 5.772250e-01 3.259260e-05 2.979825e-07 6.520441e-07
## Promedio_General 5.740014e-01 8.658397e-09 1.599019e-06 8.917693e-06
## Genero 8.980784e-09 5.468330e-02 8.328473e-03 1.402804e-02
## Area_Estudio 1.826280e-04 2.434612e-02 1.150883e-01 1.047840e-01
## Nivel_Estres 4.049412e-03 4.957908e-02 5.861630e-04 1.959983e-02
## Actividades 4.670687e-04 1.191840e-03 5.156494e-02 1.767140e-02
## Dim.5 Dim.6 Dim.7 Dim.8
## Edad 1.501821e-04 9.698008e-06 7.406878e-06 1.834452e-02
## Horas_Estudio_Semanal 3.081090e-09 3.660896e-04 4.808528e-04 5.280114e-05
## Promedio_General 3.249574e-04 2.258185e-04 1.578477e-05 9.673536e-04
## Genero 5.630917e-03 3.929631e-02 1.901864e-02 7.145126e-04
## Area_Estudio 8.024090e-02 3.493791e-03 6.481072e-02 2.620602e-02
## Nivel_Estres 2.918091e-02 1.974305e-01 6.160736e-04 6.052758e-02
## Actividades 3.318097e-02 8.833232e-05 7.877235e-02 3.299940e-03
## Dim.9 Dim.10
## Edad 7.328871e-02 3.246507e-06
## Horas_Estudio_Semanal 2.493017e-04 2.856483e-02
## Promedio_General 4.630722e-08 2.879233e-02
## Genero 1.403016e-02 6.864183e-14
## Area_Estudio 1.919839e-02 4.652563e-06
## Nivel_Estres 5.339598e-03 2.145654e-05
## Actividades 2.880820e-03 2.649422e-07
Dimensión 2: Las variables con mayor peso son las demográficas como Genero y Nivel_Estres. Esto confirma que esta dimensión agrupa el Perfil Personal.
## Dim.1 Dim.2 Dim.3 Dim.4
## Edad 3.988249944 26.075995012 14.12692539 4.45049791
## Horas_Estudio_Semanal 44.142647340 0.491122979 0.04976338 0.07610316
## Promedio_General 44.019215070 0.008004781 0.11527663 0.28144303
## Genero 0.005506085 20.116761981 8.31949902 11.16253265
## Area_Estudio 1.359972581 23.249104620 53.56619170 52.84117178
## Nivel_Estres 5.228736992 27.089124761 3.12132282 18.65973297
## Actividades 1.255671989 2.969885865 20.70102106 12.52851849
## Dim.5 Dim.6 Dim.7 Dim.8 Dim.9
## Edad 1.201753814 0.3191837 0.2947828 15.2816377 33.74807388
## Horas_Estudio_Semanal 0.005443254 1.9610703 2.3751478 0.8198575 1.96830807
## Promedio_General 1.767744871 1.5402074 0.4303321 3.5092101 0.02682593
## Genero 7.358613042 20.3177380 14.9373762 3.0159330 14.76596548
## Area_Estudio 48.113272454 10.4932144 47.7604753 31.6357357 29.91737701
## Nivel_Estres 23.690314197 64.4052914 3.8020328 39.2562120 12.88248836
## Actividades 17.862858369 0.9632949 30.3998531 6.4814139 6.69096127
## Dim.10
## Edad 5.128998e-01
## Horas_Estudio_Semanal 4.811054e+01
## Promedio_General 4.830174e+01
## Genero 7.457939e-05
## Area_Estudio 1.063484e+00
## Nivel_Estres 1.864744e+00
## Actividades 1.465210e-01
Dimensión 1 (Rendimiento Académico):
Está formada casi en su totalidad por Horas_Estudio_Semanal (44.1%) y Promedio_General (44.0%). Juntas, suman más del 88% de la contribución, lo que confirma que esta dimensión trata exclusivamente sobre el rendimiento.
var_analysis_quanti <- famd_pre_result %>% get_famd_var(element = "quanti.var")
aaa <- var_analysis_quanti$contrib
aaa## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Edad 3.98825 26.075995012 14.12692539 4.45049791 1.201753814
## Horas_Estudio_Semanal 44.14265 0.491122979 0.04976338 0.07610316 0.005443254
## Promedio_General 44.01922 0.008004781 0.11527663 0.28144303 1.767744871
## Dim.6 Dim.7 Dim.8 Dim.9 Dim.10
## Edad 0.3191837 0.2947828 15.2816377 33.74807388 0.5128998
## Horas_Estudio_Semanal 1.9610703 2.3751478 0.8198575 1.96830807 48.1105362
## Promedio_General 1.5402074 0.4303321 3.5092101 0.02682593 48.3017401
## [1] 92.15011
famd_pre_result %>%
fviz_famd_var(choice = "quanti.var", col.var = "contrib",
gradient.cols = c("red", "yellow", "green"))Horas de Estudio y Promedio General: Están fuertemente conectadas. Las flechas verdes, largas y juntas indican que a más horas de estudio, mayor es el promedio. Definen el eje principal (Dim 1).
Edad: No tiene relación con las otras dos variables. Su flecha roja apunta en otra dirección, indicando que es un factor independiente.
La leyenda de color contrib confirma esto: el verde indica una alta contribución, mientras que el rojo indica una más baja. Por lo tanto, el rendimiento académico (verde) es el patrón más fuerte en los datos.
var_analysis_quali <- famd_pre_result %>% get_famd_var(element = "quali.var")
var_analysis_quali$v.test # Pruebas Z para significancia de categorías## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Femenino -0.1536131 -7.630682 4.766955 -5.430614 4.322594
## Masculino 0.1536131 7.630682 -4.766955 5.430614 -4.322594
## Artes y Humanidades -1.7176838 -0.244868 7.654134 -7.914016 -5.243894
## Ciencias de la Salud 1.3542104 -1.721785 6.632499 8.527055 6.182167
## Ciencias Sociales 1.3325127 7.562759 -3.876899 -4.992951 6.525149
## Ingeniería -1.0463235 -5.961824 -8.710776 4.492947 -7.521805
## Bajo -4.6251914 -1.863087 -2.792995 6.850248 5.096143
## Moderado 3.7058792 7.883877 1.106914 -3.138920 -7.751864
## Alto 0.5263499 -7.604068 1.700944 -3.653235 3.906673
## No -2.3197697 2.931934 -7.519489 -5.753305 6.734757
## Si 2.3197697 -2.931934 7.519489 5.753305 -6.734757
## Dim.6 Dim.7 Dim.8 Dim.9 Dim.10
## Femenino 7.02566809 -5.85995856 -2.579896 5.4308195 0.008076941
## Masculino -7.02566809 5.85995856 2.579896 -5.4308195 -0.008076941
## Artes y Humanidades 4.13852209 7.38029944 2.974801 -4.0779436 0.445541915
## Ciencias de la Salud -3.16970241 3.19910043 -8.289612 -0.5270693 0.070291180
## Ciencias Sociales -1.99840423 -9.16083018 2.848125 -3.2563161 -0.928319769
## Ingeniería 1.20238936 -0.02652024 1.845395 7.3910609 0.490320239
## Bajo 9.62748330 1.32303176 4.768566 -5.0328718 -0.965009805
## Moderado 0.09752856 -2.88470455 -9.207659 2.6918420 1.258348737
## Alto -10.64872087 2.08090952 6.045324 2.2123560 -0.483497805
## No 1.52978211 8.35974689 -3.782041 3.6557686 0.358003664
## Si -1.52978211 -8.35974689 3.782041 -3.6557686 -0.358003664
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Femenino 0.002753043 10.0583810 4.1597495 5.581266 3.679307
## Masculino 0.002753043 10.0583810 4.1597495 5.581266 3.679307
## Artes y Humanidades 0.550760627 0.0165724 17.1592078 18.964822 8.663728
## Ciencias de la Salud 0.340621337 0.8152717 12.8198382 21.906658 11.981235
## Ciencias Sociales 0.286704985 13.6740746 3.8079408 6.529585 11.603635
## Ingeniería 0.181885632 8.7431858 19.7792049 5.440107 15.864674
## Bajo 3.613969276 0.8682333 2.0677315 12.859263 7.405063
## Moderado 1.563827388 10.4792656 0.2189086 1.819891 11.548862
## Alto 0.050940328 15.7416259 0.8346827 3.980579 4.736390
## No 0.768471257 1.8175701 12.6690249 7.667453 10.932069
## Si 0.487200732 1.1523157 8.0319962 4.861065 6.930789
## Dim.6 Dim.7 Dim.8 Dim.9
## Femenino 10.158868991 7.468688e+00 1.507967 7.3829827
## Masculino 10.158868991 7.468688e+00 1.507967 7.3829827
## Artes y Humanidades 5.640019953 1.895497e+01 3.207918 6.6604493
## Ciencias de la Salud 3.291926606 3.543676e+00 24.785568 0.1107081
## Ciencias Sociales 1.137556227 2.526161e+01 2.543558 3.6735869
## Ingeniería 0.423711589 2.178312e-04 1.098692 19.4726326
## Bajo 27.622578161 5.512700e-01 7.459876 9.1812418
## Moderado 0.001910661 1.766476e+00 18.747168 1.7703130
## Alto 36.780802542 1.484287e+00 13.049168 1.9309336
## No 0.589536468 1.860471e+01 3.966625 4.0948683
## Si 0.373758414 1.179514e+01 2.514789 2.5960930
## Dim.10
## Femenino 3.728969e-05
## Masculino 3.728969e-05
## Artes y Humanidades 1.815483e-01
## Ciencias de la Salud 4.496139e-03
## Ciencias Sociales 6.817518e-01
## Ingeniería 1.956882e-01
## Bajo 7.707740e-01
## Moderado 8.833786e-01
## Alto 2.105912e-01
## No 8.967087e-02
## Si 5.685016e-02
## [1] 7.849888
## [1] 100
famd_pre_result %>%
fviz_famd_var("quali.var", col.var = "contrib",
gradient.cols = c("red", "yellow", "green"))## [1] 250 7
## FAMD results for individuals
## ===================================================
## Name Description
## 1 "$coord" "Coordinates"
## 2 "$cos2" "Cos2, quality of representation"
## 3 "$contrib" "Contributions"
# La suma de las contribuciones de los individuos para una dimensión es 100
sum(ind_analysis$contrib[1:250, 1]) # 250 individuos en nuestra simulación## [1] 100
# La suma de cos2 para un individuo a través de todas las dimensiones es 1
sum(ind_analysis$cos2[3, 1:10]) # cos2 del estudiante 3 en las 10 dimensiones## [1] 1
famd_pre_result %>%
fviz_famd_ind(col.ind = "contrib",
gradient.cols = c("red", "yellow", "green"),
repel = TRUE)famd_pre_result %>%
fviz_famd_ind(col.ind = "cos2",
gradient.cols = c("red", "yellow", "green"),
repel = TRUE)El análisis factorial mixto reveló que la estructura de los datos se organiza en torno a dos ejes principales que son independientes entre sí: el rendimiento académico y el perfil demográfico.
Se confirma una fuerte y directa correlación: a más horas de estudio, mayor es el promedio. Este es el patrón más dominante en todo el conjunto de datos.
Este eje de rendimiento es independiente de las características demográficas de los estudiantes como su género, carrera o nivel de estrés.
El análisis identificó perfiles claros y diferenciados:
Perfil 1 (Mujeres): Existe una fuerte asociación entre ser mujer y estudiar carreras de Ciencias de la Salud o Ciencias Sociales. El grupo de Ciencias de la Salud, en particular, se asocia con un nivel de estrés alto.
Perfil 2 (Hombres): Se asocia fuertemente a los hombres con las carreras de Ingeniería y Artes y Humanidades. El perfil de Ingeniería destaca por tener un nivel de estrés bajo y una mayor participación en actividades extracurriculares.
En resumen, la conclusión principal es que el éxito académico (promedio) depende directamente de un factor controlable como las horas de estudio, mientras que las características demográficas como la carrera y el género forman un conjunto de perfiles completamente separado que no influye directamente en este rendimiento.