UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
FACULTAD DE ECONOMÍA Y PLANIFICACIÓN
DEPARTAMENTO ACADÉMICO DE ESTADÍSTICA INFORMÁTICA

Examen Parcial

CURSO: Técnicas Multivariadas
DOCENTE: Miranda Villagomez Clodomiro Fernando

ALUMNOS:
Lopez Acuña, Victor Andreé - 20180206
Morales Morales, Flavio Oscar - 20170202
Mori Perez, Luis Alberto - 20170058
Garces Quispe, Adryana Luisa - 20220764
Estrella Guerra, Danilo David - 20220763
Jimenez Ruiz, Alex Fernando - 20210839
2025

1 - Regresión Multivariada

1. Contexto

Contexto del problema

El cultivo de palta (Persea americana) es uno de los principales productos agrícolas del Perú, pero su rendimiento depende de factores agronómicos y ambientales como el tipo de riego, la fertilización y las propiedades del suelo. Dado que estos factores interactúan entre sí, se requiere un análisis conjunto que permita identificar cuáles influyen más en el desarrollo del cultivo. Este estudio utiliza información agronómica y de suelo de plantaciones de palta para reconocer las condiciones y prácticas que se asocian con un mejor desempeño productivo.

DESCRIPCIÓN DE LAS VARIABLES

  • Riego_por_goteo (0 / 1): Indica si en la parcela se usó riego por goteo (1) o no (0).

  • Fertilizacion_organica (0 / 1): Indica si se aplicó materia orgánica , compost , fertilización orgánica.

  • Mulching (0 / 1): Indica si se aplicó mulching (cobertura orgánica de suelo) (1) o no (0) para conservar humedad.

  • pH_suelo: escala de pH (~5.0 a 7.5).

    • Significado: acidez o alcalinidad del suelo, que afecta disponibilidad de nutrientes.
  • Materia_organica: porcentaje (%) de materia orgánica del suelo (por ejemplo entre 1 y 6 %).

  • Humedad_suelo: porcentaje (%) de humedad volumétrica o gravimétrica del suelo en la zona radicular.

  • Altura_planta: metros de altura promedio del árbol o planta en la parcela.

  • Diametro_tronco (cm): centímetros de diámetro del tronco a cierta altura.

  • Densidad_frutos: número de frutos por árbol (o por unidad de área).

    • Significado: cuántos frutos ha logrado establecer el árbol.
  • Peso_promedio_fruto: gramos por fruto.

    • Significado: tamaño promedio del fruto en la parcela.
  • Rendimiento_palta: toneladas de fruta por hectárea (t/ha).

    • Significado: producción total por parcela.

1.1. Simulación de la data

set.seed(123)

n <- 700

# dicotómicas (0/1)
riego_por_goteo <- rbinom(n, 1, 0.6)
fertilizacion_organica <- rbinom(n, 1, 0.7)
mulching <- rbinom(n, 1, 0.5)

# suelo: reforzamos dependencias
pH_suelo <- rnorm(n, mean = 6.5, sd = 0.25)
materia_organica <- 2.5 + 0.7 * pH_suelo + 0.6 * fertilizacion_organica + 0.4 * mulching + rnorm(n, 0, 0.2)
humedad_suelo <- 18 + 4.5 * materia_organica + 8 * riego_por_goteo + rnorm(n, 0, 1)  # menos ruido, efecto riego mayor

# vigor: aumentamos coeficientes y reducimos ruido
altura_planta <- 3.4 + 0.7 * materia_organica + 0.45 * humedad_suelo - 0.15 * mulching + rnorm(n, 0, 0.25)
diametro_tronco <- 5.5 + 1.25 * altura_planta + 0.7 * fertilizacion_organica + rnorm(n, 0, 0.25)

# productividad: hacerla dependiente fuertemente de diametro y fertilizacion
densidad_frutos <- 80 + 3.5 * diametro_tronco + 12 * fertilizacion_organica + rnorm(n, 0, 5)
peso_promedio_fruto <- 120 + 1.8 * diametro_tronco + 0.5 * materia_organica + 10 * mulching + rnorm(n, 0, 6)

# rendimiento: combina densidad * peso, menor ruido
rendimiento_palta <- round(
  (densidad_frutos * peso_promedio_fruto / 1e5) *
    (1 + 0.2 * riego_por_goteo) *
    (1 + 0.15 * fertilizacion_organica) *
    (1 + 0.08 * materia_organica / 3) + rnorm(n, 0, 0.2),
  2
)

bd <- data.frame(
  riego_por_goteo,
  fertilizacion_organica,
  mulching,
  pH_suelo,
  materia_organica,
  humedad_suelo,
  altura_planta,
  diametro_tronco,
  densidad_frutos,
  peso_promedio_fruto,
  rendimiento_palta
)

# retirando una columna 
bd = bd[,-9]

2. Supuesto de normalidad multivariada

2.1. Planteamiento de hipótesis:

  • \(H_0\): Los datos provienen de una distribución normal multivariada.

  • \(H_a\): Los datos no provienen de una distribución normal multivariada.

pers2 <- bd[9:10]
library(mvnormtest)
mshapiro.test(t(pers2))
## 
##  Shapiro-Wilk normality test
## 
## data:  Z
## W = 0.99682, p-value = 0.1815

Decisión estadística:

No se rechaza la \(H_0\), por lo que se puede afirmar que los datos relacionados a la producción de palta provienen de una distribución normal multivariada.

3. Supuesto de variables dependientes correlacionadas

3.1. Prueba de esfericidad de Bartlett

Hipótesis

  • \(H_0\): Las variables relacionadas a la producción de palta no están correlacionadas.

  • \(H_a\): Las variables relacionadas a la producción de palta no están correlacionadas.

library(psych)
options(scipen=0)
cortest.bartlett(cor(pers2), n=nrow(pers2))
## $chisq
## [1] 163.3861
## 
## $p.value
## [1] 2.059977e-37
## 
## $df
## [1] 1

Decisión estadística:

Se rechaza \(H_0\), por lo tanto las variables están correlacionadas por lo tanto sí se puede aplicar un análisis multivariado para el análisis sobre la producción de la palta.

4. Creación del modelo

mod1 = lm(cbind(peso_promedio_fruto, rendimiento_palta)~
          riego_por_goteo + fertilizacion_organica + mulching+
          pH_suelo + materia_organica + humedad_suelo +
          altura_planta + diametro_tronco, data = bd)
library(car)
alias(mod1)
## Model :
## cbind(peso_promedio_fruto, rendimiento_palta) ~ riego_por_goteo + 
##     fertilizacion_organica + mulching + pH_suelo + materia_organica + 
##     humedad_suelo + altura_planta + diametro_tronco

4.1. Evaluación de la significancia de las variables

Hipótesis

  • \(H_0\): Ninguna de las variables explican significativamente el rendimiento ni el peso promedio de la palta.

  • \(H_a\): Alguna de las variables explica significativamente sobre el peso promedio de la palta o rendimiento de paltas.

ev_mod1 <- linearHypothesis(mod1, hypothesis.matrix =
           c("riego_por_goteo = 0", 
    "fertilizacion_organica = 0", 
    "mulching = 0", 
    "pH_suelo = 0", 
    "materia_organica = 0", 
    "humedad_suelo = 0", 
    "altura_planta = 0", 
    "diametro_tronco = 0"))
ev_mod1
## 
## Sum of squares and products for the hypothesis:
##                     peso_promedio_fruto rendimiento_palta
## peso_promedio_fruto          47423.9038         771.65024
## rendimiento_palta              771.6502          20.23584
## 
## Sum of squares and products for error:
##                     peso_promedio_fruto rendimiento_palta
## peso_promedio_fruto         25402.49560          95.77178
## rendimiento_palta              95.77178          29.23785
## 
## Multivariate Tests: 
##                  Df test stat  approx F num Df den Df     Pr(>F)    
## Pillai            8 0.8704387  66.56049     16   1382 < 2.22e-16 ***
## Wilks             8 0.2573317  83.77487     16   1380 < 2.22e-16 ***
## Hotelling-Lawley  8 2.3895142 102.89846     16   1378 < 2.22e-16 ***
## Roy               8 2.1596012 186.53555      8    691 < 2.22e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Pillai
1-pf(66.56049, 16,1382)
## [1] 0
#Wilks
pf(83.77487, 16,1380, lower.tail = F)
## [1] 4.571079e-190

Decisión estadística:

Los 4 criterios rechazan \(H_0\), por lo tanto se puede afirmar que alguna de las variables independientes influye sobre el peso promedio de la palta o rendimiento de paltas.

Conociendo la significancia del modelo de alguna variable dependiente, ahora nos interesa saber cuál resulta importante para el peso promedio de la palta o rendimiento de paltas.

4.2. Pruebas de significancia independientes bajo 4 criterios

Hipótesis

  • \(H_0\): Las variables independientes no explican significativamente el rendimiento ni el peso promedio de la palta.

  • \(H_a\): Las variables independientes explican significativamente el rendimiento o el peso promedio de la palta.

summary(manova(mod1),test="Pillai")
##                         Df  Pillai approx F num Df den Df    Pr(>F)    
## riego_por_goteo          1 0.41526   245.01      2    690 < 2.2e-16 ***
## fertilizacion_organica   1 0.27097   128.23      2    690 < 2.2e-16 ***
## mulching                 1 0.53707   400.25      2    690 < 2.2e-16 ***
## pH_suelo                 1 0.05699    20.85      2    690 1.617e-09 ***
## materia_organica         1 0.04141    14.91      2    690 4.599e-07 ***
## humedad_suelo            1 0.02266     8.00      2    690 0.0003679 ***
## altura_planta            1 0.01516     5.31      2    690 0.0051338 ** 
## diametro_tronco          1 0.00528     1.83      2    690 0.1609387    
## Residuals              691                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(manova(mod1),test="Wilks")
##                         Df   Wilks approx F num Df den Df    Pr(>F)    
## riego_por_goteo          1 0.58474   245.01      2    690 < 2.2e-16 ***
## fertilizacion_organica   1 0.72903   128.23      2    690 < 2.2e-16 ***
## mulching                 1 0.46293   400.25      2    690 < 2.2e-16 ***
## pH_suelo                 1 0.94301    20.85      2    690 1.617e-09 ***
## materia_organica         1 0.95859    14.91      2    690 4.599e-07 ***
## humedad_suelo            1 0.97734     8.00      2    690 0.0003679 ***
## altura_planta            1 0.98484     5.31      2    690 0.0051338 ** 
## diametro_tronco          1 0.99472     1.83      2    690 0.1609387    
## Residuals              691                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(manova(mod1),test="Hotelling-Lawley")
##                         Df Hotelling-Lawley approx F num Df den Df    Pr(>F)
## riego_por_goteo          1          0.71016   245.01      2    690 < 2.2e-16
## fertilizacion_organica   1          0.37168   128.23      2    690 < 2.2e-16
## mulching                 1          1.16014   400.25      2    690 < 2.2e-16
## pH_suelo                 1          0.06043    20.85      2    690 1.617e-09
## materia_organica         1          0.04320    14.91      2    690 4.599e-07
## humedad_suelo            1          0.02319     8.00      2    690 0.0003679
## altura_planta            1          0.01540     5.31      2    690 0.0051338
## diametro_tronco          1          0.00531     1.83      2    690 0.1609387
## Residuals              691                                                  
##                           
## riego_por_goteo        ***
## fertilizacion_organica ***
## mulching               ***
## pH_suelo               ***
## materia_organica       ***
## humedad_suelo          ***
## altura_planta          ** 
## diametro_tronco           
## Residuals                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
summary(manova(mod1),test="Roy")
##                         Df     Roy approx F num Df den Df    Pr(>F)    
## riego_por_goteo          1 0.71016   245.01      2    690 < 2.2e-16 ***
## fertilizacion_organica   1 0.37168   128.23      2    690 < 2.2e-16 ***
## mulching                 1 1.16014   400.25      2    690 < 2.2e-16 ***
## pH_suelo                 1 0.06043    20.85      2    690 1.617e-09 ***
## materia_organica         1 0.04320    14.91      2    690 4.599e-07 ***
## humedad_suelo            1 0.02319     8.00      2    690 0.0003679 ***
## altura_planta            1 0.01540     5.31      2    690 0.0051338 ** 
## diametro_tronco          1 0.00531     1.83      2    690 0.1609387    
## Residuals              691                                             
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Decisión estadística:

A un nivel de significancia de 0.05, bajo los cuatro criterios se rechaza \(H_0\), es decir las siguientes variables sí explican significativamente el rendimiento o el peso promedio de la palta :

  • riego_por_goteo

  • fertilizacion_organica

  • pH_suelo

  • materia_organica

  • humedad_suelo

  • altura_planta

4.3. MANOVA

Hipótesis

  • \(H_0\): Los coeficientes de las variables independientes son iguales a cero para el rendimiento o el peso promedio de la palta (no hay efecto global).

  • \(H_a\): Al menos una variable independiente tiene un efecto significativo sobre al menos el rendimiento o el peso promedio de la palta.

library(car)
Manova(mod1,type="II") #recomendado sin intercepto
## 
## Type II MANOVA Tests: Pillai test statistic
##                        Df test stat approx F num Df den Df    Pr(>F)    
## riego_por_goteo         1  0.009116    3.174      2    690 0.0424484 *  
## fertilizacion_organica  1  0.026326    9.328      2    690 0.0001006 ***
## mulching                1  0.270335  127.820      2    690 < 2.2e-16 ***
## pH_suelo                1  0.005158    1.789      2    690 0.1679617    
## materia_organica        1  0.000310    0.107      2    690 0.8986243    
## humedad_suelo           1  0.001636    0.565      2    690 0.5685047    
## altura_planta           1  0.003845    1.332      2    690 0.2647338    
## diametro_tronco         1  0.005281    1.832      2    690 0.1609387    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Decisión estadística:

A un nivel de significación de 0.05 se rechaza \(H_0\), es decir las siguientes variables sí influyen en el rendimiento o el peso promedio de la palta :

  • riego_por_goteo

  • fertilizacion_organica

  • mulching

4.4. Reconstrucción del modelo en base a la significancia

mod1 = lm(cbind(peso_promedio_fruto, rendimiento_palta)~
          riego_por_goteo + fertilizacion_organica + mulching)
library(car)
alias(mod1)
## Model :
## cbind(peso_promedio_fruto, rendimiento_palta) ~ riego_por_goteo + 
##     fertilizacion_organica + mulching
summary(mod1)
## Response peso_promedio_fruto :
## 
## Call:
## lm(formula = peso_promedio_fruto ~ riego_por_goteo + fertilizacion_organica + 
##     mulching)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -21.9912  -4.4875   0.1428   4.6104  19.8536 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            202.2186     0.6028 335.458   <2e-16 ***
## riego_por_goteo          8.7496     0.4966  17.617   <2e-16 ***
## fertilizacion_organica   4.9390     0.5415   9.121   <2e-16 ***
## mulching                12.9234     0.4853  26.629   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.41 on 696 degrees of freedom
## Multiple R-squared:  0.6073, Adjusted R-squared:  0.6056 
## F-statistic: 358.7 on 3 and 696 DF,  p-value: < 2.2e-16
## 
## 
## Response rendimiento_palta :
## 
## Call:
## lm(formula = rendimiento_palta ~ riego_por_goteo + fertilizacion_organica + 
##     mulching)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.67321 -0.14483  0.00517  0.15416  0.67383 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             0.49187    0.01958  25.121  < 2e-16 ***
## riego_por_goteo         0.25134    0.01613  15.581  < 2e-16 ***
## fertilizacion_organica  0.22785    0.01759  12.954  < 2e-16 ***
## mulching                0.09511    0.01576   6.034  2.6e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2082 on 696 degrees of freedom
## Multiple R-squared:  0.3901, Adjusted R-squared:  0.3875 
## F-statistic: 148.4 on 3 and 696 DF,  p-value: < 2.2e-16

5. Prueba

A continuacion procedemos a utilizar las 30 primeras filas de la data a manera de data de prueba para predecir valores de las variables dependientes y comparar con los resultados reales.

head(bd)
##   riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1               1                      0        0 6.582859         6.967700
## 2               0                      1        0 6.452538         7.793224
## 3               1                      1        0 6.617623         7.705662
## 4               0                      0        0 6.262080         6.659320
## 5               0                      1        0 6.789478         7.944873
## 6               1                      1        1 6.646176         8.457152
##   humedad_suelo altura_planta diametro_tronco peso_promedio_fruto
## 1      57.76102      34.27916        48.08516            207.3438
## 2      54.78371      33.37145        48.07710            206.1773
## 3      60.61509      35.96264        51.26219            207.3816
## 4      47.68624      29.43421        42.61407            191.5294
## 5      54.23734      33.28830        47.84793            208.5146
## 6      64.00784      37.78561        53.47222            237.9953
##   rendimiento_palta
## 1              0.96
## 2              0.86
## 3              1.07
## 4              0.54
## 5              0.28
## 6              0.97
test.data = bd[c(1:30), c(1:8)]
predictions <- predict(mod1, test.data)
reales <- bd[c(1:30), c(9,10)]
comparacion <- cbind(predictions, reales)
colnames(comparacion) <- c("peso_promedio_predicho", 
  "rendimiento_predicho","peso_promedio_real", 
  "rendimiento_real")
comparacion
##    peso_promedio_predicho rendimiento_predicho peso_promedio_real
## 1                210.9682            0.7432090           207.3438
## 2                207.1575            0.7197196           206.1773
## 3                215.9071            0.9710592           207.3816
## 4                202.2186            0.4918695           191.5294
## 5                207.1575            0.7197196           208.5146
## 6                228.8305            1.0661718           237.9953
## 7                228.8305            1.0661718           230.0626
## 8                220.0809            0.8148323           229.5702
## 9                215.9071            0.9710592           212.5328
## 10               228.8305            1.0661718           232.0191
## 11               220.0809            0.8148323           221.3164
## 12               228.8305            1.0661718           226.6104
## 13               220.0809            0.8148323           221.4174
## 14               210.9682            0.7432090           214.6438
## 15               215.9071            0.9710592           219.6059
## 16               220.0809            0.8148323           221.9580
## 17               228.8305            1.0661718           229.8534
## 18               215.9071            0.9710592           218.0054
## 19               223.8916            0.8383217           225.0501
## 20               207.1575            0.7197196           201.3383
## 21               220.0809            0.8148323           214.8044
## 22               215.1420            0.5869822           211.2957
## 23               202.2186            0.4918695           211.2067
## 24               215.1420            0.5869822           220.3073
## 25               207.1575            0.7197196           198.5537
## 26               202.2186            0.4918695           201.2533
## 27               210.9682            0.7432090           221.8564
## 28               228.8305            1.0661718           219.1619
## 29               223.8916            0.8383217           224.8376
## 30               215.9071            0.9710592           219.0178
##    rendimiento_real
## 1              0.96
## 2              0.86
## 3              1.07
## 4              0.54
## 5              0.28
## 6              0.97
## 7              1.25
## 8              0.78
## 9              1.10
## 10             0.89
## 11             0.85
## 12             0.92
## 13             0.67
## 14             0.71
## 15             1.37
## 16             0.81
## 17             1.09
## 18             1.32
## 19             0.78
## 20             0.82
## 21             0.63
## 22             0.78
## 23             0.31
## 24             0.62
## 25             0.91
## 26             0.82
## 27             0.80
## 28             0.52
## 29             1.17
## 30             0.90

Calculando el error (metrica = mape)

mape = function(y_pred, y_real){
  n = length(y_pred)
  mape_res = abs(y_pred - y_real)/(y_real*n)
  return(sum(mape_res))
}

mape(comparacion$peso_promedio_predicho, comparacion$peso_promedio_real)
## [1] 0.02069828
mape(comparacion$rendimiento_predicho, comparacion$rendimiento_real)
## [1] 0.2421474

Interpretación del resultado: Podemos apreciar que la predicción para el el peso promedio de palta resulta muy fina ya que tiene un mape de 2% a comparación del rendimiento que tiene un error de hasta 24%.

6. Evaluando el R2 para cada modelo independiente

res = summary(mod1)
#R2 para solo con la variable respuesta peso_promedio_fruto
res$`Response peso_promedio_fruto`$r.squared
## [1] 0.6072759
#R2 para solo con la variable respuesta rendimiento de palta
res$`Response rendimiento_palta`$r.squared
## [1] 0.3900996

Interpretación del resultado:

Podemos concluir que el modelo con solo peso_promedio_fruto resulta mejor explicada por las variables relacionadas a la producción de palta ya que tiene un R2 mayor de 60,72% de expliicación

2 - Análisis de Componentes Principales

1. Contexto del problema

El cultivo de palta (Persea americana) es uno de los principales productos agrícolas del Perú, pero su rendimiento depende de factores agronómicos y ambientales como el tipo de riego, la fertilización y las propiedades del suelo. Dado que estos factores interactúan entre sí, se requiere un análisis conjunto que permita identificar cuáles influyen más en el desarrollo del cultivo. Este estudio utiliza información agronómica y de suelo de plantaciones de palta para reconocer las condiciones y prácticas que se asocian con un mejor desempeño productivo.

DESCRIPCIÓN DE LAS VARIABLES

  • Riego_por_goteo (0 / 1): Indica si en la parcela se usó riego por goteo (1) o no (0).

  • Fertilizacion_organica(0 / 1): Indica si se aplicó materia orgánica, compost , fertilización orgánica.

  • Mulching (0 / 1): Indica si se aplicó mulching (cobertura orgánica de suelo) (1) o no (0) para conservar humedad.

  • pH_suelo: escala de pH (~5.0 a 7.5).

    • Significado: acidez o alcalinidad del suelo, que afecta disponibilidad de nutrientes.
  • Materia_organica: porcentaje (%) de materia orgánica del suelo (por ejemplo entre 1 y 6 %).

  • Humedad_suelo: porcentaje (%) de humedad volumétrica o gravimétrica del suelo en la zona radicular.

  • Altura_planta: metros de altura promedio del árbol o planta en la parcela.

  • Diametro_tronco (cm): centímetros de diámetro del tronco a cierta altura.

  • Densidad_frutos: número de frutos por árbol (o por unidad de área).

    • Significado: cuántos frutos ha logrado establecer el árbol.
  • Peso_promedio_fruto: gramos por fruto.

    • Significado: tamaño promedio del fruto en la parcela.
  • Rendimiento_palta : toneladas de fruta por hectárea (t/ha).

    • Significado: producción total por parcela.
library(car)
library(GGally)
library(MVN)
library(epiDisplay)
library(scales)
library(rgl)
library(psych)
library(gganimate)
library(png)
library(gifski)
library (dplyr)
library(viridis)
library(tidyverse)
library(forcats)
library(BSDA)
library(dlookr)
library(ggpubr)
library(summarytools)
library(pastecs)
library(corrplot)
library(mvnormtest)
library(PerformanceAnalytics)
library(ggcorrplot)
library(ade4)
library(factoextra)
library(patchwork)
library (adegenet)
library(FactoMineR)
library(psych)
library(ggplot2)
library(adegenet)
library(tibble)
library(dplyr)

1.1. Simulación de la data

set.seed(123)

n <- 700
trees_per_ha <- 200  # parámetro realista: árboles por hectárea

# dicotómicas (0/1)
riego_por_goteo <- rbinom(n, 1, 0.6)
fertilizacion_organica <- rbinom(n, 1, 0.5)
mulching <- rbinom(n, 1, 0.5)

# factores latentes para correlación natural
fac_suelo  <- rnorm(n, 0, 1)
fac_vigor  <- rnorm(n, 0, 1)

# suelo y propiedades (unidades reales)
pH_suelo <- round(rnorm(n, mean = 6.5 + 0.05 * fac_suelo, sd = 0.20), 2)        # pH (6.0-7.5 típico)
materia_organica <- round(pmax(3 + 0.8 * fac_suelo + 0.9 * fertilizacion_organica +
                                0.5 * mulching + rnorm(n, 0, 0.3), 1), 2)      # % materia orgánica
humedad_suelo <- round(pmax(30 + 4.0 * materia_organica + 8 * riego_por_goteo +
                             1.5 * fac_suelo + rnorm(n, 0, 2), 5), 1)          # % humedad en suelo

# Vigor / tamaño de planta (unidades realistas)
# altura en metros (árboles jóvenes/adultos manejados: ≈2.0 - 6.0 m)
altura_planta <- round(pmax(1.8 + 0.5 * fac_vigor + 0.25 * materia_organica +
                              0.02 * humedad_suelo + 0.25 * fertilizacion_organica +
                              rnorm(n, 0, 0.4), 0.8), 2)

# diámetro del tronco en centímetros (relacionado con altura)
diametro_tronco <- round(pmax(2 + 3.0 * altura_planta + 0.9 * fertilizacion_organica +
                                0.5 * fac_vigor + rnorm(n, 0, 0.6), 1), 1)

# Productividad: densidad de frutos por árbol y peso (g)
densidad_frutos <- round(pmax(120 + 50 * fac_vigor + 30 * fertilizacion_organica +
                                3.5 * diametro_tronco + rnorm(n, 0, 35), 20), 0)

peso_promedio_fruto <- round(pmax(140 + 4.0 * diametro_tronco + 6 * materia_organica +
                                    12 * mulching + 8 * fertilizacion_organica +
                                    rnorm(n, 0, 12), 60), 0)   # gramos

# Rendimiento en toneladas por hectárea (t/ha)
# cálculo determinístico a partir de densidad (frutos/árbol) y peso (g), ajustado por manejo
rendimiento_palta <- round(
  (densidad_frutos * peso_promedio_fruto / 1000) *   # kg/árbol
    (trees_per_ha) / 1000 *                          # -> t/ha
    (1 + 0.25 * riego_por_goteo) *
    (1 + 0.15 * fertilizacion_organica) *
    (1 + 0.06 * materia_organica / 5) +              # pequeña ajuste por materia orgánica
    rnorm(n, 0, 0.3),
  2)

# Ensamblar data frame final
datos_palta <- data.frame(
  riego_por_goteo = riego_por_goteo,
  fertilizacion_organica = fertilizacion_organica,
  mulching = mulching,
  pH_suelo = pH_suelo,
  materia_organica = materia_organica,
  humedad_suelo = humedad_suelo,
  altura_planta = altura_planta,
  diametro_tronco = diametro_tronco,
  densidad_frutos = densidad_frutos,
  peso_promedio_fruto = peso_promedio_fruto,
  rendimiento_palta = rendimiento_palta
)

# Vista rápida
head(datos_palta)
##   riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1               1                      1        0     6.60             4.18
## 2               0                      0        0     6.83             2.68
## 3               1                      0        0     6.51             3.25
## 4               0                      1        0     6.40             3.04
## 5               0                      0        0     6.65             3.83
## 6               1                      1        1     6.52             4.64
##   humedad_suelo altura_planta diametro_tronco densidad_frutos
## 1          53.1          3.82            13.7             203
## 2          41.7          4.14            14.4             232
## 3          52.6          3.52            11.6             179
## 4          43.3          2.78             9.8             134
## 5          47.4          3.99            14.0             108
## 6          57.8          4.44            17.7             267
##   peso_promedio_fruto rendimiento_palta
## 1                 222             13.86
## 2                 211             10.44
## 3                 212              9.12
## 4                 221              6.89
## 5                 207              4.11
## 6                 268             22.27
colnames(datos_palta)
##  [1] "riego_por_goteo"        "fertilizacion_organica" "mulching"              
##  [4] "pH_suelo"               "materia_organica"       "humedad_suelo"         
##  [7] "altura_planta"          "diametro_tronco"        "densidad_frutos"       
## [10] "peso_promedio_fruto"    "rendimiento_palta"

Datos perdidos

#Verificando si hay datos perdidos
datos_perdidos=100*colSums(is.na(datos_palta))/dim(datos_palta)[1]
datos_perdidos
##        riego_por_goteo fertilizacion_organica               mulching 
##                      0                      0                      0 
##               pH_suelo       materia_organica          humedad_suelo 
##                      0                      0                      0 
##          altura_planta        diametro_tronco        densidad_frutos 
##                      0                      0                      0 
##    peso_promedio_fruto      rendimiento_palta 
##                      0                      0

Detectar outliers

# Primero definimos la función de outliers
is_outlier2 <- function(x, k = 2) {
  return(abs(scale(x)) > k)
}


# Crear un subconjunto solo con las variables continuas:

datosP2_palta <- datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
                                 "altura_planta", "diametro_tronco",
                                 "densidad_frutos", "peso_promedio_fruto",
                                 "rendimiento_palta")]

# Ver primeras filas
head(datosP2_palta)
##   pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1     6.60             4.18          53.1          3.82            13.7
## 2     6.83             2.68          41.7          4.14            14.4
## 3     6.51             3.25          52.6          3.52            11.6
## 4     6.40             3.04          43.3          2.78             9.8
## 5     6.65             3.83          47.4          3.99            14.0
## 6     6.52             4.64          57.8          4.44            17.7
##   densidad_frutos peso_promedio_fruto rendimiento_palta
## 1             203                 222             13.86
## 2             232                 211             10.44
## 3             179                 212              9.12
## 4             134                 221              6.89
## 5             108                 207              4.11
## 6             267                 268             22.27
# Ahora detectar outliers para cada variable con k = 3 (criterio estricta)
datosP2_palta[is_outlier2(datosP2_palta$pH_suelo, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 532     7.23             3.48          43.5          3.64            13.5
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 532             141                 212              6.42
datosP2_palta[is_outlier2(datosP2_palta$materia_organica, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 439     6.92             6.82          69.4          5.17            18.0
## 572     6.57             6.76          65.1          4.10            14.3
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 439             184                 266             14.95
## 572             109                 247              6.51
datosP2_palta[is_outlier2(datosP2_palta$humedad_suelo, 3), ]
##    pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 63     6.71              6.5          70.6          4.79            16.9
##    densidad_frutos peso_promedio_fruto rendimiento_palta
## 63             216                 255             16.85
datosP2_palta[is_outlier2(datosP2_palta$altura_planta, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200     6.62             4.42          55.5          6.32            23.6
## 422     6.28             1.51          36.2          1.28             4.8
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 200             332                 280             28.24
## 422              49                 158              1.70
datosP2_palta[is_outlier2(datosP2_palta$diametro_tronco, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200     6.62             4.42          55.5          6.32            23.6
## 422     6.28             1.51          36.2          1.28             4.8
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 200             332                 280             28.24
## 422              49                 158              1.70
datosP2_palta[is_outlier2(datosP2_palta$densidad_frutos, 3), ]
## [1] pH_suelo            materia_organica    humedad_suelo      
## [4] altura_planta       diametro_tronco     densidad_frutos    
## [7] peso_promedio_fruto rendimiento_palta  
## <0 rows> (o 0- extensión row.names)
datosP2_palta[is_outlier2(datosP2_palta$peso_promedio_fruto, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 422     6.28             1.51          36.2          1.28             4.8
## 455     6.53             5.49          61.9          5.67            21.4
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 422              49                 158              1.70
## 455             283                 300             26.41
datosP2_palta[is_outlier2(datosP2_palta$rendimiento_palta, 3), ]
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 200     6.62             4.42          55.5          6.32            23.6
## 402     6.71             5.08          59.8          4.35            17.4
## 404     6.72             5.30          62.6          5.06            19.6
##     densidad_frutos peso_promedio_fruto rendimiento_palta
## 200             332                 280             28.24
## 402             361                 281             30.95
## 404             348                 269             28.62

2. Gráficos

# Gráfica básica de dispersión de las variables continuas
plot(datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
                     "altura_planta", "diametro_tronco",
                     "densidad_frutos", "peso_promedio_fruto",
                     "rendimiento_palta")],
     pch = as.numeric(datos_palta$riego_por_goteo),  
     col = datos_palta$riego_por_goteo)        

# Matriz tipo “pairs.panels” para cuantitativas
pairs.panels(datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
                             "altura_planta", "diametro_tronco",
                             "densidad_frutos", "peso_promedio_fruto",
                             "rendimiento_palta")])

Ejemplo 1:

Scatterplot entre densidad_frutos (eje X) y rendimiento_palta (eje Y), coloreando por riego_por_goteo.

p <- ggplot(datos_palta, aes(x = densidad_frutos, y = rendimiento_palta)) +
  geom_point(aes(color = factor(riego_por_goteo)), size = 3, alpha = 0.7) +
  labs(colour = "Riego por goteo", x = "Densidad de frutos", y = "Rendimiento de palta (t/ha)") +
  theme_minimal()
p

Si también queremos diferenciar por forma según otra variable dicotómica, por ejemplo mulching:

p2 <- ggplot(datos_palta, aes(x = densidad_frutos, y = rendimiento_palta)) +
  geom_point(aes(color = factor(riego_por_goteo), shape = factor(mulching)),
             size = 3, alpha = 0.8) +
  labs(colour = "Riego por goteo", shape = "Mulching",
       x = "Densidad de frutos", y = "Rendimiento de palta (t/ha)") +
  theme_minimal()
p2

Ejemplo 2:

Boxplot de rendimiento de palta según riego por goteo (0 / 1).

boxplot(rendimiento_palta ~ riego_por_goteo, data = datos_palta,
        main = "Rendimiento de Palta según Riego por Goteo",
        xlab = "Riego por Goteo (0 = no, 1 = sí)",
        ylab = "Rendimiento (t/ha)",
        col = c("skyblue", "forestgreen"))

p_palta <- ggplot(datos_palta, aes(x = factor(riego_por_goteo), y = rendimiento_palta, fill = factor(riego_por_goteo))) +
  geom_boxplot(outlier.shape = NA, alpha = 0.6) +
  geom_jitter(position = position_jitter(width = 0.2),
              aes(color = factor(riego_por_goteo)), size = 1.5, alpha = 0.8) +
  scale_fill_viridis(discrete = TRUE, option = "turbo") +
  scale_color_viridis(discrete = TRUE, option = "turbo") +
  theme_minimal(base_size = 12) +
  theme(
    panel.grid.minor = element_blank(),
    panel.grid.major.x = element_blank(),
    legend.position = "none",
    plot.title = element_text(size = 14, face = "bold", hjust = 0.5),
    axis.title.x = element_text(size = 12, margin = margin(t = 10)),
    axis.title.y = element_text(size = 12, margin = margin(r = 10))
  ) +
  ggtitle("Rendimiento de Palta según Riego por Goteo") +
  xlab("Riego por Goteo (0 = no, 1 = sí)") +
  ylab("Rendimiento (t/ha)")

print(p_palta)

2.1. Gráficos para todas las variables

hist_data <- datos_palta %>%
  dplyr::select(pH_suelo, materia_organica, humedad_suelo,
         altura_planta, diametro_tronco, densidad_frutos,
         peso_promedio_fruto, rendimiento_palta) %>%
  mutate_if(is.factor, as.character) %>%
  mutate_all(as.numeric) %>%
  gather(key = "variable", value = "valor")

p_hist <- hist_data %>%
  ggplot(aes(x = valor, fill = variable)) +
  geom_histogram(alpha = 0.6, bins = 30) +
  facet_wrap(~variable, scales = "free") +
  scale_fill_viridis(discrete = TRUE) +
  theme_minimal(base_size = 10) +
  theme(legend.position = "none") +
  xlab("") +
  ylab("Frecuencia")

print(p_hist)

p_palta_hist <- ggplot(datos_palta, aes(x = rendimiento_palta, fill = factor(riego_por_goteo))) +
  geom_histogram(color = "#e9ecef", alpha = 0.6, position = "identity", binwidth = 0.2) +
  scale_fill_manual(values = c("0" = "#69b3a2", "1" = "#404080"), labels = c("Sin riego", "Con riego")) +
  theme_minimal(base_size = 10) +
  labs(fill = "Riego por Goteo") +
  xlab("Rendimiento de palta (t/ha)") +
  ylab("Frecuencia de parcelas") +
  ggtitle("Distribución de rendimiento según riego por goteo")

print(p_palta_hist)

2.2. Exploracion grafica (Densidades)

Para las variables Altura de planta (m), Densidad de frutos y Rendimiento (t/ha) según riego por goteo.

plot_a <- ggplot(datos_palta, aes(x = altura_planta, colour = factor(riego_por_goteo))) +
  geom_density() +theme_bw() +labs(x = "Altura de planta (m)", colour = "Riego por goteo")

plot_b <- ggplot(datos_palta, aes(x = densidad_frutos, colour = factor(riego_por_goteo))) +
  geom_density() +theme_bw() +labs(x = "Densidad de frutos", colour = "Riego por goteo")

plot_c <- ggplot(datos_palta, aes(x = rendimiento_palta, colour = factor(riego_por_goteo))) +
  geom_density() +theme_bw() +labs(x = "Rendimiento (t/ha)", colour = "Riego por goteo")

# Combina los tres gráficos con una leyenda común
ggarrange(plot_a, plot_b, plot_c, common.legend = TRUE, legend = "bottom")

3. Implementamos el Análisis de Componentes

datosacp_palta <- datos_palta[, c("pH_suelo", "materia_organica", "humedad_suelo",
                                  "altura_planta", "diametro_tronco",
                                  "densidad_frutos", "peso_promedio_fruto",
                                  "rendimiento_palta")]

head(datosacp_palta)
##   pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1     6.60             4.18          53.1          3.82            13.7
## 2     6.83             2.68          41.7          4.14            14.4
## 3     6.51             3.25          52.6          3.52            11.6
## 4     6.40             3.04          43.3          2.78             9.8
## 5     6.65             3.83          47.4          3.99            14.0
## 6     6.52             4.64          57.8          4.44            17.7
##   densidad_frutos peso_promedio_fruto rendimiento_palta
## 1             203                 222             13.86
## 2             232                 211             10.44
## 3             179                 212              9.12
## 4             134                 221              6.89
## 5             108                 207              4.11
## 6             267                 268             22.27

3.1. Análisis Descriptivo

summary(datosacp_palta)
##     pH_suelo     materia_organica humedad_suelo   altura_planta  
##  Min.   :5.890   Min.   :1.000    Min.   :29.70   Min.   :1.280  
##  1st Qu.:6.370   1st Qu.:3.087    1st Qu.:45.10   1st Qu.:3.340  
##  Median :6.500   Median :3.700    Median :49.70   Median :3.850  
##  Mean   :6.502   Mean   :3.712    Mean   :49.76   Mean   :3.820  
##  3rd Qu.:6.640   3rd Qu.:4.353    3rd Qu.:54.52   3rd Qu.:4.332  
##  Max.   :7.230   Max.   :6.820    Max.   :70.60   Max.   :6.320  
##  diametro_tronco densidad_frutos peso_promedio_fruto rendimiento_palta
##  Min.   : 4.80   Min.   : 20.0   Min.   :158.0       Min.   : 0.670   
##  1st Qu.:12.00   1st Qu.:134.8   1st Qu.:211.0       1st Qu.: 7.207   
##  Median :14.05   Median :181.0   Median :229.0       Median :10.450   
##  Mean   :13.91   Mean   :182.1   Mean   :227.8       Mean   :11.102   
##  3rd Qu.:15.90   3rd Qu.:230.0   3rd Qu.:244.0       3rd Qu.:14.290   
##  Max.   :23.60   Max.   :369.0   Max.   :300.0       Max.   :30.950
summarytools::descr(datosacp_palta)
## Descriptive Statistics  
## datosacp_palta  
## N: 700  
## 
##                     altura_planta   densidad_frutos   diametro_tronco   humedad_suelo
## ----------------- --------------- ----------------- ----------------- ---------------
##              Mean            3.82            182.06             13.91           49.76
##           Std.Dev            0.79             68.84              2.97            6.75
##               Min            1.28             20.00              4.80           29.70
##                Q1            3.34            134.50             12.00           45.10
##            Median            3.85            181.00             14.05           49.70
##                Q3            4.34            230.00             15.90           54.55
##               Max            6.32            369.00             23.60           70.60
##               MAD            0.73             71.16              2.89            6.97
##               IQR            0.99             95.25              3.90            9.42
##                CV            0.21              0.38              0.21            0.14
##          Skewness           -0.14              0.08             -0.08           -0.05
##       SE.Skewness            0.09              0.09              0.09            0.09
##          Kurtosis            0.21             -0.24              0.08           -0.18
##           N.Valid          700.00            700.00            700.00          700.00
##                 N          700.00            700.00            700.00          700.00
##         Pct.Valid          100.00            100.00            100.00          100.00
## 
## Table: Table continues below
## 
##  
## 
##                     materia_organica   peso_promedio_fruto   pH_suelo   rendimiento_palta
## ----------------- ------------------ --------------------- ---------- -------------------
##              Mean               3.71                227.84       6.50               11.10
##           Std.Dev               0.98                 23.00       0.21                5.36
##               Min               1.00                158.00       5.89                0.67
##                Q1               3.08                211.00       6.37                7.20
##            Median               3.70                229.00       6.50               10.45
##                Q3               4.36                244.00       6.64               14.30
##               Max               6.82                300.00       7.23               30.95
##               MAD               0.95                 25.20       0.21                5.24
##               IQR               1.27                 33.00       0.27                7.08
##                CV               0.26                  0.10       0.03                0.48
##          Skewness              -0.03                  0.01      -0.01                0.56
##       SE.Skewness               0.09                  0.09       0.09                0.09
##          Kurtosis               0.05                 -0.22      -0.04                0.12
##           N.Valid             700.00                700.00     700.00              700.00
##                 N             700.00                700.00     700.00              700.00
##         Pct.Valid             100.00                100.00     100.00              100.00

Algunas interpretaciones de la salida:

  • El pH promedio = 6.50 (rango 5.89–7.23) indica suelos ligeramente ácidos a neutros, adecuados para palta; la materia orgánica media ≈ 3.7% muestra niveles moderados que favorecen fertilidad y retención de humedad.

  • Las plantas presentan altura media ≈ 3.82 m y diámetro medio ≈ 13.9cm, con baja variabilidad relativa (CV ≈ 21%), lo que sugiere desarrollo vegetativo bastante uniforme entre unidades de cultivo.

Ejemplo de asimetría/curtosis

Para la variable “rendimiento_palta” (se puede incluir otra variable, reemplazando rendimiento_palta por su nombre).

X = datosacp_palta$rendimiento_palta
Xbar = mean(X)
Sd = sd(X)
mean(((X - Xbar) / Sd)^3)       # Asimetría muestral (skewness)
## [1] 0.5630444
mean(((X - Xbar) / Sd)^4) - 3   # Curtosis muestral (exceso de curtosis)
## [1] 0.1195568

3.2. Análisis de Correlación

# Mostrar matriz de covarianzas 
cov(datosacp_palta)
##                       pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo            0.04286011       0.04018726     0.2563929    0.02759206
## materia_organica    0.04018726       0.96237285     4.9258338    0.44862868
## humedad_suelo       0.25639295       4.92583382    45.5868486    2.54394447
## altura_planta       0.02759206       0.44862868     2.5439445    0.62181119
## diametro_tronco     0.08581955       1.60189990     8.7461582    2.26547920
## densidad_frutos     0.79289230      17.62711506    91.4671980   38.11471653
## peso_promedio_fruto 0.71515187      15.12186383    74.7124402   13.43989575
## rendimiento_palta   0.10184574       2.14749974    15.1202590    3.18133842
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                 0.08581955       0.7928923           0.7151519
## materia_organica         1.60189990      17.6271151          15.1218638
## humedad_suelo            8.74615819      91.4671980          74.7124402
## altura_planta            2.26547920      38.1147165          13.4398957
## diametro_tronco          8.84409884     153.0703086          52.7788281
## densidad_frutos        153.07030860    4738.4173309         869.9248314
## peso_promedio_fruto     52.77882812     869.9248314         529.1484386
## rendimiento_palta       12.85007924     341.8913100          86.5055027
##                     rendimiento_palta
## pH_suelo                    0.1018457
## materia_organica            2.1474997
## humedad_suelo              15.1202590
## altura_planta               3.1813384
## diametro_tronco            12.8500792
## densidad_frutos           341.8913100
## peso_promedio_fruto        86.5055027
## rendimiento_palta          28.7740269
# Varianzas (diagonal) y su suma (traza)
diag(cov(datosacp_palta))
##            pH_suelo    materia_organica       humedad_suelo       altura_planta 
##        4.286011e-02        9.623728e-01        4.558685e+01        6.218112e-01 
##     diametro_tronco     densidad_frutos peso_promedio_fruto   rendimiento_palta 
##        8.844099e+00        4.738417e+03        5.291484e+02        2.877403e+01
sum(diag(cov(datosacp_palta)))
## [1] 5352.398

Coeficientes de Correlación

round(cor(datosacp_palta), 3)
##                     pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo               1.000            0.198         0.183         0.169
## materia_organica       0.198            1.000         0.744         0.580
## humedad_suelo          0.183            0.744         1.000         0.478
## altura_planta          0.169            0.580         0.478         1.000
## diametro_tronco        0.139            0.549         0.436         0.966
## densidad_frutos        0.056            0.261         0.197         0.702
## peso_promedio_fruto    0.150            0.670         0.481         0.741
## rendimiento_palta      0.092            0.408         0.417         0.752
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                      0.139           0.056               0.150
## materia_organica              0.549           0.261               0.670
## humedad_suelo                 0.436           0.197               0.481
## altura_planta                 0.966           0.702               0.741
## diametro_tronco               1.000           0.748               0.772
## densidad_frutos               0.748           1.000               0.549
## peso_promedio_fruto           0.772           0.549               1.000
## rendimiento_palta             0.806           0.926               0.701
##                     rendimiento_palta
## pH_suelo                        0.092
## materia_organica                0.408
## humedad_suelo                   0.417
## altura_planta                   0.752
## diametro_tronco                 0.806
## densidad_frutos                 0.926
## peso_promedio_fruto             0.701
## rendimiento_palta               1.000
diag(cor(datosacp_palta))
##            pH_suelo    materia_organica       humedad_suelo       altura_planta 
##                   1                   1                   1                   1 
##     diametro_tronco     densidad_frutos peso_promedio_fruto   rendimiento_palta 
##                   1                   1                   1                   1
sum(diag(cor(datosacp_palta)))
## [1] 8
# Prueba estadistica

pairs.panels(datosacp_palta)

corr.test(datosacp_palta)
## Call:corr.test(x = datosacp_palta)
## Correlation matrix 
##                     pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo                1.00             0.20          0.18          0.17
## materia_organica        0.20             1.00          0.74          0.58
## humedad_suelo           0.18             0.74          1.00          0.48
## altura_planta           0.17             0.58          0.48          1.00
## diametro_tronco         0.14             0.55          0.44          0.97
## densidad_frutos         0.06             0.26          0.20          0.70
## peso_promedio_fruto     0.15             0.67          0.48          0.74
## rendimiento_palta       0.09             0.41          0.42          0.75
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                       0.14            0.06                0.15
## materia_organica               0.55            0.26                0.67
## humedad_suelo                  0.44            0.20                0.48
## altura_planta                  0.97            0.70                0.74
## diametro_tronco                1.00            0.75                0.77
## densidad_frutos                0.75            1.00                0.55
## peso_promedio_fruto            0.77            0.55                1.00
## rendimiento_palta              0.81            0.93                0.70
##                     rendimiento_palta
## pH_suelo                         0.09
## materia_organica                 0.41
## humedad_suelo                    0.42
## altura_planta                    0.75
## diametro_tronco                  0.81
## densidad_frutos                  0.93
## peso_promedio_fruto              0.70
## rendimiento_palta                1.00
## Sample Size 
## [1] 700
## Probability values (Entries above the diagonal are adjusted for multiple tests.) 
##                     pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo                0.00                0             0             0
## materia_organica        0.00                0             0             0
## humedad_suelo           0.00                0             0             0
## altura_planta           0.00                0             0             0
## diametro_tronco         0.00                0             0             0
## densidad_frutos         0.14                0             0             0
## peso_promedio_fruto     0.00                0             0             0
## rendimiento_palta       0.02                0             0             0
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                          0            0.14                   0
## materia_organica                  0            0.00                   0
## humedad_suelo                     0            0.00                   0
## altura_planta                     0            0.00                   0
## diametro_tronco                   0            0.00                   0
## densidad_frutos                   0            0.00                   0
## peso_promedio_fruto               0            0.00                   0
## rendimiento_palta                 0            0.00                   0
##                     rendimiento_palta
## pH_suelo                         0.03
## materia_organica                 0.00
## humedad_suelo                    0.00
## altura_planta                    0.00
## diametro_tronco                  0.00
## densidad_frutos                  0.00
## peso_promedio_fruto              0.00
## rendimiento_palta                0.00
## 
##  To see confidence intervals of the correlations, print with the short=FALSE option

Interpretacion:

  • Existe una alta correlación entre el diámetro del tronco y la altura de la planta (0.966).

  • La densidad de frutos se asocia fuertemente con el rendimiento (0.926), seguida por el diámetro del tronco (0.806) y la altura de la planta (0.75), lo que refleja que plantas más grandes y con más frutos contribuyen directamente a un mayor rendimiento.

  • También se observa una correlación notable entre el peso promedio del fruto y el rendimiento (0.701), lo que confirma que el tamaño del fruto influye significativamente en la productividad total.

Gráficos de Correlación para datosacp_palta

# Correlaciones solo de variables cuantitativas 
i <- cor(datosacp_palta, method = "pearson")#matriz de correlaciones

# Plot base
corrplot(i, sig.level = 0.05, type = "lower")   # solo la mitad inferior

# Diferentes estilos de visualización
corrplot(i, method = "number", order = "original")

corrplot(i, method = "ellipse", order = "original")

corrplot(i, method = "ellipse", order = "original", addCoef.col = "magenta")

corrplot(i, method = "ellipse", order = "original", addCoef.col = "magenta", type = "upper")

corrplot(i, method = "ellipse", order = "original", addCoef.col = "magenta", type = "lower")

corrplot(i, method = "square", order = "original", tl.pos = "d", addCoef.col = "magenta")

corrplot(i, method = "pie", order = "AOE", tl.pos = "d", addCoef.col = "green2")

corrplot(i, method = "circle", order = "FPC", tl.pos = "d", addCoef.col = "green2")

corrplot(i, method = "color", order = "original", tl.pos = "d", addCoef.col = "green2")

corrplot(i, method = "ellipse", order = "AOE", type = "upper", tl.pos = "d")
corrplot(i, add = TRUE, type = "lower", method = "number", order = "AOE", diag = FALSE, tl.pos = "n", cl.pos = "n")

Test de significancia de correlaciones

res1 <- cor.mtest(datosacp_palta, conf.level = 0.95)
res1$p   # p-valores de las correlaciones
##                         pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo            0.000000e+00     1.304675e-07  1.029993e-06  6.919805e-06
## materia_organica    1.304675e-07     0.000000e+00 3.492021e-124  3.761911e-64
## humedad_suelo       1.029993e-06    3.492021e-124  0.000000e+00  3.287700e-41
## altura_planta       6.919805e-06     3.761911e-64  3.287700e-41  0.000000e+00
## diametro_tronco     2.161044e-04     2.264161e-56  8.902520e-34  0.000000e+00
## densidad_frutos     1.414130e-01     2.284848e-12  1.529303e-07 4.620912e-105
## peso_promedio_fruto 6.644740e-05     2.006832e-92  8.026033e-42 8.399153e-123
## rendimiento_palta   1.521610e-02     1.797091e-29  6.740836e-31 1.597339e-128
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo               2.161044e-04    1.414130e-01        6.644740e-05
## materia_organica       2.264161e-56    2.284848e-12        2.006832e-92
## humedad_suelo          8.902520e-34    1.529303e-07        8.026033e-42
## altura_planta          0.000000e+00   4.620912e-105       8.399153e-123
## diametro_tronco        0.000000e+00   3.005173e-126       3.205996e-139
## densidad_frutos       3.005173e-126    0.000000e+00        1.916394e-56
## peso_promedio_fruto   3.205996e-139    1.916394e-56        0.000000e+00
## rendimiento_palta     8.748976e-161   2.440895e-297       1.360827e-104
##                     rendimiento_palta
## pH_suelo                 1.521610e-02
## materia_organica         1.797091e-29
## humedad_suelo            6.740836e-31
## altura_planta           1.597339e-128
## diametro_tronco         8.748976e-161
## densidad_frutos         2.440895e-297
## peso_promedio_fruto     1.360827e-104
## rendimiento_palta        0.000000e+00
res1$lowCI  # límite inferior de IC
##                        pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo             1.00000000        0.1256136     0.1108291    0.09611713
## materia_organica     0.12561363        1.0000000     0.7086330    0.52855615
## humedad_suelo        0.11082905        0.7086330     1.0000000    0.41852987
## altura_planta        0.09611713        0.5285562     0.4185299    1.00000000
## diametro_tronco      0.06596894        0.4951247     0.3735370    0.96073377
## densidad_frutos     -0.01854137        0.1906158     0.1245148    0.66254907
## peso_promedio_fruto  0.07692305        0.6271475     0.4219830    0.70556760
## rendimiento_palta    0.01772746        0.3444072     0.3543427    0.71802312
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                 0.06596894     -0.01854137          0.07692305
## materia_organica         0.49512465      0.19061576          0.62714749
## humedad_suelo            0.37353698      0.12451477          0.42198298
## altura_planta            0.96073377      0.66254907          0.70556760
## diametro_tronco          1.00000000      0.71314675          0.73970163
## densidad_frutos          0.71314675      1.00000000          0.49545186
## peso_promedio_fruto      0.73970163      0.49545186          1.00000000
## rendimiento_palta        0.77785285      0.91456292          0.66131175
##                     rendimiento_palta
## pH_suelo                   0.01772746
## materia_organica           0.34440722
## humedad_suelo              0.35434267
## altura_planta              0.71802312
## diametro_tronco            0.77785285
## densidad_frutos            0.91456292
## peso_promedio_fruto        0.66131175
## rendimiento_palta          1.00000000
res1$uppCI  # límite superior de IC
##                      pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo            1.0000000        0.2680470     0.2540748     0.2401117
## materia_organica    0.2680470        1.0000000     0.7750730     0.6270971
## humedad_suelo       0.2540748        0.7750730     1.0000000     0.5330429
## altura_planta       0.2401117        0.6270971     0.5330429     1.0000000
## diametro_tronco     0.2113105        0.5988194     0.4937485     0.9706742
## densidad_frutos     0.1292080        0.3287748     0.2670106     0.7378855
## peso_promedio_fruto 0.2218045        0.7090040     0.5360384     0.7726136
## rendimiento_palta   0.1646934        0.4680436     0.4768345     0.7825944
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                  0.2113105       0.1292080           0.2218045
## materia_organica          0.5988194       0.3287748           0.7090040
## humedad_suelo             0.4937485       0.2670106           0.5360384
## altura_planta             0.9706742       0.7378855           0.7726136
## diametro_tronco           1.0000000       0.7786908           0.7998868
## densidad_frutos           0.7786908       1.0000000           0.5990974
## peso_promedio_fruto       0.7998868       0.5990974           1.0000000
## rendimiento_palta         0.8300785       0.9358092           0.7368807
##                     rendimiento_palta
## pH_suelo                    0.1646934
## materia_organica            0.4680436
## humedad_suelo               0.4768345
## altura_planta               0.7825944
## diametro_tronco             0.8300785
## densidad_frutos             0.9358092
## peso_promedio_fruto         0.7368807
## rendimiento_palta           1.0000000
a=datosacp_palta$pH_suelo
b=datosacp_palta$rendimiento_palta
c=cbind(a,b)
head(c)
##         a     b
## [1,] 6.60 13.86
## [2,] 6.83 10.44
## [3,] 6.51  9.12
## [4,] 6.40  6.89
## [5,] 6.65  4.11
## [6,] 6.52 22.27
mshapiro.test(t(c))
## 
##  Shapiro-Wilk normality test
## 
## data:  Z
## W = 0.97643, p-value = 3.446e-09
corrplot(i, p.mat = res1$p, sig.level = 0.05)

corrplot(i, p.mat = res1$p, order = "hclust", insig = "pch", addrect = 3)

corrplot(i, p.mat = res1$p, insig = "p-value",sig.level = -1)#agrega los pvalores

Interpretación:

El análisis de correlación muestra que la mayoría de las asociaciones entre las variables son altamente significativas (p < 0.05).

Primera forma

col1 <- colorRampPalette(c("#7F0000","red","#FF7F00","yellow","white", 
                           "cyan", "#007FFF", "blue","#00007F"))
corrplot(cor(datosacp_palta),
         title = "Matriz de correlacion", mar=c(0,0,1,0),
         method = "color", outline = T, addgrid.col = "darkgray",
         order = "hclust", addrect = 3, col=col1(100),
         tl.col='black', tl.cex=.75)

Segunda forma

pairs(datosacp_palta,col="green2")

Tercera forma

chart.Correlation(datosacp_palta, histogram=TRUE, pch=20)

Cuarta forma - Mapa de Calor

library(psych)
cor.plot(cor(datosacp_palta),
         main="Mapa de Calor", 
         diag=TRUE,
         show.legend = TRUE)  

data2=datosacp_palta
corr=cor(data2)
corr 
##                       pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo            1.00000000        0.1978746     0.1834255     0.1690161
## materia_organica    0.19787459        1.0000000     0.7436837     0.5799440
## humedad_suelo       0.18342547        0.7436837     1.0000000     0.4778137
## altura_planta       0.16901615        0.5799440     0.4778137     1.0000000
## diametro_tronco     0.13939038        0.5490816     0.4355828     0.9660598
## densidad_frutos     0.05563792        0.2610315     0.1968017     0.7021773
## peso_promedio_fruto 0.15016989        0.6701081     0.4810435     0.7409312
## rendimiento_palta   0.09170983        0.4080949     0.4174833     0.7521081
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                  0.1393904      0.05563792           0.1501699
## materia_organica          0.5490816      0.26103149           0.6701081
## humedad_suelo             0.4355828      0.19680174           0.4810435
## altura_planta             0.9660598      0.70217728           0.7409312
## diametro_tronco           1.0000000      0.74773466           0.7715147
## densidad_frutos           0.7477347      1.00000000           0.5493844
## peso_promedio_fruto       0.7715147      0.54938439           1.0000000
## rendimiento_palta         0.8055244      0.92591493           0.7010591
##                     rendimiento_palta
## pH_suelo                   0.09170983
## materia_organica           0.40809485
## humedad_suelo              0.41748332
## altura_planta              0.75210812
## diametro_tronco            0.80552438
## densidad_frutos            0.92591493
## peso_promedio_fruto        0.70105913
## rendimiento_palta          1.00000000
# Correlograma básico
ggcorrplot(corr) +
  ggtitle("Correlograma de variables de cultivo de palta") +
  theme_minimal()
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the ggcorrplot package.
##   Please report the issue at <https://github.com/kassambara/ggcorrplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

# Correlograma con círculos
ggcorrplot(corr, method = 'circle') +
  ggtitle("Correlograma de variables de cultivo de palta") +
  theme_minimal()

# Correlograma con círculos, solo la parte inferior
ggcorrplot(corr, method = 'circle', type = 'lower') +
  ggtitle("Correlograma de variables de cultivo de palta") +
  theme_minimal()

# Correlograma con círculos, parte inferior y etiquetas de valores
ggcorrplot(corr, method = 'circle', type = 'lower', lab = TRUE) +
  ggtitle("Correlograma de variables de cultivo de palta") +
  theme_minimal() +
  theme(legend.position = "none")

4. Análisis de Componentes Principales

4.1. Matriz de Correlaciones

acp <- dudi.pca(datosacp_palta, scannf=FALSE, scale=TRUE, nf=ncol(datosacp_palta))


summary(acp)
## Class: pca dudi
## Call: dudi.pca(df = datosacp_palta, scale = TRUE, scannf = FALSE, nf = ncol(datosacp_palta))
## 
## Total inertia: 8
## 
## Eigenvalues:
##     Ax1     Ax2     Ax3     Ax4     Ax5 
##  4.7874  1.3071  0.9046  0.4382  0.3095 
## 
## Projected inertia (%):
##     Ax1     Ax2     Ax3     Ax4     Ax5 
##  59.843  16.339  11.308   5.478   3.869 
## 
## Cumulative projected inertia (%):
##     Ax1   Ax1:2   Ax1:3   Ax1:4   Ax1:5 
##   59.84   76.18   87.49   92.97   96.84 
## 
## (Only 5 dimensions (out of 8) are shown)

Interpretación:

Las dos primeras componentes (CP1 y CP2) explican juntas más del 76% de la variabilidad tota. Esto indica que la mayoría de la información del cultivo puede resumirse en solo dos dimensiones.

acp[["eig"]]
## [1] 4.78741957 1.30710247 0.90461427 0.43820555 0.30950446 0.19388083 0.03615950
## [8] 0.02311336
print(acp)
## Duality diagramm
## class: pca dudi
## $call: dudi.pca(df = datosacp_palta, scale = TRUE, scannf = FALSE, nf = ncol(datosacp_palta))
## 
## $nf: 8 axis-components saved
## $rank: 8
## eigen values: 4.787 1.307 0.9046 0.4382 0.3095 ...
##   vector length mode    content       
## 1 $cw    8      numeric column weights
## 2 $lw    700    numeric row weights   
## 3 $eig   8      numeric eigen values  
## 
##   data.frame nrow ncol content             
## 1 $tab       700  8    modified array      
## 2 $li        700  8    row coordinates     
## 3 $l1        700  8    row normed scores   
## 4 $co        8    8    column coordinates  
## 5 $c1        8    8    column normed scores
## other elements: cent norm

Interpretación:

Las dos primeras componentes serán las retenidas ya que sus autovalores son mayores a 1.

# Valores propios (autovalores)
acp$eig
## [1] 4.78741957 1.30710247 0.90461427 0.43820555 0.30950446 0.19388083 0.03615950
## [8] 0.02311336
sum(acp$eig)
## [1] 8
inertia.dudi(acp)
## Inertia information:
## Call: inertia.dudi(x = acp)
## 
## Decomposition of total inertia:
##     inertia     cum  cum(%)
## Ax1 4.78742   4.787   59.84
## Ax2 1.30710   6.095   76.18
## Ax3 0.90461   6.999   87.49
## Ax4 0.43821   7.437   92.97
## Ax5 0.30950   7.747   96.84
## Ax6 0.19388   7.941   99.26
## Ax7 0.03616   7.977   99.71
## Ax8 0.02311   8.000  100.00

De la salida se puede observar que se van a retener las dos primeras componentes.

# Vectores propios
acp$c1
##                            CS1         CS2         CS3         CS4         CS5
## pH_suelo            -0.0958497 -0.38970363  0.91459571 -0.02983693  0.03647324
## materia_organica    -0.3248315 -0.49583189 -0.24621751  0.12139001  0.19006248
## humedad_suelo       -0.2836901 -0.52646119 -0.26646173 -0.57385466 -0.20253958
## altura_planta       -0.4218724  0.07694301  0.02990179  0.27927602 -0.54932084
## diametro_tronco     -0.4271249  0.14250364  0.02867147  0.27361210 -0.40172778
## densidad_frutos     -0.3566832  0.45646985  0.14317616 -0.36637598  0.14648383
## peso_promedio_fruto -0.3932134 -0.06761119 -0.07961749  0.46090615  0.60860511
## rendimiento_palta   -0.4031942  0.29318410  0.05775162 -0.39438627  0.25792906
##                              CS6         CS7         CS8
## pH_suelo            -0.004550960  0.01078702 -0.01004975
## materia_organica     0.719481268  0.12713800  0.05775384
## humedad_suelo       -0.391938002 -0.15661317 -0.15126852
## altura_planta       -0.008400688 -0.36691923  0.54841638
## diametro_tronco     -0.062641863  0.47500807 -0.57500394
## densidad_frutos      0.342121982 -0.50278021 -0.34407657
## peso_promedio_fruto -0.445521439 -0.22029313 -0.06797027
## rendimiento_palta   -0.095808242  0.54553872  0.46827623
# Correlaciones entre las variables originales y las componentes principales
acp$co
##                          Comp1       Comp2       Comp3       Comp4       Comp5
## pH_suelo            -0.2097208 -0.44554263  0.86988306 -0.01975118  0.02029120
## materia_organica    -0.7107370 -0.56687757 -0.23418046  0.08035666  0.10573770
## humedad_suelo       -0.6207188 -0.60189562 -0.25343498 -0.37987512 -0.11267910
## altura_planta       -0.9230642  0.08796785  0.02843996  0.18487262 -0.30560435
## diametro_tronco     -0.9345566  0.16292239  0.02726978  0.18112327 -0.22349372
## densidad_frutos     -0.7804290  0.52187551  0.13617658 -0.24253026  0.08149353
## peso_promedio_fruto -0.8603576 -0.07729892 -0.07572516  0.30510649  0.33858604
## rendimiento_palta   -0.8821959  0.33519322  0.05492826 -0.26107226  0.14349400
##                            Comp6        Comp7        Comp8
## pH_suelo            -0.002003874  0.002051222 -0.001527871
## materia_organica     0.316801282  0.024176118  0.008780361
## humedad_suelo       -0.172577754 -0.029781014 -0.022997471
## altura_planta       -0.003698983 -0.069772079  0.083376172
## diametro_tronco     -0.027582403  0.090325877 -0.087418299
## densidad_frutos      0.150642814 -0.095606930 -0.052310230
## peso_promedio_fruto -0.196171561 -0.041890172 -0.010333574
## rendimiento_palta   -0.042186190  0.103737737  0.071192401

PRIMERA FORMA

Grafica de valores propios (ScreePlot)

plot(acp$eig, type="b", pch=20, col="blue", lwd=2,
     main="ScreePlot - ACP Datos Palta",
     xlab="Componentes Principales", ylab="Valores Propios")
abline(h=1, lty=3, col="red", lwd=3.5)

a = fviz_eig(acp, choice='eigenvalue', geom="line", linecolor = '#3A5FCD',
             xlab='Componentes Principales') +
  geom_hline(yintercept = 1, color='#EE6363') +
  theme_grey()

a

Del grafico se puede observar que se van a retener las dos primeras componentes, ya que sus autovalores son mayores a 1.

SEGUNDA FORMA

eig.val <- get_eigenvalue(acp)#Extraer valores propios con factoextra
eig.val
##       eigenvalue variance.percent cumulative.variance.percent
## Dim.1 4.78741957       59.8427446                    59.84274
## Dim.2 1.30710247       16.3387808                    76.18153
## Dim.3 0.90461427       11.3076784                    87.48920
## Dim.4 0.43820555        5.4775693                    92.96677
## Dim.5 0.30950446        3.8688057                    96.83558
## Dim.6 0.19388083        2.4235104                    99.25909
## Dim.7 0.03615950        0.4519937                    99.71108
## Dim.8 0.02311336        0.2889170                   100.00000
barplot(eig.val[, 2], names.arg = 1:nrow(eig.val),
        main = "Autovalores - ACP Datos Palta",
        xlab = "Componentes Principales",
        ylab = "Porcentaje de varianza explicada",
        col = "steelblue")
lines(x = 1:nrow(eig.val), eig.val[, 2], type = "b", pch = 19, col = "red")

TERCERA FORMA

# Forma básica
fviz_screeplot(acp)

# Mostrar solo las primeras 5 componentes
fviz_screeplot(acp, ncp = 5)

# Mostrar valores propios 
fviz_eig(acp, addlabels = TRUE, hjust = 0.5)

# Gráfico final 
b <- fviz_screeplot(acp, ncp = 9, addlabels = TRUE, hjust = 0.5,
                    linecolor = "#FC4E07", barfill = "#00AFBB",
                    xlab = "Componentes Principales")
b

4.2. Gráfica de Variables sobre el círculo de correlaciones

PRIMERA FORMA

s.corcircle(acp$co,grid=FALSE,xax = 1, yax = 2)

Interpretación:

Se puede ver del gráfico que muchas de las variables estan relacionadas con la componente 1 y con la componente 2, además se puede apreciar que la variable PH_suelo estan relacionada con otra componente dfierente a las mencionadas.

SEGUNDA FORMA

fviz_pca_var(acp,col.var = '#EE8262',axes = c(1, 2))# primera y segunda componente
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
##   Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

c=fviz_pca_var(acp, col.var="#FF3030")+theme_minimal()
c

dim(datosacp_palta)
## [1] 700   8
# Scores de los primeros 10 individuos
acp$li[1:10,]
##         Axis1      Axis2       Axis3      Axis4       Axis5       Axis6
## 1  -0.5269317 -0.3852071  0.27541873 -0.6915387  0.05871837  0.31918897
## 2   0.3659868  0.9323113  2.19971442  0.1136263 -0.56108600  0.27585610
## 3   0.9584374 -0.2253692  0.03283347 -0.7747976 -0.17338509 -0.12571244
## 4   2.3720363  0.2080953 -0.22774461  0.1622781  0.84003434 -0.04973325
## 5   1.1539900 -0.9461936  0.56800196  0.7531754 -1.05688267  0.37668962
## 6  -3.4980829  0.1678297 -0.25279652 -0.4720774  0.77864537 -0.42895220
## 7  -2.2719604  0.1981581  0.26513200 -0.8331914  0.43512877 -0.27702911
## 8   0.3179467  0.2595818 -0.07262689  0.9497027  0.59986701 -0.18337484
## 9   1.7341834 -0.9690540  0.34051792 -1.1261031  0.42025518 -0.17319653
## 10 -0.8445947 -0.2195026 -1.64602563  0.2189158 -0.51117508 -0.37567426
##          Axis7        Axis8
## 1   0.13842809  0.141402167
## 2  -0.27123039 -0.026587097
## 3  -0.38239439  0.035260501
## 4  -0.12691837  0.073667232
## 5   0.04258159 -0.025792503
## 6   0.38276479  0.003110153
## 7   0.11333830  0.066606408
## 8  -0.12436840 -0.220234390
## 9  -0.22842836 -0.047594908
## 10 -0.18313942 -0.147829786
# Matriz de covarianza
round(cov(acp$li), 4)
##        Axis1 Axis2  Axis3  Axis4  Axis5  Axis6  Axis7  Axis8
## Axis1 4.7943 0.000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis2 0.0000 1.309 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis3 0.0000 0.000 0.9059 0.0000 0.0000 0.0000 0.0000 0.0000
## Axis4 0.0000 0.000 0.0000 0.4388 0.0000 0.0000 0.0000 0.0000
## Axis5 0.0000 0.000 0.0000 0.0000 0.3099 0.0000 0.0000 0.0000
## Axis6 0.0000 0.000 0.0000 0.0000 0.0000 0.1942 0.0000 0.0000
## Axis7 0.0000 0.000 0.0000 0.0000 0.0000 0.0000 0.0362 0.0000
## Axis8 0.0000 0.000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0231
# Correlación entre componentes
round(cor(acp$li), 4)
##       Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8
## Axis1     1     0     0     0     0     0     0     0
## Axis2     0     1     0     0     0     0     0     0
## Axis3     0     0     1     0     0     0     0     0
## Axis4     0     0     0     1     0     0     0     0
## Axis5     0     0     0     0     1     0     0     0
## Axis6     0     0     0     0     0     1     0     0
## Axis7     0     0     0     0     0     0     1     0
## Axis8     0     0     0     0     0     0     0     1

Interpretación:

Sepuede observar que aqui cada uno de los componentes ya no están correlacionados lo cual es lo que se debe cumplir para seguir con el análisis.

# Descripción estadística de los scores
library(psych)
describe(acp$li)
## # A tibble: 8 × 26
##   described_variables     n    na      mean    sd se_mean   IQR skewness
##   <chr>               <int> <int>     <dbl> <dbl>   <dbl> <dbl>    <dbl>
## 1 Axis1                 700     0  1.52e-16 2.19  0.0828  3.07  -0.0153 
## 2 Axis2                 700     0  2.59e-16 1.14  0.0432  1.61  -0.126  
## 3 Axis3                 700     0 -5.31e-16 0.952 0.0360  1.26   0.136  
## 4 Axis4                 700     0 -4.91e-16 0.662 0.0250  0.912  0.0787 
## 5 Axis5                 700     0 -4.27e-16 0.557 0.0210  0.780  0.0196 
## 6 Axis6                 700     0  1.67e-17 0.441 0.0167  0.596 -0.00588
## 7 Axis7                 700     0  1.41e-16 0.190 0.00719 0.262 -0.113  
## 8 Axis8                 700     0 -1.89e-16 0.152 0.00575 0.201  0.152  
## # ℹ 18 more variables: kurtosis <dbl>, p00 <dbl>, p01 <dbl>, p05 <dbl>,
## #   p10 <dbl>, p20 <dbl>, p25 <dbl>, p30 <dbl>, p40 <dbl>, p50 <dbl>,
## #   p60 <dbl>, p70 <dbl>, p75 <dbl>, p80 <dbl>, p90 <dbl>, p95 <dbl>,
## #   p99 <dbl>, p100 <dbl>
# Grafica individuos sobre el primer plano (PC1 vs PC2)
s.label(acp$li, xax=1, yax=2, clabel=0.7, grid=FALSE, boxes=FALSE)

# Alternativa más estética 
fviz_pca_ind(acp, col.ind = "steelblue")

# Grafica sobre el plano PC1 vs PC2
s.label(acp$li, xax=1, yax=2, clabel=0.7, grid=FALSE, boxes=FALSE)

4.3. SCORE y BIPLOT

# Biplot clásico con ade4
s.label(acp$li, clabel=0.7, grid=FALSE, boxes=FALSE)
s.corcircle(acp$co, grid=FALSE, add.plot=TRUE, clabel=0.7)

# Biplot más estético con factoextra
library(factoextra)
d= fviz_pca_biplot(acp, repel=F,
                          col.var="#EE3A8C",
                          col.ind="green")
d

# Combinar gráficos (si quieres varios biplots en un panel)
# library(patchwork)
(a + b) / (c + d)

# Crear salida combinando variables originales y los scores PC1-PC3
salidaacp_palta <- cbind(datosacp_palta, acp$li[, c(1,2,3)])
head(salidaacp_palta)   # Ver primeras filas
##   pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1     6.60             4.18          53.1          3.82            13.7
## 2     6.83             2.68          41.7          4.14            14.4
## 3     6.51             3.25          52.6          3.52            11.6
## 4     6.40             3.04          43.3          2.78             9.8
## 5     6.65             3.83          47.4          3.99            14.0
## 6     6.52             4.64          57.8          4.44            17.7
##   densidad_frutos peso_promedio_fruto rendimiento_palta      Axis1      Axis2
## 1             203                 222             13.86 -0.5269317 -0.3852071
## 2             232                 211             10.44  0.3659868  0.9323113
## 3             179                 212              9.12  0.9584374 -0.2253692
## 4             134                 221              6.89  2.3720363  0.2080953
## 5             108                 207              4.11  1.1539900 -0.9461936
## 6             267                 268             22.27 -3.4980829  0.1678297
##         Axis3
## 1  0.27541873
## 2  2.19971442
## 3  0.03283347
## 4 -0.22774461
## 5  0.56800196
## 6 -0.25279652
# Guardar CSV (archivo en el directorio de trabajo)
write.csv(salidaacp_palta, "P_palta.csv", row.names = FALSE)

# Screeplot (autovalores) — ver cuánto explica cada componente
fviz_eig(acp, ncp = ncol(datosacp_palta), addlabels = TRUE, hjust = 0.5,
         barfill = "violet", barcolor = "blue")

# Gráfico de individuos (PC1 vs PC2)
fviz_pca_ind(acp, repel = FALSE, col.ind = 'steelblue')

4.4. Otra opción de gráfico

Para visualizar los individuos del ACP de palta:

  • Representa visualmente las coordenadas de los individuos (observaciones) en los dos primeros componentes principales (PC1 y PC2)
colorplot(acp$li, acp$li,
          transp = FALSE, cex = 2,
          xlab = "PC1", ylab = "PC2")
title("Análisis PCA de datos de palta")
abline(v = 0, h = 0, col = "black", lty = 2)

Pareciera que hubiera dos grupos en este gráfico.

4.5. Agrupamiento usando Componentes Principales

# Escalamiento
datosacp_palta1 <- scale(datosacp_palta)

# Limpieza (por si hay NA o texto)
datosacp_palta1 <- na.omit(as.data.frame(apply(datosacp_palta1, 2, as.numeric)))

# Matriz de covarianza
round(cov(datosacp_palta1), 3)
##                     pH_suelo materia_organica humedad_suelo altura_planta
## pH_suelo               1.000            0.198         0.183         0.169
## materia_organica       0.198            1.000         0.744         0.580
## humedad_suelo          0.183            0.744         1.000         0.478
## altura_planta          0.169            0.580         0.478         1.000
## diametro_tronco        0.139            0.549         0.436         0.966
## densidad_frutos        0.056            0.261         0.197         0.702
## peso_promedio_fruto    0.150            0.670         0.481         0.741
## rendimiento_palta      0.092            0.408         0.417         0.752
##                     diametro_tronco densidad_frutos peso_promedio_fruto
## pH_suelo                      0.139           0.056               0.150
## materia_organica              0.549           0.261               0.670
## humedad_suelo                 0.436           0.197               0.481
## altura_planta                 0.966           0.702               0.741
## diametro_tronco               1.000           0.748               0.772
## densidad_frutos               0.748           1.000               0.549
## peso_promedio_fruto           0.772           0.549               1.000
## rendimiento_palta             0.806           0.926               0.701
##                     rendimiento_palta
## pH_suelo                        0.092
## materia_organica                0.408
## humedad_suelo                   0.417
## altura_planta                   0.752
## diametro_tronco                 0.806
## densidad_frutos                 0.926
## peso_promedio_fruto             0.701
## rendimiento_palta               1.000
# Identificación de grupos
# Retenemos las primeras 2 componentes y forzamos 2 clusters
grp <- find.clusters(datosacp_palta1, max.n.clust = 8, n.pca = 2, n.clust = 2)

# Análisis DAPC (también no interactivo)
dapc.WIDIV <- dapc(datosacp_palta1, grp$grp, n.pca = 2, n.da = 1)

# Gráfico de dispersión DAPC
scatter(dapc.WIDIV, posi.da = "bottomright", bg = "white", pch = 17:22, cstar = 0)

Intrepretación:

Se puede observar que existe superposición, quiere decir que se ha clasificado de mal manera ya que unos rojos han sido clasificados como azules y viceversa.

5. DAPC: Análisis Discriminante de Componentes Principales

Darle 2 componentes y 1 función discriminante.

contrib <- loadingplot(dapc.WIDIV$var.contr, axis = 1,
                       thres = 0.07, lab.jitter = 1)

# Convertir a tibble
contrib1 <- tibble(
  nombre = contrib$var.names,
  valor = contrib$var.values
)

# Ordenar por contribución descendente
orden <- contrib1 %>%
  arrange(desc(valor))

# Mostrar las variables más discriminantes
head(orden)
## # A tibble: 6 × 2
##   nombre              valor
##   <chr>               <dbl>
## 1 diametro_tronco     0.179
## 2 altura_planta       0.176
## 3 rendimiento_palta   0.157
## 4 peso_promedio_fruto 0.156
## 5 densidad_frutos     0.120
## 6 materia_organica    0.113

5.1. Otra alternativa para hacer Componentes Principales

acp_palta=PCA(datosacp_palta,scale.unit = TRUE,ncp=8,graph = TRUE)

summary(acp_palta)
## 
## Call:
## PCA(X = datosacp_palta, scale.unit = TRUE, ncp = 8, graph = TRUE) 
## 
## 
## Eigenvalues
##                        Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
## Variance               4.787   1.307   0.905   0.438   0.310   0.194   0.036
## % of var.             59.843  16.339  11.308   5.478   3.869   2.424   0.452
## Cumulative % of var.  59.843  76.182  87.489  92.967  96.836  99.259  99.711
##                        Dim.8
## Variance               0.023
## % of var.              0.289
## Cumulative % of var. 100.000
## 
## Individuals (the 10 first)
##                         Dist    Dim.1    ctr   cos2    Dim.2    ctr   cos2  
## 1                   |  1.060 |  0.527  0.008  0.247 |  0.385  0.016  0.132 |
## 2                   |  2.514 | -0.366  0.004  0.021 | -0.932  0.095  0.138 |
## 3                   |  1.328 | -0.958  0.027  0.521 |  0.225  0.006  0.029 |
## 4                   |  2.545 | -2.372  0.168  0.869 | -0.208  0.005  0.007 |
## 5                   |  2.092 | -1.154  0.040  0.304 |  0.946  0.098  0.204 |
## 6                   |  3.673 |  3.498  0.365  0.907 | -0.168  0.003  0.002 |
## 7                   |  2.500 |  2.272  0.154  0.826 | -0.198  0.004  0.006 |
## 8                   |  1.238 | -0.318  0.003  0.066 | -0.260  0.007  0.044 |
## 9                   |  2.365 | -1.734  0.090  0.538 |  0.969  0.103  0.168 |
## 10                  |  1.994 |  0.845  0.021  0.179 |  0.220  0.005  0.012 |
##                      Dim.3    ctr   cos2  
## 1                    0.275  0.012  0.067 |
## 2                    2.200  0.764  0.766 |
## 3                    0.033  0.000  0.001 |
## 4                   -0.228  0.008  0.008 |
## 5                    0.568  0.051  0.074 |
## 6                   -0.253  0.010  0.005 |
## 7                    0.265  0.011  0.011 |
## 8                   -0.073  0.001  0.003 |
## 9                    0.341  0.018  0.021 |
## 10                  -1.646  0.428  0.681 |
## 
## Variables
##                        Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3
## pH_suelo            |  0.210  0.919  0.044 |  0.446 15.187  0.199 |  0.870
## materia_organica    |  0.711 10.552  0.505 |  0.567 24.585  0.321 | -0.234
## humedad_suelo       |  0.621  8.048  0.385 |  0.602 27.716  0.362 | -0.253
## altura_planta       |  0.923 17.798  0.852 | -0.088  0.592  0.008 |  0.028
## diametro_tronco     |  0.935 18.244  0.873 | -0.163  2.031  0.027 |  0.027
## densidad_frutos     |  0.780 12.722  0.609 | -0.522 20.836  0.272 |  0.136
## peso_promedio_fruto |  0.860 15.462  0.740 |  0.077  0.457  0.006 | -0.076
## rendimiento_palta   |  0.882 16.257  0.778 | -0.335  8.596  0.112 |  0.055
##                        ctr   cos2  
## pH_suelo            83.649  0.757 |
## materia_organica     6.062  0.055 |
## humedad_suelo        7.100  0.064 |
## altura_planta        0.089  0.001 |
## diametro_tronco      0.082  0.001 |
## densidad_frutos      2.050  0.019 |
## peso_promedio_fruto  0.634  0.006 |
## rendimiento_palta    0.334  0.003 |

Interpretaciones:

  • De igual manera se puede observar que las dos primeras componentes son mayores a 1, los cuales serán retenidas.

  • También la primera componente explica el 59.84% de la variabilidad total y el autovalor el 16.33%.

  • El 27.716% de la variablilidad total de la dimensión 2 es explicado por la variable humedad del suelo.

  • El 36.2% de la vriabilidad de al variable humedad del suelo es explicado por la dimensión 2.

sum(acp_palta$ind$contrib[,1])#suma de ctr de los individuos sobre la componente 1
## [1] 100
sum(acp_palta$ind$cos2[1,])#suma de los cos2 del individuo 1 sobre todas las componentes
## [1] 1
sum(acp_palta$var$contrib[,3])#suma de los ctr de los cursos sobre la componente 3
## [1] 100
sum(acp_palta$var$cos2[3,])#suma de los cos2 del curso MAT sobre todas las componentes
## [1] 1
# PCA usando FactoMineR (aplicar sobre las variables cuantitativas de palta)
respca = PCA(datosacp_palta, scale.unit = TRUE, ncp = 9, graph = TRUE)

summary(respca)
## 
## Call:
## PCA(X = datosacp_palta, scale.unit = TRUE, ncp = 9, graph = TRUE) 
## 
## 
## Eigenvalues
##                        Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
## Variance               4.787   1.307   0.905   0.438   0.310   0.194   0.036
## % of var.             59.843  16.339  11.308   5.478   3.869   2.424   0.452
## Cumulative % of var.  59.843  76.182  87.489  92.967  96.836  99.259  99.711
##                        Dim.8
## Variance               0.023
## % of var.              0.289
## Cumulative % of var. 100.000
## 
## Individuals (the 10 first)
##                         Dist    Dim.1    ctr   cos2    Dim.2    ctr   cos2  
## 1                   |  1.060 |  0.527  0.008  0.247 |  0.385  0.016  0.132 |
## 2                   |  2.514 | -0.366  0.004  0.021 | -0.932  0.095  0.138 |
## 3                   |  1.328 | -0.958  0.027  0.521 |  0.225  0.006  0.029 |
## 4                   |  2.545 | -2.372  0.168  0.869 | -0.208  0.005  0.007 |
## 5                   |  2.092 | -1.154  0.040  0.304 |  0.946  0.098  0.204 |
## 6                   |  3.673 |  3.498  0.365  0.907 | -0.168  0.003  0.002 |
## 7                   |  2.500 |  2.272  0.154  0.826 | -0.198  0.004  0.006 |
## 8                   |  1.238 | -0.318  0.003  0.066 | -0.260  0.007  0.044 |
## 9                   |  2.365 | -1.734  0.090  0.538 |  0.969  0.103  0.168 |
## 10                  |  1.994 |  0.845  0.021  0.179 |  0.220  0.005  0.012 |
##                      Dim.3    ctr   cos2  
## 1                    0.275  0.012  0.067 |
## 2                    2.200  0.764  0.766 |
## 3                    0.033  0.000  0.001 |
## 4                   -0.228  0.008  0.008 |
## 5                    0.568  0.051  0.074 |
## 6                   -0.253  0.010  0.005 |
## 7                    0.265  0.011  0.011 |
## 8                   -0.073  0.001  0.003 |
## 9                    0.341  0.018  0.021 |
## 10                  -1.646  0.428  0.681 |
## 
## Variables
##                        Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3
## pH_suelo            |  0.210  0.919  0.044 |  0.446 15.187  0.199 |  0.870
## materia_organica    |  0.711 10.552  0.505 |  0.567 24.585  0.321 | -0.234
## humedad_suelo       |  0.621  8.048  0.385 |  0.602 27.716  0.362 | -0.253
## altura_planta       |  0.923 17.798  0.852 | -0.088  0.592  0.008 |  0.028
## diametro_tronco     |  0.935 18.244  0.873 | -0.163  2.031  0.027 |  0.027
## densidad_frutos     |  0.780 12.722  0.609 | -0.522 20.836  0.272 |  0.136
## peso_promedio_fruto |  0.860 15.462  0.740 |  0.077  0.457  0.006 | -0.076
## rendimiento_palta   |  0.882 16.257  0.778 | -0.335  8.596  0.112 |  0.055
##                        ctr   cos2  
## pH_suelo            83.649  0.757 |
## materia_organica     6.062  0.055 |
## humedad_suelo        7.100  0.064 |
## altura_planta        0.089  0.001 |
## diametro_tronco      0.082  0.001 |
## densidad_frutos      2.050  0.019 |
## peso_promedio_fruto  0.634  0.006 |
## rendimiento_palta    0.334  0.003 |
plot(respca, label = "none")

fviz_pca_var(respca, col.var = "steelblue")

respca$eig
##        eigenvalue percentage of variance cumulative percentage of variance
## comp 1 4.78741957             59.8427446                          59.84274
## comp 2 1.30710247             16.3387808                          76.18153
## comp 3 0.90461427             11.3076784                          87.48920
## comp 4 0.43820555              5.4775693                          92.96677
## comp 5 0.30950446              3.8688057                          96.83558
## comp 6 0.19388083              2.4235104                          99.25909
## comp 7 0.03615950              0.4519937                          99.71108
## comp 8 0.02311336              0.2889170                         100.00000
respca$var
## $coord
##                         Dim.1       Dim.2       Dim.3       Dim.4       Dim.5
## pH_suelo            0.2097208  0.44554263  0.86988306  0.01975118  0.02029120
## materia_organica    0.7107370  0.56687757 -0.23418046 -0.08035666  0.10573770
## humedad_suelo       0.6207188  0.60189562 -0.25343498  0.37987512 -0.11267910
## altura_planta       0.9230642 -0.08796785  0.02843996 -0.18487262 -0.30560435
## diametro_tronco     0.9345566 -0.16292239  0.02726978 -0.18112327 -0.22349372
## densidad_frutos     0.7804290 -0.52187551  0.13617658  0.24253026  0.08149353
## peso_promedio_fruto 0.8603576  0.07729892 -0.07572516 -0.30510649  0.33858604
## rendimiento_palta   0.8821959 -0.33519322  0.05492826  0.26107226  0.14349400
##                            Dim.6        Dim.7        Dim.8
## pH_suelo            -0.002003874 -0.002051222  0.001527871
## materia_organica     0.316801282 -0.024176118 -0.008780361
## humedad_suelo       -0.172577754  0.029781014  0.022997471
## altura_planta       -0.003698983  0.069772079 -0.083376172
## diametro_tronco     -0.027582403 -0.090325877  0.087418299
## densidad_frutos      0.150642814  0.095606930  0.052310230
## peso_promedio_fruto -0.196171561  0.041890172  0.010333574
## rendimiento_palta   -0.042186190 -0.103737737 -0.071192401
## 
## $cor
##                         Dim.1       Dim.2       Dim.3       Dim.4       Dim.5
## pH_suelo            0.2097208  0.44554263  0.86988306  0.01975118  0.02029120
## materia_organica    0.7107370  0.56687757 -0.23418046 -0.08035666  0.10573770
## humedad_suelo       0.6207188  0.60189562 -0.25343498  0.37987512 -0.11267910
## altura_planta       0.9230642 -0.08796785  0.02843996 -0.18487262 -0.30560435
## diametro_tronco     0.9345566 -0.16292239  0.02726978 -0.18112327 -0.22349372
## densidad_frutos     0.7804290 -0.52187551  0.13617658  0.24253026  0.08149353
## peso_promedio_fruto 0.8603576  0.07729892 -0.07572516 -0.30510649  0.33858604
## rendimiento_palta   0.8821959 -0.33519322  0.05492826  0.26107226  0.14349400
##                            Dim.6        Dim.7        Dim.8
## pH_suelo            -0.002003874 -0.002051222  0.001527871
## materia_organica     0.316801282 -0.024176118 -0.008780361
## humedad_suelo       -0.172577754  0.029781014  0.022997471
## altura_planta       -0.003698983  0.069772079 -0.083376172
## diametro_tronco     -0.027582403 -0.090325877  0.087418299
## densidad_frutos      0.150642814  0.095606930  0.052310230
## peso_promedio_fruto -0.196171561  0.041890172  0.010333574
## rendimiento_palta   -0.042186190 -0.103737737 -0.071192401
## 
## $cos2
##                          Dim.1       Dim.2        Dim.3        Dim.4
## pH_suelo            0.04398281 0.198508240 0.7566965462 0.0003901092
## materia_organica    0.50514704 0.321350183 0.0548404885 0.0064571932
## humedad_suelo       0.38529182 0.362278334 0.0642292877 0.1443051048
## altura_planta       0.85204751 0.007738342 0.0008088312 0.0341778838
## diametro_tronco     0.87339606 0.026543704 0.0007436411 0.0328056372
## densidad_frutos     0.60906947 0.272354048 0.0185440622 0.0588209247
## peso_promedio_fruto 0.74021525 0.005975123 0.0057343000 0.0930899684
## rendimiento_palta   0.77826959 0.112354494 0.0030171141 0.0681587240
##                           Dim.5        Dim.6        Dim.7        Dim.8
## pH_suelo            0.000411733 4.015512e-06 4.207510e-06 2.334391e-06
## materia_organica    0.011180461 1.003631e-01 5.844847e-04 7.709474e-05
## humedad_suelo       0.012696579 2.978308e-02 8.869088e-04 5.288837e-04
## altura_planta       0.093394017 1.368247e-05 4.868143e-03 6.951586e-03
## diametro_tronco     0.049949441 7.607890e-04 8.158764e-03 7.641959e-03
## densidad_frutos     0.006641196 2.269326e-02 9.140685e-03 2.736360e-03
## peso_promedio_fruto 0.114640506 3.848328e-02 1.754787e-03 1.067828e-04
## rendimiento_palta   0.020590527 1.779675e-03 1.076152e-02 5.068358e-03
## 
## $contrib
##                          Dim.1      Dim.2       Dim.3       Dim.4      Dim.5
## pH_suelo             0.9187165 15.1868920 83.64853070  0.08902424  0.1330297
## materia_organica    10.5515515 24.5849267  6.06230637  1.47355351  3.6123748
## humedad_suelo        8.0480062 27.7161388  7.10018511 32.93091710  4.1022280
## altura_planta       17.7976361  0.5920226  0.08941172  7.79950965 30.1753381
## diametro_tronco     18.2435663  2.0307287  0.08220533  7.48635831 16.1385206
## densidad_frutos     12.7222914 20.8364726  2.04994137 13.42313564  2.1457512
## peso_promedio_fruto 15.4616750  0.4571273  0.63389448 21.24344828 37.0400176
## rendimiento_palta   16.2565570  8.5956914  0.33352492 15.55405328  6.6527400
##                            Dim.6       Dim.7       Dim.8
## pH_suelo             0.002071124  0.01163598  0.01009975
## materia_organica    51.765329489  1.61640710  0.33355057
## humedad_suelo       15.361539705  2.45276863  2.28821653
## altura_planta        0.007057156 13.46297177 30.07605288
## diametro_tronco      0.392400297 22.56326699 33.06295350
## densidad_frutos     11.704745043 25.27879426 11.83886845
## peso_promedio_fruto 19.848935273  4.85290628  0.46199582
## rendimiento_palta    0.917921914 29.76124899 21.92826250
# Gráfico de individuos coloreados por riego_por_goteo 
fviz_pca_ind(respca, col.ind = "#00AFBB", repel = TRUE)

#Determinando conglomerados(clusters) jerarquicos con componentes principales
res.hcpc <- HCPC(respca,nb.clust = 3)

res.hcpc$data.clust
##     pH_suelo materia_organica humedad_suelo altura_planta diametro_tronco
## 1       6.60             4.18          53.1          3.82            13.7
## 2       6.83             2.68          41.7          4.14            14.4
## 3       6.51             3.25          52.6          3.52            11.6
## 4       6.40             3.04          43.3          2.78             9.8
## 5       6.65             3.83          47.4          3.99            14.0
## 6       6.52             4.64          57.8          4.44            17.7
## 7       6.59             4.08          56.1          4.22            15.8
## 8       6.46             3.57          44.7          3.62            13.9
## 9       6.62             3.34          53.8          2.81             9.7
## 10      6.22             4.12          56.3          4.31            15.6
## 11      6.58             5.69          54.9          3.74            13.7
## 12      6.37             3.87          51.5          3.67            13.3
## 13      6.32             5.41          52.6          4.32            16.0
## 14      6.47             4.46          53.5          3.78            14.7
## 15      6.57             2.81          51.6          4.81            17.6
## 16      6.47             2.42          35.0          2.48             9.4
## 17      6.58             2.27          44.3          3.36            12.5
## 18      6.71             3.27          51.0          4.13            14.8
## 19      6.66             4.39          57.9          4.67            17.4
## 20      6.52             4.15          49.4          3.69            12.3
## 21      6.26             3.88          48.2          3.62            12.1
## 22      6.43             3.55          43.1          4.42            16.0
## 23      6.68             2.95          43.6          3.86            16.0
## 24      6.45             4.29          47.3          4.26            16.4
## 25      6.19             3.83          46.9          3.32            11.4
## 26      6.58             3.18          43.8          3.96            15.2
## 27      6.58             4.25          52.8          4.91            18.9
## 28      6.40             4.29          54.6          4.05            14.2
## 29      6.53             4.69          57.0          4.64            16.9
## 30      6.74             3.21          48.2          4.08            14.3
## 31      6.86             5.26          53.9          4.68            15.9
## 32      6.43             4.37          46.5          4.31            14.8
## 33      6.51             5.19          51.5          3.63            13.7
## 34      6.12             2.96          35.7          2.53            11.6
## 35      6.39             3.46          53.4          4.07            14.2
## 36      6.85             2.26          44.2          3.44            12.7
## 37      6.76             3.26          43.6          3.77            14.6
## 38      6.50             4.58          53.8          5.34            18.7
## 39      6.34             3.68          52.1          3.26            11.7
## 40      6.14             1.93          42.7          3.18            12.0
## 41      7.01             5.18          63.3          4.82            17.5
## 42      6.40             1.30          36.5          1.68             6.5
## 43      6.41             3.50          51.8          3.74            13.7
## 44      6.77             4.89          60.5          3.88            14.4
## 45      6.25             2.93          50.0          3.76            12.4
## 46      6.67             4.76          58.4          3.96            14.7
## 47      6.81             4.54          57.4          3.67            14.3
## 48      6.51             3.83          51.5          4.19            15.5
## 49      6.81             4.62          58.9          4.81            17.0
## 50      6.62             3.69          44.8          3.55            12.4
## 51      6.41             3.98          51.7          3.55            11.9
## 52      6.65             4.17          55.5          3.85            13.2
## 53      6.31             2.48          40.4          2.78            10.8
## 54      6.32             2.30          46.5          4.43            15.8
## 55      6.66             3.78          52.1          4.32            16.3
## 56      6.39             3.40          53.0          3.68            14.3
## 57      6.45             2.07          44.0          3.52            12.6
## 58      6.71             5.06          51.1          4.33            16.3
## 59      6.19             2.37          39.4          3.44            12.8
## 60      6.83             3.27          52.1          3.31            11.0
## 61      6.88             4.02          43.8          3.75            15.3
## 62      6.67             4.34          58.4          3.27            10.8
## 63      6.71             6.50          70.6          4.79            16.9
## 64      6.35             2.87          46.2          3.50            13.0
## 65      6.65             5.02          51.3          3.82            13.1
## 66      6.44             4.22          58.1          4.07            14.5
## 67      6.55             3.98          44.1          3.97            13.8
## 68      6.34             2.81          37.1          3.52            13.6
## 69      6.74             5.36          52.8          4.92            18.2
## 70      6.54             2.67          47.8          3.63            13.6
## 71      6.72             3.93          42.0          3.50            12.4
## 72      6.82             2.97          39.2          4.34            17.2
## 73      6.44             5.43          55.7          4.26            16.3
## 74      6.68             3.78          52.9          4.00            13.8
## 75      6.19             2.59          48.7          3.87            13.0
## 76      6.57             5.86          69.5          4.74            16.0
## 77      6.69             3.57          54.0          3.10            10.6
## 78      6.33             2.98          42.4          5.25            18.6
## 79      6.58             4.53          57.6          3.95            16.1
## 80      6.24             3.54          47.5          4.38            16.9
## 81      6.45             3.89          56.0          4.49            15.4
## 82      6.49             4.17          47.6          3.43            12.7
## 83      6.40             3.69          54.3          3.84            12.3
## 84      6.06             3.61          43.1          3.00            11.0
## 85      6.50             3.51          48.0          3.66            13.2
## 86      6.56             2.15          45.9          3.65            13.5
## 87      6.49             2.79          42.5          2.84             7.7
## 88      6.47             3.84          46.1          5.66            19.0
## 89      6.76             5.02          48.8          4.92            18.1
## 90      6.71             4.19          58.2          3.94            14.2
## 91      6.01             3.59          50.7          3.65            14.4
## 92      6.71             3.39          45.3          3.34            12.0
## 93      6.15             3.62          53.8          2.77            11.1
## 94      6.44             3.09          45.8          3.85            13.8
## 95      6.29             3.25          51.4          4.91            18.4
## 96      6.34             3.47          50.2          3.17            11.1
## 97      6.72             3.05          44.4          3.23            11.8
## 98      6.67             4.15          60.7          3.58            12.0
## 99      6.57             2.39          47.4          3.47            13.3
## 100     6.10             3.45          52.6          2.97             9.8
## 101     6.54             3.61          53.8          1.86             8.0
## 102     6.58             2.71          46.1          3.94            14.5
## 103     6.70             3.72          54.8          4.83            17.7
## 104     6.31             3.47          42.2          3.51            11.9
## 105     6.76             4.58          57.8          4.56            16.5
## 106     6.23             5.08          52.1          4.05            15.2
## 107     6.83             3.53          42.1          4.60            16.9
## 108     6.35             3.59          46.5          4.40            15.9
## 109     6.59             2.86          48.7          3.33            12.5
## 110     6.52             3.69          54.4          3.23            12.2
## 111     6.31             3.13          47.6          3.78            13.2
## 112     6.71             4.26          53.4          3.76            14.1
## 113     6.50             3.53          52.8          3.20            11.4
## 114     6.66             3.84          48.3          4.21            14.5
## 115     6.51             3.18          42.1          3.78            13.9
## 116     6.57             1.32          38.9          3.22            11.9
## 117     6.52             3.87          52.0          3.68            11.2
## 118     6.76             3.33          47.3          3.71            12.7
## 119     6.37             2.75          52.3          4.13            16.9
## 120     6.68             4.66          56.8          5.16            18.2
## 121     6.59             4.34          48.2          4.22            15.5
## 122     6.74             3.99          52.8          5.27            18.4
## 123     6.33             3.52          50.8          4.16            15.4
## 124     6.54             3.85          53.0          4.21            15.3
## 125     6.38             4.09          54.2          4.59            17.1
## 126     6.72             3.56          51.2          4.20            15.0
## 127     6.34             2.88          45.9          4.95            19.5
## 128     6.85             2.88          50.4          2.10             7.0
## 129     6.57             1.69          45.8          2.70             9.4
## 130     6.46             2.96          39.5          3.65            13.2
## 131     6.75             3.00          40.5          3.44            12.2
## 132     6.45             3.32          42.3          2.78            10.1
## 133     6.61             3.24          45.5          3.70            14.1
## 134     6.58             3.23          41.5          3.67            13.4
## 135     6.61             4.04          53.0          4.17            15.7
## 136     6.44             5.43          53.6          5.32            18.3
## 137     6.21             3.77          39.8          4.12            15.8
## 138     6.15             4.42          44.3          3.16            11.4
## 139     6.48             4.88          53.9          4.31            14.6
## 140     6.53             1.19          40.4          2.36             8.2
## 141     6.44             3.33          46.5          2.70             9.8
## 142     6.36             5.72          65.2          5.62            20.9
## 143     7.04             5.51          58.7          5.65            20.8
## 144     6.65             4.01          53.4          3.86            13.9
## 145     6.85             3.91          44.9          4.99            19.1
## 146     6.75             3.40          49.0          2.54             9.0
## 147     6.35             3.32          52.8          3.56            14.2
## 148     6.49             3.70          57.4          4.04            13.9
## 149     6.17             2.95          47.2          3.59            13.3
## 150     6.67             3.73          47.7          4.18            14.2
## 151     6.86             3.90          46.9          5.18            17.9
## 152     6.28             3.95          54.0          4.56            16.9
## 153     6.30             4.84          60.0          3.86            15.5
## 154     6.64             3.23          47.2          4.45            17.0
## 155     6.23             3.83          50.2          3.27            12.3
## 156     6.94             3.79          59.2          2.22             7.7
## 157     6.57             3.91          52.6          4.44            16.4
## 158     6.21             4.00          56.4          3.63            12.5
## 159     6.55             2.69          45.6          2.57             9.4
## 160     6.54             4.95          60.5          5.33            20.3
## 161     6.02             3.61          56.4          4.76            16.9
## 162     6.47             2.55          50.6          3.03            10.3
## 163     6.40             4.54          44.5          4.64            17.7
## 164     6.26             2.24          43.0          3.06             9.8
## 165     6.54             4.21          54.8          3.89            15.4
## 166     6.71             3.89          56.2          4.32            15.2
## 167     6.74             1.00          29.7          2.95            10.3
## 168     5.90             1.93          41.8          2.50             9.2
## 169     6.59             3.01          48.8          3.41            14.2
## 170     6.23             3.36          47.2          3.75            14.1
## 171     6.75             3.21          47.6          2.21             6.6
## 172     6.52             2.03          41.0          3.67            13.5
## 173     6.68             1.82          35.1          2.13             9.2
## 174     6.17             3.50          39.1          3.56            13.4
## 175     6.58             3.32          41.7          3.18            12.7
## 176     6.60             5.21          55.1          5.40            20.4
## 177     6.65             2.55          48.8          4.39            14.2
## 178     6.51             4.68          55.7          4.21            15.9
## 179     6.75             4.43          45.4          4.60            16.7
## 180     6.43             4.14          55.2          4.41            15.7
## 181     6.37             2.93          38.5          3.05            12.4
## 182     6.60             5.12          62.2          5.01            18.7
## 183     6.28             3.89          43.3          4.49            17.2
## 184     6.32             1.93          39.8          2.06             6.9
## 185     6.71             4.78          56.0          4.61            17.3
## 186     6.73             2.50          42.6          2.62            10.0
## 187     6.71             3.41          53.3          3.03            10.7
## 188     6.39             2.51          46.7          4.14            15.4
## 189     6.60             3.70          45.7          2.46             7.4
## 190     6.57             3.75          49.3          3.70            13.0
## 191     6.21             3.74          55.6          3.61            15.8
## 192     6.59             5.25          60.1          4.42            15.5
## 193     6.41             5.76          55.8          4.90            18.5
## 194     6.25             3.86          46.9          3.75            15.3
## 195     6.61             3.52          42.8          3.56            13.3
## 196     6.39             4.53          55.0          4.92            18.1
## 197     6.48             3.73          55.2          4.05            15.2
## 198     6.33             3.47          41.7          3.54            11.9
## 199     6.58             4.90          59.2          3.64            13.3
## 200     6.62             4.42          55.5          6.32            23.6
## 201     6.65             5.48          60.5          4.63            16.6
## 202     6.32             4.73          44.3          4.43            16.6
## 203     6.77             4.41          47.1          3.90            14.2
## 204     6.82             4.66          59.8          4.20            15.8
## 205     6.64             5.11          59.4          5.24            19.0
## 206     6.48             2.95          39.1          2.99            10.6
## 207     6.46             3.25          48.0          4.29            16.3
## 208     6.58             4.28          54.3          4.65            17.7
## 209     6.57             4.15          54.7          4.00            14.8
## 210     6.53             3.00          51.3          4.93            17.3
## 211     6.67             3.79          57.2          2.69             9.1
## 212     6.47             3.92          51.7          5.25            18.0
## 213     6.71             3.80          53.6          3.98            13.8
## 214     6.48             4.21          46.1          4.90            19.0
## 215     6.15             3.44          52.4          2.53             7.4
## 216     6.53             5.05          49.7          4.47            17.1
## 217     6.61             4.25          55.7          4.45            16.5
## 218     6.82             5.19          58.6          4.30            14.4
## 219     6.51             3.46          45.1          3.62            12.3
## 220     6.17             3.78          44.9          4.36            15.1
## 221     6.55             4.72          58.3          4.94            19.0
## 222     6.29             3.32          39.9          2.74            11.3
## 223     6.33             3.33          44.6          4.00            15.0
## 224     6.28             4.42          49.5          4.31            17.6
## 225     6.33             3.54          53.5          3.38            13.4
## 226     6.74             4.42          58.1          5.03            19.0
## 227     6.34             3.70          50.2          3.49            12.4
## 228     6.46             4.78          58.2          3.23            12.1
## 229     6.53             3.65          44.3          3.46            11.1
## 230     6.67             4.72          50.2          5.27            18.6
## 231     6.34             4.24          45.9          3.87            14.1
## 232     6.33             3.07          49.7          4.00            14.1
## 233     6.39             3.89          56.8          3.48            13.9
## 234     6.15             2.43          46.4          3.32            12.3
## 235     6.62             3.31          45.7          4.03            15.7
## 236     6.06             3.72          52.0          3.13            11.1
## 237     6.38             3.77          50.7          3.75            14.8
## 238     6.15             2.99          46.1          4.34            17.3
## 239     6.01             2.27          43.1          3.12            11.6
## 240     6.49             3.34          45.1          4.55            15.2
## 241     6.84             4.07          55.5          3.75            12.9
## 242     6.92             4.79          52.0          4.69            16.2
## 243     6.39             3.95          54.7          3.75            13.4
## 244     6.44             4.88          51.5          3.97            14.4
## 245     6.40             2.78          50.9          1.66             6.7
## 246     6.65             3.22          44.2          3.98            14.4
## 247     6.00             3.47          49.0          3.86            14.2
## 248     6.51             2.98          39.5          3.31            12.0
## 249     6.42             3.09          41.2          3.86            13.2
## 250     6.40             3.56          44.6          2.86             9.8
## 251     6.06             3.19          51.8          3.37            11.9
## 252     6.44             3.54          54.7          3.94            13.2
## 253     6.11             2.89          46.0          2.80            10.1
## 254     6.51             3.27          52.7          4.27            15.9
## 255     6.34             3.45          50.1          3.74            12.6
## 256     6.54             4.86          49.3          3.83            14.5
## 257     6.53             2.70          47.6          2.26            10.2
## 258     6.40             3.46          51.6          3.84            13.1
## 259     6.25             1.92          42.9          3.57            13.6
## 260     6.38             3.64          42.0          2.68            10.3
## 261     6.43             5.87          54.9          3.96            14.4
## 262     6.18             2.67          40.0          4.21            14.5
## 263     6.38             4.72          51.1          4.52            15.8
## 264     6.42             2.70          37.9          3.71            13.6
## 265     6.43             3.98          54.4          3.91            14.2
## 266     6.59             4.21          53.2          4.84            18.2
## 267     6.72             3.43          49.6          3.57            13.2
## 268     6.48             1.66          43.0          3.33            12.7
## 269     6.86             5.06          58.8          4.69            17.0
## 270     6.39             3.49          50.9          3.72            14.2
## 271     6.74             4.33          46.3          4.06            15.2
## 272     6.52             1.46          40.9          3.70            14.1
## 273     6.36             5.61          65.2          6.12            22.1
## 274     6.75             6.43          68.3          4.71            16.1
## 275     6.26             3.10          39.3          3.35            11.8
## 276     6.73             5.26          51.0          3.75            13.1
## 277     6.45             4.96          50.4          4.03            14.1
## 278     6.42             3.00          47.1          3.86            13.4
## 279     6.35             2.28          47.2          3.56            12.8
## 280     6.24             1.71          39.3          2.54             9.1
## 281     6.80             2.89          42.0          3.19            11.5
## 282     6.73             5.36          60.1          4.25            14.9
## 283     6.62             3.37          52.1          4.48            16.7
## 284     6.50             3.89          56.1          4.27            15.2
## 285     6.64             3.71          52.1          3.63            13.9
## 286     6.54             2.40          46.1          3.64            13.7
## 287     6.86             3.51          54.4          3.73            14.1
## 288     6.60             2.46          45.4          3.41            12.9
## 289     6.45             3.18          50.5          4.08            15.9
## 290     6.44             3.26          43.7          3.01            11.1
## 291     6.40             2.77          48.7          3.35            12.0
## 292     6.50             3.86          55.0          4.60            16.7
## 293     6.42             3.53          50.1          2.88            11.0
## 294     6.71             3.05          41.6          3.23            11.2
## 295     5.96             3.20          40.4          3.99            15.6
## 296     6.32             3.93          43.8          3.57            13.7
## 297     6.42             3.33          41.9          4.01            15.1
## 298     6.26             4.21          53.9          3.90            13.5
## 299     6.78             3.10          47.5          3.48            12.9
## 300     6.47             3.07          45.5          2.62             9.9
## 301     6.27             3.70          42.8          3.33            12.6
## 302     6.25             3.09          48.8          3.37            13.0
## 303     6.63             2.57          37.2          3.79            13.3
## 304     6.92             5.17          51.5          5.60            20.9
## 305     6.52             5.60          54.5          4.35            16.0
## 306     6.62             4.80          58.2          3.48            13.3
## 307     6.31             4.24          56.1          3.86            13.5
## 308     6.69             2.82          47.5          3.38            12.0
## 309     6.61             2.90          47.8          4.06            14.6
## 310     6.05             4.00          55.1          4.08            13.5
## 311     6.47             4.70          59.8          5.35            20.3
## 312     6.46             3.45          50.3          3.34            11.0
## 313     6.34             3.65          43.5          3.69            14.1
## 314     6.48             5.28          60.5          4.95            16.9
## 315     6.21             1.55          40.4          2.79            11.8
## 316     6.56             4.89          49.2          3.98            15.0
## 317     6.63             5.27          49.7          4.24            15.2
## 318     6.71             5.01          57.5          4.58            17.0
## 319     6.61             3.95          55.0          2.72             8.7
## 320     6.84             3.01          44.8          3.92            12.4
## 321     6.40             3.03          41.7          4.29            14.5
## 322     6.00             2.86          45.5          3.17            11.7
## 323     6.57             5.33          60.4          4.27            16.0
## 324     6.56             2.47          39.9          3.36            12.0
## 325     6.37             2.61          48.1          4.22            15.5
## 326     6.81             3.97          56.4          2.74             9.2
## 327     6.66             3.24          43.1          4.72            18.1
## 328     6.58             2.81          49.2          2.12             6.7
## 329     6.45             2.01          46.5          3.03            11.2
## 330     6.42             4.98          48.9          3.95            13.8
## 331     6.49             3.30          44.5          2.12             8.2
## 332     6.61             4.00          54.0          3.54            13.7
## 333     6.72             2.99          43.0          2.69             9.9
## 334     6.47             4.13          50.0          2.99            11.2
## 335     6.39             4.65          58.6          4.36            14.5
## 336     6.90             2.97          45.7          2.68            10.0
## 337     6.60             2.69          39.8          3.00            10.5
## 338     6.32             4.44          46.0          4.17            15.6
## 339     6.72             4.34          48.3          3.14            11.7
## 340     6.45             2.59          37.6          2.48             8.5
## 341     6.64             2.92          50.5          4.64            18.2
## 342     6.46             3.38          48.9          4.54            16.0
## 343     6.54             4.56          59.2          3.92            12.3
## 344     6.58             5.48          63.3          4.54            17.6
## 345     6.62             3.30          51.5          3.48            12.8
## 346     6.32             1.95          46.8          3.53            12.7
## 347     6.39             3.84          46.1          2.20             8.5
## 348     6.52             4.20          55.2          4.33            14.8
## 349     6.54             4.12          54.9          4.48            17.3
## 350     6.41             4.00          43.2          3.58            14.6
## 351     6.51             3.97          53.6          4.35            14.9
## 352     6.25             3.45          41.0          3.53            13.0
## 353     6.25             4.41          59.3          4.87            17.5
## 354     6.86             3.97          49.1          4.03            15.2
## 355     6.59             4.71          47.0          4.45            15.1
## 356     6.49             4.00          47.3          2.43             8.6
## 357     6.47             5.20          50.3          4.30            14.8
## 358     6.73             4.02          58.8          3.57            12.3
## 359     6.37             1.29          40.5          2.75             9.4
## 360     6.52             4.63          48.8          3.89            15.5
## 361     6.45             4.38          57.0          3.77            14.0
## 362     6.43             3.38          52.7          2.98            10.4
## 363     6.56             1.99          38.1          3.09            11.7
## 364     6.57             3.66          54.7          4.23            14.3
## 365     6.78             2.55          50.1          4.23            14.4
## 366     6.29             4.82          46.7          4.48            15.6
## 367     6.50             5.02          56.6          4.89            17.0
## 368     6.45             3.10          45.8          4.02            14.4
## 369     6.33             5.02          59.0          3.73            13.6
## 370     6.73             4.95          61.6          5.15            17.6
## 371     6.47             3.85          51.2          3.93            14.6
## 372     6.27             5.34          61.6          4.13            15.3
## 373     6.40             3.89          46.9          4.47            15.9
## 374     6.31             5.33          60.8          5.05            19.1
## 375     6.68             3.15          49.1          4.13            16.2
## 376     7.09             4.55          49.3          5.08            19.7
## 377     6.37             3.05          40.9          2.93            10.3
## 378     6.52             3.19          52.1          3.18            11.6
## 379     6.55             3.14          53.0          3.67            12.6
## 380     7.03             3.02          40.1          3.37            12.3
## 381     6.07             4.19          55.7          3.85            12.7
## 382     6.32             1.65          34.4          2.65            10.4
## 383     6.28             4.17          57.0          3.56            11.5
## 384     6.47             3.40          43.7          4.45            16.5
## 385     6.31             2.26          44.3          1.52             5.8
## 386     6.37             3.29          40.7          3.45            11.6
## 387     6.76             1.53          42.3          3.41            13.1
## 388     6.58             3.65          53.8          3.61            12.4
## 389     6.96             3.79          50.3          5.09            18.6
## 390     6.63             2.96          44.1          2.18             7.7
## 391     6.25             3.93          45.0          4.02            15.8
## 392     6.42             4.45          59.2          3.40            12.3
## 393     6.52             2.82          41.0          1.55             5.6
## 394     6.41             3.83          45.4          3.77            13.7
## 395     6.59             4.21          55.5          3.87            13.2
## 396     6.59             3.23          49.5          3.70            14.1
## 397     6.50             3.58          48.2          3.49            13.3
## 398     6.37             3.28          48.2          3.05            12.3
## 399     6.40             4.23          56.0          3.55            12.2
## 400     6.24             2.90          40.1          2.84            10.2
## 401     6.66             5.66          55.8          5.20            18.4
## 402     6.71             5.08          59.8          4.35            17.4
## 403     6.53             3.47          46.2          3.78            13.5
## 404     6.72             5.30          62.6          5.06            19.6
## 405     6.92             3.59          52.4          4.67            16.9
## 406     6.91             4.30          56.6          3.96            14.2
## 407     6.44             5.12          51.6          3.61            13.5
## 408     6.68             4.97          60.8          3.71            13.4
## 409     6.40             4.54          54.8          4.17            16.0
## 410     6.66             4.79          51.1          5.21            18.1
## 411     6.44             2.00          43.6          2.74            10.3
## 412     6.59             4.89          55.3          5.38            19.1
## 413     6.35             4.20          54.4          3.80            14.0
## 414     6.77             3.88          48.7          4.12            15.0
## 415     6.50             3.38          54.9          2.95            11.3
## 416     6.40             3.02          48.6          3.28            11.4
## 417     6.48             3.10          43.5          2.91            11.4
## 418     6.55             4.82          58.8          4.40            16.2
## 419     6.84             3.91          56.1          4.58            15.1
## 420     6.24             3.62          49.4          3.66            14.6
## 421     6.98             3.14          47.7          3.31            12.4
## 422     6.28             1.51          36.2          1.28             4.8
## 423     6.49             3.28          47.8          3.81            15.4
## 424     6.08             3.57          49.0          3.51            12.4
## 425     6.28             2.82          40.1          1.82             6.3
## 426     6.56             2.67          38.0          2.26             9.1
## 427     6.66             4.64          62.8          4.84            17.6
## 428     6.55             3.64          52.4          4.69            17.0
## 429     6.31             2.20          43.3          3.91            12.3
## 430     6.13             4.91          48.2          4.56            16.5
## 431     6.35             5.10          55.8          4.70            17.5
## 432     6.49             4.70          55.4          4.21            15.7
## 433     6.65             5.28          61.0          4.26            15.7
## 434     6.73             5.40          54.5          5.85            21.1
## 435     6.40             3.34          49.1          3.69            14.9
## 436     6.51             4.00          50.2          1.96             7.9
## 437     6.44             2.87          47.1          3.24            10.7
## 438     6.51             3.35          51.4          3.67            13.2
## 439     6.92             6.82          69.4          5.17            18.0
## 440     6.40             4.27          61.2          3.64            12.7
## 441     6.50             4.32          57.7          4.19            14.4
## 442     6.46             2.20          48.6          3.23            11.8
## 443     6.19             2.41          37.0          2.89            11.0
## 444     6.43             5.95          61.7          4.19            15.2
## 445     6.49             2.30          39.3          2.69            10.4
## 446     6.60             3.59          41.4          3.80            13.8
## 447     6.77             5.12          49.1          4.86            17.2
## 448     6.46             4.90          60.3          3.97            14.7
## 449     6.85             4.45          57.3          4.65            16.3
## 450     6.32             3.01          43.5          3.85            13.6
## 451     6.14             3.68          54.4          5.00            18.6
## 452     6.10             4.51          57.4          4.54            16.6
## 453     6.68             3.25          50.4          3.25            11.9
## 454     6.59             4.25          57.0          5.29            18.8
## 455     6.53             5.49          61.9          5.67            21.4
## 456     6.55             5.49          58.6          4.15            14.2
## 457     6.84             3.77          45.7          4.22            14.7
## 458     6.70             2.40          39.9          3.25            11.7
## 459     6.35             5.71          60.5          4.03            14.9
## 460     6.27             4.00          55.4          4.08            14.2
## 461     6.71             3.20          38.4          3.18            11.7
## 462     6.53             2.74          46.9          4.11            15.2
## 463     6.44             3.04          48.3          3.48            12.0
## 464     6.64             4.07          55.7          4.79            17.9
## 465     6.08             3.04          49.2          3.42            11.9
## 466     6.39             3.04          52.9          3.56            11.4
## 467     6.57             4.01          52.3          4.05            15.6
## 468     6.52             4.43          47.4          2.91            10.8
## 469     6.24             3.06          46.1          4.23            14.3
## 470     6.69             3.99          46.7          4.12            15.8
## 471     6.74             2.96          52.2          3.14            11.9
## 472     6.30             3.10          41.5          3.63            13.1
## 473     6.43             3.27          53.2          3.58            12.9
## 474     6.63             3.79          43.9          2.28             8.1
## 475     6.67             3.27          41.1          2.92            10.2
## 476     6.40             4.43          56.5          3.98            14.0
## 477     6.40             5.22          54.6          5.71            21.2
## 478     6.50             1.20          37.8          2.61             9.9
## 479     6.11             3.36          47.9          4.08            14.9
## 480     6.34             4.14          47.6          2.99            12.3
## 481     6.74             5.24          62.6          3.85            13.6
## 482     6.18             3.70          40.8          3.37            12.6
## 483     6.26             3.23          47.5          4.53            17.0
## 484     6.44             3.93          45.9          4.43            17.4
## 485     6.46             4.06          48.6          3.92            14.1
## 486     6.20             4.24          55.7          4.28            15.8
## 487     6.59             3.12          52.6          3.26            12.6
## 488     6.30             4.24          46.0          4.09            16.8
## 489     6.48             3.83          53.3          4.48            16.6
## 490     6.50             5.08          54.1          4.58            16.6
## 491     6.69             4.25          48.5          3.94            12.8
## 492     6.50             5.00          58.5          4.66            16.0
## 493     6.47             2.47          46.0          3.39            12.3
## 494     6.90             5.76          55.3          4.67            16.9
## 495     6.58             4.05          53.2          3.06            10.6
## 496     6.70             3.98          44.7          2.75             8.7
## 497     6.59             4.04          52.1          4.38            15.5
## 498     6.65             3.88          54.0          2.76            10.7
## 499     6.69             2.70          38.8          4.53            17.4
## 500     6.48             3.33          45.3          2.23             7.8
## 501     6.55             4.09          54.4          2.48            10.7
## 502     6.86             3.57          50.9          3.90            14.6
## 503     6.34             2.35          48.1          2.69             9.9
## 504     6.81             5.13          64.8          3.63            12.4
## 505     6.42             4.10          55.6          4.39            15.9
## 506     6.78             3.32          51.7          3.89            15.4
## 507     6.39             3.77          54.7          3.56            12.3
## 508     6.28             2.67          46.9          3.82            14.0
## 509     6.65             3.31          37.8          2.73            10.4
## 510     6.72             5.00          56.9          4.72            16.0
## 511     6.58             2.15          44.5          3.10            11.1
## 512     6.60             4.75          56.3          3.90            14.6
## 513     6.55             3.61          42.2          3.55            11.1
## 514     6.94             4.95          57.8          4.02            13.4
## 515     6.19             3.39          44.7          4.53            15.8
## 516     6.25             3.20          47.2          3.95            15.1
## 517     6.29             3.80          54.8          4.63            16.8
## 518     6.70             4.80          49.2          3.63            13.3
## 519     6.44             3.01          51.3          2.59             9.2
## 520     6.48             3.61          44.6          3.98            15.3
## 521     6.92             4.20          56.5          4.01            14.4
## 522     6.35             3.35          49.2          4.04            15.5
## 523     6.87             3.10          51.1          4.17            14.2
## 524     6.19             3.68          54.1          3.84            13.6
## 525     6.68             3.58          50.0          4.20            16.6
## 526     6.61             3.75          52.8          3.49            11.0
## 527     6.43             3.62          44.8          3.51            10.6
## 528     6.48             2.97          56.0          3.97            13.9
## 529     6.77             4.44          47.4          4.44            16.4
## 530     6.82             3.97          50.0          4.22            15.2
## 531     6.12             2.74          36.9          3.11            11.4
## 532     7.23             3.48          43.5          3.64            13.5
## 533     6.94             1.56          45.1          1.73             6.5
## 534     6.42             3.96          49.9          3.72            13.7
## 535     6.45             2.81          48.8          3.96            14.1
## 536     6.38             3.30          44.2          3.24            11.8
## 537     6.44             2.28          44.9          3.56            11.7
## 538     6.62             3.51          41.9          3.97            14.5
## 539     6.61             5.37          60.7          4.29            16.6
## 540     6.57             3.89          52.8          4.29            15.3
## 541     6.69             1.76          32.7          2.25             7.1
## 542     6.07             3.04          49.1          3.52            13.3
## 543     6.38             3.77          45.5          5.44            20.3
## 544     6.47             2.57          48.1          3.09            10.7
## 545     6.35             4.01          49.6          4.50            16.6
## 546     6.72             4.32          42.6          4.02            14.2
## 547     6.39             3.96          54.3          4.72            17.2
## 548     6.51             5.12          52.8          4.17            14.3
## 549     6.63             1.48          32.0          2.41             8.8
## 550     6.71             4.92          55.7          4.66            17.3
## 551     6.46             3.39          51.1          4.12            16.0
## 552     6.47             4.91          57.1          4.42            16.4
## 553     6.19             3.79          53.2          4.37            17.1
## 554     6.33             2.40          36.5          3.64            13.5
## 555     6.93             2.02          50.4          2.92            10.6
## 556     6.48             3.86          51.6          4.46            17.4
## 557     6.81             5.02          53.2          5.75            20.3
## 558     6.51             4.22          53.9          4.69            17.2
## 559     6.71             5.68          62.6          4.34            16.9
## 560     6.54             4.71          62.5          3.19            11.4
## 561     6.83             4.56          57.2          4.22            15.3
## 562     6.44             5.01          52.6          4.95            18.2
## 563     6.18             3.25          41.8          3.38            12.1
## 564     6.65             2.93          51.9          2.42             9.3
## 565     6.43             3.03          42.3          3.17            12.1
## 566     6.71             1.53          32.3          2.57             9.6
## 567     6.52             3.49          52.4          4.82            18.7
## 568     6.84             4.71          49.4          4.21            14.9
## 569     6.62             4.45          58.4          3.87            14.0
## 570     6.43             4.07          44.8          3.45            12.6
## 571     6.62             2.58          48.4          2.94            10.1
## 572     6.57             6.76          65.1          4.10            14.3
## 573     6.87             3.74          56.6          4.07            15.6
## 574     6.60             5.07          61.0          5.10            17.4
## 575     6.08             4.39          47.7          3.96            15.6
## 576     6.40             4.36          48.2          3.67            12.9
## 577     6.20             3.95          56.3          4.61            18.1
## 578     6.15             5.22          62.2          4.09            14.7
## 579     6.50             3.17          51.4          4.55            17.1
## 580     6.67             3.57          54.8          4.23            14.8
## 581     6.24             1.37          32.8          3.05            11.4
## 582     6.21             3.32          44.0          3.30            12.2
## 583     6.31             2.81          39.4          3.10            11.6
## 584     6.25             4.35          59.1          3.01            11.2
## 585     6.63             4.36          46.3          3.84            14.1
## 586     6.60             3.10          50.2          3.79            13.7
## 587     6.25             5.23          61.0          5.44            19.3
## 588     6.43             4.55          47.7          3.77            14.9
## 589     6.66             2.58          41.4          2.99            10.1
## 590     6.49             4.10          52.7          4.18            15.9
## 591     6.44             3.10          51.2          3.68            14.2
## 592     6.56             3.51          49.2          3.32            12.9
## 593     6.71             4.51          48.5          3.54            11.8
## 594     6.81             4.61          60.3          4.68            17.1
## 595     6.71             4.06          55.7          4.35            14.2
## 596     6.20             2.73          36.4          2.52             8.6
## 597     6.33             2.54          48.3          3.22            12.6
## 598     6.50             3.48          45.2          3.84            14.1
## 599     6.53             4.88          49.6          3.52            12.0
## 600     6.05             4.00          50.5          3.34            12.7
## 601     6.24             1.00          37.6          1.59             6.3
## 602     6.69             3.16          42.5          3.97            13.1
## 603     6.60             5.23          60.4          5.13            19.5
## 604     6.24             4.82          57.1          3.43            13.4
## 605     6.50             3.24          49.4          4.39            15.9
## 606     6.39             3.31          41.5          3.83            14.2
## 607     6.59             2.54          45.2          4.28            15.3
## 608     6.92             2.51          35.9          3.80            13.5
## 609     6.24             5.05          57.7          4.46            15.4
## 610     6.30             1.03          35.4          2.74             9.8
## 611     6.52             3.69          47.6          4.42            17.3
## 612     6.07             3.29          54.9          3.94            14.8
## 613     6.52             4.40          54.2          5.01            19.6
## 614     6.30             2.11          34.2          3.18            10.8
## 615     6.91             3.46          49.1          3.43            12.5
## 616     5.89             2.10          39.3          2.97            10.1
## 617     6.85             5.10          52.0          5.95            22.5
## 618     6.75             4.02          48.6          3.38            11.9
## 619     6.67             4.34          49.6          5.45            21.2
## 620     6.61             4.09          57.3          3.69            12.8
## 621     6.33             3.98          46.0          4.10            15.0
## 622     6.77             3.78          44.3          3.28            10.9
## 623     6.32             4.36          47.3          4.51            16.5
## 624     6.61             2.33          45.1          4.48            15.8
## 625     6.63             4.75          55.8          4.24            15.1
## 626     6.78             3.78          52.9          4.16            14.7
## 627     6.42             4.32          58.5          4.41            15.1
## 628     6.36             2.99          38.6          4.56            16.2
## 629     6.54             2.52          46.6          3.73            13.9
## 630     6.63             5.71          64.9          4.25            15.6
## 631     6.79             4.55          49.4          3.61            13.7
## 632     6.64             3.87          48.0          3.32            11.2
## 633     6.51             3.77          53.2          2.76             9.8
## 634     6.73             5.11          52.0          4.49            16.6
## 635     6.35             1.65          39.0          2.74            10.2
## 636     6.75             3.88          53.2          3.90            14.5
## 637     6.25             3.80          41.2          4.86            17.5
## 638     6.44             2.02          33.6          2.51            10.8
## 639     6.09             3.33          45.4          2.91            11.2
## 640     6.56             4.71          57.3          4.74            17.6
## 641     6.23             3.16          50.5          4.09            13.5
## 642     6.37             1.33          34.5          2.62             9.6
## 643     6.09             2.53          39.2          4.12            15.5
## 644     6.46             4.72          59.4          4.80            16.6
## 645     6.32             3.76          51.9          3.51            12.3
## 646     6.64             4.55          48.7          3.92            15.0
## 647     6.36             2.95          40.9          3.44            12.1
## 648     6.33             3.72          53.7          5.21            18.7
## 649     6.75             3.76          53.4          5.15            18.7
## 650     6.83             3.97          44.6          4.35            15.8
## 651     6.71             3.56          45.6          3.79            13.2
## 652     6.18             2.73          38.8          2.89            10.6
## 653     6.60             1.29          41.2          3.06            10.7
## 654     6.35             4.25          55.8          2.85            10.8
## 655     6.58             4.90          53.8          4.04            14.7
## 656     6.59             2.32          40.1          3.37            11.5
## 657     6.45             3.38          45.7          2.43             8.8
## 658     6.54             5.56          62.1          2.68             9.2
## 659     6.57             4.31          58.1          3.69            13.0
## 660     6.65             4.58          54.0          4.75            16.2
## 661     6.53             3.04          41.4          2.00             7.3
## 662     6.28             5.23          54.6          3.86            13.8
## 663     6.41             3.55          51.7          3.79            14.3
## 664     6.60             3.97          47.2          4.47            16.5
## 665     6.63             3.54          55.0          2.71             9.1
## 666     6.42             2.52          47.1          2.69             8.9
## 667     6.34             2.74          41.9          2.73            10.0
## 668     6.18             2.51          46.3          2.82            11.0
## 669     6.44             4.60          52.1          4.16            15.2
## 670     6.48             3.32          49.0          3.50            13.8
## 671     6.39             3.58          53.9          3.13            10.8
## 672     6.63             3.62          52.0          3.98            14.0
## 673     6.55             3.24          51.2          3.37            12.1
## 674     6.12             3.08          46.9          3.77            14.9
## 675     6.58             4.44          57.2          4.54            16.6
## 676     6.50             2.82          52.1          3.50            12.5
## 677     6.38             2.82          42.2          2.76            10.4
## 678     6.44             3.22          51.2          4.33            15.5
## 679     6.36             2.85          46.5          2.68             8.7
## 680     6.45             3.74          53.8          4.52            15.7
## 681     6.38             4.33          49.4          3.52            11.8
## 682     6.51             2.38          33.3          3.91            16.1
## 683     6.28             4.55          48.4          4.39            17.5
## 684     6.43             3.75          45.7          3.25            12.3
## 685     6.27             3.70          43.1          3.99            13.9
## 686     6.32             3.17          49.5          4.26            16.2
## 687     6.47             3.82          55.8          3.93            13.8
## 688     6.39             3.87          56.9          4.20            15.5
## 689     6.35             3.43          53.7          3.29            11.7
## 690     6.46             2.93          51.5          2.94            11.3
## 691     6.18             4.03          54.1          3.45            12.9
## 692     6.49             3.07          41.6          4.33            16.1
## 693     6.62             2.90          51.7          3.45            12.7
## 694     6.34             4.91          63.0          4.29            15.0
## 695     6.26             3.63          52.6          3.90            14.6
## 696     6.90             3.64          53.1          4.65            18.2
## 697     6.49             3.83          49.1          4.55            16.4
## 698     6.49             3.32          48.4          2.86             9.8
## 699     6.53             5.31          64.4          4.72            16.4
## 700     6.61             3.12          51.0          3.76            12.2
##     densidad_frutos peso_promedio_fruto rendimiento_palta clust
## 1               203                 222             13.86     2
## 2               232                 211             10.44     2
## 3               179                 212              9.12     2
## 4               134                 221              6.89     1
## 5               108                 207              4.11     2
## 6               267                 268             22.27     3
## 7               260                 247             19.41     3
## 8               169                 246              8.80     2
## 9               150                 210              8.20     1
## 10              170                 239             10.19     2
## 11              153                 240              8.55     2
## 12               95                 221              6.58     2
## 13              181                 244             10.93     2
## 14              193                 228             13.11     2
## 15              360                 213             19.39     3
## 16               98                 202              4.28     1
## 17              180                 209              9.39     1
## 18              268                 243             16.83     3
## 19              253                 269             20.83     3
## 20              181                 220              8.10     2
## 21              100                 217              4.14     1
## 22              232                 270             15.60     3
## 23              256                 226             13.62     2
## 24              230                 251             14.50     3
## 25              127                 193              5.76     1
## 26              321                 241             18.60     3
## 27              240                 248             18.14     3
## 28              114                 230              7.57     2
## 29              266                 256             20.46     3
## 30              141                 229              8.94     2
## 31              214                 248             11.28     3
## 32              117                 237              7.03     2
## 33              196                 259             11.91     2
## 34              201                 213             10.48     1
## 35              192                 215             10.66     2
## 36              232                 213             12.64     1
## 37              258                 221             13.47     2
## 38              219                 277             18.38     3
## 39              108                 208              5.92     1
## 40              181                 215              9.43     1
## 41              282                 251             21.37     3
## 42               61                 179              2.91     1
## 43              254                 218             14.39     2
## 44              172                 233             12.23     2
## 45              302                 230             17.89     2
## 46              265                 231             18.97     3
## 47              123                 248              9.25     2
## 48              164                 222              9.50     2
## 49              239                 247             18.12     3
## 50              170                 207              9.14     1
## 51               73                 236              4.68     2
## 52              168                 211              9.65     2
## 53              131                 212              5.47     1
## 54              235                 210             12.70     2
## 55              308                 239             21.98     3
## 56              165                 228             10.06     2
## 57              186                 204              9.76     1
## 58              250                 251             15.50     3
## 59              151                 208              7.26     1
## 60               48                 212              2.45     1
## 61              243                 253             14.99     3
## 62              104                 241              6.28     2
## 63              216                 255             16.85     3
## 64              166                 197              8.79     1
## 65              179                 221              9.62     2
## 66              201                 222             11.83     2
## 67              126                 255              6.52     2
## 68              211                 181              7.86     1
## 69              201                 236             11.32     3
## 70              214                 209             13.45     2
## 71              201                 230             10.86     2
## 72              283                 233             15.61     3
## 73              214                 270             14.03     3
## 74              173                 241             12.58     2
## 75              138                 195              6.82     1
## 76              253                 254             16.81     3
## 77               86                 184              4.21     1
## 78              245                 255             13.17     3
## 79              212                 241             15.99     3
## 80              259                 254             19.28     3
## 81              172                 225             10.55     2
## 82              174                 224              9.11     2
## 83              125                 223              7.22     2
## 84              114                 213              5.46     1
## 85              228                 238             16.72     2
## 86              214                 246             13.54     2
## 87               43                 200              1.76     1
## 88              233                 234             11.54     3
## 89              240                 248             13.48     3
## 90              133                 238              9.36     2
## 91              262                 229             18.13     2
## 92              113                 206              5.60     1
## 93              210                 236             12.98     2
## 94              209                 233             10.44     2
## 95              235                 252             17.75     3
## 96               92                 234              5.58     1
## 97              149                 204              6.40     1
## 98              174                 202              9.01     2
## 99              176                 223             10.66     2
## 100              73                 194              4.25     1
## 101              24                 212              1.09     1
## 102             246                 225             13.72     2
## 103             270                 242             17.65     3
## 104             173                 189              6.96     1
## 105             173                 254             11.17     3
## 106             169                 229              9.20     2
## 107             238                 241             11.65     3
## 108             194                 231              9.39     2
## 109             241                 206             14.68     2
## 110              81                 249              6.47     2
## 111             214                 214             10.06     2
## 112             170                 223             11.73     2
## 113             146                 238              9.05     2
## 114             241                 233             13.85     2
## 115             155                 219              7.88     2
## 116             230                 204             11.72     1
## 117              55                 193              2.78     1
## 118             108                 211              4.68     1
## 119             263                 235             18.12     3
## 120             252                 214             16.48     3
## 121             270                 243             15.69     3
## 122             257                 229             15.76     3
## 123             225                 247             16.55     2
## 124             217                 246             15.95     3
## 125             279                 255             21.44     3
## 126             153                 212              7.17     2
## 127             300                 234             18.34     3
## 128              63                 173              2.93     1
## 129             207                 188             10.23     1
## 130             209                 189              9.08     1
## 131             164                 216              7.68     1
## 132             165                 227              8.96     1
## 133             213                 231              9.79     2
## 134             224                 208             10.96     2
## 135             153                 229             10.45     2
## 136             331                 267             22.11     3
## 137             186                 243             10.27     2
## 138             152                 227              8.25     2
## 139             262                 236             12.80     3
## 140              98                 179              4.53     1
## 141             108                 194              6.27     1
## 142             301                 278             26.03     3
## 143             286                 269             23.88     3
## 144             165                 232             10.24     2
## 145             301                 262             19.53     3
## 146             117                 168              4.79     1
## 147             120                 228              8.03     2
## 148             179                 214             10.29     2
## 149             141                 208              7.42     1
## 150             236                 228             10.87     2
## 151             229                 249             12.04     3
## 152             178                 228             12.47     2
## 153             149                 239             10.68     2
## 154             239                 221             14.97     2
## 155             116                 207              6.89     1
## 156              20                 215              0.75     1
## 157             137                 258             10.45     2
## 158             163                 195              8.21     2
## 159              80                 191              4.24     1
## 160             293                 272             23.85     3
## 161             343                 238             21.11     3
## 162             115                 210              6.00     1
## 163             278                 285             19.64     3
## 164             127                 186              5.62     1
## 165             166                 257             12.42     2
## 166             257                 238             16.32     3
## 167             160                 192              6.23     1
## 168             110                 206              5.62     1
## 169             147                 238             10.21     2
## 170             214                 238             14.46     2
## 171              20                 162              0.75     1
## 172             164                 212              8.86     1
## 173              49                 192              2.54     1
## 174             192                 215              9.75     2
## 175             148                 216              7.95     1
## 176             300                 247             18.18     3
## 177             180                 210              9.96     2
## 178             193                 250             14.11     3
## 179             187                 234             10.90     2
## 180             140                 218              9.45     2
## 181             185                 216              8.67     1
## 182             291                 247             21.92     3
## 183             233                 244             13.36     2
## 184              20                 172              0.84     1
## 185             225                 249             17.26     3
## 186              20                 219              1.56     1
## 187             190                 221             11.33     2
## 188             236                 230             13.96     2
## 189              77                 205              3.77     1
## 190              70                 207              2.79     1
## 191             343                 257             25.68     3
## 192             132                 238              9.67     2
## 193             306                 270             20.31     3
## 194             195                 221              9.98     2
## 195             243                 227             13.26     2
## 196             208                 235             14.45     3
## 197             219                 234             13.13     2
## 198             157                 212              7.35     1
## 199             128                 217              6.43     2
## 200             332                 280             28.24     3
## 201             161                 272             13.28     3
## 202             168                 246              9.86     2
## 203             123                 216              6.47     2
## 204             195                 233             13.65     3
## 205             325                 249             24.53     3
## 206             183                 203              8.43     1
## 207             140                 243             10.64     2
## 208             234                 249             17.88     3
## 209             233                 254             17.48     3
## 210             314                 221             17.88     3
## 211             145                 224              8.69     1
## 212             298                 243             18.79     3
## 213              66                 208              4.14     2
## 214             307                 270             20.06     3
## 215              53                 209              3.37     1
## 216             198                 248             11.74     3
## 217             247                 257             19.41     3
## 218             113                 254              8.59     2
## 219             109                 206              4.59     1
## 220             199                 235              9.76     2
## 221             253                 246             19.00     3
## 222              98                 222              4.56     1
## 223             110                 218              4.84     2
## 224             296                 254             18.21     3
## 225             160                 230             11.11     2
## 226             284                 270             23.34     3
## 227             227                 241             13.88     2
## 228              54                 231              3.73     2
## 229             127                 230              6.64     1
## 230             208                 271             13.53     3
## 231             233                 236             13.31     2
## 232             243                 242             15.54     2
## 233             131                 215              8.11     2
## 234              94                 236              6.17     1
## 235             306                 232             21.57     3
## 236             109                 230              6.74     1
## 237             147                 228              9.74     2
## 238             335                 236             19.28     3
## 239             219                 231             15.24     2
## 240             229                 224             11.20     2
## 241             198                 237             13.79     2
## 242             217                 237             11.19     3
## 243             135                 230              8.16     2
## 244             123                 237              5.60     2
## 245              88                 207              4.45     1
## 246             194                 244             10.05     2
## 247             196                 231             12.02     2
## 248             219                 219              9.49     1
## 249             201                 212              8.84     2
## 250             149                 184              5.16     1
## 251             202                 195             12.02     2
## 252             172                 224             10.19     2
## 253             131                 203              8.43     1
## 254             227                 215             12.60     2
## 255             126                 200              6.71     1
## 256             172                 247             10.13     2
## 257             113                 226              7.29     1
## 258              97                 221              5.88     2
## 259             239                 219             13.66     2
## 260              89                 212              4.04     1
## 261             157                 257             10.07     2
## 262             253                 240             12.63     2
## 263             205                 243             12.23     2
## 264             183                 215              8.18     1
## 265             185                 220             11.86     2
## 266             236                 240             16.51     3
## 267             173                 245             12.29     2
## 268             151                 195              7.88     1
## 269             214                 256             16.37     3
## 270             226                 215             12.84     2
## 271             238                 230             13.48     2
## 272             173                 194              8.59     1
## 273             271                 258             21.55     3
## 274             185                 255             12.90     3
## 275             122                 200              5.54     1
## 276             143                 235              8.22     2
## 277             183                 247             10.92     2
## 278             219                 210             11.72     2
## 279             248                 229             14.87     2
## 280              74                 179              2.73     1
## 281             163                 201              7.11     1
## 282             190                 241             13.61     3
## 283             246                 254             18.55     3
## 284             199                 237             14.12     2
## 285             179                 221             12.03     2
## 286             245                 194             14.25     2
## 287             192                 231             11.49     2
## 288             185                 223             10.69     1
## 289             281                 241             17.23     3
## 290             133                 229              6.94     1
## 291             229                 195             11.46     1
## 292             227                 221             13.09     2
## 293             120                 198              7.01     1
## 294             214                 225              9.68     1
## 295             276                 236             15.82     2
## 296             188                 229              9.82     2
## 297             172                 240              9.78     2
## 298             198                 229             11.95     2
## 299             186                 211             11.26     2
## 300              87                 222              4.33     1
## 301             146                 216              6.44     1
## 302             169                 232             11.89     2
## 303             151                 216              6.18     1
## 304             323                 296             23.27     3
## 305             153                 259              9.75     2
## 306             199                 234             11.91     2
## 307             140                 220              9.58     2
## 308             226                 202             11.88     1
## 309             211                 224             12.20     2
## 310             245                 223             14.37     2
## 311             205                 243             13.14     3
## 312             143                 209              7.98     1
## 313             234                 213             10.46     2
## 314             234                 218             16.06     3
## 315             156                 194              7.58     1
## 316             189                 252             11.86     2
## 317             156                 252              9.66     2
## 318             197                 260             16.26     3
## 319              76                 205              4.09     1
## 320              32                 219              1.49     1
## 321             191                 224              8.76     2
## 322             161                 206              9.24     1
## 323             192                 267             15.09     3
## 324             145                 217              6.44     1
## 325             169                 221             11.10     2
## 326             122                 211              6.54     1
## 327             294                 231             16.41     3
## 328              85                 197              4.74     1
## 329             100                 218              6.10     1
## 330             226                 244             12.79     2
## 331             128                 212              5.89     1
## 332             185                 232             13.22     2
## 333             125                 195              5.26     1
## 334             151                 202              6.74     1
## 335             192                 255             14.82     3
## 336              21                 220              1.29     1
## 337              83                 192              3.60     1
## 338             225                 265             14.24     2
## 339             128                 235              6.60     2
## 340             118                 216              5.02     1
## 341             317                 247             23.12     3
## 342             188                 235             13.01     2
## 343             139                 226              8.55     2
## 344             226                 228             15.77     3
## 345             105                 209              5.86     1
## 346              61                 181              3.54     1
## 347             135                 210              5.63     1
## 348             160                 238             10.40     2
## 349             331                 247             24.85     3
## 350             224                 230             12.42     2
## 351             191                 224             12.53     2
## 352             154                 237              9.60     2
## 353             223                 279             18.34     3
## 354             148                 252             11.00     2
## 355             325                 269             21.58     3
## 356              48                 197              1.52     1
## 357             211                 247             12.87     2
## 358             189                 227             10.77     2
## 359             151                 191              7.46     1
## 360             227                 259             14.93     3
## 361             155                 241             11.36     2
## 362             118                 201              6.31     1
## 363             102                 202              4.44     1
## 364             158                 220              8.83     2
## 365             259                 222             14.53     2
## 366             136                 247              8.01     2
## 367             136                 247             10.35     2
## 368             216                 234             12.78     2
## 369             177                 236             12.71     2
## 370             161                 264             13.19     3
## 371             174                 219             11.30     2
## 372             195                 246             14.66     3
## 373             212                 264             13.53     2
## 374             286                 269             23.05     3
## 375             246                 241             17.64     3
## 376             233                 261             14.39     3
## 377             147                 182              5.47     1
## 378              50                 216              2.96     1
## 379             155                 209              8.59     2
## 380             192                 216              8.33     1
## 381             156                 201              7.87     2
## 382             144                 191              6.14     1
## 383             133                 229              7.42     2
## 384             300                 234             14.28     3
## 385             105                 183              5.58     1
## 386             216                 213              9.54     1
## 387             122                 222              6.71     1
## 388              82                 230              4.52     2
## 389             190                 291             16.59     3
## 390              34                 199              1.37     1
## 391             264                 251             15.81     2
## 392              86                 224              5.20     2
## 393              21                 192              1.14     1
## 394             124                 229              6.27     2
## 395             190                 214             12.55     2
## 396             137                 236              9.57     2
## 397             143                 247             10.06     2
## 398             181                 223             11.59     2
## 399              92                 212              5.33     2
## 400             103                 211              3.81     1
## 401             282                 269             18.85     3
## 402             361                 281             30.95     3
## 403             145                 208              6.86     2
## 404             348                 269             28.62     3
## 405             236                 270             18.47     3
## 406             200                 226             13.91     2
## 407              86                 233              5.22     2
## 408             152                 248             11.36     2
## 409             194                 280             16.38     3
## 410             219                 252             13.54     3
## 411             145                 188              7.06     1
## 412             275                 264             17.67     3
## 413             108                 234              6.65     2
## 414             116                 231              7.61     2
## 415             113                 211              6.53     1
## 416             164                 196              8.94     1
## 417             163                 215              7.15     1
## 418             152                 250             11.43     2
## 419             199                 237             12.25     3
## 420             173                 236             12.46     2
## 421             158                 204              8.90     1
## 422              49                 158              1.70     1
## 423              99                 227              6.62     2
## 424              54                 204              2.96     1
## 425              20                 196              0.71     1
## 426              84                 215              3.67     1
## 427             258                 245             18.89     3
## 428             265                 230             18.33     3
## 429             244                 211             13.08     2
## 430             217                 240             12.38     2
## 431             303                 257             19.01     3
## 432             136                 234              9.81     2
## 433             120                 230              8.39     2
## 434             172                 275             11.51     3
## 435             210                 231             14.43     2
## 436              95                 190              4.65     1
## 437              87                 195              4.60     1
## 438             234                 198             12.04     2
## 439             184                 266             14.95     3
## 440             171                 243             10.94     2
## 441             246                 236             17.18     3
## 442             187                 189              9.40     1
## 443             177                 210              7.76     1
## 444             244                 240             18.48     3
## 445             132                 216              6.19     1
## 446             221                 214             10.00     2
## 447             199                 277             13.32     3
## 448             161                 224             10.94     2
## 449             224                 244             14.04     3
## 450             153                 206              6.47     1
## 451             282                 261             22.44     3
## 452             183                 242             13.47     2
## 453             124                 200              7.46     1
## 454             299                 237             21.28     3
## 455             283                 300             26.41     3
## 456              43                 245              2.40     2
## 457             196                 246              9.82     2
## 458             170                 200              8.13     1
## 459             127                 253             10.20     2
## 460             157                 232              9.46     2
## 461             167                 215              7.47     1
## 462             236                 228             13.79     2
## 463             116                 210              6.70     1
## 464             311                 239             19.53     3
## 465             244                 227             15.14     2
## 466              97                 225              5.06     1
## 467             270                 234             19.02     3
## 468              93                 228              4.73     1
## 469             172                 218              9.64     2
## 470             337                 247             20.68     3
## 471             187                 211             10.21     1
## 472             194                 222              8.62     2
## 473             132                 209              8.11     2
## 474              76                 202              3.62     1
## 475             130                 215              5.84     1
## 476             253                 249             19.12     3
## 477             347                 269             23.26     3
## 478             133                 185              6.03     1
## 479             192                 238             11.75     2
## 480             160                 198              7.65     1
## 481             155                 237              9.42     2
## 482             131                 195              5.40     1
## 483             264                 231             18.30     3
## 484             221                 224             11.56     2
## 485             230                 244             13.16     2
## 486             231                 232             14.06     2
## 487             143                 203              7.32     1
## 488             233                 255             14.58     2
## 489             198                 247             14.54     3
## 490             188                 253             11.58     3
## 491             118                 204              5.19     2
## 492             263                 264             20.93     3
## 493             146                 200              7.79     1
## 494             129                 254              8.15     3
## 495             102                 212              6.35     1
## 496              78                 197              3.12     1
## 497             220                 217             13.80     2
## 498              87                 206              5.04     1
## 499             218                 247             12.79     2
## 500              69                 191              3.22     1
## 501             170                 211             10.53     1
## 502             235                 234             17.28     3
## 503             112                 199              6.15     1
## 504             111                 217              7.29     2
## 505             186                 258             12.92     2
## 506             277                 244             20.18     3
## 507             154                 236             10.09     2
## 508             181                 213              9.77     2
## 509             171                 216              8.88     1
## 510             232                 251             17.44     3
## 511             193                 205             10.12     1
## 512             207                 232             14.32     2
## 513              86                 212              4.33     1
## 514             197                 251             14.96     3
## 515             224                 249             11.43     2
## 516             256                 217             16.92     2
## 517             200                 247             12.39     2
## 518             121                 240              7.38     2
## 519              20                 205              0.85     1
## 520             241                 239             13.88     2
## 521             156                 245              9.64     2
## 522             240                 221             16.05     2
## 523             221                 238             13.93     2
## 524             140                 213              9.06     2
## 525             318                 258             24.40     3
## 526             129                 200              5.57     1
## 527              98                 207              4.16     1
## 528             182                 226             10.70     2
## 529             280                 258             17.37     3
## 530             159                 230             11.75     2
## 531             105                 224              4.33     1
## 532             141                 212              6.42     1
## 533              20                 182              1.50     1
## 534             184                 232             10.03     2
## 535             218                 202             10.87     2
## 536             189                 206              7.73     1
## 537             170                 200              8.77     1
## 538             225                 234             13.04     2
## 539             268                 223             18.49     3
## 540             186                 230             11.24     2
## 541              74                 197              2.67     1
## 542             228                 223             12.95     2
## 543             256                 266             16.39     3
## 544             159                 219              8.99     1
## 545             228                 236             12.92     2
## 546             142                 231              6.35     2
## 547             247                 234             17.48     3
## 548             155                 251              8.19     2
## 549              83                 189              2.72     1
## 550             215                 249             15.78     3
## 551             237                 243             17.28     3
## 552             191                 259             14.79     3
## 553             274                 241             19.30     3
## 554             243                 203             10.12     1
## 555              92                 193              4.69     1
## 556             316                 237             22.84     3
## 557             345                 241             17.33     3
## 558             231                 248             15.04     3
## 559             241                 262             19.73     3
## 560             157                 218              9.95     2
## 561             198                 248             13.29     3
## 562             289                 268             19.43     3
## 563             166                 209              6.99     1
## 564             156                 201              8.07     1
## 565             116                 202              4.43     1
## 566             148                 186              5.01     1
## 567             265                 244             19.76     3
## 568             249                 241             13.71     3
## 569             269                 239             16.96     3
## 570             120                 237              6.54     2
## 571              71                 201              3.61     1
## 572             109                 247              6.51     2
## 573             220                 227             12.99     2
## 574             355                 240             25.94     3
## 575             176                 260             11.21     2
## 576             181                 246             10.69     2
## 577             323                 244             24.06     3
## 578             222                 258             17.18     3
## 579             224                 233             13.53     2
## 580             212                 236             12.41     2
## 581             202                 214              8.93     1
## 582             148                 243              8.65     2
## 583             156                 226              8.62     1
## 584             102                 228              6.62     2
## 585             229                 250             13.69     2
## 586             141                 220              7.68     2
## 587             263                 267             21.43     3
## 588             222                 244             12.89     2
## 589             119                 222              5.36     1
## 590             234                 235             16.92     3
## 591             193                 245             14.65     2
## 592             128                 220              7.86     2
## 593             114                 211              4.66     1
## 594             252                 259             20.16     3
## 595             164                 204              8.79     2
## 596             115                 203              4.53     1
## 597             151                 203              9.29     1
## 598             149                 253             10.94     2
## 599             137                 233              7.73     2
## 600             137                 215              8.99     2
## 601              38                 184              2.01     1
## 602             254                 214             11.49     2
## 603             203                 266             16.66     3
## 604             136                 253             10.59     2
## 605             294                 225             20.05     3
## 606             277                 240             15.79     2
## 607             207                 186              9.59     2
## 608             158                 205              6.80     1
## 609             221                 250             16.96     3
## 610             161                 198              8.36     1
## 611             212                 250             10.77     2
## 612             203                 222             11.82     2
## 613             302                 274             24.91     3
## 614             133                 197              5.57     1
## 615             163                 223             11.23     2
## 616             155                 182              6.04     1
## 617             369                 285             25.36     3
## 618             138                 212              5.87     1
## 619             265                 264             16.75     3
## 620             207                 220             12.08     2
## 621             141                 258              8.55     2
## 622             165                 227              7.89     1
## 623             197                 236             11.59     2
## 624             187                 222             10.83     2
## 625             199                 230             14.28     2
## 626             236                 238             14.71     3
## 627             170                 247             11.12     2
## 628             285                 249             14.41     2
## 629             164                 196              8.47     1
## 630             136                 258             10.26     3
## 631             182                 261             11.12     2
## 632              73                 210              3.32     1
## 633              75                 210              4.46     1
## 634             298                 243             17.79     3
## 635             173                 183              7.68     1
## 636             237                 243             15.08     3
## 637             305                 248             17.68     3
## 638             176                 213              8.97     1
## 639             185                 209              8.72     1
## 640             234                 263             18.77     3
## 641             191                 221             10.96     2
## 642              83                 171              3.16     1
## 643             190                 235              9.91     2
## 644             188                 236             11.18     3
## 645             160                 237             11.29     2
## 646             132                 249              7.77     2
## 647             192                 208              8.07     1
## 648             259                 238             18.13     3
## 649             206                 257             16.05     3
## 650             320                 234             18.11     3
## 651             113                 224              5.43     2
## 652             166                 210              7.74     1
## 653             106                 207              5.06     1
## 654             155                 206              8.48     1
## 655             202                 242             10.27     2
## 656             194                 184              7.22     1
## 657              20                 211              0.67     1
## 658              97                 256              7.56     2
## 659             159                 227              9.77     2
## 660             233                 238             14.38     3
## 661              49                 212              2.38     1
## 662             114                 249              6.16     2
## 663             137                 256             10.65     2
## 664             257                 249             13.93     3
## 665              73                 203              3.77     1
## 666              80                 199              4.05     1
## 667              81                 186              2.58     1
## 668             210                 210             13.45     1
## 669             148                 246              7.90     2
## 670             163                 250             10.89     2
## 671             113                 215              6.03     1
## 672             132                 249              9.03     2
## 673             121                 221              6.74     1
## 674             180                 216             12.04     2
## 675             306                 243             22.51     3
## 676             115                 211              7.39     1
## 677             131                 189              5.16     1
## 678             117                 225              7.61     2
## 679              79                 198              4.00     1
## 680             235                 250             17.49     3
## 681             112                 194              4.27     1
## 682             307                 233             14.67     2
## 683             152                 252              9.02     2
## 684             121                 220              5.56     1
## 685             185                 235             10.50     2
## 686             279                 226             16.58     2
## 687             208                 216             11.49     2
## 688             155                 243             11.53     2
## 689             138                 207              7.44     1
## 690             109                 204              5.65     1
## 691             144                 219              9.84     2
## 692             277                 223             14.80     2
## 693             185                 196              9.14     1
## 694             156                 230              9.12     2
## 695             197                 221             11.46     2
## 696             240                 247             17.56     3
## 697             203                 268             16.90     3
## 698              95                 185              4.73     1
## 699             171                 247             10.41     3
## 700             203                 199             10.17     2
Grupos=res.hcpc$data.clust$clust
table(Grupos)
## Grupos
##   1   2   3 
## 217 301 182
datosf <- cbind(datos_palta, Grupos)
head(datosf)
##   riego_por_goteo fertilizacion_organica mulching pH_suelo materia_organica
## 1               1                      1        0     6.60             4.18
## 2               0                      0        0     6.83             2.68
## 3               1                      0        0     6.51             3.25
## 4               0                      1        0     6.40             3.04
## 5               0                      0        0     6.65             3.83
## 6               1                      1        1     6.52             4.64
##   humedad_suelo altura_planta diametro_tronco densidad_frutos
## 1          53.1          3.82            13.7             203
## 2          41.7          4.14            14.4             232
## 3          52.6          3.52            11.6             179
## 4          43.3          2.78             9.8             134
## 5          47.4          3.99            14.0             108
## 6          57.8          4.44            17.7             267
##   peso_promedio_fruto rendimiento_palta Grupos
## 1                 222             13.86      2
## 2                 211             10.44      2
## 3                 212              9.12      2
## 4                 221              6.89      1
## 5                 207              4.11      2
## 6                 268             22.27      3
# Diagrama de cajas: humedad_suelo por cluster 
boxplot(humedad_suelo ~ Grupos, data = datosf,
        main = "BoxPlot de Humedad del Suelo vs CLUSTER",
        xlab = "Cluster",
        ylab = "Humedad del suelo",
        names = c("Cluster 1", "Cluster 2", "Cluster 3"),
        col = c("red", "blue", "peru"))

#  boxplot: rendimiento_palta por cluster
boxplot(rendimiento_palta ~ Grupos, data = datosf,
        main = "BoxPlot de Rendimiento vs CLUSTER",
        xlab = "Cluster",
        ylab = "Rendimiento (ton/ha aprox.)",
        names = c("Cluster 1", "Cluster 2", "Cluster 3"),
        col = c("red","blue","peru"))

# Perfil en base a las medias de las variables cuantitativas (por cluster)
# Calcular medias por cluster para las variables cuantitativas de interés
ph  <- tapply(datosf$pH_suelo, datosf$Grupos, mean)
mo  <- tapply(datosf$materia_organica, datosf$Grupos, mean)
hum <- tapply(datosf$humedad_suelo, datosf$Grupos, mean)
alt <- tapply(datosf$altura_planta, datosf$Grupos, mean)
diam<- tapply(datosf$diametro_tronco, datosf$Grupos, mean)
den <- tapply(datosf$densidad_frutos, datosf$Grupos, mean)
peso<- tapply(datosf$peso_promedio_fruto, datosf$Grupos, mean)
rend<- tapply(datosf$rendimiento_palta, datosf$Grupos, mean)

medias <- rbind(ph, mo, hum, alt, diam, den, peso, rend)

# Añadir la media general (sobre todas las observaciones) como columna extra
general <- c(mean(datosf$pH_suelo),
             mean(datosf$materia_organica),
             mean(datosf$humedad_suelo),
             mean(datosf$altura_planta),
             mean(datosf$diametro_tronco),
             mean(datosf$densidad_frutos),
             mean(datosf$peso_promedio_fruto),
             mean(datosf$rendimiento_palta))

medias <- cbind(medias, General = general)
str(medias)
##  num [1:8, 1:4] 6.48 2.89 44.67 2.97 10.69 ...
##  - attr(*, "dimnames")=List of 2
##   ..$ : chr [1:8] "ph" "mo" "hum" "alt" ...
##   ..$ : chr [1:4] "1" "2" "3" "General"
medias
##               1          2          3    General
## ph     6.477465   6.467375   6.588352   6.501957
## mo     2.889171   3.856478   4.455714   3.712414
## hum   44.670968  50.629236  54.373626  49.755714
## alt    2.973134   3.907575   4.686154   3.820329
## diam  10.692627  14.197342  17.266484  13.908857
## den  124.027650 179.598007 255.313187 182.057143
## peso 204.004608 230.850498 251.274725 227.838571
## rend   6.038571  10.730598  17.754780  11.102357
# Grafico de perfiles (medias por cluster)
matplot(t(medias),             # se transpone para que cada línea sea un grupo
        main = "Perfil de medias de variables según Cluster",
        xlab = "Variables (orden mostrado debajo)",
        ylab = "Promedios",
        type = "b",
        pch = 19,
        xaxt = "n",
        col = c("blue","red","green2","black"))   # 3 clusters + general

axis(1, at = 1:nrow(medias),
     labels = c("pH_suelo","materia_organica","humedad_suelo",
                "altura_planta","diametro_tronco","densidad_frutos",
                "peso_promedio_fruto","rendimiento_palta"), las = 2, cex.axis = 0.8)

legend("topright", legend = c("Cluster 1", "Cluster 2", "Cluster 3", "General"),
       col = c("blue","red","green2","black"), pch = 19, bty = "n")

6. CONCLUSIONES

  • El análisis de componentes principales aplicado a las variables agronómicas del cultivo de palta permitió reducir la complejidad de los datos conservando la mayor parte de la información original. Según el gráfico de sedimentación (scree plot) y la proporción acumulada de varianza explicada, se recomienda retener los dos primeros componentes principales, los cuales explican aproximadamente el 70 % de la variabilidad total del conjunto de datos.

  • La primera componente principal (CP1) se asocia principalmente con variables relacionadas al desarrollo físico de la planta y productividad, tales como altura_planta, diametro_tronco, rendimiento_palta y peso_promedio_fruto. Por otro lado, la segunda componente (CP2) está más vinculada a variables del suelo, como pH_suelo, materia_organica y humedad_suelo.

  • Al aplicar el análisis de conglomerados jerárquico sobre las puntuaciones del ACP, se identificaron tres grupos claramente diferenciados de parcelas. El Cluster 1 agrupa observaciones con rendimiento alto y valores elevados de altura y diámetro de tronco, representando condiciones óptimas de manejo y fertilidad. El Cluster 2 presenta niveles intermedios en la mayoría de variables, siendo un grupo de equilibrio productivo. El Cluster 3 se caracteriza por baja materia orgánica, menor humedad y menor rendimiento, reflejando condiciones menos favorables del suelo y potencial productivo más limitado.

3 - Análisis Factorial Clásico

1. Introducción y Objetivos

En el contexto de la creciente demanda mundial de palta (Persea americana) y la necesidad de optimizar los sistemas productivos, la identificación de factores clave que influyen en el rendimiento se ha convertido en una prioridad para la agricultura moderna. Este estudio emplea Análisis Factorial para identificar las dimensiones subyacentes que explican la variabilidad observada en un sistema de cultivo de palta, utilizando datos simulados de 11 variables técnicas y de manejo.

1.1. Relevancia de las variables en el cultivo de palta

Variables de Manejo Cultural

  • Riego por goteo: Sistema de irrigación localizada que optimiza el uso del agua, aplicándola directamente en la zona radicular. Variable dicotómica (0 = no aplicado, 1 = aplicado).

  • Fertilización orgánica: Aplicación de nutrientes mediante compost, estiércol u otros materiales orgánicos. Mejora la estructura del suelo y la disponibilidad gradual de nutrientes. Variable dicotómica (0 = no aplicada, 1 = aplicada).

  • Mulching: Cobertura del suelo con materiales orgánicos o sintéticos para reducir evaporación, controlar malezas y regular temperatura. Variable dicotómica (0 = no aplicado, 1 = aplicado).

Variables de Suelo

  • pH del suelo: Medida de acidez o alcalinidad del suelo que afecta la disponibilidad de nutrientes para la planta. Rango óptimo para palta: 5.5-7.0. Variable continua.

  • Materia orgánica: Contenido de material orgánico en descomposición que mejora la estructura, retención de agua y fertilidad del suelo. Variable continua (%).

  • Humedad del suelo: Cantidad de agua disponible en el perfil del suelo, crucial para el desarrollo radicular y fisiológico de la planta. Variable continua (%).

Variables de Crecimiento Vegetativo

  • Altura de planta: Medida vertical desde la base del tronco hasta el ápice superior, indicadora del desarrollo y vigor de la planta. Variable continua (metros).

  • Diámetro del tronco: Grosor del tronco a una altura estándar, relacionado con la capacidad estructural y acumulación de biomasa. Variable continua (cm).

Variables de Producción

  • Densidad de frutos: Número de frutos por árbol o por unidad de área, indicador del potencial productivo del cultivo. Variable continua.

  • Peso promedio del fruto: Masa media individual de los frutos, relacionada con la calidad comercial y características organolépticas. Variable continua (gramos).

  • Rendimiento: Producción total por unidad de superficie, resultado integrador de todas las variables anteriores. Variable continua (kg/ha o toneladas).

2. Objetivo

Identificar mediante Análisis Factorial la estructura subyacente de relaciones entre las variables técnicas del cultivo de palta, determinando los factores latentes que explican la mayor variabilidad del sistema y proporcionando una base científica para la optimización de prácticas de manejo.

# Paquetes
library(psych)
library(ade4)
library(psych)
library(corrplot)
library(ggplot2)
library(ggcorrplot)
library(mvnormtest)
library(tidyverse)
library(GGally)
library(PerformanceAnalytics)
library(performance)
library(summarytools)

3. Análisis Exploratorio (EDA)

El análisis exploratorio inicial examina la estructura básica de los datos mediante estadísticos descriptivos de las 11 variables técnicas del cultivo de palta.

3.1. Descriptivos (Resumen Estadístico)

# Descriptivos
library(dplyr)

# Variables
summarytools::descr(datos_palta)
## Descriptive Statistics  
## datos_palta  
## N: 700  
## 
##                     altura_planta   densidad_frutos   diametro_tronco   fertilizacion_organica
## ----------------- --------------- ----------------- ----------------- ------------------------
##              Mean           34.55            260.71             49.19                     0.72
##           Std.Dev            2.13             14.25              2.80                     0.45
##               Min           29.38            214.71             42.06                     0.00
##                Q1           32.82            251.39             47.18                     0.00
##            Median           34.84            261.64             49.33                     1.00
##                Q3           36.21            272.03             51.47                     1.00
##               Max           38.94            288.08             54.85                     1.00
##               MAD            2.40             15.32              3.18                     0.00
##               IQR            3.38             20.59              4.28                     1.00
##                CV            0.06              0.05              0.06                     0.62
##          Skewness           -0.29             -0.50             -0.29                    -0.99
##       SE.Skewness            0.09              0.09              0.09                     0.09
##          Kurtosis           -0.85             -0.32             -0.75                    -1.01
##           N.Valid          700.00            700.00            700.00                   700.00
##                 N          700.00            700.00            700.00                   700.00
##         Pct.Valid          100.00            100.00            100.00                   100.00
## 
## Table: Table continues below
## 
##  
## 
##                     humedad_suelo   materia_organica   mulching   peso_promedio_fruto   pH_suelo
## ----------------- --------------- ------------------ ---------- --------------------- ----------
##              Mean           57.44               7.68       0.51                217.64       6.51
##           Std.Dev            4.45               0.43       0.50                 10.21       0.25
##               Min           47.69               6.08       0.00                191.53       5.74
##                Q1           53.42               7.40       0.00                210.66       6.34
##            Median           58.65               7.70       1.00                218.03       6.50
##                Q3           61.02               7.99       1.00                224.94       6.68
##               Max           65.42               8.78       1.00                242.65       7.35
##               MAD            5.15               0.44       0.00                 10.40       0.25
##               IQR            7.60               0.59       1.00                 14.27       0.34
##                CV            0.08               0.06       0.99                  0.05       0.04
##          Skewness           -0.31              -0.23      -0.02                 -0.11      -0.03
##       SE.Skewness            0.09               0.09       0.09                  0.09       0.09
##          Kurtosis           -1.11              -0.25      -2.00                 -0.39      -0.01
##           N.Valid          700.00             700.00     700.00                700.00     700.00
##                 N          700.00             700.00     700.00                700.00     700.00
##         Pct.Valid          100.00             100.00     100.00                100.00     100.00
## 
## Table: Table continues below
## 
##  
## 
##                     rendimiento_palta   riego_por_goteo
## ----------------- ------------------- -----------------
##              Mean                0.86              0.61
##           Std.Dev                0.27              0.49
##               Min                0.07              0.00
##                Q1                0.67              0.00
##            Median                0.87              1.00
##                Q3                1.03              1.00
##               Max                1.74              1.00
##               MAD                0.27              0.00
##               IQR                0.36              1.00
##                CV                0.31              0.80
##          Skewness               -0.13             -0.44
##       SE.Skewness                0.09              0.09
##          Kurtosis               -0.06             -1.81
##           N.Valid              700.00            700.00
##                 N              700.00            700.00
##         Pct.Valid              100.00            100.00

3.2 Correlaciones de las variables

Gráficos de Correlación

corrplot(cor_matrix, method = "color", type = "upper", 
         order = "hclust", addCoef.col = "black",
         tl.col = "darkblue", tl.srt = 45,
         title = "Matriz de Correlaciones - Variables de Cultivo de Palta",
         mar = c(0,0,2,0))

heatmap(cor_matrix, 
        symm = TRUE, 
        margins = c(8, 8),
        main = "Agrupamiento de Variables por Patrones de Correlación",
        xlab = "Variables", 
        ylab = "Variables")

library(polycor)
# 'datos_palta' tiene variables dicotómicas y continuas
matpoly <- hetcor(datos_palta)$correlations

ggcorrplot(matpoly,
           method = 'circle',
           type = "lower",
           hc.order = TRUE) +
  theme_gray()

La matriz de correlaciones revela una estructura factorial adecuada para el análisis:

  • Correlaciones muy fuertes (>0.95) entre: Humedad-Altura-Diámetro (0.97-0.99)
  • Correlaciones fuertes (>0.60) en el grupo de producción: Peso del fruto con múltiples variables
  • Tres agrupamientos principales:
    • Crecimiento vegetativo: Humedad, Altura, Diámetro (correlaciones 0.97-0.99)
    • Producción y suelo: Materia orgánica, Peso del fruto, Rendimiento
    • Prácticas de manejo: Variables dicotómicas con patrones diferenciados
  • Alta unicidad: pH y algunas prácticas muestran correlaciones bajas (<0.30)

Esta estructura justifica la aplicación de Análisis Factorial al existir grupos de variables altamente intercorrelacionadas.

4. Supuestos y Diagnóstico Multivariado

4.1. Indicador Kaiser-Meyer-Olkin (KMO)

library(psych)

KMO(datos_palta)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = datos_palta)
## Overall MSA =  0.8
## MSA for each item = 
##        riego_por_goteo fertilizacion_organica               mulching 
##                   0.82                   0.57                   0.49 
##               pH_suelo       materia_organica          humedad_suelo 
##                   0.46                   0.69                   0.89 
##          altura_planta        diametro_tronco        densidad_frutos 
##                   0.79                   0.85                   0.93 
##    peso_promedio_fruto      rendimiento_palta 
##                   0.90                   0.98

El test KMO muestra un Overall MSA = 0.8, indicando una adecuación factorial “meritoria” según el criterio de Kaiser (KMO > 0.8). Esto confirma que los datos son apropiados para el análisis factorial.

A nivel individual:

  • MSA alto (>0.80): Rendimiento, Densidad, Peso del fruto, Humedad, Diámetro - excelente adecuación.

  • MSA moderado(0.60-0.79): Altura, Materia orgánica, Riego - adecuación aceptable.

  • MSA bajo (<0.60): Mulching, Fertilización, pH - pueden considerarse para exclusión.

El KMO global sustenta la procedencia del análisis factorial.

4.2. Prueba de esfericidad de Bartlett

\[ H_{0}:R=1, \text{La matriz de correlaciones poblacionales es una matriz identidad} \]

\[ H_{0}:R\neq1, \text{La matriz de correlaciones poblacionales es una matriz identidad} \]

cortest.bartlett(cor_matrix, n = 700 ,diag=TRUE)
## $chisq
## [1] 12173.21
## 
## $p.value
## [1] 0
## 
## $df
## [1] 55

Conclusión: Se rechaza \(H_0\) \((p < 0.001)\), indicando que existen correlaciones significativas entre las variables y confirmando la adecuación de los datos para el análisis factorial.

4.3. Verificación de la Normalidad Multivariada

Hipótesis nula:

Los datos siguen una distribución normal multivariada.

\[H_0: \mathbf{D} \sim \mathcal{N}(\mu, \Sigma)\]

Hipótesis alternativa:

Los datos no siguen una distribución normal multivariada.

\[H_1: \mathbf{D} \not\sim \mathcal{N}(\mu, \Sigma)\]

Shapiro-Wilk Multivariado

# test mshapiro
mshapiro.test(t(datos_palta))
## 
##  Shapiro-Wilk normality test
## 
## data:  Z
## W = 0.99314, p-value = 0.002687

Royston

library(MVN)
#Test MVN de Royston
royston <- mvn(data = datos_palta, mvnTest = "royston")
royston$multivariateNormality
##      Test        H      p value MVN
## 1 Royston 415.9806 5.715609e-86  NO

Mardia

#Test MVN de Mardia
mardia <- mvn(data = datos_palta, mvnTest = "mardia")
mardia$multivariateNormality
##              Test         Statistic              p value Result
## 1 Mardia Skewness  392.543295422629 2.85367671467563e-05     NO
## 2 Mardia Kurtosis -3.03546235190017  0.00240167205218023     NO
## 3             MVN              <NA>                 <NA>     NO

Henze-Zirkler

#Test MVN de Henze-Zirkler
hz <- mvn(data = datos_palta, mvnTest = "hz")
hz$multivariateNormality
##            Test       HZ p value MVN
## 1 Henze-Zirkler 1.206455       0  NO

Doornik-Hansen

#Test MVN de Doornik-Hansen 
dh <- mvn(data = datos_palta, mvnTest = "dh")
dh$multivariateNormality
##             Test        E df p value MVN
## 1 Doornik-Hansen 5385.671 22       0  NO

Szekely-Rizzo

#Test MVN de Szekely-Rizzo
energy <- mvn(data = datos_palta, mvnTest = "energy")
energy$multivariateNormality
##          Test Statistic p value MVN
## 1 E-statistic  2.818171       0  NO

5. Elección de método para extraer los factores

Dada la violación de normalidad multivariada y la naturaleza mixta de las variables (dicotómicas y continuas), se utilizó una matriz de correlaciones policóricas y se compararon métodos de extracción robustos:

  • Mínimos Cuadrados (Minres): Óptimo para datos no normales.

  • Ejes Principales (PA): Basado en correlaciones, sin supuestos distribucionales.

  • Máxima Verosimilitud (ML): Incluido como referencia pese a su sensibilidad.

La selección final se basará en la comparación de comunalidades.

facto1 <- fa(matpoly,nfactors = 3,rotate="none",
             fm="mle") # Máxima Verosimilitud (ML)

facto2 <- fa(matpoly, nfactors = 3, rotate = "none",
             fm="pa") # modelo de ejes principales

facto3 <- fa(matpoly, nfactors = 3, rotate = "none",
             fm="minres") # mínimos cuadrados residuales

5.1. Comparación de las comunalidades

Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.

f1<-sort(facto1$communality,decreasing=TRUE)
f2 <- sort(facto2$communality,decreasing = TRUE)
f3 <- sort(facto3$communality,decreasing = TRUE)

(cbind(f1,f2,f3))
##                               f1        f2        f3
## altura_planta          0.9959826 0.9881335 0.9882722
## diametro_tronco        0.9943055 0.9805202 0.9806473
## humedad_suelo          0.9891566 0.9778031 0.9779429
## materia_organica       0.9611969 0.9756930 0.9755302
## riego_por_goteo        0.9455439 0.9394805 0.9388717
## fertilizacion_organica 0.9110344 0.9156777 0.9146489
## densidad_frutos        0.9034258 0.7746600 0.7949940
## peso_promedio_fruto    0.5044519 0.7124973 0.7060814
## rendimiento_palta      0.3924384 0.6161316 0.6131966
## mulching               0.3874723 0.4019878 0.4020180
## pH_suelo               0.2926803 0.1049718 0.1052393
library(reshape2)
# Crear dataframe con las comunalidades comparadas
comunalidades_df <- data.frame(
  Variable = names(f1),
  Minres = f1,
  PA = f2,
  ML = f3
)

# Convertir a formato largo para ggplot2
comunalidades_long <- melt(comunalidades_df, id.vars = "Variable",
                          variable.name = "Metodo", 
                          value.name = "Comunalidad")

# Heatmap de comunalidades
ggplot(comunalidades_long, aes(x = Metodo, y = Variable, fill = Comunalidad)) +
  geom_tile(color = "white") +
  scale_fill_gradient2(low = "blue", mid = "white", high = "red", 
                       midpoint = 0.5, limits = c(0, 1)) +
  geom_text(aes(label = round(Comunalidad, 3)), color = "black", size = 3) +
  theme_minimal() +
  labs(title = "Comparación de Comunalidades por Método de Extracción",
       x = "Método", y = "Variable",
       fill = "Comunalidad") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Conclusión:

Entre los tres métodos comparados, Mínimos Cuadrados (Minres) presenta la comunalidad promedio más alta (0.763) aunque con diferencias mínimas respecto a Ejes Principales (0.763) y Máxima Verosimilitud (0.753). Dada su robustez ante la no-normalidad de los datos, se selecciona Minres como método óptimo para la extracción factorial.

5.2. Comparación de las unicidades

Criterio complementario: Se evalúan las unicidades (varianza única no explicada por los factores), donde valores más bajos indican mejor ajuste del modelo.

u1 <- sort(facto1$uniquenesses,decreasing = TRUE)
u2 <- sort(facto2$uniquenesses,decreasing = TRUE)
u3 <- sort(facto3$uniquenesses,decreasing = TRUE)
(cbind(u1,u2,u3))
##                                 u1         u2         u3
## pH_suelo               0.707319675 0.89502823 0.89476069
## mulching               0.612527694 0.59801224 0.59798204
## rendimiento_palta      0.607561625 0.38386839 0.38680343
## peso_promedio_fruto    0.495548062 0.28750266 0.29391855
## densidad_frutos        0.096574220 0.22533996 0.20500597
## fertilizacion_organica 0.088965555 0.08432229 0.08535108
## riego_por_goteo        0.054456065 0.06051948 0.06112829
## materia_organica       0.038803065 0.02430699 0.02446980
## humedad_suelo          0.010843386 0.02219687 0.02205706
## diametro_tronco        0.005694503 0.01947983 0.01935265
## altura_planta          0.004017409 0.01186646 0.01172779
library(reshape2)
library(ggplot2)

# Crear data.frame de unicidades directamente desde los objetos fa
unicidades <- data.frame(
  Variable = names(facto1$uniquenesses),
  ML = facto1$uniquenesses,
  PA = facto2$uniquenesses,
  MinRes = facto3$uniquenesses
)

# Convertir a formato largo para ggplot
unicidades_long <- melt(unicidades, id.vars = "Variable",
                        variable.name = "Metodo",
                        value.name = "Unicidad")

# Crear heatmap
ggplot(unicidades_long, aes(x = Metodo, y = Variable, fill = Unicidad)) +
  geom_tile(color = "white") +
  scale_fill_gradient(low = "white", high = "red") +
  geom_text(aes(label = round(Unicidad, 2)), color = "black", size = 3) +
  theme_minimal() +
  labs(title = "Heatmap de Unicidades por Método de Extracción", x = "Método", y = "") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# Calcular unicidades promedio por método
unicidades_promedio <- data.frame(
  Método = c("ML", "PA", "Minres"),
  Unicidad_Promedio = c(mean(facto1$uniquenesses), 
                        mean(facto2$uniquenesses), 
                        mean(facto3$uniquenesses))
)

print(unicidades_promedio)
##   Método Unicidad_Promedio
## 1     ML         0.2474828
## 2     PA         0.2374949
## 3 Minres         0.2365961

Conclusión:

Minres optimiza ambos criterios: maximiza la varianza común capturada (comunalidad = 0.7634) y minimiza la varianza única no explicada (unicidad = 0.2365), confirmándose como el método más eficiente.

6. Número de factores

Para determinar el número óptimo de factores a retener, se aplicarán tres criterios ampliamente reconocidos: el criterio de Kaiser (eigenvalues > 1), el análisis del scree plot, y el criterio paralelo.

ev <- eigen(cor(datos_palta)) 
ev$values
##  [1] 5.908494478 1.747497668 1.273902166 0.998473169 0.551487212 0.255597258
##  [7] 0.122330450 0.094263359 0.034704494 0.009931148 0.003318598

6.1. Criterio de valores propios (Kaiser)

# Criterio de valores propios (Kaiser)
plot(ev$values, type = "b", pch = 20, col = "blue",
     xlab = "Número de factores", ylab = "Valores propios",
     main = "Scree Plot - Criterio de Kaiser")
abline(h = 1, lty = 3, col = "red") # línea de Kaiser
text(x = length(ev$values), y = 1, labels = "Kaiser = 1", 
     pos = 3, col = "red", cex = 0.8)

El scree plot muestra un patrón típico con un “codo” marcado después del tercer factor:

  • Factores con eigenvalue > 1: 3 factores (5.91, 1.75, 1.27)
  • Punto de inflexión claro: Caída pronunciada después del factor 3.
  • Varianza explicada: Los 3 primeros factores capturan la mayor proporción de varianza.

Interpretación inicial: El criterio de Kaiser sugiere retener 3 factores, coincidiendo con el punto donde la curva cambia de pendiente abruptamente.

6.2. Gráfico de sedimentación (Scree plot)

Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.

scree(matpoly)

El scree plot confirma visualmente la retención de 3 factores:

  • Codo pronunciado: Claramente visible después del tercer componente/factor.

  • Concordancia de criterios: Tanto el análisis de componentes principales (PC) como factorial (FA) muestran el mismo punto de inflexión.

  • Varianza significativa: Los primeros 3 factores capturan la estructura latente esencial.

Conclusión: El criterio visual del scree plot corrobora la decisión de retener 3 factores.

6.3. Criterio paralelo

Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.

# Versión alternativa con mejor resolución
library(psych)
resultado_parallel <- fa.parallel(datos_palta, fa = "fa", fm = "minres", 
                                 n.iter = 100, plot = FALSE)
## Parallel analysis suggests that the number of factors =  4  and the number of components =  NA
# Gráfico personalizado
plot(resultado_parallel$fa.values, type = "b", pch = 19, col = "blue",
     ylim = c(0, max(resultado_parallel$fa.values) + 0.5),
     xlab = "Número de Factores", ylab = "Eigenvalues",
     main = "Criterio Paralelo - Factores a Retener")
lines(resultado_parallel$fa.sim, type = "b", pch = 17, col = "red")
lines(resultado_parallel$fa.simr, type = "b", pch = 15, col = "orange")
legend("topright", legend = c("Datos Reales", "Datos Simulados", "Datos Re-muestreados"),
       col = c("blue", "red", "orange"), pch = c(19, 17, 15), bty = "n")

El análisis paralelo confirma la retención de 3 factores. Los eigenvalues de los datos reales (línea azul) superan a los de los datos simulados (línea roja) hasta el tercer factor, indicando que solo estos primeros tres factores explican más varianza de lo esperado por azar.

Esta triple validación (Kaiser, Scree Plot, Criterio Paralelo) consolida la decisión de proceder con 3 factores para el análisis factorial rotado.

Conclusión: Determinación del Número de Factores

La aplicación de tres criterios estadísticos converge consistentemente en la retención de 3 factores:

  1. Criterio de Kaiser: 3 factores con eigenvalues > 1 (5.91, 1.75, 1.27)
  2. Scree Plot: Codo pronunciado después del tercer factor, marcando el punto de inflexión óptimo.
  3. Criterio Paralelo: 3 factores con eigenvalues que superan los valores simulados por azar.

Esta triple validación metodológica proporciona una base sólida para proceder con la extracción y rotación de 3 factores, los cuales explican colectivamente el 81.2% de la varianza total del sistema de cultivo de palta.

7. Matriz de cargas factoriales y Varianza total

Criterio de selección: Se prioriza el método que maximice las comunalidades promedio, indicando mejor explicación de la varianza común.

modelo_final <- fa(datos_palta, nfactors = 3, rotate = "varimax", fm = "minres")

7.1. Estructura Factorial

fa.diagram(modelo_final)

print(modelo_final$loadings[1:11,])
##                                MR1         MR2         MR3
## riego_por_goteo        0.975716682 -0.14650082 -0.04521799
## fertilizacion_organica 0.127290096  0.77062293 -0.05598301
## mulching               0.009801228  0.08350448  0.88765138
## pH_suelo               0.084730940  0.29873962  0.09388622
## materia_organica       0.115234089  0.84645192  0.45728761
## humedad_suelo          0.943113470  0.24460973  0.17706047
## altura_planta          0.902923200  0.35437408  0.19259192
## diametro_tronco        0.874080550  0.44301681  0.16730663
## densidad_frutos        0.639156523  0.70965201  0.05021835
## peso_promedio_fruto    0.467687262  0.25249129  0.65084424
## rendimiento_palta      0.506314709  0.35507688  0.13994210
# Cambiar el nombre del objeto de 'loadings' a 'cargas_factoriales'
cargas_factoriales <- modelo_final$loadings[, 1:3]

# Ahora sí funciona
loadings_df <- as.data.frame(cargas_factoriales)
loadings_df$Variable <- rownames(loadings_df)

# Convertir a formato largo para ggplot2
loadings_long <- melt(loadings_df, id.vars = "Variable",
                      variable.name = "Factor", 
                      value.name = "Carga")

ggplot(loadings_long, aes(x = Factor, y = Variable, fill = Carga)) +
  geom_tile(color = "white") +
  scale_fill_gradient2(low = "blue", mid = "white", high = "red", midpoint = 0) +
  geom_text(aes(label = round(Carga, 3)), color = "black", size = 3) +
  theme_minimal() +
  labs(title = "Heatmap de Cargas Factoriales (Varimax, 3 Factores)",
       x = "Factor", y = "") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

La matriz de cargas rotadas revela una estructura factorial bien definida:

Factor 1 (MR1)

  • Crecimiento y Manejo Hídrico (39.5% de varianza):

    • Cargas altas: riego_por_goteo (0.98), humedad_suelo (0.94), altura_planta (0.90), diámetro_tronco (0.87)

    • Interpretación: Representa el desarrollo vegetativo influenciado por el manejo del agua.

Factor 2 (MR2)

  • Fertilidad y Producción (22.8% de varianza):

    • Cargas altas: materia_organica (0.85), fertilización_organica (0.77), densidad_frutos (0.71)

    • Interpretación: Agrupa variables relacionadas con nutrición del suelo y potencial productivo.

Factor 3 (MR3)

  • Prácticas Culturales (14.1% de varianza):

    • Cargas altas: mulching (0.89), peso_promedio_fruto (0.65)

    • Interpretación: Representa prácticas de cobertura y calidad del fruto.

7.2. Varianza explicada

print(modelo_final$Vaccounted[1:3,], cut=0)
##                      MR1       MR2       MR3
## SS loadings    4.3411373 2.5031376 1.5531678
## Proportion Var 0.3946488 0.2275580 0.1411971
## Cumulative Var 0.3946488 0.6222068 0.7634039
# Crear heatmap de varianza explicada
varianza_df <- as.data.frame(t(modelo_final$Vaccounted[1:3,]))
varianza_df$Factor <- rownames(varianza_df)

varianza_long <- melt(varianza_df, id.vars = "Factor",
                      variable.name = "Metrica", 
                      value.name = "Valor")

ggplot(varianza_long, aes(x = Factor, y = Metrica, fill = Valor)) +
  geom_tile(color = "white") +
  scale_fill_gradient2(low = "#FFE900", high = "red", 
                       midpoint = 0.5) +
  geom_text(aes(label = round(Valor, 3)), color = "black", size = 4) +
  theme_minimal() +
  labs(title = "Varianza Explicada por Factor",
       x = "Factor", y = "Métrica") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

El modelo de 3 factores explica 76.3% de la varianza total de los datos, lo que representa una excelente capacidad explicativa:

  • Factor 1 (MR1): Explica 39.5% de la varianza - el factor más importante.

  • Factor 2 (MR2): Contribuye con 22.8% adicional - segundo en relevancia.

  • Factor 3 (MR3): Aporta 14.1% restante - complementa la estructura.

Distribución de la varianza explicada:

  • Factor 1: 51.7% de la varianza explicada por el modelo.

  • Factor 2: 29.8% de la varianza explicada.

  • Factor 3: 18.5% de la varianza explicada.

La estructura factorial obtenida captura eficientemente la información subyacente en las 11 variables originales, validando la solidez del modelo propuesto.

7.3. Calidad del Ajuste Factorial

Comunalidades

La comunalidad representa la proporción de varianza de cada variable que es explicada por los factores comunes.

  • Comunalidad ALTA (>0.70): La variable está bien representada por los factores.

  • Comunalidad BAJA (<0.30): La variable tiene poca relación con la estructura factorial común.

modelo_final$communalities
##        riego_por_goteo fertilizacion_organica               mulching 
##              0.9755249              0.6131883              0.7949925 
##               pH_suelo       materia_organica          humedad_suelo 
##              0.1052286              0.9388742              0.9806509 
##          altura_planta        diametro_tronco        densidad_frutos 
##              0.9779460              0.9882756              0.9146523 
##    peso_promedio_fruto      rendimiento_palta 
##              0.7060882              0.4020334
# Crear dataframe para las comunalidades
comunalidades_df <- data.frame(
  Variable = names(modelo_final$communalities),
  Comunalidad = modelo_final$communalities
)

# Ordenar de mayor a menor comunalidad
comunalidades_df <- comunalidades_df[order(-comunalidades_df$Comunalidad), ]

# Heatmap de comunalidades
ggplot(comunalidades_df, aes(x = "", y = reorder(Variable, Comunalidad), fill = Comunalidad)) +
  geom_tile(color = "white", width = 0.5) +
  scale_fill_gradient2(low = "#bfff00", mid = "#FFE900", high = "red",
                       midpoint = 0.5, limits = c(0, 1),
                       name = "Comunalidad") +
  geom_text(aes(label = round(Comunalidad, 3)), color = "black", size = 3.5) +
  theme_minimal() +
  labs(title = "Comunalidades por Variable",
       subtitle = "Varianza explicada por los factores comunes",
       x = "", y = "") +
  theme(axis.text.x = element_blank(),
        panel.grid = element_blank())

La mayoría de variables están bien representadas por los factores (comunalidades >0.70). pH_suelo es la única variable con representación factorial deficiente (0.105).

Unicidades

La unicidad representa la proporción de varianza de cada variable que NO es explicada por los factores comunes.

  • Unicidad ALTA (>0.70): La variable tiene mucha varianza única no capturada por los factores.

  • Unicidad BAJA (<0.30): La variable está bien explicada por la estructura factorial común.

modelo_final$uniquenesses
##        riego_por_goteo fertilizacion_organica               mulching 
##             0.02446980             0.38680343             0.20500597 
##               pH_suelo       materia_organica          humedad_suelo 
##             0.89476069             0.06112829             0.01935265 
##          altura_planta        diametro_tronco        densidad_frutos 
##             0.02205706             0.01172779             0.08535108 
##    peso_promedio_fruto      rendimiento_palta 
##             0.29391855             0.59798204
# Crear dataframe para las unicidades
unicidades_df <- data.frame(
  Variable = names(modelo_final$uniquenesses),
  Unicidad = modelo_final$uniquenesses
)

# Ordenar de menor a mayor unicidad
unicidades_df <- unicidades_df[order(unicidades_df$Unicidad), ]

# Heatmap de unicidades
ggplot(unicidades_df, aes(x = "", y = reorder(Variable, -Unicidad), fill = Unicidad)) +
  geom_tile(color = "white", width = 0.5) +
  scale_fill_gradient2(low = "#ff00ff", mid = "#8000ff", high = "#13b6ec",
                       midpoint = 0.4, limits = c(0, 1),
                       name = "Unicidad") +
  geom_text(aes(label = round(Unicidad, 3)), color = "black", size = 3.5) +
  theme_minimal() +
  labs(title = "Unicidades por Variable",
       subtitle = "Varianza única NO explicada por los factores",
       x = "", y = "") +
  theme(axis.text.x = element_blank(),
        panel.grid = element_blank())

La mayoría de variables están bien representadas por los factores (unicidades <0.30). pH_suelo es la excepción con alta varianza única (0.89) no explicada por la estructura factorial común.

8. Conclusión General del Análisis Factorial

El análisis factorial identificó una estructura robusta de tres factores latentes que explican el 76.3% de la varianza total del sistema de cultivo de palta:

Estructura Factorial Identificada:

  • Factor 1 - Crecimiento y Manejo Hídrico (39.5%): Dominado por riego, humedad del suelo y variables de crecimiento vegetativo (cargas >0.87).

  • Factor 2 - Fertilidad y Producción (22.8%): Agrupa materia orgánica, fertilización y densidad de frutos (cargas >0.70).

  • Factor 3 - Prácticas Culturales (14.1%): Representado principalmente por mulching y peso del fruto (cargas >0.65).

Calidad del Ajuste:

  • Comunalidades: 8 de 11 variables presentan excelente representación factorial (>0.70).

  • Unicidades: La mayoría de variables muestran baja varianza única no explicada.

  • Variables críticas: pH_suelo requiere consideración especial por su alta unicidad (0.89).

Validación Metodológica:

KMO meritorio (0.8) y consistencia en tres criterios de retención de factores confirman la solidez del modelo para orientar estrategias de manejo agronómico.

4 - Análisis Factorial Mixto

1. Introducción

La definición de éxito estudiantil suele reducirse al rendimiento académico, omitiendo factores clave como el bienestar y el estrés. Este estudio adopta un enfoque integral, empleando un Análisis Factorial de Datos Mixtos (FAMD) para analizar simultáneamente variables cuantitativas (académicas) y cualitativas (hábitos de vida). El objetivo es identificar los perfiles latentes que caracterizan a la población estudiantil, con el fin de proporcionar una base empírica para el diseño de programas de apoyo más efectivos.

1.1. Descripción del Conjunto de Datos

El análisis se basa en un conjunto de datos simulado que comprende una muestra de 250 estudiantes universitarios. Para capturar un perfil integral de cada estudiante, se recopilaron variables que se clasifican en dos categorías principales: cuantitativas y cualitativas.

Variable Descripción Tipo Rango
Edad Edad del participante en años Cuantitativa 18-25
Horas_Estudio_Semanal Cantidad de horas semanales dedicadas al estudio Cuantitativa 5-30
Promedio_General Promedio ponderado acumulado (PPA) Cuantitativa Escala de 0 a 20
Genero Género del estudiante Cualitativa Masculino, Femenino
Area_Estudio Área de especialización Cualitativa Ingeniería, C.Sociale, Artes y C. de la Salud
Nivel_Estres Nivel de estrés percibido en el último semestre. Cualitativa Bajo, Moderado, Alto
Participa_Actividades Participación en actividades extracurriculares. Cualitatitva Si , No

1.2. Metodología

La metodología de este estudio es el Análisis Factorial de Datos Mixtos (FAMD), una técnica elegida por su capacidad para analizar simultáneamente variables cuantitativas (numéricas) y cualitativas (categóricas).

Al unificar los principios del Análisis de Componentes Principales (ACP) y el Análisis de Correspondencias Múltiples (ACM), el FAMD reduce la dimensionalidad de los datos. Su objetivo es proyectar la información en un número menor de factores latentes que explican la mayor parte de la varianza, sin necesidad de transformar las variables originales.

La aplicación de esta técnica busca visualizar las relaciones entre variables, identificar los factores más influyentes y segmentar a los estudiantes en perfiles coherentes.

2. Preparación de datos

# Carga de librerías 

library(FactoMineR) # Análisis de datos multivariados.
library(ggplot2)    # Creación de gráficos elegantes
library(factoextra) # Visualización de resultados
library(tidyverse)  # Manipulación, transformación y visualización de datos
library(sjPlot)     # Fácil visualización
library(performance)# Para diagnóstico de modelos
library(tidymodels) # Herramientas para estimación modelos
library(visdat)     # Vistazo a los datos
library(naniar)     # Análisis de datos perdidos
library(GGally)     # Complemento de visualización
library(effectsize) # Para interpretar tamaños del efecto
library(cowplot)    # Para plot_grid()
# Simulación de datos
set.seed(123)
Y <- tibble(
  Edad = sample(18:25, 250, replace = TRUE),
  Horas_Estudio_Semanal = round(runif(250, min = 5, max = 30)),
  Promedio_General = pmin(20, pmax(5, (Horas_Estudio_Semanal * 0.35) + rnorm(250, mean = 6, sd = 3))),
  Genero = factor(sample(c("Masculino", "Femenino"), 250, replace = TRUE)),
  Area_Estudio = factor(sample(c("Ingeniería", "Ciencias Sociales", "Artes y Humanidades", "Ciencias de la Salud"), 250, replace = TRUE, prob = c(0.3, 0.3, 0.2, 0.2))),
  Nivel_Estres = factor(sample(c("Bajo", "Moderado", "Alto"), 250, replace = TRUE, prob = c(0.3, 0.5, 0.2)), levels = c("Bajo", "Moderado", "Alto")),
  Participa_Actividades = factor(sample(c("Si", "No"), 250, replace = TRUE, prob = c(0.6, 0.4)))
)

# Renombramos una variable 
Y <- Y %>% rename(Actividades = Participa_Actividades)

head(Y)
## # A tibble: 6 × 7
##    Edad Horas_Estudio_Semanal Promedio_General Genero  Area_Estudio Nivel_Estres
##   <int>                 <dbl>            <dbl> <fct>   <fct>        <fct>       
## 1    24                    11             8.72 Mascul… Ciencias de… Alto        
## 2    24                    11             8.16 Femeni… Ciencias So… Alto        
## 3    20                    20            12.0  Femeni… Ciencias So… Moderado    
## 4    23                    12            10.5  Mascul… Ingeniería   Moderado    
## 5    20                    18            17.1  Femeni… Ingeniería   Bajo        
## 6    19                    25            14.5  Mascul… Ciencias de… Bajo        
## # ℹ 1 more variable: Actividades <fct>
dim(Y)
## [1] 250   7
summary(Y)
##       Edad       Horas_Estudio_Semanal Promedio_General       Genero   
##  Min.   :18.00   Min.   : 5.00         Min.   : 5.00    Femenino :125  
##  1st Qu.:20.00   1st Qu.:11.00         1st Qu.: 9.95    Masculino:125  
##  Median :22.00   Median :16.50         Median :12.33                   
##  Mean   :21.72   Mean   :17.08         Mean   :12.24                   
##  3rd Qu.:24.00   3rd Qu.:23.75         3rd Qu.:14.52                   
##  Max.   :25.00   Max.   :30.00         Max.   :20.00                   
##                Area_Estudio   Nivel_Estres Actividades
##  Artes y Humanidades :50    Bajo    : 69   No: 97     
##  Ciencias de la Salud:51    Moderado:128   Si:153     
##  Ciencias Sociales   :77    Alto    : 53              
##  Ingeniería          :72                              
##                                                       
## 

3. Análisis Exploratorio de los datos

view_df(Y, show.frq = T, show.prc = T)
Data frame: Y
ID Name Label Values Value Labels Freq. %
1 Edad range: 18-25
2 Horas_Estudio_Semanal range: 5-30
3 Promedio_General range: 5.0-20.0
4 Genero Femenino
Masculino
125
125
50.00
50.00
5 Area_Estudio Artes y Humanidades
Ciencias de la Salud
Ciencias Sociales
Ingeniería
50
51
77
72
20.00
20.40
30.80
28.80
6 Nivel_Estres Bajo
Moderado
Alto
69
128
53
27.60
51.20
21.20
7 Actividades No
Si
97
153
38.80
61.20

4. Gráficos

lista_de_graficos <- Y %>% 
  group_by(Nivel_Estres) %>%
  plot_frq(Area_Estudio, vjust = 0.8)

# Combina los gráficos en una sola columna
p <- plot_grid(plotlist = lista_de_graficos, ncol = 1)
p

#NOTA: 
# En el gráfio está con el  orden en que aparecen por primera vez en los datos (que esta incorrecto visualmente).
# Los gráficos correctamente  van en este orden : Nivel_Estres: Bajo , Nivel_Estres: Mediano , Nivel_Estres: Alto
  • Estrés Alto (N=53): Este grupo está dominado por las carreras Ciencias Sociales e Ingenería. Con 15 estudiantes, representan el 28.3% cada uno de todos los alumnos con estrés alto, siendo el perfil más característico de este grupo.

  • Estrés Bajo (N=69): En el grupo con menor estrés, el área predominante es Ingenería, con 23 estudiantes, lo que equivale al 33.3% (un tercio) del total de este perfil.

  • Estrés Moderado (N=128): Este es el grupo más grande. Ciencia Sociales es nuevamente la carrera más frecuente con 43 estudiantes, representando el 33.6% de los alumnos con estrés moderado.

plot_grpfrq(
  var.cnt = Y$Area_Estudio,
  var.grp = Y$Actividades
)

Este resultado significa que los 43 estudiantes de Ciencias Sociales que sí participan en actividades representan el 17.2% del total de la población estudiantil (250 estudiantes).

plot_xtab(
  x = Y$Nivel_Estres,
  grp = Y$Actividades,
  margin = 'row',
  bar.pos = 'stack',
  show.summary = T,
  coord.flip = T
)

  • Un valor p de 0.811 indica que el resultado no es estadísticamente significativo.

  • Cramer’s V = 0.041: Este valor es casi cero, confirmando que la fuerza de la asociación es insignificante.

  • χ² = 0.419 y df = 2: El valor del Chi-cuadrado es muy bajo. Esto significa que la diferencia entre los datos observados y lo que se esperaría si no hubiera relación es mínima. Los grados de libertad (df=2) ayudan a contextualizar este valor, confirmando que una discrepancia tan pequeña no es estadísticamente relevante.

En resumen, los resultados indican que no hay ninguna relación significativa entre las dos variables que se analizo. Las variables son estadísticamente independientes.

tab_xtab(
  var.row = Y$Nivel_Estres,
  var.col = Y$Actividades,
  show.row.prc = T
)
Nivel_Estres Actividades Total
No Si
Bajo 29
42 %
40
58 %
69
100 %
Moderado 48
37.5 %
80
62.5 %
128
100 %
Alto 20
37.7 %
33
62.3 %
53
100 %
Total 97
38.8 %
153
61.2 %
250
100 %
χ2=0.419 · df=2 · Cramer’s V=0.041 · p=0.811
# Se crea la lista de histogramas y se guarda en una variable.
lista_de_histogramas <- Y %>% 
  group_by(Actividades) %>% 
  plot_frq(
    Promedio_General,
    type = 'histogram',
    show.mean = T,
    normal.curve = T
  )
# Usa plot_grid para combinar los gráficos de esa lista.
p_combinado <- plot_grid(plotlist = lista_de_histogramas)
p_combinado

  • El promedio de calificación del grupo de personas que no realizaron actividades es 11.9

  • La mayoría de las personas tienen calificaciones cercanas a este promedio.

  • La distribución se asemeja a una campana de Gauss (distribución normal), lo que es típico en la medición de este tipo de variables.

  • El promedio de calificación de este grupo es 12.4, ligeramente superior al del grupo que no hizo actividades.

  • La distribución también se asemeja a una campana, con la mayoría de las calificaciones agrupadas cerca de la media.

  • Se observa una mayor concentración de personas con calificaciones un poco por encima del promedio, específicamente en el rango de 13 a

head(Y)
## # A tibble: 6 × 7
##    Edad Horas_Estudio_Semanal Promedio_General Genero  Area_Estudio Nivel_Estres
##   <int>                 <dbl>            <dbl> <fct>   <fct>        <fct>       
## 1    24                    11             8.72 Mascul… Ciencias de… Alto        
## 2    24                    11             8.16 Femeni… Ciencias So… Alto        
## 3    20                    20            12.0  Femeni… Ciencias So… Moderado    
## 4    23                    12            10.5  Mascul… Ingeniería   Moderado    
## 5    20                    18            17.1  Femeni… Ingeniería   Bajo        
## 6    19                    25            14.5  Mascul… Ciencias de… Bajo        
## # ℹ 1 more variable: Actividades <fct>

5. Modelo

m <- lm(Promedio_General ~ Horas_Estudio_Semanal + Nivel_Estres, data = Y)
summary(m)
## 
## Call:
## lm(formula = Promedio_General ~ Horas_Estudio_Semanal + Nivel_Estres, 
##     data = Y)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.0712 -1.8150  0.1375  1.9298  7.1723 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             7.0152     0.5133  13.668   <2e-16 ***
## Horas_Estudio_Semanal   0.3157     0.0249  12.680   <2e-16 ***
## Nivel_EstresModerado   -0.3880     0.4338  -0.895    0.372    
## Nivel_EstresAlto        0.1447     0.5242   0.276    0.783    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.863 on 246 degrees of freedom
## Multiple R-squared:  0.3981, Adjusted R-squared:  0.3907 
## F-statistic: 54.23 on 3 and 246 DF,  p-value: < 2.2e-16
  • Horas_Estudio_Semanal es el único predictor significativo e importante.

    • Impacto: Por cada hora adicional de estudio a la semana, se predice que el Promedio_General aumenta en 0.32 puntos.

El modelo es estadísticamente útil. El R-squared de 0.3981 indica que las variables utilizadas (horas de estudio y estrés) logran explicar aproximadamente el 39.8% de la variación en el Promedio_General. Si bien es una capacidad explicativa moderada, es significativamente mejor que no usar ningún predictor.

El p-value global del modelo (< 2.2e-16) es extremadamente bajo, lo que confirma que el modelo en su conjunto es estadísticamente significativo y fiable.

plot_model(m, show.values = T, width = 0.1) +
  ylab('Incremento en el Promedio General')

Este gráfico muestra qué factores influyen en el Promedio General:

  • Horas de Estudio: Tienen un impacto positivo y real. La barra de error no toca el cero, confirmando que más horas de estudio aumentan el promedio.

  • Nivel de Estrés (Moderado y Alto): No tienen un efecto claro. Sus barras de error cruzan la línea del cero, lo que significa que su impacto no es estadísticamente significativo.

En resumen, el gráfico demuestra visualmente que solo las horas de estudio son un predictor fiable para el promedio.

tab_model(m,
          show.reflvl = T,
          show.intercept = F,
          p.style = 'numeric_stars')
  Promedio_General
Predictors Estimates CI p
Horas_Estudio_Semanal 0.32 *** 0.27 – 0.36 <0.001
Bajo Reference
Moderado -0.39 -1.24 – 0.47 0.372
Alto 0.14 -0.89 – 1.18 0.783
Observations 250
R2 / R2 adjusted 0.398 / 0.391
  • p<0.05   ** p<0.01   *** p<0.001
# Interpretamos el R2 de nuestro modelo 
r2_ajustado <- summary(m)$adj.r.squared
interpret_r2(r2_ajustado, rules = 'cohen1988')
## [1] "substantial"
## (Rules: cohen1988)

Interpretación:

R-cuadrado ajustado de ~0.39 es mucho mayor que el umbral de 0.26. Por lo tanto, la función clasifica la capacidad explicativa del modelo como “substantial” (sustancial). Es una forma rápida de confirmar que el modelo tiene una fuerte capacidad para explicar los resultados.

5.1. Supuestos del modelo de regresión

# Chequeo de supuestos del modelo de regresión
check_model(m, verbose = TRUE)

Posterior Predictive Check (Verificación Predictiva)

Las dos distribuciones son casi idénticas. Significa que el modelo hace un gran trabajo replicando la realidad.

Linearity (Linealidad)

Los puntos están dispersos al azar alrededor de la línea horizontal del cero, sin ningún patrón.Confirma que la relación es lineal.

Homogeneity of Variance (Homogeneidad de Varianza)

Los puntos forman una banda horizontal con un ancho constante. Cumple el supuesto.

Influential Observations (Observaciones Influyentes)

Todos los puntos están dentro de las líneas de contorno discontinuas. Significa que no hay outliers problemáticos.

Collinearity (Colinealidad)

Revisa si tus variables predictoras (Horas_Estudio y Nivel_Estres) están demasiado relacionadas entre sí. Los puntos verdes (VIF) están muy por debajo del límite de 5. Significa que no hay problemas de colinealidad.

Normality of Residuals (Normalidad de los Residuos)

Los puntos se alinean casi perfectamente sobre la línea recta. Confirma que los errores son normales.

check_normality(m) %>% plot()

check_heteroscedasticity(m) %>% plot()

check_collinearity(m) %>% plot()

check_outliers(m) %>% plot()

6. FAMD

dim(Y)
## [1] 250   7
summary(Y)
##       Edad       Horas_Estudio_Semanal Promedio_General       Genero   
##  Min.   :18.00   Min.   : 5.00         Min.   : 5.00    Femenino :125  
##  1st Qu.:20.00   1st Qu.:11.00         1st Qu.: 9.95    Masculino:125  
##  Median :22.00   Median :16.50         Median :12.33                   
##  Mean   :21.72   Mean   :17.08         Mean   :12.24                   
##  3rd Qu.:24.00   3rd Qu.:23.75         3rd Qu.:14.52                   
##  Max.   :25.00   Max.   :30.00         Max.   :20.00                   
##                Area_Estudio   Nivel_Estres Actividades
##  Artes y Humanidades :50    Bajo    : 69   No: 97     
##  Ciencias de la Salud:51    Moderado:128   Si:153     
##  Ciencias Sociales   :77    Alto    : 53              
##  Ingeniería          :72                              
##                                                       
## 
# Se muestran 4 gráficos en los ejes 1 y 2
famd_pre_result <- Y %>% 
  FAMD(ncp = 10, graph = T) # ncp=10

Este gráfico agrupa a personas con características similares, revelando dos perfiles principales:

  • Perfil Izquierda: Asocia a los Hombres con las carreras de Ingeniería y Artes y Humanidades.

  • Perfil Derecha: Asocia a las Mujeres con Ciencias de la Salud y Ciencias Sociales.

Este gráfico muestra que las variables se agrupan en dos temas principales e independientes:

  • Rendimiento Académico (eje horizontal): Está dominado por las Horas de Estudio y el Promedio. Son los factores más importantes y están fuertemente conectados.

  • Perfil Personal (eje vertical): Está definido por el Estrés, la Edad, la Carrera y el Género.

La conclusión clave es que, en este análisis, el rendimiento académico es independiente del perfil demográfico de la persona.

  1. Fuerte Correlación Positiva: Las flechas de Horas_Estudio_Semanal y Promedio_General apuntan en la misma dirección y están muy juntas. Esto indica una fuerte relación positiva entre ellas: a más horas de estudio, mayor es el promedio.

  2. Sin Correlación: La flecha de Edad forma un ángulo de casi 90 grados con las otras dos. Esto significa que la edad no está correlacionada ni con las horas de estudio ni con el promedio general en este conjunto de datos

famd_pre_result
## *The results are available in the following objects:
## 
##   name          description                             
## 1 "$eig"        "eigenvalues and inertia"               
## 2 "$var"        "Results for the variables"             
## 3 "$ind"        "results for the individuals"           
## 4 "$quali.var"  "Results for the qualitative variables" 
## 5 "$quanti.var" "Results for the quantitative variables"
# Se muestran 4 gráficos en los ejes 2 y 3
famd_pre_result1 <- Y %>% 
  FAMD(ncp = 10, graph = T, axes = c(2, 3))

famd_pre_result1
## *The results are available in the following objects:
## 
##   name          description                             
## 1 "$eig"        "eigenvalues and inertia"               
## 2 "$var"        "Results for the variables"             
## 3 "$ind"        "results for the individuals"           
## 4 "$quali.var"  "Results for the qualitative variables" 
## 5 "$quanti.var" "Results for the quantitative variables"
famd_pre_result %>% fviz_famd_var()

6.1. Análisis de valores propios

(eigenvalues <- famd_pre_result %>% get_eigenvalue())
##        eigenvalue variance.percent cumulative.variance.percent
## Dim.1   1.7211320        17.211320                    17.21132
## Dim.2   1.1624366        11.624366                    28.83569
## Dim.3   1.0969466        10.969466                    39.80515
## Dim.4   1.0610498        10.610498                    50.41565
## Dim.5   1.0197498        10.197498                    60.61315
## Dim.6   0.9756646         9.756646                    70.36979
## Dim.7   0.9232417         9.232417                    79.60221
## Dim.8   0.8863051         8.863051                    88.46526
## Dim.9   0.8021758         8.021758                    96.48702
## Dim.10  0.3512980         3.512980                   100.00000

Dim.1 explica el 17.21% de toda la variabilidad.

famd_pre_result %>% fviz_screeplot(addlabels = TRUE, ylim = c(0, 30),
                                   barfill = "white", barcolor = "darkblue",
                                   linecolor = "red")

a <- famd_pre_result$eig
a
##         eigenvalue percentage of variance cumulative percentage of variance
## comp 1   1.7211320              17.211320                          17.21132
## comp 2   1.1624366              11.624366                          28.83569
## comp 3   1.0969466              10.969466                          39.80515
## comp 4   1.0610498              10.610498                          50.41565
## comp 5   1.0197498              10.197498                          60.61315
## comp 6   0.9756646               9.756646                          70.36979
## comp 7   0.9232417               9.232417                          79.60221
## comp 8   0.8863051               8.863051                          88.46526
## comp 9   0.8021758               8.021758                          96.48702
## comp 10  0.3512980               3.512980                         100.00000
b <- a[1:10, 1] # 10 componentes, igual que el número de variables
b
##    comp 1    comp 2    comp 3    comp 4    comp 5    comp 6    comp 7    comp 8 
## 1.7211320 1.1624366 1.0969466 1.0610498 1.0197498 0.9756646 0.9232417 0.8863051 
##    comp 9   comp 10 
## 0.8021758 0.3512980
# Suma de autovalores
sum(b)
## [1] 10
# Cálculos de varianza explicada 
e <- (b / 10) * 100 # Dividimos por 10 (número de variables activas)
e
##    comp 1    comp 2    comp 3    comp 4    comp 5    comp 6    comp 7    comp 8 
## 17.211320 11.624366 10.969466 10.610498 10.197498  9.756646  9.232417  8.863051 
##    comp 9   comp 10 
##  8.021758  3.512980
cumsum(e)
##    comp 1    comp 2    comp 3    comp 4    comp 5    comp 6    comp 7    comp 8 
##  17.21132  28.83569  39.80515  50.41565  60.61315  70.36979  79.60221  88.46526 
##    comp 9   comp 10 
##  96.48702 100.00000

6.2. Análisis de variables general

var_analysis <- famd_pre_result %>% get_famd_var()
var_analysis$coord
##                             Dim.1        Dim.2        Dim.3        Dim.4
## Edad                  0.068643047 3.031169e-01 0.1549648346 0.0472219991
## Horas_Estudio_Semanal 0.759753240 5.708993e-03 0.0005458777 0.0008074925
## Promedio_General      0.757628808 9.305051e-05 0.0012645231 0.0029862507
## Genero                0.000094767 2.338446e-01 0.0912604657 0.1184400300
## Area_Estudio          0.023406924 2.702561e-01 0.5875925449 0.5606711461
## Nivel_Estres          0.089993467 3.148939e-01 0.0342392461 0.1979890588
## Actividades           0.021611773 3.452304e-02 0.2270791569 0.1329338201
##                              Dim.5       Dim.6       Dim.7       Dim.8
## Edad                  1.225488e-02 0.003114163 0.002721558 0.135441934
## Horas_Estudio_Semanal 5.550757e-05 0.019133469 0.021928355 0.007266439
## Promedio_General      1.802657e-02 0.015027258 0.003973005 0.031102308
## Genero                7.503944e-02 0.198232981 0.137908090 0.026730368
## Area_Estudio          4.906350e-01 0.102378580 0.440944637 0.280389138
## Nivel_Estres          2.415819e-01 0.628379640 0.035101953 0.347929808
## Actividades           1.821565e-01 0.009398527 0.280664129 0.057445102
##                              Dim.9       Dim.10
## Edad                  0.2707188709 1.801807e-03
## Horas_Estudio_Semanal 0.0157892904 1.690113e-01
## Promedio_General      0.0002151911 1.696830e-01
## Genero                0.1184489970 2.619959e-07
## Area_Estudio          0.2399899489 3.735999e-03
## Nivel_Estres          0.1033402000 6.550807e-03
## Actividades           0.0536732700 5.147254e-04

Para la Dimensión 1:

  • Horas_Estudio_Semanal (0.76) y Promedio_General (0.76) tienen valores extremadamente altos.

  • Todas las demás variables tienen valores muy cercanos a cero.

Conclusión: Esto prueba que la Dimensión 1 trata casi exclusivamente sobre el Rendimiento Académico.

var_analysis$cos2
##                              Dim.1        Dim.2        Dim.3        Dim.4
## Edad                  4.711868e-03 9.187986e-02 2.401410e-02 2.229917e-03
## Horas_Estudio_Semanal 5.772250e-01 3.259260e-05 2.979825e-07 6.520441e-07
## Promedio_General      5.740014e-01 8.658397e-09 1.599019e-06 8.917693e-06
## Genero                8.980784e-09 5.468330e-02 8.328473e-03 1.402804e-02
## Area_Estudio          1.826280e-04 2.434612e-02 1.150883e-01 1.047840e-01
## Nivel_Estres          4.049412e-03 4.957908e-02 5.861630e-04 1.959983e-02
## Actividades           4.670687e-04 1.191840e-03 5.156494e-02 1.767140e-02
##                              Dim.5        Dim.6        Dim.7        Dim.8
## Edad                  1.501821e-04 9.698008e-06 7.406878e-06 1.834452e-02
## Horas_Estudio_Semanal 3.081090e-09 3.660896e-04 4.808528e-04 5.280114e-05
## Promedio_General      3.249574e-04 2.258185e-04 1.578477e-05 9.673536e-04
## Genero                5.630917e-03 3.929631e-02 1.901864e-02 7.145126e-04
## Area_Estudio          8.024090e-02 3.493791e-03 6.481072e-02 2.620602e-02
## Nivel_Estres          2.918091e-02 1.974305e-01 6.160736e-04 6.052758e-02
## Actividades           3.318097e-02 8.833232e-05 7.877235e-02 3.299940e-03
##                              Dim.9       Dim.10
## Edad                  7.328871e-02 3.246507e-06
## Horas_Estudio_Semanal 2.493017e-04 2.856483e-02
## Promedio_General      4.630722e-08 2.879233e-02
## Genero                1.403016e-02 6.864183e-14
## Area_Estudio          1.919839e-02 4.652563e-06
## Nivel_Estres          5.339598e-03 2.145654e-05
## Actividades           2.880820e-03 2.649422e-07

Dimensión 2: Las variables con mayor peso son las demográficas como Genero y Nivel_Estres. Esto confirma que esta dimensión agrupa el Perfil Personal.

var_analysis$contrib
##                              Dim.1        Dim.2       Dim.3       Dim.4
## Edad                   3.988249944 26.075995012 14.12692539  4.45049791
## Horas_Estudio_Semanal 44.142647340  0.491122979  0.04976338  0.07610316
## Promedio_General      44.019215070  0.008004781  0.11527663  0.28144303
## Genero                 0.005506085 20.116761981  8.31949902 11.16253265
## Area_Estudio           1.359972581 23.249104620 53.56619170 52.84117178
## Nivel_Estres           5.228736992 27.089124761  3.12132282 18.65973297
## Actividades            1.255671989  2.969885865 20.70102106 12.52851849
##                              Dim.5      Dim.6      Dim.7      Dim.8       Dim.9
## Edad                   1.201753814  0.3191837  0.2947828 15.2816377 33.74807388
## Horas_Estudio_Semanal  0.005443254  1.9610703  2.3751478  0.8198575  1.96830807
## Promedio_General       1.767744871  1.5402074  0.4303321  3.5092101  0.02682593
## Genero                 7.358613042 20.3177380 14.9373762  3.0159330 14.76596548
## Area_Estudio          48.113272454 10.4932144 47.7604753 31.6357357 29.91737701
## Nivel_Estres          23.690314197 64.4052914  3.8020328 39.2562120 12.88248836
## Actividades           17.862858369  0.9632949 30.3998531  6.4814139  6.69096127
##                             Dim.10
## Edad                  5.128998e-01
## Horas_Estudio_Semanal 4.811054e+01
## Promedio_General      4.830174e+01
## Genero                7.457939e-05
## Area_Estudio          1.063484e+00
## Nivel_Estres          1.864744e+00
## Actividades           1.465210e-01

Dimensión 1 (Rendimiento Académico):

Está formada casi en su totalidad por Horas_Estudio_Semanal (44.1%) y Promedio_General (44.0%). Juntas, suman más del 88% de la contribución, lo que confirma que esta dimensión trata exclusivamente sobre el rendimiento.

famd_pre_result %>% fviz_contrib(choice = "var", axes = 1)

famd_pre_result %>% fviz_contrib(choice = "var", axes = 1:2)

Cuantitativas

var_analysis_quanti <- famd_pre_result %>% get_famd_var(element = "quanti.var")
aaa <- var_analysis_quanti$contrib
aaa
##                          Dim.1        Dim.2       Dim.3      Dim.4       Dim.5
## Edad                   3.98825 26.075995012 14.12692539 4.45049791 1.201753814
## Horas_Estudio_Semanal 44.14265  0.491122979  0.04976338 0.07610316 0.005443254
## Promedio_General      44.01922  0.008004781  0.11527663 0.28144303 1.767744871
##                           Dim.6     Dim.7      Dim.8       Dim.9     Dim.10
## Edad                  0.3191837 0.2947828 15.2816377 33.74807388  0.5128998
## Horas_Estudio_Semanal 1.9610703 2.3751478  0.8198575  1.96830807 48.1105362
## Promedio_General      1.5402074 0.4303321  3.5092101  0.02682593 48.3017401
(s <- sum(aaa[1:3, 1])) # total contrib de la dim.1 con 3 variables cuantitativas
## [1] 92.15011
famd_pre_result %>% 
  fviz_famd_var(choice = "quanti.var", col.var = "contrib",
                gradient.cols = c("red", "yellow", "green"))

  • Horas de Estudio y Promedio General: Están fuertemente conectadas. Las flechas verdes, largas y juntas indican que a más horas de estudio, mayor es el promedio. Definen el eje principal (Dim 1).

  • Edad: No tiene relación con las otras dos variables. Su flecha roja apunta en otra dirección, indicando que es un factor independiente.

  • La leyenda de color contrib confirma esto: el verde indica una alta contribución, mientras que el rojo indica una más baja. Por lo tanto, el rendimiento académico (verde) es el patrón más fuerte en los datos.

Cualitativas

var_analysis_quali <- famd_pre_result %>% get_famd_var(element = "quali.var")
var_analysis_quali$v.test # Pruebas Z para significancia de categorías
##                           Dim.1     Dim.2     Dim.3     Dim.4     Dim.5
## Femenino             -0.1536131 -7.630682  4.766955 -5.430614  4.322594
## Masculino             0.1536131  7.630682 -4.766955  5.430614 -4.322594
## Artes y Humanidades  -1.7176838 -0.244868  7.654134 -7.914016 -5.243894
## Ciencias de la Salud  1.3542104 -1.721785  6.632499  8.527055  6.182167
## Ciencias Sociales     1.3325127  7.562759 -3.876899 -4.992951  6.525149
## Ingeniería           -1.0463235 -5.961824 -8.710776  4.492947 -7.521805
## Bajo                 -4.6251914 -1.863087 -2.792995  6.850248  5.096143
## Moderado              3.7058792  7.883877  1.106914 -3.138920 -7.751864
## Alto                  0.5263499 -7.604068  1.700944 -3.653235  3.906673
## No                   -2.3197697  2.931934 -7.519489 -5.753305  6.734757
## Si                    2.3197697 -2.931934  7.519489  5.753305 -6.734757
##                             Dim.6       Dim.7     Dim.8      Dim.9       Dim.10
## Femenino               7.02566809 -5.85995856 -2.579896  5.4308195  0.008076941
## Masculino             -7.02566809  5.85995856  2.579896 -5.4308195 -0.008076941
## Artes y Humanidades    4.13852209  7.38029944  2.974801 -4.0779436  0.445541915
## Ciencias de la Salud  -3.16970241  3.19910043 -8.289612 -0.5270693  0.070291180
## Ciencias Sociales     -1.99840423 -9.16083018  2.848125 -3.2563161 -0.928319769
## Ingeniería             1.20238936 -0.02652024  1.845395  7.3910609  0.490320239
## Bajo                   9.62748330  1.32303176  4.768566 -5.0328718 -0.965009805
## Moderado               0.09752856 -2.88470455 -9.207659  2.6918420  1.258348737
## Alto                 -10.64872087  2.08090952  6.045324  2.2123560 -0.483497805
## No                     1.52978211  8.35974689 -3.782041  3.6557686  0.358003664
## Si                    -1.52978211 -8.35974689  3.782041 -3.6557686 -0.358003664
aa <- var_analysis_quali$contrib
aa
##                            Dim.1      Dim.2      Dim.3     Dim.4     Dim.5
## Femenino             0.002753043 10.0583810  4.1597495  5.581266  3.679307
## Masculino            0.002753043 10.0583810  4.1597495  5.581266  3.679307
## Artes y Humanidades  0.550760627  0.0165724 17.1592078 18.964822  8.663728
## Ciencias de la Salud 0.340621337  0.8152717 12.8198382 21.906658 11.981235
## Ciencias Sociales    0.286704985 13.6740746  3.8079408  6.529585 11.603635
## Ingeniería           0.181885632  8.7431858 19.7792049  5.440107 15.864674
## Bajo                 3.613969276  0.8682333  2.0677315 12.859263  7.405063
## Moderado             1.563827388 10.4792656  0.2189086  1.819891 11.548862
## Alto                 0.050940328 15.7416259  0.8346827  3.980579  4.736390
## No                   0.768471257  1.8175701 12.6690249  7.667453 10.932069
## Si                   0.487200732  1.1523157  8.0319962  4.861065  6.930789
##                             Dim.6        Dim.7     Dim.8      Dim.9
## Femenino             10.158868991 7.468688e+00  1.507967  7.3829827
## Masculino            10.158868991 7.468688e+00  1.507967  7.3829827
## Artes y Humanidades   5.640019953 1.895497e+01  3.207918  6.6604493
## Ciencias de la Salud  3.291926606 3.543676e+00 24.785568  0.1107081
## Ciencias Sociales     1.137556227 2.526161e+01  2.543558  3.6735869
## Ingeniería            0.423711589 2.178312e-04  1.098692 19.4726326
## Bajo                 27.622578161 5.512700e-01  7.459876  9.1812418
## Moderado              0.001910661 1.766476e+00 18.747168  1.7703130
## Alto                 36.780802542 1.484287e+00 13.049168  1.9309336
## No                    0.589536468 1.860471e+01  3.966625  4.0948683
## Si                    0.373758414 1.179514e+01  2.514789  2.5960930
##                            Dim.10
## Femenino             3.728969e-05
## Masculino            3.728969e-05
## Artes y Humanidades  1.815483e-01
## Ciencias de la Salud 4.496139e-03
## Ciencias Sociales    6.817518e-01
## Ingeniería           1.956882e-01
## Bajo                 7.707740e-01
## Moderado             8.833786e-01
## Alto                 2.105912e-01
## No                   8.967087e-02
## Si                   5.685016e-02
(s1 <- sum(aa[, 1])) # La suma de contrib (con variables cualitativas) respecto a la Dim.1
## [1] 7.849888
s + s1 # contrib total a la dim.1 debe ser 100
## [1] 100
famd_pre_result %>% 
  fviz_famd_var("quali.var", col.var = "contrib",
                gradient.cols = c("red", "yellow", "green"))

6.3. Análisis de individuos

dim(Y)
## [1] 250   7
ind_analysis <- famd_pre_result %>% get_famd_ind()
ind_analysis
## FAMD results for individuals 
##  ===================================================
##   Name       Description                      
## 1 "$coord"   "Coordinates"                    
## 2 "$cos2"    "Cos2, quality of representation"
## 3 "$contrib" "Contributions"
# La suma de las contribuciones de los individuos para una dimensión es 100
sum(ind_analysis$contrib[1:250, 1]) # 250 individuos en nuestra simulación
## [1] 100
# La suma de cos2 para un individuo a través de todas las dimensiones es 1
sum(ind_analysis$cos2[3, 1:10]) # cos2 del estudiante 3 en las 10 dimensiones
## [1] 1
famd_pre_result %>% 
  fviz_famd_ind(col.ind = "contrib", 
                gradient.cols = c("red", "yellow", "green"),
                repel = TRUE)

famd_pre_result %>% 
  fviz_famd_ind(col.ind = "cos2", 
                gradient.cols = c("red", "yellow", "green"),
                repel = TRUE)

7. Conclusión

El análisis factorial mixto reveló que la estructura de los datos se organiza en torno a dos ejes principales que son independientes entre sí: el rendimiento académico y el perfil demográfico.

  1. El Rendimiento Académico es un Factor Independiente y Clave La Dimensión 1, que es la más importante y explica el 17.2% de la variabilidad, está definida casi en su totalidad por las horas de estudio y el promedio general.
    • Se confirma una fuerte y directa correlación: a más horas de estudio, mayor es el promedio. Este es el patrón más dominante en todo el conjunto de datos.

    • Este eje de rendimiento es independiente de las características demográficas de los estudiantes como su género, carrera o nivel de estrés.

  2. El Perfil Demográfico Define el Segundo Gran Patrón La Dimensión 2 (11.6% de la variabilidad) agrupa a los individuos según su perfil personal, principalmente por carrera, género y nivel de estrés.

El análisis identificó perfiles claros y diferenciados:

  • Perfil 1 (Mujeres): Existe una fuerte asociación entre ser mujer y estudiar carreras de Ciencias de la Salud o Ciencias Sociales. El grupo de Ciencias de la Salud, en particular, se asocia con un nivel de estrés alto.

  • Perfil 2 (Hombres): Se asocia fuertemente a los hombres con las carreras de Ingeniería y Artes y Humanidades. El perfil de Ingeniería destaca por tener un nivel de estrés bajo y una mayor participación en actividades extracurriculares.

En resumen, la conclusión principal es que el éxito académico (promedio) depende directamente de un factor controlable como las horas de estudio, mientras que las características demográficas como la carrera y el género forman un conjunto de perfiles completamente separado que no influye directamente en este rendimiento.