1.Regresión Lineal Múltiple

Los datos siguientes son número de especies de plantas en 30 islas de Galápagos (Faraway, 2005). Además del número de especies, contiene las variables Endemic (número de especies endémicas), Area (km2), Elevation (altura máxima, m), Nearest (distancia a la isla más cercana, km), Scruz (distancia hasta la isla Santa Cruz, km), Adjacent (área de la isla adyacente, km2).

a.Análisis de correlacion bivariado

I.Análisis de correlacion bivariado entre Número de especies vs especies endémicas

Se realizo el análisis de correlación bivariado entre número de especies y especies endémicas donde el coeficiente de correlación de Pearson es de r=0.9708765, lo cual significa que existe una correlación lineal positiva o relación directa y además es fuerte, es decir, una baja dispersión en la nuve de puntos.

II.Análisis de correlacion bivariado entre Número de especies vs área

Se realizo el análisis de correlación bivariado entre número de especies y área donde el coeficiente de correlación de Pearson es de r=0.6178431, lo cual significa que existe una correlación lineal positiva o relación directa y además es fuerte, es decir, una baja dispersión en la nuve de puntos.

III.Análisis de correlacion bivariado entre Número de especies vs altura máxima

Se realizo el análisis de correlación bivariado entre número de especies y altura máxima donde el coeficiente de correlación de Pearson es de r=0.7384867, lo cual significa que existe una correlación lineal positiva o relación directa y además es fuerte, es decir, una baja dispersión en la nuve de puntos.

IV.Análisis de correlacion bivariado entre Número de especies vs distancia a la isla más cercana

Se realizo el análisis de correlacion bivariado entre número de especies y distancia a la isla más cercana donde el coeficiente de correlación de Pearson es de r=-0.01409407, el cual significa que existe una correlación lineal negativa o relación inversa y además es casi nula, es decir, que existe una gran dispersión en la nube de punto

V.Análisis de correlacion bivariado entre Número de especies vs distancia hasta la isla de Santa Cruz

Se realizo el análisis de correlacion bivariado entre número de especies y distancia hasta la isla de Santa Cruz donde el coeficiente de correlación de Pearson es de r=-0.1711424, el cual significa que existe una correlación lineal negativa o relación inversa y además es casi nula, es decir, que existe una gran dispersión en la nube de punto

VI.Análisis de correlacion bivariado entre Número de especies vs área de la isla adyacente

Se realizo el análisis de correlación bivariado entre número de especies y altura máxima donde el coeficiente de correlación de Pearson es de r=0.02616635, lo cual significa que existe una correlación lineal positiva o relación directa y además es fuerte, es decir, una baja dispersión en la nuve de puntos.

b.Estimación el modelo de regresión lineal múltiple

## 
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4 + x5 + x6)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -68.219 -10.225   1.830   9.557  71.090 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -15.337942   9.423550  -1.628    0.117    
## x1            4.393654   0.481203   9.131 4.13e-09 ***
## x2            0.013258   0.011403   1.163    0.257    
## x3           -0.047537   0.047596  -0.999    0.328    
## x4           -0.101460   0.500871  -0.203    0.841    
## x5            0.008256   0.105884   0.078    0.939    
## x6            0.001811   0.011879   0.152    0.880    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 28.96 on 23 degrees of freedom
## Multiple R-squared:  0.9494, Adjusted R-squared:  0.9362 
## F-statistic: 71.88 on 6 and 23 DF,  p-value: 9.674e-14

En primer lugar, tenemos el valor p, el cual está dado por: p-value: <9.674e-14, podemos notar que valor p es demasiado pequeño por lo cual el resultado del estudio es fiable, es decir, la hipótesis de que existe una correlación entre las covariables y el número de especies es correcta, ya que este es muy cercano a cero. Por otro lado, los coeficientes de las variables significativas son: \(\beta_0=-15.337942\) es la cordenada en el origen, el valor de la variable dependiente Y cuando todos los predictores son cero, \(\beta_1= 4.393654\), \(\beta_2=0.013258\), \(\beta_3=-0.047537\) y \(\beta_4=-0.101460\), \(\beta_5=0.008256\) y \(\beta_6=0.001811\) son el efecto promedio que tiene el incremento en una unidad de la variable predictora X (en nuestro caso son: \(x_1\),\(x_2\),\(x_3\), \(x_4\), \(x_5\) y \(x_6\)) sobre la variable dependiente Y, manteniéndose constantes el resto de variables. Se conocen como coeficientes parciales de regresión.Y por último tenemos el coeficiente R2, está dado por: R-squared:0.9494, donde es el 94.94%, esto quiere decir, que se ajusta bien el modelo a sus datos, es decir, indica que el modelo explica gran parte de la variabilidad de los datos de respuesta en torno a su media.

c.Predicción de la cantidad de especies estimada para cada isla

I.Datos reales

##    gala.Species
## 1            58
## 2            31
## 3             3
## 4            25
## 5             2
## 6            18
## 7            24
## 8            10
## 9             8
## 10            2
## 11           97
## 12           93
## 13           58
## 14            5
## 15           40
## 16          347
## 17           51
## 18            2
## 19          104
## 20          108
## 21           12
## 22           70
## 23          280
## 24          237
## 25          444
## 26           62
## 27          285
## 28           44
## 29           16
## 30           21

II.Datos Aproximados

##              predict.modelomul..gala.
## Baltra                      69.548232
## Bartolome                   72.956216
## Caldwell                    -7.371508
## Champion                    22.218429
## Coamano                    -13.144557
## Daphne.Major                26.597516
## Daphne.Minor               -20.266924
## Darwin                       6.403492
## Eden                        -1.142860
## Enderby                    -11.721599
## Espanola                    90.875630
## Fernandina                  84.636464
## Gardner1                    57.794920
## Gardner2                    -8.496779
## Genovesa                    60.945142
## Isabela                    357.767204
## Marchena                    68.992131
## Onslow                      -7.694627
## Pinta                      109.349785
## Pinzon                     107.121290
## Las.Plazas                  19.739135
## Rabida                      99.881628
## SanCristobal               239.491159
## SanSalvador                305.219227
## SantaCruz                  372.909915
## SantaFe                     94.154529
## SantaMaria                 277.383535
## Seymour                     48.060734
## Tortuga                     10.748584
## Wolf                        24.043957

III.Errores

##    gala.Species
## 1    11.5482319
## 2    41.9562162
## 3    10.3715084
## 4     2.7815705
## 5    15.1445567
## 6     8.5975161
## 7    44.2669242
## 8     3.5965084
## 9     9.1428598
## 10   13.7215992
## 11    6.1243701
## 12    8.3635361
## 13    0.2050797
## 14   13.4967794
## 15   20.9451419
## 16   10.7672036
## 17   17.9921308
## 18    9.6946274
## 19    5.3497850
## 20    0.8787096
## 21    7.7391351
## 22   29.8816284
## 23   40.5088408
## 24   68.2192273
## 25   71.0900849
## 26   32.1545286
## 27    7.6164651
## 28    4.0607345
## 29    5.2514162
## 30    3.0439571

IV.Gráfica

2.Modelo de Diseño de Experimentos

Dos tipos de moluscos A y B fueron sometidos a tres concentraciones distintas de agua de mar (100%, 75% y 50%) y se observó el consumo de oxígeno midiendo la proporción de \(O_2\) por unidad de peso seco del molusco

a.Análisis exploratorio

En el grupo A el consumo de oxigeno en la concentración de agua al 50% se tiene una mediana de 11.11 la cual tiene una diferencia de 1.74 al grupo B del consumo de oxigeno en la concentración de agua al 50% dado que su mediana es de 12.85. Ahora, el grupo A el consumo de oxigeno en la concentración de agua al 75% se tiene una mediana de 7.18 la cual tiene una diferencia de 1.58 al grupo B del consumo de oxigeno en la concentración de agua al 75% dado que su mediana es de 5.60, y el grupo A el consumo de oxigeno en la concentración de agua al 100% se tiene una mediana de 9.29 la cual tiene una diferencia de 3.15 al grupo B del consumo de oxigeno en la concentración de agua al 100% dado que su mediana es de 6.14. Esto quiere decir, que la concentacion de agua al 50% es mayor a comparación de las concentaciones de agua al 75% y 100%, por lo tanto, a menor concentración de agua mayor será el consumo de oxigeno y viceversa, es decir, que a mayor concentración de agua menor será el consumo de oxigeno, además se tiene que las conclusiones son distintas para cada molusco.

b.Estimación del modelo de diseño de experimentos

## 
## Call:
## lm(formula = cons_o ~ molusco + c_agua, data = BD_moluscos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.8092 -2.2945 -0.6798  2.8297  7.3011 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 15.36948    1.91620   8.021 3.22e-10 ***
## moluscoB    -1.39125    0.97343  -1.429  0.15985    
## c_agua      -0.07159    0.02384  -3.002  0.00436 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.372 on 45 degrees of freedom
## Multiple R-squared:  0.1972, Adjusted R-squared:  0.1616 
## F-statistic: 5.528 on 2 and 45 DF,  p-value: 0.007132

En primer lugar, tenemos el valor p, el cual está dado por: p-value:0.007132, podemos notar que valor p es demasiado pequeño por lo cual el resultado del estudio es fiable, es decir, la hipótesis de que existe una correlación entre consumo de oxigeno y concentración de agua es correcta, ya que este es muy cercano a cero. Por otro lado, los coeficientes de las variables significativas son: \(\beta_0=15.36948\) es la cordenada en el origen, el valor de la variable dependiente Y cuando todos los predictores son cero y \(\beta_1=-1.39125\) y \(\beta_2=-0.07159\), son el efecto promedio que tiene el incremento en una unidad de la variable predictora X (en nuestro caso es: \(x_1\) y \(x_2\)) sobre la variable dependiente Y. Por último tenemos el coeficiente R2, está dado por: R-squared:0.1972, donde es el 19,72%, esto quiere decir, que no se ajusta muy bien el modelo a sus datos, es decir, indica que el modelo no explica gran parte de la variabilidad de los datos de respuesta en torno a su media.

3.Análisis de Componentes Principales

Es una metodología que permite analizar grandes conjuntos de datos numericos multivariados, es decir un conjunto amplio de variables e individuos. El objetivo principal es estudiar las correlaciones entre las variables y sus similitudes entre individuos de manera eficiente.

Se seleccionaron un total de 10 cafés que fueron evaluados en cuanto a características de calidad por un grupo de catadores expertos quienes evaluaron en una escala de cero a diez, algunos factores como la intensidad y el aroma del café.

a.Descomposición espectral de la matriz de varianzas y covarianzas

##              Intensidad Aroma Cuerpo Acidez Amargo Astringencia
## Intensidad         1.00  0.83   0.84   0.87   0.70         0.78
## Aroma              0.83  1.00   0.86   0.72   0.71         0.66
## Cuerpo             0.84  0.86   1.00   0.67   0.66         0.62
## Acidez             0.87  0.72   0.67   1.00   0.67         0.61
## Amargo             0.70  0.71   0.66   0.67   1.00         0.56
## Astringencia       0.78  0.66   0.62   0.61   0.56         1.00

En estos resultados, la correlación de Pearson entre las variables intensidad, aroma, cuerpo acidez, amargo y astringencia se tienen que todas las correlaciones son potivas, lo que indica que existe una relación positiva moderada entre las variables.

Matriz de Covarianza

##              Intensidad Aroma Cuerpo Acidez Amargo Astringencia
## Intensidad         0.31  0.29   0.13   0.16   0.10         0.09
## Aroma              0.29  0.38   0.15   0.15   0.12         0.08
## Cuerpo             0.13  0.15   0.08   0.06   0.05         0.04
## Acidez             0.16  0.15   0.06   0.11   0.06         0.04
## Amargo             0.10  0.12   0.05   0.06   0.07         0.03
## Astringencia       0.09  0.08   0.04   0.04   0.03         0.04

La covarianza es similar a la correlación, pero cuando se calcula la covarianza, los datos no están estandarizados. Por lo tanto, la covarianza se expresa en unidades que varían con los datos y no se convierte a una escala estandarizada de −1 a +1. Puesto que los datos no están estandarizados, no se puede utilizar el estadístico de covarianza para evaluar la fuerza de una relación lineal. En estos resultados, la covarianza entre las variables intensidad, aroma, cuerpo acidez, amargo y astringencia se tienen que todas las correlaciones son potivas, lo que indica que existe una relación positiva moderada entre las variables.

Matriz de Varianza

##              Intensidad Aroma Cuerpo Acidez Amargo Astringencia
## Intensidad         0.31  0.29   0.13   0.16   0.10         0.09
## Aroma              0.29  0.38   0.15   0.15   0.12         0.08
## Cuerpo             0.13  0.15   0.08   0.06   0.05         0.04
## Acidez             0.16  0.15   0.06   0.11   0.06         0.04
## Amargo             0.10  0.12   0.05   0.06   0.07         0.03
## Astringencia       0.09  0.08   0.04   0.04   0.03         0.04

La varianza de los datos de la muestra es una estimación de la varianza de la población. Puesto que la varianza se basa en los datos de una muestra y no en toda la población, es improbable que la varianza de la muestra sea igual a la varianza de la población. Para estimar mejor la varianza de la población, utilice el intervalo de confianza. En estos resultados, la varianza entre las variables intensidad, aroma, cuerpo acidez, amargo y astringencia se tienen que todas las correlaciones son potivas, lo que indica que existe una relación positiva entre las variables.

Inercia

##        inertia      cum    cum(%)
## Ax1 4.60147661 4.601477  76.69128
## Ax2 0.46937103 5.070848  84.51413
## Ax3 0.38451212 5.455360  90.92266
## Ax4 0.34461612 5.799976  96.66626
## Ax5 0.14487978 5.944856  99.08093
## Ax6 0.05514434 6.000000 100.00000

La inercia queda distribuidad de la siguiente manera: la componente uno tiene una inercia de 4.60147661, la componente dos tiene una inercia de 0.46937103, la componente tres tiene una inercia de 0.38451212, la componente cuatro tiene una inercia de 0.34461612, la componente cinco tiene una inercia de 0.14487978 y la componente seis tiene una inercia de 0.05514434.Por otro lado, se sugiere analizar dos componentes principales, dado que con esos dos componentes se logra preservar 84.51% de la información original, lo cual es aceptable, dado que el porcentaje esperado es de 75%.

b.Gráfico del circulo de correlaciones del primer plano factorial

c.Gráfico de los individuos (cafés) del primer plano factorial

d. Interprete ambos resultados

Las variables acidez, intensidad,aroma y cuerpo están relacionadas positivamente, dado que están cerca entonces tienen una alta correlación directa.

Los cafés 040C, 020M y C20C están relacionados dado que están cerca, entonces se podría decir que son parecidos.

Por otro lado, a cada uno de los 10 cafés se les realizaron pruebas químicas para evaluar algunas características como el nivel de cafeína, la densidad aparente (DA), el pH, los ácidos cítricos entre otras.

e.Matriz de datos que incluyendo ambas bases café química y café calidad

##      Intensidad Aroma Cuerpo Acidez Amargo Astringencia Color    DA   pH
## ExCl       7.72  7.00   6.84   5.02   5.04         5.36   298 385.1 5.02
## C40M       6.02  5.42   6.22   4.34   4.60         4.78   361 481.3 5.11
## C40C       6.48  5.98   6.44   4.58   4.82         4.80   321 422.6 5.12
## C20M       6.82  6.44   6.70   4.62   4.38         4.80   335 444.3 5.05
## C20C       7.08  6.20   6.72   4.78   4.94         4.90   314 368.7 5.04
## ExOs       7.66  7.42   6.98   5.12   5.18         5.22   186 346.6 5.31
## O40M       6.18  5.82   6.26   4.00   4.46         4.96   278 422.6 5.45
## O40C       6.84  6.56   6.82   4.30   4.96         4.84   238 403.0 5.33
## O20M       6.66  7.06   6.70   4.64   5.00         4.90   226 368.7 5.33
## O20C       7.00  6.70   7.04   4.60   4.88         5.18   210 368.7 5.31
##      AcidezT Cafeina AcidosCl
## ExCl    11.7    1.40     2.74
## C40M     6.5    0.81     1.62
## C40C     5.8    0.80     1.61
## C20M     8.8    1.10     2.20
## C20C     9.3    1.10     2.19
## ExOs     8.7    1.35     2.30
## O40M     4.9    0.80     1.35
## O40C     5.2    0.79     1.36
## O20M     6.7    1.10     1.83
## O20C     7.0    1.05     1.83

f.Descomposición espectral de la matriz de varianzas y covarianzas

##              Intensidad Aroma Cuerpo Acidez Amargo Astringencia Color    DA
## Intensidad         1.00  0.83   0.84   0.87   0.70         0.78 -0.46 -0.74
## Aroma              0.83  1.00   0.86   0.72   0.71         0.66 -0.76 -0.81
## Cuerpo             0.84  0.86   1.00   0.67   0.66         0.62 -0.68 -0.78
## Acidez             0.87  0.72   0.67   1.00   0.67         0.61 -0.25 -0.61
## Amargo             0.70  0.71   0.66   0.67   1.00         0.56 -0.63 -0.80
## Astringencia       0.78  0.66   0.62   0.61   0.56         1.00 -0.51 -0.63
## Color             -0.46 -0.76  -0.68  -0.25  -0.63        -0.51  1.00  0.79
## DA                -0.74 -0.81  -0.78  -0.61  -0.80        -0.63  0.79  1.00
## pH                -0.22  0.17   0.03  -0.45   0.07         0.07 -0.71 -0.27
## AcidezT            0.78  0.47   0.48   0.82   0.33         0.60  0.11 -0.34
## Cafeina            0.88  0.79   0.67   0.89   0.53         0.76 -0.32 -0.63
## AcidosCl           0.81  0.57   0.53   0.88   0.38         0.63  0.01 -0.41
##                 pH AcidezT Cafeina AcidosCl
## Intensidad   -0.22    0.78    0.88     0.81
## Aroma         0.17    0.47    0.79     0.57
## Cuerpo        0.03    0.48    0.67     0.53
## Acidez       -0.45    0.82    0.89     0.88
## Amargo        0.07    0.33    0.53     0.38
## Astringencia  0.07    0.60    0.76     0.63
## Color        -0.71    0.11   -0.32     0.01
## DA           -0.27   -0.34   -0.63    -0.41
## pH            1.00   -0.67   -0.29    -0.60
## AcidezT      -0.67    1.00    0.88     0.98
## Cafeina      -0.29    0.88    1.00     0.94
## AcidosCl     -0.60    0.98    0.94     1.00

En estos resultados, la correlación de Pearson entre las variables intensidad, aroma, cuerpo acidez, amargo, astringencia, color, DA, ph y acidezT se tienen que todas la mayoria de las correlaciones son potivas, lo que indica que existe una relación positiva moderada entre las variables y las que son negativas indica que existe una relación negativa entre las variables.

Matriz de covarianza

##              Intensidad  Aroma Cuerpo Acidez Amargo Astringencia   Color
## Intensidad         0.31   0.29   0.13   0.16   0.10         0.09  -15.04
## Aroma              0.29   0.38   0.15   0.15   0.12         0.08  -27.39
## Cuerpo             0.13   0.15   0.08   0.06   0.05         0.04  -11.28
## Acidez             0.16   0.15   0.06   0.11   0.06         0.04   -4.93
## Amargo             0.10   0.12   0.05   0.06   0.07         0.03   -9.63
## Astringencia       0.09   0.08   0.04   0.04   0.03         0.04   -6.21
## Color            -15.04 -27.39 -11.28  -4.93  -9.63        -6.21 3450.90
## DA               -17.16 -20.88  -9.16  -8.45  -8.77        -5.43 1931.54
## pH                -0.02   0.02   0.00  -0.02   0.00         0.00   -6.48
## AcidezT            0.92   0.62   0.29   0.58   0.18         0.26   13.72
## Cafeina            0.11   0.11   0.04   0.07   0.03         0.04   -4.34
## AcidosCl           0.20   0.16   0.07   0.13   0.04         0.06    0.21
##                   DA    pH AcidezT Cafeina AcidosCl
## Intensidad    -17.16 -0.02    0.92    0.11     0.20
## Aroma         -20.88  0.02    0.62    0.11     0.16
## Cuerpo         -9.16  0.00    0.29    0.04     0.07
## Acidez         -8.45 -0.02    0.58    0.07     0.13
## Amargo         -8.77  0.00    0.18    0.03     0.04
## Astringencia   -5.43  0.00    0.26    0.04     0.06
## Color        1931.54 -6.48   13.72   -4.34     0.21
## DA           1733.54 -1.72  -29.96   -5.95    -7.63
## pH             -1.72  0.02   -0.22   -0.01    -0.04
## AcidezT       -29.96 -0.22    4.54    0.43     0.94
## Cafeina        -5.95 -0.01    0.43    0.05     0.10
## AcidosCl       -7.63 -0.04    0.94    0.10     0.20

La covarianza es similar a la correlación, pero cuando se calcula la covarianza, los datos no están estandarizados. Por lo tanto, la covarianza se expresa en unidades que varían con los datos y no se convierte a una escala estandarizada de −1 a +1. Puesto que los datos no están estandarizados, no se puede utilizar el estadístico de covarianza para evaluar la fuerza de una relación lineal. En estos resultados, la covarianza entre las variables intensidad, aroma, cuerpo acidez, amargo, astringencia, color, DA, pH y AcidezT se tienen que la mayoria de las correlaciones son potivas, lo que indica que existe una relación positiva moderada entre las variables y las que son negativas indica que existe una relación negativa entre las variables.

Matriz de varianza

##              Intensidad  Aroma Cuerpo Acidez Amargo Astringencia   Color
## Intensidad         0.31   0.29   0.13   0.16   0.10         0.09  -15.04
## Aroma              0.29   0.38   0.15   0.15   0.12         0.08  -27.39
## Cuerpo             0.13   0.15   0.08   0.06   0.05         0.04  -11.28
## Acidez             0.16   0.15   0.06   0.11   0.06         0.04   -4.93
## Amargo             0.10   0.12   0.05   0.06   0.07         0.03   -9.63
## Astringencia       0.09   0.08   0.04   0.04   0.03         0.04   -6.21
## Color            -15.04 -27.39 -11.28  -4.93  -9.63        -6.21 3450.90
## DA               -17.16 -20.88  -9.16  -8.45  -8.77        -5.43 1931.54
## pH                -0.02   0.02   0.00  -0.02   0.00         0.00   -6.48
## AcidezT            0.92   0.62   0.29   0.58   0.18         0.26   13.72
## Cafeina            0.11   0.11   0.04   0.07   0.03         0.04   -4.34
## AcidosCl           0.20   0.16   0.07   0.13   0.04         0.06    0.21
##                   DA    pH AcidezT Cafeina AcidosCl
## Intensidad    -17.16 -0.02    0.92    0.11     0.20
## Aroma         -20.88  0.02    0.62    0.11     0.16
## Cuerpo         -9.16  0.00    0.29    0.04     0.07
## Acidez         -8.45 -0.02    0.58    0.07     0.13
## Amargo         -8.77  0.00    0.18    0.03     0.04
## Astringencia   -5.43  0.00    0.26    0.04     0.06
## Color        1931.54 -6.48   13.72   -4.34     0.21
## DA           1733.54 -1.72  -29.96   -5.95    -7.63
## pH             -1.72  0.02   -0.22   -0.01    -0.04
## AcidezT       -29.96 -0.22    4.54    0.43     0.94
## Cafeina        -5.95 -0.01    0.43    0.05     0.10
## AcidosCl       -7.63 -0.04    0.94    0.10     0.20

La varianza de los datos de la muestra es una estimación de la varianza de la población. Puesto que la varianza se basa en los datos de una muestra y no en toda la población, es improbable que la varianza de la muestra sea igual a la varianza de la población. Para estimar mejor la varianza de la población, se debe utilizar el intervalo de confianza. En estos resultados, la varianza entre las variables intensidad, aroma, cuerpo acidez, amargo, astringencia, color, DA, pH y acidez se tienen que la mayoria de las correlaciones son potivas, lo que indica que existe una relación positiva entre las variables y las que son negativas indica que existe una relación negativa entre las variables.

Inercia

##        inertia      cum    cum(%)
## Ax1 7.57389986  7.57390  63.11583
## Ax2 2.88991089 10.46381  87.19842
## Ax3 0.60177036 11.06558  92.21318
## Ax4 0.38830444 11.45389  95.44905
## Ax5 0.24642988 11.70032  97.50263
## Ax6 0.15677898 11.85709  98.80912
## Ax7 0.07184318 11.92894  99.40781
## Ax8 0.04578521 11.97472  99.78936
## Ax9 0.02527719 12.00000 100.00000

La inercia queda distribuidad de la siguiente manera: la componente uno tiene una inercia de 7.573899861, la componente dos tiene una inercia de 2.88991089, la componente tres tiene una inercia de 0.60177036, la componente cuatro tiene una inercia de 0.38830444, la componente cinco tiene una inercia de 0.24642988, la componente seis tiene una inercia de 0.15677898, la componente siete tiene una inercia de 0.07184318,la componente ocho tiene una inercia de 0.04578521 y la componente nueve tiene una inercia de 0.02527719.Por otro lado, se sugiere analizar dos componentes principales, dado que con esos dos componentes se logra preservar 87.19% de la información original, lo cual es aceptable, dado que el porcentaje esperado es de 75%.

g.Gráfico del circulo de correlaciones del primer plano factorial

Tanto las variables acidosCl y acidozT, las variables intensidad y astringencia y las variables cafeina y acidez tienen una alta correlación positiva porque está muy cerca en el gráfico. Por otro lado, las variables aroma, amargo y cuerpo tienen una alta correlación positiva porque está muy cerca en el gráfico y tienen una alta correlación negativa con respecto a la variable DA.

h.Gráfico de los individuos (cafés) del primer plano factorial

Los cafés 020M y 020C son parecidos porque están cerca en el gráfico.

4.Clasificación usando FactoCLass

Se tiene un tipo de gráfico el cual es un dendrograma que, en la agrupación jerárquica, el cual ilustra la disposición de las agrupaciones producidas por los análisis correspondientes, en este caso se necesitaba determinar en cuantos grupos de islas galápagos se iba a conformar, donde mediante este gráfico determina que se debe de clasicar en tres grupos.

## The number of retained axes for factorial analysis is  2 
## 
## The number of axes for clustering is  2
## Look the histogram of 25 indexes 
## Partition in  3  clusters
##       Baltra    Bartolome     Caldwell     Champion      Coamano Daphne.Major 
##            1            1            1            1            1            1 
## Daphne.Minor       Darwin         Eden      Enderby     Espanola   Fernandina 
##            1            2            1            1            1            3 
##     Gardner1     Gardner2     Genovesa      Isabela     Marchena       Onslow 
##            1            1            2            3            2            1 
##        Pinta       Pinzon   Las.Plazas       Rabida SanCristobal  SanSalvador 
##            2            1            1            1            2            3 
##    SantaCruz      SantaFe   SantaMaria      Seymour      Tortuga         Wolf 
##            3            1            3            1            1            2 
## Levels: 1 2 3
## class: 1
##           Test.Value Class.Mean Frequency Global.Mean
## Area          -2.120      7.220        19     261.709
## Scruz         -2.644     31.984        19      56.977
## Nearest       -3.098      3.916        19      10.060
## Species       -3.221     33.947        19      85.233
## Endemics      -3.450     13.000        19      26.100
## Elevation     -3.501    163.000        19     368.033
## ------------------------------------------------------------ 
## class: 2
##         Test.Value Class.Mean Frequency Global.Mean
## Nearest      5.073     36.500         6      10.060
## Scruz        3.806    151.533         6      56.977
## ------------------------------------------------------------ 
## class: 3
##           Test.Value Class.Mean Frequency Global.Mean
## Elevation      4.382   1122.200         5     368.033
## Endemics       4.347     74.600         5      26.100
## Species        4.187    281.200         5      85.233
## Area           3.199   1390.176         5     261.709
## Adjacent       2.269   1061.864         5     261.098

En el grupo uno, se tiene que tanto área, distancia hasta la isla Santa Cruz, distancia a la isla más cercana, especies, número de especies endémicas y altura máxima tienen un promedio por debajo del promedio del total de las islas. El grupo dos, se tiene que la distancia a la isla más cercana y la distancia hasta la isla Santa Cruz tiene un promedio por encima del promedio del total de las islas y el grupo tres, se tiene que tanto altura máxima, número de especies endémicas, especies, área y área de la isla adyacente tiene un promedio por encima del promedio del total de las islas.