Paper julio 2025
Gráficos EDA (Exploratory Data Analysis)
Abstract estadístico
An exploratory data analysis based on statistical graphics was carried out for the purposes of choosing an appropriate analysis and checking assumptions.
One-way analysis of variance (ANOVA) was used to compare las características físico-químicas en función de su origen botánico (phenolic compound content, DPPH and FRAP assays, glucose, etc.) with α = 0.05.
Se llevó a cabo un análisis de correlación de Pearson para todas las variables numéricas.
Se realizó un análisis de componentes principales con el fin de reducir la dimensionalidad y llevar a cabo un análisis de clusters con el fin de agrupar las distintas muestras analizadas.
All of the data were processed using R software version 4.5.0—R Development Core Team 2025. Graphs were generated using the ggplot2 package.
Correlaciones
Matriz de correlacion completa para observar algo interesante
No veo ninguna correlación intereante para seguir investigando
Boxplots con barra de error y pvalues
mapping: x = ~x, y = ~y
geom_text: na.rm = FALSE, parse = TRUE
stat_identity: na.rm = FALSE
position_identity
Sugerencia N° 2
The relationship of total carbohy-22 drates, glucose/fructose ratio, and total phenolic compounds to their antioxidant/antiradical activity should be designed or discussed in the manuscript.
¿Esto será?
Carbohidratos versus glu/fru
Total Phenolics / (FRAP/ DPPH)
ANOVA
Compararemos las medias de cada variable entre los distintos orígenes botánicos. A continuación los pvalues de cada uno de los ANOVA para evaluar si existen diferencias estadísticamente significativas entre origenes botánicos (sólo aquellos con p-value < 0,05 son significtivos)
| Parameter | p.value |
|---|---|
| Ash | 0.540 |
| Carbohydrates | 0.085 |
| DPPH | 0.197 |
| FRAP | 0.029 |
| Fructose | 0.305 |
| Glucose | 0.726 |
| HMF | 0.000 |
| Moisture | 0.009 |
| Na | 0.045 |
| Total_phenols | 0.269 |
APC para evaluar si hay clusters de mieles
ATENCION: HICE UN NUEVO GRÁFICO de PC, POR FAVOR CAMBIAR
Un análisis de componenentes principales lo que hace es reducir la dimensionalidad de los datos originales con el fin de generar nuevas variables (los componenentes principales) que capturen la mayor cantidad de variabilidad de tus datos originales.
ESte APC se realiza sobre todas tus variables NUMERICAS solamente. Tu tenías N = 10 variables numéricas y te gustaría visualizarlas. Pero no puedes hacer un gráfico de 10 dimensiones. Entonces el APC toma tus N = 10 variabless y calcula los componenetes principales. Estos componenenetes son combinaciones lineales de tus variables originales y la gracia que tienen es que son independientes (ortogonales).
Lo que se busca es pasar de 10 dimensiones ojalá sólo a 2. Pero esta será posible siempre y cuando los 2 primeros componentes principales capturen la mayor cantidad de variabilidad de tus datos originales. En este caso, el primer PC cpaturó el 27,99% de la variabilidad de las 10 dimensiones originales. El segundo el 19,03%. Entre el primero y el segundo componente principales capturaron el 47% de la variabilidad original.
¿Para qué se hace todo esto? Porque ahora tus 10 dimensiones originales numéricas, ahora están graficadas sólo en 2 dimensiones lo cual permite visualizar clusters. Al go que sería muy difícil de ver si miraras las 10 variables simultáneamente. Los cluster en este caso podrian estar agrupados por Origen Botánico (aunque no necesariamente). La Tineo está muy bien separada, sin embargo, las otras dos tienen cierto grado de solapamiento lo que quiere decir que comparten ciertas características (no necesariamente las que mediste, quizás son otras que están correlacionadas con las que mediste).
Correlaciones y anovas especiales
Fenoles azúcares HMF con origen botánico
Aquí estan correlacionados sólo pata Tiaca (apenas eso sí)
Nada por quí
Aquí estan correlacionados sólo en Tineo
Aquí también estan correlacionados sólo en Tineo