Paper julio 2025

Published

September 12, 2025

Gráficos EDA (Exploratory Data Analysis)

Abstract estadístico

An exploratory data analysis based on statistical graphics was carried out for the purposes of choosing an appropriate analysis and checking assumptions.

One-way analysis of variance (ANOVA) was used to compare las características físico-químicas en función de su origen botánico (phenolic compound content, DPPH and FRAP assays, glucose, etc.) with α = 0.05.

Se llevó a cabo un análisis de correlación de Pearson para todas las variables numéricas.

Se realizó un análisis de componentes principales con el fin de reducir la dimensionalidad y llevar a cabo un análisis de clusters con el fin de agrupar las distintas muestras analizadas.

All of the data were processed using R software version 4.5.0—R Development Core Team 2025. Graphs were generated using the ggplot2 package.

Correlaciones

Matriz de correlacion completa para observar algo interesante

No veo ninguna correlación intereante para seguir investigando

Boxplots con barra de error y pvalues

mapping: x = ~x, y = ~y 
geom_text: na.rm = FALSE, parse = TRUE
stat_identity: na.rm = FALSE
position_identity 

Sugerencia N° 2

The relationship of total carbohy-22 drates, glucose/fructose ratio, and total phenolic compounds to their antioxidant/antiradical activity should be designed or discussed in the manuscript.

¿Esto será?

Carbohidratos versus glu/fru

Total Phenolics / (FRAP/ DPPH)

ANOVA

Compararemos las medias de cada variable entre los distintos orígenes botánicos. A continuación los pvalues de cada uno de los ANOVA para evaluar si existen diferencias estadísticamente significativas entre origenes botánicos (sólo aquellos con p-value < 0,05 son significtivos)

Parameter p.value
Ash 0.540
Carbohydrates 0.085
DPPH 0.197
FRAP 0.029
Fructose 0.305
Glucose 0.726
HMF 0.000
Moisture 0.009
Na 0.045
Total_phenols 0.269

APC para evaluar si hay clusters de mieles

ATENCION: HICE UN NUEVO GRÁFICO de PC, POR FAVOR CAMBIAR

Un análisis de componenentes principales lo que hace es reducir la dimensionalidad de los datos originales con el fin de generar nuevas variables (los componenentes principales) que capturen la mayor cantidad de variabilidad de tus datos originales.

ESte APC se realiza sobre todas tus variables NUMERICAS solamente. Tu tenías N = 10 variables numéricas y te gustaría visualizarlas. Pero no puedes hacer un gráfico de 10 dimensiones. Entonces el APC toma tus N = 10 variabless y calcula los componenetes principales. Estos componenenetes son combinaciones lineales de tus variables originales y la gracia que tienen es que son independientes (ortogonales).

Lo que se busca es pasar de 10 dimensiones ojalá sólo a 2. Pero esta será posible siempre y cuando los 2 primeros componentes principales capturen la mayor cantidad de variabilidad de tus datos originales. En este caso, el primer PC cpaturó el 27,99% de la variabilidad de las 10 dimensiones originales. El segundo el 19,03%. Entre el primero y el segundo componente principales capturaron el 47% de la variabilidad original.

¿Para qué se hace todo esto? Porque ahora tus 10 dimensiones originales numéricas, ahora están graficadas sólo en 2 dimensiones lo cual permite visualizar clusters. Al go que sería muy difícil de ver si miraras las 10 variables simultáneamente. Los cluster en este caso podrian estar agrupados por Origen Botánico (aunque no necesariamente). La Tineo está muy bien separada, sin embargo, las otras dos tienen cierto grado de solapamiento lo que quiere decir que comparten ciertas características (no necesariamente las que mediste, quizás son otras que están correlacionadas con las que mediste).

Correlaciones y anovas especiales

Fenoles azúcares HMF con origen botánico

Aquí estan correlacionados sólo pata Tiaca (apenas eso sí)

Nada por quí

Aquí estan correlacionados sólo en Tineo

Aquí también estan correlacionados sólo en Tineo