Una serie de 55 sujetos realizan todos ellos 3 catas aleatorizadas de 3 productos de crema de avellanas y cacao, con distintas concentraciones de harina de grillo. El objetivo primordial es confeccionar un perfil de los consumidores y obtener sus valoraciones y preferencias sobre los productos testados, con el fin de establecer el porcentaje de harina de grillo óptimo a incluir en la receta.
Las valoraciones en la encuesta se resumen en una variable suma de todas las valoraciones solicitadas, tanto para manifestar si una determinada característica gusta (en una escala del 0 al 6), como para valorar su percepción en la muestra catada (en una escala de -3 a 3). Se construye así una variable final “valoración”, sumando todas las valoraciones en los items de la escala. Valores altos en “valoración” significan satisfacción alta con el producto, y valores bajos implican satisfacción baja con el producto. El mínimo valor posible es de -17 y el máximo de 87.
En la cata se incluye la recogida de datos sobre diversos factores de clasificación como: edad (en cuatro niveles: 18-20, 21-23, 24-26 y 26-30 años), sexo y frecuencia de consumo de crema de avellanas y cacao (en seis niveles, desde 1=esporádicamente hasta 6=todos los días). A posteriori, podemos también clasificar a los sujetos en función de si les gusta o no la avellana o el cacao. Creamos así las variables “noavellana” que tiene 1 cuando al sujeto le desagrada tanto el olor como el sabor de la avellana (y 0 en caso contrario), y “nocacao”, que tiene 1 cuando al sujeto le desagrada tanto el olor como el sabor del cacao (y 0 en caso contrario). A priori es de esperar cierta diferenciación en las valoraciones de los sujetos, en función de si les gusta o no la avellana y el cacao.
Consideramos pues, como objetivos secundarios, investigar si hay diferencias en las valoraciones de las muestras debidas a:
Visualicemos en primer lugar las valoraciones obtenidas en la encuesta de cata y resumidas en la mencionada variable “valoracion”. En la Fig1. apreciamos diferencias en las valoraciones de las tres muestras, siendo en general la mejor valorada la muestra identificada como “678”, y la menor valorada la identificada por “654”.
Cuando diferenciamos a los consumidores según les guste o no la avellana, observamos que siempre la valoración (mediana) es inferior para los sujetos a los que NO les gusta la avellana (verde) frente a los que sí (roja). La preferencia por las muestras para los que sí les gusta la avellana son similares a las preferencias globales.
Idéntico comportamiento al global en la preferencia por las muestras encontramos para los consumidores a los que sí les gusta el cacao: la muestra mejor valorada es la “678” y le peor la “654”. Sin embargo, para los consumidores a los que no les gusta el cacao, la muestra mejor valorada sigue siendo la “678”, pero la peor valorada es la “100”. Distinguimos a continuación (Fig4.), a través de una nueva variable (nocave), entre los sujetos a los que les gusta tanto el cacao como la avellana (nocave=0), a los que les gusta una cosa u otra, pero no las dos (nocave=1) y a los que no les gusta ni el cacao ni la avellana (nocave=2). De nuevo representamos las valoraciones, y si bien la muestra “678” sigue siendo la preferida por aquellos a los que les gusta el cacao y la avellana, la muestra “654” es prácticamte igual de valorada por esos sujetos como por los que manifiestan no gustarle alguno de los ingredientes (no los dos)
## Warning in stats::qt(ci/2 + 0.5, data_sum$length - 1): NaNs produced
Visualicemos a continuación posibles relaciones con el resto de variables de clasificación consideradas.
Según la Fig5. no se aprecian a priori diferencias por sexo.
Según la Fig6. no se aprecian a priori diferencias por edad Según la Fig7. no se aprecian a priori diferencias relevantes respecto a la ordenación de las muestras por preferencia, clasificando a los sujetos por su frecuencia de consumo de cremas de cacao y avellanas.
Procedemos a continuación a validar estadísticamente las diferencias que previamente hemos detectado en los gráficos.
Dado que cada sujeto ha realizado la cata de las tres muestras y sus opiniones/valoraciones estarán relacionadas entre sí, es razonable considerar el efecto “catador” para correlacionar entre sí todas las valoraciones de un mismo sujeto. Incorporamos este efecto como un efecto aleatorio en un modelo lineal mixto, en el que a priori incluimos todos los factores de clasificación considerados, con el fin de discriminar cuáles provocan diferencias y cuáles no sobre las valoraciones de las cremas. Ver (linear mixed effects model and lmer package).
Como podemos ver en la tabla de Anova (Tabla1) del modelo mixto en el que hemos incluido todos los factores de clasificación, ninguno de los integrados en la encuesta (sexo, edad, consumo), resultan significativos. Sí es significativa sin embargo, la diferencia entre las muestras (concentración de harina de grillo), así como las valoraciones entre aquellos a los que gusta/no gusta el cacao y gusta/no gusta la avellana. Reajustamos pues, mediante un procedimiento de selección paso a paso, un modelo con las variables que resultan significativas, y obtenemos las siguientes conclusiones a partir de la Tabla 2.
## Backward reduced random-effect table:
##
## Eliminated npar logLik AIC LRT Df Pr(>Chisq)
## <none> 17 -535.25 1104.5
## (1 | id.1) 0 16 -556.93 1145.9 43.365 1 4.542e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Backward reduced fixed-effect table:
## Degrees of freedom method: Satterthwaite
##
## Eliminated Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
## sexo 1 0.09 0.09 1 42.213 0.0027 0.958974
## edad 2 60.36 15.09 4 43.236 0.4544 0.768668
## consumo 3 344.49 68.90 5 47.287 2.0737 0.085352 .
## muestra 0 1816.62 908.31 2 106.810 27.3517 2.562e-10 ***
## nocacao 0 295.62 295.62 1 122.140 8.9019 0.003441 **
## noavellana 0 973.86 973.86 1 138.589 29.3254 2.626e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Model found:
## suma ~ muestra + nocacao + noavellana + (1 | id.1)
Hemos investigado incluso posibles valoraciones diferentes de las tres muestras por los individuos a los que les gusta/no les gusta el cacao y la avellana, pero no salen significativas. Concluimos pues con que hay diferencias significativas en las valoraciones de las tres muestras a distintas concentraciones de grillos, así como entre las valoraciones que proporcionan catadores a los que gusta el cacao y a los que no les gusta, y las que proporcionan catadores a los que gusta la avellana y a los que no les gusta.
Verificamos la validez del efecto “sujeto”, lo que implica correlación entre las valoraciones que proporciona cada sujeto/catador, y que se ha tenido en cuenta a la hora de aislar los efectos (fijos) del resto de factores. Observamos en la siguiente tabla que el efecto aleatorio es claramente significativo.
## ANOVA-like table for random-effects: Single term deletions
##
## Model:
## suma ~ muestra + nocacao + noavellana + (1 | id.1)
## npar logLik AIC LRT Df Pr(>Chisq)
## <none> 7 -566.57 1147.1
## (1 | id.1) 6 -592.15 1196.3 51.161 1 8.509e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El resumen del modelo se muestra a continuación (seleccionaremos si queremos mostrar algo o no).
## Linear mixed model fit by maximum likelihood . t-tests use
## Satterthwaite's method [lmerModLmerTest]
## Formula: suma ~ muestra + nocacao + noavellana + (1 | id.1)
## Data: cata
##
## AIC BIC logLik deviance df.resid
## 1147.1 1168.9 -566.6 1133.1 158
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3144 -0.5935 0.0713 0.6160 2.0425
##
## Random effects:
## Groups Name Variance Std.Dev.
## id.1 (Intercept) 46.93 6.851
## Residual 32.08 5.664
## Number of obs: 165, groups: id.1, 55
##
## Fixed effects:
## Estimate Std. Error df t value Pr(>|t|)
## (Intercept) 41.640 1.225 99.050 33.983 < 2e-16 ***
## muestra654 -3.084 1.131 111.320 -2.726 0.00746 **
## muestra678 5.323 1.081 107.900 4.926 3.04e-06 ***
## nocacao1 -5.202 1.720 126.040 -3.025 0.00301 **
## noavellana1 -9.023 1.640 142.950 -5.502 1.69e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Correlation of Fixed Effects:
## (Intr) mst654 mst678 nocac1
## muestra654 -0.371
## muestra678 -0.447 0.468
## nocacao1 -0.045 -0.225 0.019
## noavellana1 -0.171 -0.096 0.017 -0.377
Así, el modelo ajustado nos permite predecir la valoración media según la encuesta de las tres muestras de crema de cacao consideradas.
Como cabía esperar, las valoraciones más altas las dan los sujetos a los que les gusta tanto el cacao como la avellana. En segundo lugar quedan las valoraciones de aquellos a los que no les gusta el cacao, pero sí la avellana. En tercer lugar las de los consumidores a los que no les gusta la avellana, aunque sí les gusta el cacao, y en último lugar las valoraciones de los que ni les gusta el cacao ni la avellana.
A diferencia de las medias puras que calculábamos y representábamos en la Fig4, tras ajustar el modelo se muestra claramente el efecto diferenciado de utilizar una u otra concentración de harina de grillo (tras salvar la variabilidad que provocan los diferentes individuos, así como la correlación entre las valoraciones de cada sujeto).
Se llevó a cabo una encuesta estructurada diferenciada en tres partes relativas a:
Todos los items estaban planteados sobre una escala de Likert del 1 al 5. Los items positivos (a favor de la característica de interés) se codifican desde “1=completamente en desacuerdo”, a “5=completamente de acuerdo”, y los negativos en orden inverso: “1=completamente de acuerdo” a “5=completamente en desacuerdo”.
La parte relativa a alimentos saludables (as) contenía 8 items, de los cuales 4 estaban formulados en positivo y 4 en negativo. Los valores posibles de la variable suma que resume el interés de cada sujeto por una alimentación saludable varía entre 8 y 40. Valores altos identifican interés por alimentos saludables, y valores bajos, desinterés.
La parte relativa a neofilia (nfa) contenía 10 items, de los cuales 5 estaban formulados en positivo y 5 en negativo. Los valores posibles de la variable suma que resume el grado de neofilia de cada sujeto varía entre 10 y 50. Valores altos de esta variable implican neofilia alta (baja neofobia) y valores bajos implican neofilia baja (neofobia alta).
La parte relativa a interés alimentario en la crema de cacao con harina de grillo (ccg) contiene 5 items diferenciados, de los cuales 3 son positivos y 2 son negativos. Los valores posibles de la variable suma que resume el interés de la crema de cacao con grillo varía entre 5 y 25. Valores altos de esta variable implican interés alto y valores bajos interés bajo.
La población sujeta a estudio son estudiantes de la UMH básicamente en grados de agronomía y biotecnología. La muestra está constituída por 244 sujetos encuestados, para los que se recopiló, además de las respuestas a los items temáticos de la encuesta, características demográficas como edad, sexo, lugar de residencia habitual durante el curso y titulación que se está cursando, si bien esta variable se capturó de forma incompleta, lo que nos ha llevado a excluirla del análisis.
El objetivo del análisis es descubrir si existe interés en la población sometida a estudio por el consumo de alimentos saludables (as), si este interés está ligado a su interés por probar alimentos nuevos (neofilia) y en particular crema de cacao y avellanas elaborada con harina de grillo (ccg). Es relevante conseguir un perfil sociodemográficos según las preferencias manifestadas a estas temáticas.
Objetivos específicos del análisis serán: 1) ratificar la coherencia en la respuesta de los sujetos (entre items positivos y negativos) 2) estudiar la relación entre estas variables y las variables de clasificación para intentar establecer perfiles de comportamiento 3) estudiar la relación existente entre estos tres aspectos estudiados.
Para hablar de coherencia en las respuestas de los sujetos, es de esperar una tendencia positiva entre los items codificados en positivo y los codificados en negativo. Todo conforme.
Describimos a continuación la muestra conseguida respecto a:
(as) Interés por una alimentación saludable: a la vista de los gráficos a continuación, no se visualizan diferencias relevantes respecto a la valoración de una alimentación saludable, justificadas por edad, sexo o lugar de residencia.
(nfa) Neofilia alimentaria: a la vista de los gráficos a continuación, no se visualizan diferencias relevantes respecto a neofilia, justificadas por edad, sexo o lugar de residencia.
(ccg) Receptividad a la crema de cacao con grillo: a priori, a la vista de los gráficos, no se visualizan diferencias relevantes respecto a predisposición por la crema de cacao con grillo, justificadas por edad, sexo o lugar de residencia.
Visualicemos la relación entre las tres variables de interés.
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
## Warning: 'scatterplot.matrix' is deprecated.
## Use 'scatterplotMatrix' instead.
## See help("Deprecated") and help("car-deprecated").
A partir del gráfico anterior, no advertimos correlación alguna entre “as” (preferencia por alimentación saludable) y “nfa” (neofilia), ni tampoco entre “as” y “ccg” (predisposición al consumo de crema de cacao con grillo). Sin embargo, sí que se detecta cierta correlación positiva entre la “neofilia”" y la “predisposición al consumo de crema de cacao con grillo”: individuos a los que les gusta probar alimentos nuevos parecen ser más proclives a aceptar la crema de cacao con harina de grillo.
Calculamos a continuación las correlaciones entre las tres variables de interés, y comprobamos que efectivamente, existe una correlación significativa de 0.58 entre “nfa” y “ccg” (p-valor=5.332050110^{-23}).
Dada la correlación entre “nfa” y “ccg”, proponemos resumir ambas a través de un índice único construido a partir de un análisis de componentes principales, y con él tratar de describir, clasificar e identificar a los sujetos respecto de sus opiniones (as) y características (edad, sexo, residencia).
Al definir un índice que condense la información contenida en las variables “nfa” y “ccg”, conseguimos una nueva variable que explica un 78.82% de la variabilidad en ambas, y que se construye como combinación lineal de ambas variables estandarizadas.
La relación de esta nueva variable con “as” es similar a la que ya se manifestaba entre “as” y las variables “nfa” y “ccg”: la correlación lineal es muy pequeña (0.1773585) y no significativa (p-valor=0.0054651). La correlación con “nfa” y “ccg” es positiva (0.88). Esto significa que valores altos en “pca” identifican a sujetos con un elevado grado de neofilia y muy receptivos a aceptar en su alimentación la crema de cacao con grillos. Valores bajos en “pca” identifican a sujetos con poco interés por los alimentos nuevos y muy poco receptivos a aceptar la crema de cacao con grillos en su alimentación. Denominaremos en adelante a esta nueva variable como “receptividad a alimentos nuevos y saludables (rans)”.
Una vez tenemos esta nueva variable “rans”, investigamos diferencias debidas al sexo, edad o residencia, e incluso su relación con alimentación saludable (“as”).
A la vista del gráfico anterior, procedemos a testar efectos globales e interacciones y mediante un procedimiento de selección hacia atrás a partir de un modelo lineal completo.
Descartamos a priori la posibilidad de interacciones triples dada la escasez de observaciones en algunas de las categorías que dicha interacción diferenciaría. Forzando pues, a considerar como máximo interacciones de orden 2, llegamos a un sencillo modelo (significativo) que incluye estas tres variables de un modo significativo, contrastadas a través de un análisis ANOVA:
Así tenemos contrastada de manera significativa la relación entre:
Las predicciones de “rans” con el modelo ANOVA ajustado en el rango de valores observados para “as”, se muestran en la siguiente gráfica:
La interpretación es cómoda a partir de la gráfica: - Conseguimos explicar de un modo lineal la relación entre el interés por una alimentación saludable y la receptividad a alimentos nuevos y saludables, incorporando las variables sexo, edad y residencia.
La edad no provoca cambios significativos en la relación entre el interés por una alimentación saludable y la receptividad a alimentos nuevos y saludables (sólo interviene en la altura-interceptación de las rectas de ajuste).
La residencia habitual, así como el sexo, sí provocan cambios significativos en la relación entre interés por una alimentación saludable y receptividad a alimentos nuevos y saludables (afectan a la pendiente de las rectas de ajuste).
La relación entre las variables “as” y “rans” es generalmente positiva o nula: a mayor interés por una alimentación saludable, mayor receptividad a alimentos nuevos y saludables. Sólo para el grupo de mujeres que viven con los padres la relación es inversa.
Para los sujetos que viven con sus padres, la relación entre el interés por una alimentación saludable y la receptividad a alimentos nuevos y saludables es positiva para los hombres, y negativa para las mujeres.
Para los sujetos que viven independientes, la relación entre el interés por una alimentación saludable y la receptividad a alimentos nuevos y saludables es positiva para los hombres, y prácticamente nula para las mujeres: una opinión diversa respecto al interés por una alimentación saludable no guarda relación alguna con su receptividad a alimentos nuevos y saludables, si bien ésta es negativa, esto es, podríamos concluir que este colectivo de mujeres independientes es poco o muy poco receptivo a alimentos nuevos y saludables.
Entre los sujetos que viven en el domicilio paterno sólo los fines de semana encontramos, sin embargo, mucho más diversidad respecto a su receptividad a alimentos nuevos y saludables, y en cualquier caso está muy ligada esta receptividad con su interés por la alimentación saludable: los que muestran poco interés son muy poco receptivos a alimentos nuevos, y los que tienen mucho interés son muy receptivos. Este hecho es más acusado para los hombres que para las mujeres.
Las conclusiones básicas conllevan una serie de implicaciones de interés: - Hemos sintetizado en una variable única las variables relativas a neofilia y receptividad a la crema de cacao con harina de grillo, a través de un análisis de componentes principales. - Hemos buscado una relación entre esta nueva variable y las recopiladas en el estudio, en particular con la relativa a interés por alimentación saludable. Las relaciones las hemos identificado y testado a través de un análisis ANOVA. - El colectivo de estudiantes que viven independientes durante la semana y acuden al domicilio paterno los fines de semana son los que manifiestan una relación más clara entre el interés por una alimentación saludable y la receptividad a alimentos nuevos y saludables. En este colectivo encontramos sujetos que se pronuncian muy receptivos a probar cosas nuevas y saludables (los que tienen un interés alto por la alimentación saludable), pero también otros muy poco o nada receptivos a alimentación novedosa y saludable (los que tienen un interés bajo por la alimentación saludable). Entre los hombres encontramos más acogida de alimentación nueva y saludable entre los sujetos que tienen interés por una alimentación saludable. - El colectivo de estudiantes mujeres entre 26 y 30 años que viven independientes no manifiesta interés alguno por alimentos nuevos y saludables.