1. Pregunta d’estudi

L’objectiu principal del nostre estudi és respondre a la pregunta següent: Quins hàbits de vida (activitat física, alimentació…) tenen una major influència sobre l’IMC (Índex de Massa Corporal) d’una persona?

A partir d’aquesta pregunta general, volem assolir diferents objectius secundaris per tal d’arribar a una conclusió:

· Avaluar la relació entre els hàbits alimentaris (ncp, fcvc, favc) i l’IMC. · Estudiar la influència de factors familiars (family history with overweight) sobre l’IMC. · Analitzar si el mitjà de transport habitual (mtrans) està associat a diferències significatives en l’IMC.

2. Descripció del conjunt de dades i preprocessaments

dades <- read_csv("novabase.csv")
## Rows: 2111 Columns: 17
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (9): Gender, family_history_with_overweight, FAVC, CAEC, SMOKE, SCC, CAL...
## dbl (8): Age, Height, Weight, FCVC, NCP, CH2O, FAF, TUE
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
load("novabase.RData")
dades$IMC <- dades$Weight / (dades$Height ^ 2)
dades
## # A tibble: 2,111 × 18
##    Gender   Age Height Weight family_history_with_over…¹ FAVC   FCVC   NCP CAEC 
##    <chr>  <dbl>  <dbl>  <dbl> <chr>                      <chr> <dbl> <dbl> <chr>
##  1 Female    21   1.62   64   yes                        no        2     3 Some…
##  2 Female    21   1.52   56   yes                        no        3     3 Some…
##  3 Male      23   1.8    77   yes                        no        2     3 Some…
##  4 Male      27   1.8    87   no                         no        3     3 Some…
##  5 Male      22   1.78   89.8 no                         no        2     1 Some…
##  6 Male      29   1.62   53   no                         yes       2     3 Some…
##  7 Female    23   1.5    55   yes                        yes       3     3 Some…
##  8 Male      22   1.64   53   no                         no        2     3 Some…
##  9 Male      24   1.78   64   yes                        yes       3     3 Some…
## 10 Male      22   1.72   68   yes                        yes       2     3 Some…
## # ℹ 2,101 more rows
## # ℹ abbreviated name: ¹​family_history_with_overweight
## # ℹ 9 more variables: SMOKE <chr>, CH2O <dbl>, SCC <chr>, FAF <dbl>, TUE <dbl>,
## #   CALC <chr>, MTRANS <chr>, NObeyesdad <chr>, IMC <dbl>

El nostre conjunt de dades prové d’una pàgina web que va fer un estudi sobre l’obesitat: https://archive.ics.uci.edu/dataset/544/estimation+of+obesity+levels+based+on+eating+habits+and+physical+condition

En aquest conjunt de dades s’utilitzen 8 variables numèriques i 9 variables categòriques. Les numèriques són: Age (edat), on ens mostra l’edat de cada persona sobre la qual s’ha fet l’estudi; Height (alçada) mesurada en metres; Weight (pes) és el pes de la persona en kilograms; FCVC que representa la quantitat de vegetals que menja la persona (1 poc, 2 bastant, 3 molt); NCP representa la quantitat de vegades que menja la persona diàriament; CH20 representa la quantitat d’aigua que beu una persona diàriament; FAF representa la freqüència d’activitat física diària; TUE representa la freqüència d’utilització de tecnologies (mòbil, televisió…); l’IMC és una columna que nosaltres vam afegiramb l’IMC de cada persona calculat.

Les categòriques són: Gender (sexe) on se’ns diu el gènere de la persona (important si volem veure com varia l’IMC entre persones de diferent génere però amb els mateix estil de vida); family_history_with_overweight és una variable que ens mostra si a la família de la persona hi ha o hi ha hagut algun membre amb obesitat; FAVC ens diu si la persona menja freqüentment menjars amb moltes calories; CAEC ens diu la freqüència amb la que la persona menja entre àpats; SMOKE ens diu si la persona fuma o no; SCC ens diu si la persona mesura les calories que menja diàriament; CALC ens diu la freqüència d’ingesta d’alcohol; MTRANS ens mostra el transport principal que utilitza la persona per desplaçar-se; NObeyesdad ens diu el nivell d’obesitat de la persona (Insufficient Weight: IMC < 18.5; Normal Weight: 18.5 <= IMC < 25.0; Overweight Level I: 25.0 <= IMC < 27.5; Overweight Level II: 27.5 <= IMC < 30.0; Obesity Type I: 30.0 <= IMC <35.0; Obesity Level II: 35.0 <= IMC < 40.0; Obesity Type III: IMC >= 40.0). Aquesta última variable és la que més ens interesa i sobre la qual basarem tota la nostra recerca.

Aquest conjunt de dades consta de 2111 observacions de persones de diferents rangs d’edat i gènere, la qual cosa ens aporta una mostra diversa per poder analitzar els factors que influeixen en l’IMC d’una persona. A més, hi hem afegit una variable derivada de NObeyesdad, l’IMC. Aquesta ens indica l’IMC de cada persona calculat (IMC=WEIGHT/HEIGHT^2).

Abans de realitzar l’anàlisi estadística, es va dur a terme un procés de preprocessament de les dades que va incloure la revisió de valors absents i la comprovació de les dades a través del càlcul de la mitjana de l’IMC per cada nivell de la variable categòrica NObeyesdad, per comprovar que es troba dins del rang correcte.

#Taula amb les diferents variables

d=tibble(
 variable = names(dades),
 tipus = sapply(dades, class)
)
gt(d);
variable tipus
Gender character
Age numeric
Height numeric
Weight numeric
family_history_with_overweight character
FAVC character
FCVC numeric
NCP numeric
CAEC character
SMOKE character
CH2O numeric
SCC character
FAF numeric
TUE numeric
CALC character
MTRANS character
NObeyesdad character
IMC numeric
#Taula amb les observacions per cada nivell de NObeyesdad
taula_obesitat <- dades %>%
  count(NObeyesdad, name = "Nombre de persones") %>%
  gt() %>%
  tab_header(
    title = "Nombre de persones per nivell d'obesitat"
  )

taula_obesitat
Nombre de persones per nivell d'obesitat
NObeyesdad Nombre de persones
Insufficient_Weight 272
Normal_Weight 287
Obesity_Type_I 351
Obesity_Type_II 297
Obesity_Type_III 324
Overweight_Level_I 290
Overweight_Level_II 290
#Comprovació de valors absents

colSums(is.na(dades))
##                         Gender                            Age 
##                              0                              0 
##                         Height                         Weight 
##                              0                              0 
## family_history_with_overweight                           FAVC 
##                              0                              0 
##                           FCVC                            NCP 
##                              0                              0 
##                           CAEC                          SMOKE 
##                              0                              0 
##                           CH2O                            SCC 
##                              0                              0 
##                            FAF                            TUE 
##                              0                              0 
##                           CALC                         MTRANS 
##                              0                              0 
##                     NObeyesdad                            IMC 
##                              0                              0
#Càlcul mitjanes IMC
dades%>%
  group_by(NObeyesdad)%>%
  summarise(
    IMC=mean(IMC)
  )
## # A tibble: 7 × 2
##   NObeyesdad            IMC
##   <chr>               <dbl>
## 1 Insufficient_Weight  17.4
## 2 Normal_Weight        22.0
## 3 Obesity_Type_I       32.3
## 4 Obesity_Type_II      36.7
## 5 Obesity_Type_III     42.3
## 6 Overweight_Level_I   26.0
## 7 Overweight_Level_II  28.2

3. Plantejament de la hipòtesi associada a l’objectiu

Per plantejar la nostra hipòtesi, ens hem basat en els resultats que vam obtenir a l’informe intermedi. A partir dels resultats que vam obtenir, hem decidit que ens centrarem en estudiar les variables següents: Age, NCP, FCVC, Gender, MTRANS, family_history_with_overweight, FAVC, FAF i SMOKE (hem de comprovar que realment afecti). Les variables Weight i Height no les tenim en compte ja que aquestes són intrínseques a la fórmula de càlcul de l’IMC (esmentada anteriorment), per la qual cosa no són variables explicatives independents.

La hipòtesi que hem plantejat per contestar a la nostra pregunta és la següent:

H₀: Les variables Age, NCP, FCVC, FAVC, MTRANS, family_history_with_overweight, Gender i FAF no tenen una influència significativa sobre l’IMC d’una persona.

H₁: Almenys un dels hàbits de vida analitzats té una influència significativa sobre l’IMC.

4. Mètodes i procediment

Primer de tot, per contrastar la nostra hipòtesi s’ha ajustat un model de regressió lineal múltiple amb totes les variables que vam veure a l’informe intermedi que podrien arribar a tenir influència sobre l’IMC d’una persona. Per ajustar el nostre model, vam utilitzar el logaritme de l’IMC com a variable dependent amb l’objectiu de reduir possibles problemes d’asimetria i heterocedasticitat. El contrast global del model s’ha realitzat mitjançant el test F, que permet avaluar de forma conjunta la significació de totes les variables explicatives incloses en el model. Sobre aquest model aplicarem el contrast de significació global per comprovar que almenys una variable influeix sobre l’IMC. Amb aquest contrast estem comprovant la següent hipòtesi:

H₀: β1=β2=⋯=βk=0 (cap variable influeix) H₁: algun βj≠0 per j>0 (almenys una variable influeix)

#Model de regressió lineal

dades$FAVC <- as.factor(dades$FAVC)
dades$MTRANS <- as.factor(dades$MTRANS)
dades$family_history_with_overweight <- as.factor(dades$family_history_with_overweight)
dades$Gender <- as.factor(dades$Gender)

model <- lm(log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS +
               family_history_with_overweight + Gender + FAF,
             data = dades)

summary(model)
## 
## Call:
## lm(formula = log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS + family_history_with_overweight + 
##     Gender + FAF, data = dades)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.79080 -0.13296  0.02766  0.14825  0.57321 
## 
## Coefficients:
##                                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                        2.3095919  0.0455588  50.695  < 2e-16 ***
## Age                                0.0141346  0.0009831  14.378  < 2e-16 ***
## NCP                                0.0025093  0.0062361   0.402   0.6874    
## FCVC                               0.1003153  0.0093680  10.708  < 2e-16 ***
## FAVCyes                            0.1091628  0.0155731   7.010 3.21e-12 ***
## MTRANSBike                         0.1025170  0.0839995   1.220   0.2224    
## MTRANSMotorbike                    0.0762096  0.0671439   1.135   0.2565    
## MTRANSPublic_Transportation        0.1690027  0.0149174  11.329  < 2e-16 ***
## MTRANSWalking                      0.0574376  0.0328272   1.750   0.0803 .  
## family_history_with_overweightyes  0.3051762  0.0130244  23.431  < 2e-16 ***
## GenderMale                         0.0208764  0.0103426   2.018   0.0437 *  
## FAF                               -0.0348381  0.0059199  -5.885 4.62e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2187 on 2099 degrees of freedom
## Multiple R-squared:  0.4022, Adjusted R-squared:  0.3991 
## F-statistic: 128.4 on 11 and 2099 DF,  p-value: < 2.2e-16

Després d’analitzar els resultats de l’informe intermedi, no quedava molt clar si la variable SMOKE realment influia o no a l’IMC. Per aquesta raó, farem un primer anàlisi descriptiu mitjançant un gràfic boxplot per comprovar si hi ha variància entre les seves mitjanes. Per analitzar si l’hàbit de fumar aporta informació addicional a l’explicació de l’índex de massa corporal, compararem dos models de regressió lineal múltiple niats mitjançant un test ANOVA: un model base sense la variable SMOKE i un model ampliat que incorpora aquesta variable.

La hipòtesi que volem mesurar amb el test ANOVA és:

H₀: mA = mB (afegir SMOKE no millora el model) H₁: mA ≠ mB (afegir SMOKE millora el model)

on mA és el model reduït i mB el model amb la variable SMOKE

#Boxplot

ggplot(dades, aes(x = SMOKE, y = IMC, fill = SMOKE)) +
  geom_boxplot(alpha = 0.7, width = 0.6) +
  labs(
    title = "Distribució de l'IMC per SMOKE",
    x = "SMOKE",
    y = "IMC"
  ) +
  theme_minimal(base_size = 13) +
  theme(
    legend.position = "none",
    plot.title = element_text(hjust = 0.5, face = "bold")
  )

#ANOVA

m_smoke <- lm(log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS +
    family_history_with_overweight + Gender + FAF + SMOKE,
  data = dades
)

anova(model, m_smoke)
## Analysis of Variance Table
## 
## Model 1: log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS + family_history_with_overweight + 
##     Gender + FAF
## Model 2: log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS + family_history_with_overweight + 
##     Gender + FAF + SMOKE
##   Res.Df    RSS Df Sum of Sq      F Pr(>F)
## 1   2099 100.37                           
## 2   2098 100.28  1  0.089374 1.8697 0.1717

Un cop rebutjada la hipòtesi nul·la global i la variable SMOKE, volem comprovar quines variables són les que més influència tenen sobre l’IMC. Per fer-ho, aplicarem un contrast de significació individual a través de tests t associats als coeficients del model de regressió. Per a les variables categòriques amb més de dos nivells, hem utilitzat contrastos F parcials per avaluar la significació global de cada factor.

#Contrast de significació individual

summary(model)
## 
## Call:
## lm(formula = log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS + family_history_with_overweight + 
##     Gender + FAF, data = dades)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.79080 -0.13296  0.02766  0.14825  0.57321 
## 
## Coefficients:
##                                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                        2.3095919  0.0455588  50.695  < 2e-16 ***
## Age                                0.0141346  0.0009831  14.378  < 2e-16 ***
## NCP                                0.0025093  0.0062361   0.402   0.6874    
## FCVC                               0.1003153  0.0093680  10.708  < 2e-16 ***
## FAVCyes                            0.1091628  0.0155731   7.010 3.21e-12 ***
## MTRANSBike                         0.1025170  0.0839995   1.220   0.2224    
## MTRANSMotorbike                    0.0762096  0.0671439   1.135   0.2565    
## MTRANSPublic_Transportation        0.1690027  0.0149174  11.329  < 2e-16 ***
## MTRANSWalking                      0.0574376  0.0328272   1.750   0.0803 .  
## family_history_with_overweightyes  0.3051762  0.0130244  23.431  < 2e-16 ***
## GenderMale                         0.0208764  0.0103426   2.018   0.0437 *  
## FAF                               -0.0348381  0.0059199  -5.885 4.62e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2187 on 2099 degrees of freedom
## Multiple R-squared:  0.4022, Adjusted R-squared:  0.3991 
## F-statistic: 128.4 on 11 and 2099 DF,  p-value: < 2.2e-16
#Contrast F parcial per variables categòriques amb més de 2 nivells
drop1(model, test = "F")
## Single term deletions
## 
## Model:
## log(IMC) ~ Age + NCP + FCVC + FAVC + MTRANS + family_history_with_overweight + 
##     Gender + FAF
##                                Df Sum of Sq    RSS     AIC  F value    Pr(>F)
## <none>                                      100.37 -6406.1                   
## Age                             1    9.8861 110.26 -6209.8 206.7359 < 2.2e-16
## NCP                             1    0.0077 100.38 -6408.0   0.1619   0.68744
## FCVC                            1    5.4834 105.86 -6295.8 114.6674 < 2.2e-16
## FAVC                            1    2.3497 102.72 -6359.3  49.1361 3.206e-12
## MTRANS                          4    6.5280 106.90 -6281.1  34.1280 < 2.2e-16
## family_history_with_overweight  1   26.2539 126.63 -5917.6 549.0140 < 2.2e-16
## Gender                          1    0.1948 100.57 -6404.0   4.0743   0.04367
## FAF                             1    1.6561 102.03 -6373.6  34.6320 4.625e-09
##                                   
## <none>                            
## Age                            ***
## NCP                               
## FCVC                           ***
## FAVC                           ***
## MTRANS                         ***
## family_history_with_overweight ***
## Gender                         *  
## FAF                            ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Com que hem vist que el p-value de la variable Gender és molt proper a 0.05, utilitzarem un interval de confiança per acabar de confirmar que realment té una influència significativa sobre l’IMC.

H₀: β = 0 H₁: β ≠ 0

#Interval de confiança

confint(model, "GenderMale", level = 0.95)
##                   2.5 %     97.5 %
## GenderMale 0.0005935745 0.04115915

5. Comprovació i discussió de les assumpcions

Anem a comprovar les assumpcions del model de regressió lineal múltiple que hem utilitzat anteriorment. Comprovarem si el nostre model té residus normals i és homoscedani. Aplicarem el test de Shapiro-Wilk per comprovar la normalitat dels residus:

H₀: Els residus són normals H₁: Els residus no són normals

També aplicarem el test de Breusch-Pagan per comprovar la homoscedasticitat dels residus:

H₀: Els residus són homoscedastics H₁: Els residus no són homoscedastics

#Assumpcions del model

plot(model)

#Test de Shapiro-Wilk
shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.98106, p-value = 3.923e-16
#Test de Breusch-Pagan
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 202.02, df = 11, p-value < 2.2e-16

La linealitat de la relació entre els residus i els valors ajustats es pot veure en el gràfic Residuals vs Fitted i podem extreure que els residus es troben majoritàriament centrats al voltant del zero, tot i que algunes observacions s’allunyen bastant. Això suggereix que l’assumpció de linealitat es compleix de manera aproximada.

La normalitat dels residus s’han avaluat mitjançant el gràfic Q-Q Residuals i el test de Shapiro-Wilk. Mitjançant els resultats del test tenim evidències per rebutjar la hipòtesi nul·la, ja que hem obtingut un p-valor < 0.05, més concretament p-valor = 3.923e-16. Tot i així, el gràfic mostra un bon ajust en la part central, amb algunes desviacions als extrems. Degut a la gran quantitat d’observacions de les quals consta el nostre conjunt de dades, no ens dona gaires problemes a l’hora de fer inferència estadística.

L’assumpció d’homoscedasticitat s’ha contrastat mitjançant el gràfic Scale-Location i el test de Breusch-Pagan. Els resultats obtinguts del test ens dona evidències per rebutjar la hipòtesi nul·la, ja que hem obtingut un p-valor < 0.05, més concretament p-valor < 2.2e-16. Això també es pot veure al gràfic, on s’observa una gran variabilitat dels residus.

A través del gràfic Residuals vs Leverage podem observar que cap punt influent sobrepassa la distància de Cook, per la qual cosa podem arribar a la conclusió de que no hi ha observacions extremadament influents que jusitifiquin la seva exclusió del model.

Degut als resultats obtinguts, hem utilitzat el logaritme de l’IMC com a variable dependent del model per reduir possibles problemes d’asimetria i heterocedasticitat.

5. Anàlisi dels resultats

Vam realitzar un model de regressió lineal múltiple amb totes les variables que vam veure que podrien arribar a ser significatives en l’informe intermedi i hi vam aplicar el contrast de significació global. Els resultats mostren un valor de l’estadístic F igual a 128,4 amb 11 i 2099 graus de llibertat, associat a un valor p inferior a 2,2·10⁻¹⁶. Atès que aquest valor és molt inferior al nivell de significació establert (α = 0,05), es rebutja la hipòtesi nul·la. Per la qual cosa, podem concloure que almenys una de les variables analitzades té una influència estadísticament significativa sobre l’IMC d’una persona.

Amb l’objectiu d’analitzar l’associació entre l’hàbit de fumar i el grau d’obesitat, s’ha fet un primer anàlisi descriptiu mitjançant un gràfic boxplot per veure la variància de les mitjanes entre els dos grups de la variable SMOKE. En aquest cas, el diagrama de caixa mostra que les distribucions de l’IMC per a fumadors i no fumadors presenten medianes molt similars i un elevat solapament entre els quartils, fet que suggereix que no hi ha diferències significatives entre tots dos grups. Aquesta observació indica que l’hàbit de fumar no sembla associar-se amb diferències rellevants en els valors de l’IMC. Per acabar de confirmar si hi influeix o no, hem aplicat un test ANOVA com hem mencionat anteriorment. Els resultats mostren un valor de l’estadístic F igual a 1,87 amb un valor p de 0,172. Atès que aquest valor és superior al nivell de significació establert (α = 0,05), no es rebutja la hipòtesi nul·la. En conseqüència, es conclou que la inclusió de la variable SMOKE no millora de manera significativa l’ajust del model un cop controlada la resta de factors. Per aquest motiu, aquesta variable no s’ha inclòs en el model final.

Els resultats dels contrastos de significació individual indiquen que les variables Age, FCVC, FAVC, family_history_with_overweight, FAF, Gender i el factor MTRANS presenten una influència estadísticament significativa sobre l’IMC (p-value < 0.05). En particular, l’historial familiar de sobrepès (famili_history_with_overweight) mostra l’efecte més rellevant dins del model.

En canvi, la variable NCP no presenta un efecte estadísticament significatiu (p-value = 0.6874) un cop controlada la resta de factors, i per tant no es considera una variable explicativa rellevant en el model.

Atès que la variable Gender presentava un valor p proper al llindar de significació en el contrast individual, s’ha realitzat un contrast addicional mitjançant el càlcul de l’interval de confiança del 95% per al coeficient corresponent. L’interval obtingut no inclou el valor zero, cosa que confirma la significació estadística de l’efecte del gènere sobre l’IMC.

No obstant això, la magnitud de l’efecte és moderada, indicant que el gènere té una influència significativa però limitada en comparació amb altres variables incloses en el model.

6. Conclusió preliminar i pròximes passes

En primer lloc, el contrast de significació global del model de regressió lineal múltiple mostra evidències estadístiques sòlides per rebutjar la hipòtesi nul·la, indicant que almenys un dels hàbits de vida analitzats influeix de manera significativa sobre l’IMC. Els resultats del model final indiquen que variables com l’edat (Age), el consum de vegetals (FCVC), la ingesta freqüent d’aliments altament calòrics (FAVC), la freqüència d’activitat física (FAF), el gènere (Gender), el mitjà de transport habitual (MTRANS) i, especialment, l’historial familiar de sobrepès (family_history_with_overweight) tenen una influència estadísticament significativa sobre l’IMC. D’entre totes aquestes variables, l’historial familiar de sobrepès destaca com el factor amb un impacte més rellevant.

En canvi, variables com el nombre d’àpats diaris (NCP) i l’hàbit de fumar (SMOKE) no mostren una influència significativa sobre l’IMC un cop controlada la resta de factors del model. En particular, l’anàlisi descriptiva i el test ANOVA realitzat indiquen que la inclusió de la variable SMOKE no millora l’ajust del model, fet pel qual s’ha decidit excloure-la del model final. Pel que fa a les assumpcions del model, tot i que s’han detectat desviacions de la normalitat i de l’homoscedasticitat dels residus, aquestes no es consideren problemàtiques donada la mida elevada de la mostra.

Tot i que els resultats obtinguts són rellevants, aquest estudi presenta algunes limitacions que obren la porta a futures línies d’investigació.

En primer lloc, es podria aprofundir en l’anàlisi de possibles interaccions entre variables, especialment entre l’activitat física, els hàbits alimentaris i l’historial familiar de sobrepès. Aquestes interaccions podrien ajudar a entendre millor com la combinació de diferents hàbits influeix sobre l’IMC.

En segon lloc, en futures investigacions es podrien incorporar noves variables relacionades amb aspectes socioeconòmics, psicològics o ambientals, que no estan presents en aquest conjunt de dades però que podrien tenir un paper clau en l’explicació del sobrepès i l’obesitat.