Befolkningsundersøgelserne

Overførsel af data - møde 14. maj 2025

Author

Johan Ejstrud

1 Hvad er ETN? (#48)

ETN er en samlet vurdering af etnicitet, foretaget i samarbejd med deltageren baseret på selvopfattelse og sprog. (D=dansk, G=Grønlandsk og U=uplacerbar). Det er ikke relateret til H51A-D.

Hvor har intervieweren udfyldt denne vurdering?

Jeg forstår ikke, hvordan deltageren kan have udfyldt spørgsmål 15 (H50) for så bagefter, at blive enig med intervieweren om en anden vurdering af etnicitet. Hvordan adskiller spørgsmålene sig?

Der er en del eksempler, hvor de to spørgsmål er forskellige (se optællingen nedenfor).

b2005_raw %>% 
  mutate(H50 = haven::as_factor(H50)) %>% 
  count(H50, ETN, sort = T)

2 Dokumentation af fedtsyreprofiler (#271)

Kan jeg få adgang til alle de originale data med fedsyreprofiler fra B2005 (IHIT)?

Fedsyreprofilerne består af 43 variable som er målinger af forskellige fedtyrer, og 15 variable, som er summeringer af disse målinger, inddelt i forskellige grupper, f.eks. alle transfedtsyrer (total_trans).

Nogle af summeringsvariablene matcher ikke summen af de målte værdier.

F.eks. skal n6_trans være summen af alle n6 transfedtsyrer, hvoraf der kun er én (variabel: C18_2_n6t_t). De to variable burde altså være ens, men der er 184 rækker ud af 3089 målinger hvor de ikke matcher.

b2005_raw %>% 
  select(LBNR, n6_trans, C18_2_n6t_t) %>% 
  drop_na() %>% 
  filter(n6_trans != C18_2_n6t_t) 

3 Enhed for organochloriner (#293)

Hvordan finder vi ud af, hvad enheden er for organochloriner i B93?

  • I B99 og B2005 er enheden lipid adjusted µg/kg.
  • I B93 er enheden angiveligt µg/L, men det giver ikke-mulige værdier for målingerne.

Der er målt 28 organochloriner på tværs af de 3 undersøgelser.

Nedenfor er sammenligninger af 2 af dem (PCB #170 og Cis-nonachlor) på tværs af undersøgelser.

Hvis jeg ganger B93 værdierne med 100, passer histogrammerne nogenlunde, men jeg kan ikke se hvilken enhed der skulle være 100 × µg/L.

4 Genetiske markører (#284)

Vi mangler information om genetiske markører. Det eneste dokumentation jeg har på dem er variabelnavnene.

  • MPNUMMER
  • APOE
  • MTHFR
  • FV
  • GNB3
  • APOCIII
  • AGT_235
  • PON1_192
  • APOE4DOM
  • MTHFREC
  • MTHFRDOM
  • FVDOM
  • GNB3REC
  • GNB3DOM
  • APOC3REC
  • APOC3DOM
  • AGT_235D
  • AGT_235R
  • PON1192D
  • PON1192R

5 Manglende enhed på blodprøvemålinger (#295)

Der mangler enheder for disse variable:

  • Blood_Cadmium (B2005) Blood, cadmium
  • Blood_Lead (B2005) Blood, lead
  • D2_IHIT (B2005) Vitamin D2
  • D3_IHIT (B2005) Vitamin D3
  • selen (B93) Blood, selenium

Nedenfor er et histogram der viser deres fordeling af værdier.

6 Ensartet version af bopæl (#194)

Hvordan får vi lavet en ensartet version af bopæl på tværs af alle studierne?

Der findes en ensartet version for samtlige bopælsvariable, bortset fra variablen for nuværende bopæl.

7 Datovariable (#151, #166, #216)

Hvad er K01?

I B99 og B2005 står der i labelen at det er ‘undersøgelsesdato’, og i B93, B2014 og B2018 står der ‘Interviewdato’ eller ‘Date of interview’.

Der er en håndfuld manglende værdier i 4 af studierne (se antal nedenfor). Hvordan har I beregnet deltagernes alder i disse tilfælde?