메타분석 시작하기

웹에서 하는 R통계 앱에서 메타분석을 클릭한다.

1.png

효과 크기 분석

연속형자료-두집단

메타분석 예제데이타 선택 중 mentoring을 선택하고(1) 자료의 형태 선택에서 연속형자료-두집단을 선택한 후(2) meta분석 버튼을 누른다(3).

2.png

아래쪽으로 효과크기 분석 결과 및 이질성 검정 결과, forest plot이 나온다.

3.png

연속형자료-단일집단(사전-사후)

이번에는 단일집단(사전/사후) 데이타를 선택해보자. 메타분석 예제데이타 선택 중 one-group을 선택하고(1) 자료의 형태 선택에서 연속형자료-단일집단(사전-사후)을 선택한다(2). 이번에는 랜덤효과 모형만 사용하기 위해 forest plot 옵션중 고정효과모형을 선택해제한 후(3) meta분석 버튼을 누른다(4).

4.png

우리가 원하는 대로 랜덤효과 모형만 출력되었다.

5.png

이분형 자료

이번에는 이분형 자료를 선택해보자. 메타분석 예제데이타 선택 중 binary을 선택하고(1) 자료의 형태 선택에서 이분형데이타를 선택한다(2). 이분형데이타를 선택한 경우 L’Abbe plot이 기본적으로 선택(3)되어 있는 것을 확인한 후 meta분석 버튼을 누른다(4).

6.png

forest plot 아래에 L’Abbe plot이 출력된다. 이 plot은 x축은 대조군의 event rate를 나타내고 y축은 실험군의 event rate를 나타낸다. 각 점의 크기는 대상환자 수와 비례한다. 다른 연구들에 비해 study_4의 event 발생이 높은 것을 알 수 있고 forest plot에서 보면 odds ratio(OR)가 3.75로 높은 것을 알 수 있다.

7.png

같은 plot을 그리더라도 plot 옵션에서 study label출력을 선택 해제하고(1) 점배경색을 darkgray로 바꾸면(2) plot의 모양이 달라진다.

상관관계 자료

이번에는 상관관계 자료를 선택해보자. 메타분석 예제데이타 선택 중 cor을 선택하고(1) 자료의 형태 선택에서 상관관계데이타를 선택한 후(2) meta분석 버튼을 누른다(3).

8.png

9.png

FIsher’s Z로 전환한 상관관계계수로 효과크기를 분석하고 forest plot을 만들려면 효과크기 분석의 기타옵션에 backtransf=F를 입력하고(1) meta분석 버튼을 누른다(2). forest plot이 바뀐 것을 확인할 수 있다.

10.png 10-1.png

효과크기 데이터

이번에는 효과크기 자료를 선택해보자. 메타분석 예제데이타 선택 중 smoking을 선택하고(1) 자료의 형태 선택에서 효과크기데이타를 선택한 후(2) meta분석 버튼을 누른다(3).

11.png 12.png

조절효과 분석

하위군분석과 메타 ANOVA

ADHD아동의 주의력 결핍에 대한 단기집중 인지행동 치료자료(2주,4주,6주)인 cbt자료를 이용해 치료효과를 비교 분석해본다. 먼저 예제데이타로 cbt(1), 자료의 형태로 두 집단을 선택한 후(2) 추가분석에서 하위집단분석(3)과 메타ANOVA(4),메타회귀분석(5)을 선택하고 그룹변수와 조절변수로 group을 선택한 후(6) meta분석 버튼을 누른다(7).

13.png 13-1.png

분석결과는 메타분석 - 하위군분석- 메타ANOVA - 메타회귀순으로 출력된다.

14.png

하위군분석결과 고정효과 모형인 경우 6주 군에서 효과 크기가 0.8559로 가장 큰 것을 알 수 있으며 forest plot도 바뀌게 된다.

16.png

메타 ANOVA를 위해 각 하위집단 간의 연구간 분산이 동일하다고 가정하고 하위군 분석을 하는데 결과를 보면 랜덤효과 모형에서 세 집단의 연구간 분산(tau^2)이 0.0276으로 동일함을 알 수 있고 세 집단의 효과크기의 차이에 관한 통계적 검증결과 집단간 차이가 유의하게 다름을 알 수 있다.(p=0.0134)

18.png

이 결과는 메타회귀의 결과와 동일하며 치료집단변수에 의해 설명되는 실제 분산의 설명력(R^2)은 58.74%임을 알 수 있다.

19.png

메타회귀분석

결핵예방주사데이타를 이용해 메타 회귀분석을 해보자. 먼저 예제데이타로 bcg11을 선택하고(1) 자료의 형태는 이분형데이터(2), 효과크기의 요약측정은 “RR”을 선택하고(3) 추가분석은 모두 선택 해제하고(4) meta분석 버튼을 누른다(5).

20.png

결과를 보면 연구간 분산이 0.3818, 전체 분산 중 연구간 분산이 차지하는 비율이 92%로 나타나 연구간 효과크기의 이질성이 매우 크다는 것을 알수 있다.

21.png

효과크기의 이질성을 설명하기 위해 백신이 사용된 연구의 위도(latitude)를 조절변수로 하여 메타회귀분석을 해본다. 추가분석선택에서 메타회귀분석을 선택하고(1) 조절변수에 latitude를 선택하고(2) meta분석 버튼을 누른다(3).

22.png

회귀분석 결과를 보면 조절인자의 유의성은 Q=17.73, p<0.0001로 유의하며 latitude의 회귀계수도 -0.0298로 의미있게 나왔으며 조절변수에 의해 설명되는 연구의 분산 R^2도 82.93%로 나타나 설명력이 아주 크다는 것을 알 수 있다. bubble plot을 통해 회귀선을 확인할 수 있다.

23.png

메타회귀의 결과를 회귀선으로 보여주는 bubble plot은 meta패키지의 bubble()함수로도 그릴 수 있으나 신뢰구간이 표시 되지 않는다. 웹R에서는 메타회귀분석시 조절변수를 하나만 선택한 경우 ggplot2패키지를 이용한 bubble plot을 제공한다. 신뢰구간의 표시여부, 신뢰구간, study label 출력 여부를 선택할 수 있다. 다음은 study label 출력을 선택 해제하고(1) 신뢰구간도 선택해제하고(2) RR표시를 0.4로 선택한 경우(3)이다.

23-3.png 23-4.png

이번에는 study label 출력을 선택하고(1) 메타회귀분석의 plot종류를 bubble로 선택하고 Meta 분석을 클릭해본다(3). 이 때에는 meta패키지의 bubble()함수로 bubble plot을 그려준다.

23-5.png 23-6.png

이번에는 회귀모형의 조절변수에 latitude와 alloc2 두 개의 변수를 선택하고 meta분석 버튼을 누른다.

23-1.png

두개의 조절변수를 넣고 다중회귀를 한 결과 latitude는 유의하게 나왔으나(p=0.0027) alloc2는 유의하지 않았다(p=0.4217). 하나 이상의 조절변수가 있는 경우 bubble plot은 meta패키지의 bubble() 함수로 그린다.

23-2.png

출간편향 분석

간접흡연과 폐암의 관계를 본 smoking 데이타로 출간편향를 분석해본다. 먼저 smoking데이타를 선택하고(1) 자료의 형태는 효과크기데이터를 선택한다(2). plot옵션에서 study label 출력을 선택해제하고(3) 점배경색은 darkgray를 선택한다(4). 추가분석 선택에서 메타회귀분석은 선택해제하고(5) 출간편향분석을 선택한 다음(6) funnel plot, fail safe N, Trim-and-Fill, funnel plot이 모두 선택되어 있는 것을 확인하고 meta분석 버튼을 누른다(7).

24.png 24-0.png

출간 편향의 존재 유무에 대한 확인

출판 편향의 존재하는지에 대한 확인은 funnel plot으로 이루어진다. 웹 R에서는 메타분석 결과와 forest plot의 아래에 출간편향분석 결과가 출력된다. 깔대기 모양을 하고 있다고 해서 이름이 붙은 funnel plot은 수평축에 효과크기를, 수직축에는 표준오차로 구성된다. 일반적으로 표본이 큰 연구들은 그래프의 상단에 위치하게 되는데 가운데 직선, 즉 평균효과크기 주변에 모여있게 된다. 하지만 표본크기가 작은 연구들은 표준오차가 더 크므로 그래프의 아래쪽에 위치하게 되고 효과크기의 분포가 다양하게 나타나므로 상대적으로 폭 넓게 분포되어 있다. 대각선은 각 효과크기의 95% 신뢰구간을 나타낸다. 이 funnel plot에서 데이타에 오류가 없다면 좌우대칭의 모양을 보이지만 비대칭으로 보인다면 데이타에 오류가 있음을 보여주는 것이다. 비대칭을 파악하는 방법은 시각적으로 파악하는 방법과 통계적으로 검증하는 방법이 있다. 통계적 방법인 Egger의 회귀검정이 있다. 이 검정은 표준오차(설명변수 또는 독립변수)와 효과크기(반응변수 또는 종속변수)의 관계를 보는 회귀분석으로 이 연구에서는 p값이 0.02347로 유의하게 나와 의미있는 관계가 있다고 볼수 있음 따라서 비대칭이라고 볼 수 있다. 시각적으로 보면 funnel plot의 왼쪽 아래쪽에 분포,누락되어 있는 것을 알수 있는데 이는 표본수가 작고 효과크기가 적은 논문들은 상대적으로 출간될 가능성이 적어 연구에 포함되지 못했다는 것을 알 수 있다.

24-1.png

출간편향의 정도에 관한 분석

통계적으로 유의하지 않은 연구는 출간되지 않는 경향이 있으므로 만일 출간되지 않은 유의하지 않은 연구들이 메타분석에 추가된다면 통계적으로 유의했던 추정치가 유의하지 않게 될 수 도 있다. fail safe N 방법은 Rosenthal(1979)에 의해 ’file drawer analysis’라고 불렸는데 이는 통계적으로 유의하지 않은 연구 결과는 출간되지 못하고 파일 서랍 안에 보관되어 있던 것에서 유래하였다. 나중에 Harris Cooper(2010)에 의해 ’fail-safe N’으로 명명되었다. fail-safe N 분석은 전체효과가 유의하지 않게(p > alpha) 되기 위해 필요한 추가 연구의 개수를 구해준다. Rosenthal은 이 수치가 충분히 크지 않더라도 연구수의 5배+10개 이상이 되면 신빙성이 있다고 하였다. 즉, N > 5k+10(k ; 연구수)을 기준으로 제시하였다. 이 메타연구는 37개의 연구를 포함하고 있으므로 5*37+10=195 이상이면 신빙성이 있다고 할 수 있다. 이 연구에서는 fail-safe N계산 결과가 398로 나와 출간오류는 그다지 크지 않다고 할 수 있다. 그 외에 Orwin이나 Rosenberg 방법 등에 대한 자세한 설명은 ’R을 이용한 메타분석(황성동,학지사,2015)’를 참조한다.

출간편향이 결과에 미치는 영향

출간편향이 있다면 출간편향이 연구 결과에 어느 정도 영향을 미치는가 평가할 수 있다. Trim-and-fill 방법에서는 funnel plot에서 비대칭을 보이는 경우 대칭으로 교정하기 위해 누락되었다고 가정된 연구를 포함시켜 상대위험도를 다시 계산한다. 본 연구에서는 trim-and-fill 방법으로 모두 7개의 연구가 투입되었으며 그 결과 간접흡연으로 인한 폐암 발생의 수정된 상대위험도는 1.1688로 원래 통합 추정치 1.2040보다 낮게 추정되었으나 여전히 통계적으로 유의하여 출간편향이 연구결과에 그다지 큰 영향은 미치지 않는 것으로 결론내릴 수 있다. Adjusted funnel plot에서는 새로 추가된 연구가 속이 빈 동그라미로 나타나게 된다.

24-2.png

누적메타 분석

시간적순서에 따른 누적메타분석

우울증의 치료에 관한 데이타인 Gilbody 데이타를 이용해 누적메타분석을 해본다. 이 데이타는 일차진료기관에서 우울증에 관한 전통적인 치료와 여러 전문가를 참여시킨 연합적 치료방법의 치료효과를 비교한 35개 논문을 누적시킨 데이타이다. 먼저 Gilbody 데이타를 선택하고(1) 자료의 형태는 효과크기데이터를 선택한다(2). 요약측정에서 SMD(standardized mean difference)를 선택하고(4) 추가분석에서 누적메타분석을 선택하고(5) 정렬순서로 year를 선택한 후(5) 메타분석 버튼을 누른다(6).

25.png

메타분석 결과 및 forest plot이 출력되고 그 아래쪽에 누적메타분석 결과와 누적메타분석에 대한 forest plot이 출력된다.

25-1.png 25-2.png

누적메타분석 결과를 보면 2001년 이후연합적 치료 방법의 효과가 전통적인 치료 방법에 비해 긍정적이고 안정적인 결과(0.27-0.28)를 보여주고 있다.

표본크기에 따른 누적메타분석

smoking 데이타로 표본크기에 따른 누적메타분석을 해본다. 먼저 smoking데이타를 선택하고(1) 자료의 형태는 효과크기데이터를 선택한다(2). 추가분석에서 누적메타분석을 선택하고(3) 정렬 순서에는 아무것도 선택되지 않은 것을 확인하고(4) 메타분석 버튼을 누른다(5).

26.png

메타분석 결과 및 forest plot이 출력되고 그 아래쪽에 누적메타분석 결과가 출력된다. 먼저 표본크기가 큰 순서대로 차례로 투입하여 효과 크기가 어느 정도 안정되면 작은 연구들을 더 투입해도 효과크기에 큰 변화가 나타나지 않게 되는지 확인한다.

26-1.png

누적메타분석을 보여주는 forest plot을 보면 표본크기순서로 25번째인 study_17을 투입한 이후 효과크기가 1.19-1.20으로 안정되어 이후의 표본크기가 작고 상대적으로 효과크기의 변동이 심한 연구들이 추가되더라도 전체 결과에 영향을 미치지 못하는 것으로 나타났다.

26-2.png

요약하면 누적메타분석은 각 연구가 더해지면서 평균효과크기와 신뢰구간이 어떻게 달라지는지 보여준다. 즉 새로운 연구가 추가되면서 연구 결과가 어떻게 달라지는지 또는 변함이 없는지 보여준다.

민감성 분석

민감성 분석은 분석의 기준이나 내용에 따라 결과가 어떻게 달라질 수 있는지 검토하는 분석 방법이다. scared 데이타는 청소년들의 비행을 예방하기 위해 비행위험 청소년들로 하여금 청소년 보호시설을 미리 경험하게 한후 이들의 비행이 실제 감소하는지 연구한 데이타이다. 먼저 scared 데이타를 선택하고(1) 자료의 형태는 이분형데이터를 선택한다(2). forest plot 옵션에서 랜덤효과모형만 선택한다(3). 이분형데이타의 경우 L’Abbe plot이 선택되어 있는 것을 확인한다(4). 추가분석에서 민감성분석을 선택하고(5) random을 선택한 후(6) 메타분석 버튼을 누른다(7).

27.png 27-1.png

먼저 메타분석 결과와 forest plot을 살펴본다. 메타분석 결과에서 study_4가 다른 연구에 비해 가중치가 많음을 알 수 있으며 forest plot에서 확인해보면 study_4의 대상 환자수가 다른 연구에 비해 월등히 많은 것을 알 수 있다.

27-2.png

forest plot의 아래쪽에는 L’Abbe plot이 출력된다. 이 plot은 x축은 대조군의 event rate를 나타내고 y축은 실험군의 event rate를 나타낸다. 각 점의 크기는 대상환자 수와 비례한다. 다른 연구들에 비해 study_4와 study_1에서 실험군의 event 발생이 높은 것을 알 수 있고 forest plot에서 보면 odds ratio(OR)가 5.45, 3.75로 높은 것을 알 수 있다.

L’Abbe plot의 아래쪽에는 민감성분석으로 영향분석이 출력되며 그 아래쪽에는 영향분석 결과가 forest plot으로 출력된다. 이는 메타연구에서 각 연구를 하나씩 제외했을때 전체 효과크기가 어떻게 달라지는지 보여주는 것으로 전체 효과크기는 1.98이며 study_4를 제외했을때 OR은 1.47로 크게 달라지는 것을 알 수 있다. 다른 연구들을 제외했을 때는 OR의 변화가 전체 1.98에 비해 크게 달라지지 않는다.

27-3.png

가장 아래쪽에는 baujat plot이 출력된다. 이 plot은 각연구가 전체 이질성에 어느정도 기여하는지 또한 각 연구가 전체 결과에 미치는 영향을 시각화해준다.

27-4.png

이와 같이 어떤 특정한 연구를 제외 또는 포함하였을 때 전체 평균 효과크기가 어떻게 달라지며 연구결과에 얼마나 변화가 있는지를 검증하는 것이 민감성 분석의 목적이다.