Компьютер-ассистированная волюметрия солидных очагов в легких

Обзор литературы

Heuvelmans et al. показали, что при расчете объёма из данных о диаметре очага допускается систематическая погрешность + 47-85% -Heuvelmans et al. (2018). В среднем систематическая погрешность была выше для очагов объёмом 200–500 мм^3 и нечетким краем. Также они показали, что что оценка диаметра является менее чувствительной мерой для оценки риска рака лёгкого. Случайная погрешность измерений составляет 2.8 мм. Это выше, чем пороговые значения динамики очага рекомендованные Lung-RADS – 1.5 мм, что свидетельствует о том, что оценка диаметра является неэффективной мерой для анализа динамики размеров очагов.

Линейные измерения в двух плоскостях, обладают большей точностью и воспроизводимостью. Xie et al. на фантомном исследовании (10) показал, что полуавтоматическая волюметрия точнее чем волюметрия основанная на ручном оконтуривании очага. Однако, в обоих случаях допускается систематическая погрешность 26.4% (при ручном оконтуривании) и 7.6% при полуавтоматическом -Xie et al. (2013). Другие экспериментальные исследования с фантомными очагами (солидными и смешанными) также продемонстрировали высокую точность волюметрии -Doo et al. (2014), -Kim et al. (2013), -Siegelman, Supanich, and Gavrielides (2015).

Вариабельность измерений при волюметрии составляет около 25% (14,15).

Принципиальной целью волюметрии является выявление динамики размеров очагов, а не точное измерение объёма как такового. Естестественно гистологическая верификация динамики размеров невозможна. Обычно для этого используются данные на которых рост очага отсутствует. Например кофе-брэйк эксперименты, в которых два сканирования проводится в один и тот же день с интервалом 15 минут. Таким образом любые различия в оценке объёма между КТ исследованиями является случайной погрешностью измерений. Таким образом можно изучить влияние факторов имеющих отношение к пациенту таких как разная глубина вдоха, разное положение тела артефакты от пульсации сердца -Devaraj et al. (2017).

Wormanns et al -Wormanns et al. (2004) and Gietema et al -(gietemaPulmonaryNodulesInterscan2007b?) провели одни из первых таких исследований. В обоих исследованиях пациенты с малыми метастазами в лёгкие были обследованы дважды за один и тот-же день. Все другие факторы не менялись. Оба исследования показали похожие 95% доверительные интервалы составляющие ±25%. Значение 25% довольно часто используется в качестве порогового для определения истинного роста -Field et al. (2016), -Pastorino et al. (2012), -van Klaveren et al. (2009).

Исследование на фантоме показали что стандартное отклонение измерений составляет 4-28% в зависимости от диаметра очага -Li et al. (2015).

Revel с коллегами изучили вариабельность оценок диаметра в кофебрэйк эксперименте на 54 очагах средним диаметром 8.5 мм. Вариабельность измерений разными операторами составила 1.73 мм (20% от диаметра) -Revel et al. (2004). В исследовании Oxnard et al. удалось показать, что для очагов диаметром от 1 до 3 см вариабельность оценок диаметра 10% и меньше была обнаружена в 84% случаев. -Oxnard et al. (2011) Следует понимать, что вариабельность оценки объёма 20% при оценке объёма приводит к вариабельности 72.8%

При полуавтоматической волюметрии оператор, как правило, должен только указать на на центр очаг и его дальнейшее оконтуривание происходит автоматически. Теоретически точка на которую указывает оператор может повлиять на результаты оконтуривания. Однако, крупное исследование включающее более 4000 очагов показало, что результаты волюметрии идентичны в 86% случаев. Только в 4% разница в объёме превышала 15% -Wang et al. (2008a). Таким образом воспроизводимость связанная с оператором при полуавтоматической волюметрии значительно лучше чем при ручных измерениях.

Иногда при правильное автоматическое оконтуривание очагов невозможно. Частота ошибоке оконтуривания составляет 6% для интрапаренхиматозных очагов в голландско-бельгийском исследовании по скринингу рака лёгкого -van Klaveren et al. (2009) и в 28% датском исследовании -Ashraf et al. (2010). Не существует какого-то общепринятого определения, что считать ошибкой оконтуривания. Наиболее часто употребляемым определением является включение в контур структур изменяющих его объём более 20%–30% -de Hoop et al. (2009), -Devaraj et al. (2017). Необходимость корректировки контура вручную является источником ошибок и увеличивает вариабельность измерений -Reeves et al. (2007).

Ещё одним источником вариабельности является программное обеспечение. Hoop et al сравнили 6 различных программ волюметрии и обнаружил что 95% интервал измерений составляет +- 16%–22% -de Hoop et al. (2009). Zhao с коллегами показали, что разница в объёме между тремя программами может достигать 50% для очагов менее 100 мм^3 -Zhao et al. (2014). Некоторые программы позволяют оператору выбрать алгоритм автоматического оконтуривания. В зависимости от выбранного алгоритма результаты волюметрии могут отличаться более чем на 25% -Ashraf et al. (2010). Однако, поскольку погрешность остаётся одинаковой для любых очагов она не мешает динамическому наблюдению за очагом. Конечно, сравнение объёмов если измерения выполнены разными программами недопустимо.

Уровень шума и как следствие экспозиция при сканировании влияют на волюметри не значимо. -Das, Ley-Zaporozhan, et al. (2007), -Way et al. (2008). Вариабельность оценок объём измеренного на томограммах полученных со стандартной экспозицией (52.2 эффективных мАс) по сравнениию с низкодозовыми протоколами (3.5 эффективных мАс) примерно одинакова 25.1% vs. 28.9% -Hein et al. (2010).

То же самое касается алгоритмов реконструкции. Несмотря на то что изображения полученные путем итеративных реконструкции имеют более низкий уровень шума по сравнению с алгоритмом обратной проекции немногочисленные исследования на фантомах показывают их практически одинаковую точность. В in vivo исследовании Willemink et al не обнаружили различий в объёме солидных очагов как при применении разных алгоритмов реконструкции так и мощности при итеративных реконструкциях -Willemink et al. (2013). Doo et al в фантомном исследовании 5-12 мм очагов обнаружили статистически значимо большую точность итеративных реконструкций, но эти различия имеют сомнительное клиническое значение -Doo et al. (2014). Тем не менее некоторые программы не подходят для волюметрии, если изображения получены путем итеративных реконструкций -Chen et al. (2013).

Важным преимущество итеративных реконструкций является меньшая доля экстремальных значений а счет уменьшения доли неправильно оконтуренных очагов -Chen et al. (2013).

Сравнение томограмм полученных с разным числом детекторов может быть проблематичным, т.к. результаты 4 и 16 спиральных томографов отличаются. Сравнение 64 и 16 спиральных тографов при сопоставимой толщине срезов статистически значимых различий не выявило. -Das, Mühlenbruch, et al. (2007). Большее значение имеет производитель томографа -Das, Ley-Zaporozhan, et al. (2007). Вариабельность 7-14% возникающая при применении разных аппаратов может быть признана клинически незначимой.

Использование контрастного вещества увеличивает денситометричускую плотность очага, преимущественно по его периферии, тем самым подчеркивая границу. При сегментации будет выделена большая часть периферических отделов очага. В исследовании пациентов со опухолями в лёгких и большими образованиями Honda et al. обнаружили, что после внутривенного контрастирования размер образований увеличивается в 88% случаев -Honda et al. (2007). Медиана разницы объёма составила 5%, но у 8% пациентов степень увеличения превышала 20%. Похожие результаты были получены Rampinelli et al -Rampinelli et al. (2010). Таким образом следует избегать сравнения объёмов очагов измеренных на постконтрастных и нативных исследованиях.

Питч, потенциально, также может влиять на результаты измерений. Применение низкого питча увеличит выраженность двигательных артефактов, а увеличение питча позволяет увеличить разрешение по z-оси и уменьшить тем самым частичный объёмный эффект. Фактические исследования показали, что питч не влияет на вариабельность измерений в зависимости от питча как на томографах с 16 срезами -Way et al. (2008) так и 128ю -Hwang et al. (2015 May-Jun).

К факторам влияющим на вариабельность измерений зависящих от пациента относятся глубина вдоха, наличие эмфиземы и прочие заболевания. Объём лёгких на исследованиях одного и того же пациента, полученных при глубоков вдохе могут варьировать в диапазоне -12 - +26% -Gietema et al. (2007), -de Hoop et al. (2009). Теоретически уменьшение объёма лёгких должно повысить измеряемый объём очага в связи с увеличением плотности паренхимы лёгкого окружающей очаг.Более того, уменьшение расстояния между очагов и сосудами или другимим мягкотканными структурами может приводить к увеличению числа ошибок сегментации. Эти эффекты не нашли подтверждения в in vivo исследованиях. De Hoop et al -de Hoop et al. (2009) и Gietema et al -Gietema et al. (2007) не нашли в своих исследованиях влияния степени вдоха если исследование было выполнено при глубоком вдохе. В другом исследовании Petkovsa et al -Petkovska et al. (2007) продемонстрировали, что оценки объёма варьируют при разной глубине вдоха если исследования выполнялось не при спокойном вдохе. Другое исследование напротив продемонстрировало, что очаги кажутся больше на выдохе -Rampinelli et al. (2009). Все исследования посвященные влиянию степени вдоха проведены на маленьких выборках и характер этой связи остаётся неясным.

Отдельную проблему оценки динамики представляет сравнение изображений полученных с разными параметрами реконструкции. Если речь идет о сравнении размеров по изображениям выполненным с одинаковыми параметрами реконструкции, систематическая погрешность не мешает, т.к. имеет одинаковое значение на обоих исследованиях. Если же параметры реконструкции разнятся разная систематическая погрешность может быть ошибочно трактована как динамика размеров.

Материалы и методы

Пациенты

Было обследовано 34 пациента с метастатическим поражением лёгких у которых было обнаружено 324 очагов.

Оконтуривание очагов

Оконтуривание осуществлялось с помощью программы с функцией полуавтоматического оконтуривания Seg3d. Врач рентгенолог визуально оценивал попадание в контур очага нормальных структур лёгкого и грудной стенки, и, если обнаруживал прилегание, с целью уточнения измерения вручную корректировал контур.

Оценка параметров очагов.

Очаги были классифицированы по типу прилежащих к ним тканей на интрапульмональные, параваскулярные, параплевральные, парахиллярные.

Для интропульмональных очагов программа измеряла объем очагов, наибольший диаметр и наибольший размер в аксиальной плоскости, площадь прилегания очага к неочаговым структурам.

Цифровой фантом очагового поражения легких

Для изучения влияния на ошибку измерения объёма расположения очагов в лёгких, их размеров и расположения был разработан цифровой фантом очагового поражения лёгких. Для создания фантома использовали два компьютерно-томографических исследования нормальных лёгких и 53 искусственных очага (фантомы очага) с заранее известными объёмами. Томограммы были выполнены с автоматическим контролем экспозиции, толщиной среза 0.5 мм, питчем 1.

Создание фантома потребовало несколько этапов.

На первом этапе на одном из исследований определяли будущее расположение очагов фантомов с заранее заданным размером. Причем планировали прилегание очагов к сосудам лёгких, костальной, диафрагмальной и медиастинальной плевре.

Отображение границ наносимых очагов на трёхмерной реконструкции лёгких

\label{fig:Phantom3d} Отображение границ наносимых очагов на трёхмерной реконструкции лёгких

На втором этапе с помощью программы ANTs первую томограмму трансформировали таким образом, чтобы она была идентична второй: т.е. была скорректирована разница в изображениях обусловленная разной степенью вдоха и положением пациента, достигнута анатомическая идентичность двух КТ исследований. В результате была получена матрица трансформации, которую использовали для перенесения границ очагов с первой томограммы на вторую.

На следующем этапе границы очагов были искусственно расширены или сужены до заданных размеров – имитирована динамика очагов с заранее известными параметрами (Рисунок). Границы очагов на томограммах были заполнены вокселями с КТ-плотностью идентичной сосудам сегментарного калибра. Для придания реалистичности изображения очагов были обработаны фильтром подчеркивающим контуры, гауссовским размытием и аддитивным шумом, стандартное отклонение которого соответствовало стандартному отклонению в гомогенной зоне сердца. Конечный результат изображен на рисунке …

Отображение границ очагов до и после изменения их размеров на аксиальном срезе грудной клетки

\label{fig:Phantom} Отображение границ очагов до и после изменения их размеров на аксиальном срезе грудной клетки

Окончательный результат искусственно нанесенных фантомных очагов на реальные томограммы лёгких – цифровой фантом очагового поражения легких

\label{fig:Phantom2} Окончательный результат искусственно нанесенных фантомных очагов на реальные томограммы лёгких -- цифровой фантом очагового поражения легких

В дальнейшем цифровой фантом обрабатывался программой Mango, измерялись объёмы очагов.

Ошибка вычислялась для каждого очага как разница между измеренным и заранее известным значением объёма фантома очага.

Параметры сканирования и реконструкции

Все исследования были выполнены на компьютерных томографах Aquilion One и Aquilion CX (Toshiba). Сканирование выполнялось в 64-спиральном режиме с толщиной среза 0.5 мм, питчем 1, напряжением на трубку 120 kV и автоматическим контролем тока с помощью программы Sure Exposure (Toshiba).

Каждое изображение было реконструировано 6 раз с уникальными вариантами толщины среза (0.5, 1.5 и 3 мм) и фильтра реконструкции (FC07, FC14).

Оценка погрешности измерения

Вычисляли систематическую и случайную погрешности измерения.

Систематическую погрешность оценивали по средней ошибке измерений, которую рассчитывали по формуле \[\Delta V=\frac{\sqrt{\sum(V_0-V_i)^2}}{n}\], где \(\Delta V\)-ошибка измерения, \(i\)-номер измерения, \(V_0\)- референтное значение, \(n\)-число измерений.

В качестве референтного значения для измерений проводимых на цифровом фантоме выступал заранее заданный объём очага (см. рисунок). Если измерения проводились на компьютерных томограммах, референтным считали объём очага, измеренный на томограммах реконструированных с толщиной среза 0,5 мм и кернелем FC14 (см. рисунок).

Схема вычисления систематической погрешности для измерений которые проводились на фантоме очага

\label{fig:example_error_measure_Phantom} Схема вычисления систематической погрешности для измерений которые проводились на фантоме очага

Рисунок / На рисунке … схематично изображен алгоритм вычисления систематической ошибки для измерений выполняемых на цифровом фантоме очага. На первом этапе (верхний ряд) искусственно смоделированный фантом с заранее известным объёмом (\(V_0\)). Во втором ряду отображение фантома в вокселях при разных параметрах реконструкции (слева направо) выполненные с толщиной 0,5, 1,5, 3,5 мм, в двух горизонтальных рядах (сверху вниз) кернели реконструкции FC07 и FC14. Оттенками зеленого выделены различные воксели: ярко зелёным полные, светло зеленым неполные, белым свободные от фантома. На третьем этапе отображается процесс оконтуривания очагов после отсечения “неполных” вокселей, представляющий собой заготовку для вычисления объёмов. Четвертый этап – формула вычисления ошибки измерения. При вычислении ошибки в качестве референтного значения объёма использовали заранее заданный объём фантома.

Схема вычисления систематической погрешности для измерений которые проводились на компьютерных томограммах

\label{fig:example_error_measure_CT} Схема вычисления систематической погрешности для измерений которые проводились на компьютерных томограммах

Оценка связи погрешности измерения и кернеля реконструкции

Ошибка измерения рассчивалась по формуле \[\Delta V=\frac{V_{FC07}-V_{FC14}}{V_{FC14}}\], где \(\Delta V\)-ошибка измерения, \(V_{FC07}\)-объём измеренный на изображения реконструированных с применением кернеля FC07, \(V_{FC14}\)- -объём измеренный на изображения реконструированных с применением кернеля FC14.

Анализ эффективности определения динамики очагов в лёгких с помощью оценки их линейных размеров

Наибольший размер в аксиальной плоскости каждого очага был измерен 6 раз в тех же вариантах толщины и кернеля реконструкции.

Погрешность волюметрии

Влияние ручной коррекции контуров на ошибку волюметрии

Влияние параметров реконструкции на ошибку волюметрии

Материалы и методы

Выполнено моделирование 500 очагов диаметром от 1 до 38 мм.

На гистограмме представлено распределение числа очагов в зависимости от их диаметра.

## `summarise()` ungrouping output (override with `.groups` argument)`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Каждый из очагов был смоделирован при толщине среза 0.5, 1,2,3,4,5 мм, двумя вариантами фильтра реконструкции (размывающим и подчеркивающим контуры).

Для каждой комбинаций толщины среза и фильтра реконструкции выполнялось 10 реконструкций при небольшом смещении матрице реконструкции. Пример такого смещения представлен на рисунке ниже.

Таким образом, для каждого очага было получено 120 реконструкций.

Оконтуривание очага

Плотность фона составляла -900 HU. Плотность очагов 50 HU. После реконструкции часть вокселей неизбежно состояли из комбинации фона и очага. В зону интереса такие воксели включались, если доля очага в них превышала 50%. Оценка проводилась на основании денситометрии. Если плотность очага превышала (-900+50)/2=-452 HU значит он на половину представлен очагом.

Результаты

Зависимость погрешности измерения от размера очага.

На графике представлена зависимость ошибки измерения каждой реконструкции от эффективного диаметра очага при толщине среза 0,5 мм. В зависимости от диаметра ошибка измерения варьирует от 40 до 1%.

Cистематическая погрешность.

Случайная погрешность.

Зависимость погрешности измерения от толщины среза.

Cистематическая погрешность.

Случайная погрешность.

Из графика видно, что если диаметр очага ниже толщины среза (на графике порог обозначен красной вертикальной линией) случайная погрешность становится выше 50%.

## `summarise()` regrouping output by 'voxel_z' (override with `.groups` argument)

## Adding missing grouping variables: `voxel_z`
## function (object, ...) 
## UseMethod("summary")
## <bytecode: 0x000000001f0ba800>
## <environment: namespace:base>
## Adding missing grouping variables: `voxel_z`Adding missing grouping variables:
## `voxel_z`

## `summarise()` regrouping output by 'id', 'voxel_z', 'blur_sigma',
## 'diametr' (override with `.groups` argument)`summarise()` ungrouping output
## (override with `.groups` argument)
## 
## Call:
## lm(formula = lm_I ~ voxel_z, data = models_voxelz)
## 
## Coefficients:
## (Intercept)      voxel_z  
##      -0.519       -0.274
## 
## Call:
## lm(formula = lm_a ~ voxel_z, data = models_voxelz)
## 
## Coefficients:
## (Intercept)      voxel_z  
##       4.822       12.052
## `geom_smooth()` using formula 'y ~ x'

## `geom_smooth()` using formula 'y ~ x'

Из графиков следует, что увеличение толщины среза на каждый миллиметр увеличивает случайную погрешность на 9.42%

## `summarise()` regrouping output by 'id', 'voxel_z', 'blur_sigma',
## 'diametr' (override with `.groups` argument)
##          (Intercept)              voxel_z I(1/diametr):voxel_z 
##          0.004680873         -0.508475654         14.861160982
## 
## Call:
## lm(formula = sd ~ I(1/diametr):voxel_z + voxel_z, data = .)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -13.141  -0.495  -0.012   0.312  35.505 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           0.004681   0.039697   0.118    0.906    
## voxel_z              -0.508476   0.013575 -37.457   <2e-16 ***
## I(1/diametr):voxel_z 14.861161   0.119209 124.665   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.612 on 17538 degrees of freedom
##   (8307 observations deleted due to missingness)
## Multiple R-squared:  0.4727, Adjusted R-squared:  0.4726 
## F-statistic:  7860 on 2 and 17538 DF,  p-value: < 2.2e-16

Статистическая модель прогнозирования случайной погрешности с учётом толщины среза имеет вид: \[E_{случ}=23.26 \frac{Z}{D} -0.7 Z -0.28\] Таким образом увеличение толщины среза на каждый миллиметр обуславливает увеличение погрешности на \(\frac{23.26}{d}-0.7\)%. Модель позволяет прогнозировать случайную погрешность с ошибкой 2.5%.

Зависимость погрешности измерения от фильтра реконструкции.

Cистематическая погрешность.

Из графика следует что вне зависимости от толщины среза, применения “мягкого” фильтра приводит к недооценке объёма очагов. В большей степени эффект выражен для очагов меньшего размера.

Случайная погрешность.
## `summarise()` regrouping output by 'id', 'voxel_z', 'blur_sigma',
## 'radius' (override with `.groups` argument)
## Warning: Removed 46 rows containing non-finite values (stat_smooth).
## Warning: Removed 46 rows containing missing values (geom_point).

Из графика следует ……..

## `summarise()` regrouping output by 'id', 'voxel_z', 'blur_sigma',
## 'diametr' (override with `.groups` argument)`summarise()` regrouping output by
## 'voxel_z' (override with `.groups` argument)
## 
## Call:
## lm(formula = lm_I ~ voxel_z, data = models_voxelz)
## 
## Coefficients:
## (Intercept)      voxel_z  
##     -0.2675      -0.1741
## 
## Call:
## lm(formula = lm_a ~ voxel_z, data = models_voxelz)
## 
## Coefficients:
## (Intercept)      voxel_z  
##       2.371        9.051
## `geom_smooth()` using formula 'y ~ x'

## `geom_smooth()` using formula 'y ~ x'

data_all %>% filter(id==5,threshold>0.42,threshold<0.6,blur_sigma==0) %>% 
  ggplot(aes(abs(abs_error)))+geom_histogram()+facet_grid(voxel_z~threshold)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Оценка динамики объёма очагов

#Обсуждение

Погрешность

Анализ погрешности оценки размеров образований является ключевым этапом разработки, использующих оценку динамики размеров, протоколов оценки эфективности лечения. Важным является определение разных компонентов этой погрешности: систематического и случайного. Случайная погрешность измерений напрямую определяет пороговое зачения динамики размеров ниже которого невозможно отличить реальную динамику размеров от ошибки измерения. Наличие динамики выходящей за пределы случайной ошибки измерения также не всегда говорит от том, что произло реальное изменение этих размеров, если есть вероятность того что при измерениях была допущена разная систематическая погрешность, то кажущаяся динамика размеров может быть связана с разной систематической погрешностью оценки объёмов очагов. Многочисленные исследования показали, что погрешности измерений зависят от размеров очага Liang et al. (2017) площади контакта с другими мягкотканными структурами и параметрами сканирования.Величина случайной погрешности позволяет сделать вывод о природе выявленной динамики размеров очаговых изменений, т.к. нельзя делать вывод о прогрессировании и регрессировании процесса, если выявленная динамика не превышает случайную погрешность. Отличие предлагаемой нами модели состоит от подобных (???) заключается в возможности прогнозирования как систематической так и случайной компонент погрешности измерений. Это позволяет применять её при сопоставлении изображений выполненных с разными параметрами реконструкции. Например, согласно нашим данным применение кернеля FC07 при оценке объема очага диаметром 10 мм сопряжено с увеличением систематической погрешности на 26% и случайной на 7%. Если в ходе динамического наблюдения первые изображения получены с применением FC14, а вторые с FC07 очаг должен увеличиться не меньше чем на 26+7=33% чтобы зарегистрированные изменения можно . Если же измеренная разница составляет менее 26-7=19% значит очаг не просто не увеличился, а уменьшился.

При сравнении объёмов очага всегда следует учитывать, что оценка объёма сопряжена с погрешностью измерений. Вывод о том, что имеется прогрессиирование процесса может быть сделан только в случае, если разница объёмов превышает эту погрешность. Возможность прогнозирования погрешности измерения позволит в каждом конкретном случае определить обусловлена ли разница объёмов при двух исследованиях реальным изменением морфологического субстрата или её можно объяснить разницей в параметрах получения изображения. Например, согласно нашим данным применение кернеля FC07 при оценке объема очага диаметром 10 мм сопряжено с увеличением систематической погрешности на 14% и случайной на 5%. Если в ходе динамического наблюдения первые изображения получены с FC14, а вторые с FC07 очаг должен увеличился не меньше чем на 14+5% чтобы зарегистрировать его увеличение. Если же измеренная разница составляет менее 19% значит очаг не просто не увеличился, а уменьшился.

Погрешность измерений имеет две основные компоненты и зависит от многих факторов.

Погрешность обусловленная дискретизацией

Измерение объёма очага на компьютерных томограммах осуществляется путем подсчета числа вокселей, которые относятся к очагу. Часть вокселей, расположенных на периферии очага, содержат как отображение тканей очага, так и окружающие ткани. В связи с этим объём, измеренный путем подсчета числа вокселей, будет всегда больше фактического.

На рисунке схематично изображен пример такой систематической погрешности. Объём представленного шара радиусом длинну одной клетки составляет \(\frac{4}{3}\pi1^3=4.18879\). На томограммах с вокселем размерами 1х1х1 клетку шар можно представить в виде куба с ребром длинной 2 вокселя и объемом \(2^3=8\). Величина этой погрешности зависит во-первых от размеров очага, во вторых от размера вокселя и может быть предсказана с точностью -446.149574%. Таким образом, оценка динамики размеров очагов возможна даже в случае, когда изображения получены с разной толщиной среза.

Из-за высокой случайной погрешности волюметрии оценку динамики размеров для очагов диаметром менее 5 мм более эффективно проводить на основании измеренных оператором поперечных размеров.

Рисунок иллюстрирует связь между систематической погрешностью и размером вокселя. На рисунке А изображен объект, на рисунке Б его отображение при размере вокселя равного радиусу очага, на рисунке В \(1/4\) радиуса очага. С увеличением соотношения между диаметром очага и размерами вокселя величина системаческой погрешности уменьшается.

Как видно из рисунка, тот же самый круг диаметром 2 клетки можно “вписать”, как в квадрат 2х2 так и в 3х3. Таким образом возникает случайная погрешность измерения.

Сравнение автоматических измерений

Измерение диаметра оператором сопряжено с систематической ошибкой составляющей 1.3 мм при кернеле FC14 и 5.6 при FC07. На измерения диаметра не влияют толщина среза и прилежащие структуры.

На погрешность волюметрии влияют толщина среза, кернель, прилежащие структуры. Систематическая ошибка при измерении объёма значительно выше, чем при измерении диаметра. Однако, случайная ошибка в 3-5 раз ниже. Таким образом, если учитывать прогнозируемую систематическую погрешность, измерение объёма оказывается более чувствительным способом выявления изменения размеров очага, чем измерение диаметра.

Исследования на фантомах показали, что погрешность измерений падает с увеличением объёма очага (-Goo et al. (2005), -Xie et al. (2014)). Одно из исследований выявило, что для малых очагов допускается систематическая недооценка объёма достигающая 40% (-Xie et al. (2014)). Эти данные противоречат полученным нами результатам. Вероятно, такое расхождение связано с разными программами оконтуривания очагов. Поскольку разработчики программного обеспечения не указывают допускаемую погрешность измерений, сравнение объёмов целесообразно осуществлять с помощью одного и того же программном обеспечении.

Исследования воспроизводимости изучающие мелкие очаги in vivo ограничены. В одном из клинических исследований более 200 очагов, -de Hoop et al. (2009) обнаружили, что вариабельность возрастает обратно пропорционально размерам. Измерения очагов диаметром меньше 8 мм были более вариабельны(18%–26%) чем очаги диаметром более 8 мм (13%–17%). Гудман et al -Goodman et al. (2006) сообщили, что высоко вариабельны измерения очагов диаметром менее 6 мм, в то время как результаты волюметрии 6-9 мм образований значительно более стабильны.

Следующим фактором тесно связанным с погрешностью измерений является форма и расположение очага. Расположение влияет на погрешность измерений больше чем размер, т.к. тесно прилежащие к мягкотканым структурам очаги вообще не могут быть оконтурены правильно. Наше исследование показало, что ошибка значительно возрастает при площади контакта более 15%. В таких случаях требовалась ручная коррекция контуров. Имеются данные, что иногда проблему можно решить, начав автоматическую сегментацию изменив точку старта -Goodman et al. (2006).

Юкставаскулярные очаги в 25-50% случаев не могут быть оконтурены автоматически -Zhao et al. (2014). В крупном исследовании Wang et al -Wang et al. (2008b) изучившем 4225 солидных очагов, юкставаскулярные очаги в четыре раза чаще были подвержены значительным колебаниям измеряемого объёма. Это является причиной того, что многие протоколы скрининга рака лёгкого предлагают использовать ручные измерения для узлов такого рода -Field et al. (2016), -van Klaveren et al. (2009).

Несмотря на то, что характер границы очага значительно влияет на результат и вариабельность волюметрии, в изучаемой нами группе его влияние было незначительно, т.к. все очаги имели ровные четкие контуры. Наличие спикулообразных контуров снижает воспроизводимость оконтуривания очага (-Petrou et al. (2007),-Ashraf et al. (2010)). Xie et al продемонстрировал что объём очагов сложной формы может быть недооценен до 39% ± 21, по сравнению с 10% в искусственных очагах с ровными контурами того же размера -Xie et al. (2014). Тем не менее эти данные требуется рассматривать в контексте известных проблем измерения диаметра очагов с лучистыми спикулообразными контурами.

Термины

Оконтуривание очагов: определение границ очагов на каждом из срезов для последующего определения их объема

Автоматическое оконтуривание очагов (segmentation в англоязычной литературе) – программно реализуемый метод автоматического определение границ выбранного оператором очага

Оконтуривание (или коррекция контуров) очагов оператором (manual segmentation в англоязычной литературе) способ определения границы между очагом в легочной паренхиме и прилежащей к нему ткани (например грудной стенки, средостения, легочного сосуда)

Волюметрия –измерение объема

Морфометрия – определение измеряемых характеристик очага (таких как линейные размеры или диаметр, объем и т.д. (ЧТО например в и.т.д?)

Воспроизводимость – близость друг к другу значений серии повторных определений. В данной работе под воспроизводимостью понимали стандартное отклонение объема конкретного очага при множественных процедурах его оконтуривания

Параметры реконструкции - измеряемые характеристики формирования изображения. В данной работе изучено влияние таких параметров реконструкции как толщина среза, кернеля (ядра) реконструкции на воспроизводимость результатов волюметрии

Систематическая погрешность измерений – постоянный или закономерно изменяющийся компонент ошибки измерений

Случайная погрешность измерений – компонент ошибки изменяющийся случайным образом

Дискретизация: представление непрерывного (целостного) объекта в виде отдельных фрагментов. Например; целостный объект «шар» на компьютерных томограммах представляется в виде вокселей разной яркости

Эффективный диаметр: программно реализуемый метод автоматического приведения объекта неправильной формы к шару равного с ним объема и последующего измерения его диаметра, названного эффективным

Ashraf, H., B. de Hoop, S. B. Shaker, A. Dirksen, K. S. Bach, H. Hansen, M. Prokop, and J. H. Pedersen. 2010. “Lung Nodule Volumetry: Segmentation Algorithms Within the Same Software Package Cannot Be Used Interchangeably.” European Radiology 20 (8): 1878–85. https://doi.org/10.1007/s00330-010-1749-z.
Chen, Baiyu, Huiman Barnhart, Samuel Richard, Marthony Robins, James Colsher, and Ehsan Samei. 2013. “Volumetric Quantification of Lung Nodules in CT with Iterative Reconstruction (ASiR and MBIR).” Medical Physics 40 (11): 111902. https://doi.org/10.1118/1.4823463.
Das, Marco, Julia Ley-Zaporozhan, H. A. Gietema, Andre Czech, Georg Mühlenbruch, Andreas H. Mahnken, Markus Katoh, et al. 2007. “Accuracy of Automated Volumetry of Pulmonary Nodules Across Different Multislice CT Scanners.” European Radiology 17 (8): 1979–84. https://doi.org/10.1007/s00330-006-0562-1.
Das, Marco, Georg Mühlenbruch, Markus Katoh, Annemarie Bakai, Marcos Salganicoff, Sven Stanzel, Andreas H. Mahnken, Rolf W. Günther, and Joachim E. Wildberger. 2007. “Automated Volumetry of Solid Pulmonary Nodules in a Phantom: Accuracy Across Different CT Scanner Technologies.” Investigative Radiology 42 (5): 297–302. https://doi.org/10.1097/01.rli.0000258683.20123.c4.
de Hoop, Bartjan, Hester Gietema, Bram van Ginneken, Pieter Zanen, Gerard Groenewegen, and Mathias Prokop. 2009. “A Comparison of Six Software Packages for Evaluation of Solid Lung Nodules Using Semi-Automated Volumetry: What Is the Minimum Increase in Size to Detect Growth in Repeated CT Examinations.” European Radiology 19 (4): 800–808. https://doi.org/10.1007/s00330-008-1229-x.
Devaraj, Anand, Bram van Ginneken, Arjun Nair, and David Baldwin. 2017. “Use of Volumetry for Lung Nodule Management: Theory and Practice.” Radiology 284 (3): 630–44. https://doi.org/10.1148/radiol.2017151022.
Doo, K. W., E.-Y. Kang, H. S. Yong, O. H. Woo, K. Y. Lee, and Y.-W. Oh. 2014. “Accuracy of Lung Nodule Volumetry in Low-Dose CT with Iterative Reconstruction: An Anthropomorphic Thoracic Phantom Study.” The British Journal of Radiology 87 (1041): 20130644. https://doi.org/10.1259/bjr.20130644.
Field, J. K., S. W. Duffy, D. R. Baldwin, D. K. Whynes, A. Devaraj, K. E. Brain, T. Eisen, et al. 2016. UK Lung Cancer RCT Pilot Screening Trial: Baseline Findings from the Screening Arm Provide Evidence for the Potential Implementation of Lung Cancer Screening.” Thorax 71 (2): 161–70. https://doi.org/10.1136/thoraxjnl-2015-207140.
Gietema, Hester A., Cornelia M. Schaefer-Prokop, Willem P. T. M. Mali, Gerard Groenewegen, and Mathias Prokop. 2007. “Pulmonary Nodules: Interscan Variability of Semiautomated Volume Measurements with Multisection CT of Inspiration Level, Nodule Size, and Segmentation Performance.” Radiology 245 (3): 888–94. https://doi.org/10.1148/radiol.2452061054.
Goo, Jin Mo, Trongtum Tongdee, Ranista Tongdee, Kwangjae Yeo, Charles F. Hildebolt, and Kyongtae T. Bae. 2005. “Volumetric Measurement of Synthetic Lung Nodules with Multi: Effect of Various Image Reconstruction Parameters and Segmentation Thresholds on Measurement Accuracy.” Radiology 235 (3): 850–56. https://doi.org/10.1148/radiol.2353040737.
Goodman, Lawrence R., Meltem Gulsun, Lacey Washington, Paul G. Nagy, and Kelly L. Piacsek. 2006. “Inherent Variability of CT Lung Nodule Measurements in Vivo Using Semiautomated Volumetric Measurements.” AJR. American Journal of Roentgenology 186 (4): 989–94. https://doi.org/10.2214/AJR.04.1821.
Hein, Patrick A., Valentina C. Romano, Patrik Rogalla, Christian Klessen, Alexander Lembcke, Lars Bornemann, Volker Dicken, Bernd Hamm, and Hans-Christian Bauknecht. 2010. “Variability of Semiautomated Lung Nodule Volumetry on Ultralow-Dose CT: Comparison with Nodule Volumetry on Standard-Dose CT.” Journal of Digital Imaging 23 (1): 8–17. https://doi.org/10.1007/s10278-008-9157-5.
Heuvelmans, Marjolein A., Joan E. Walter, Rozemarijn Vliegenthart, Peter M. A. van Ooijen, Geertruida H. De Bock, Harry J. de Koning, and Matthijs Oudkerk. 2018. “Disagreement of Diameter and Volume Measurements for Pulmonary Nodule Size Estimation in CT Lung Cancer Screening.” Thorax 73 (8): 779–81. https://doi.org/10.1136/thoraxjnl-2017-210770.
Honda, Osamu, Takeshi Johkoh, Hiromitsu Sumikawa, Atsuo Inoue, Noriyuki Tomiyama, Naoki Mihara, Yuka Fujita, et al. 2007. “Pulmonary Nodules: 3d Volumetric Measurement with Multidetector CT of Intravenous Contrast Medium.” Radiology 245 (3): 881–87. https://doi.org/10.1148/radiol.2453062116.
Hwang, Sung Ho, Yu-Whan Oh, Soo-Youn Ham, Eun-Young Kang, and Ki Yeol Lee. 2015 May-Jun. “Effect of the High-Pitch Mode in Dual-Source Computed Tomography on the Accuracy of Three-Dimensional Volumetry of Solid Pulmonary Nodules: A Phantom Study.” Korean Journal of Radiology 16 (3): 641–47. https://doi.org/10.3348/kjr.2015.16.3.641.
Kim, Hyungjin, Chang Min Park, Sang Min Lee, Hyun-Ju Lee, and Jin Mo Goo. 2013. “A Comparison of Two Commercial Volumetry Software Programs in the Analysis of Pulmonary Ground-Glass Nodules: Segmentation Capability and Measurement Accuracy.” Korean Journal of Radiology 14 (4): 683–91. https://doi.org/10.3348/kjr.2013.14.4.683.
Li, Qin, Marios A. Gavrielides, Berkman Sahiner, Kyle J. Myers, Rongping Zeng, and Nicholas Petrick. 2015. “Statistical Analysis of Lung Nodule Volume Measurements with CT in a Large-Scale Phantom Study.” Medical Physics 42 (7): 3932–47. https://doi.org/10.1118/1.4921734.
Oxnard, Geoffrey R., Binsheng Zhao, Camelia S. Sima, Michelle S. Ginsberg, Leonard P. James, Robert A. Lefkowitz, Pingzhen Guo, Mark G. Kris, Lawrence H. Schwartz, and Gregory J. Riely. 2011. “Variability of Lung Tumor Measurements on Repeat Computed Tomography Scans Taken Within 15 Minutes.” Journal of Clinical Oncology 29 (23): 3114–19. https://doi.org/10.1200/JCO.2010.33.7071.
Pastorino, Ugo, Marta Rossi, Valentina Rosato, Alfonso Marchianò, Nicola Sverzellati, Carlo Morosi, Alessandra Fabbri, et al. 2012. “Annual or Biennial CT Screening Versus Observation in Heavy Smokers: 5-Year Results of the MILD Trial.” European Journal of Cancer Prevention: The Official Journal of the European Cancer Prevention Organisation (ECP) 21 (3): 308–15. https://doi.org/10.1097/CEJ.0b013e328351e1b6.
Petkovska, Iva, Matthew S. Brown, Jonathan G. Goldin, Hyun J. Kim, Michael F. McNitt-Gray, Fereidoun G. Abtin, Raffi J. Ghurabi, and Denise R. Aberle. 2007. “The Effect of Lung Volume on Nodule Size on CT.” Academic Radiology 14 (4): 476–85. https://doi.org/10.1016/j.acra.2007.01.008.
Petrou, Myria, Leslie E. Quint, Bin Nan, and Laurence H. Baker. 2007. “Pulmonary Nodule Volumetric Measurement Variability as a Function of CT Slice Thickness and Nodule Morphology.” AJR. American Journal of Roentgenology 188 (2): 306–12. https://doi.org/10.2214/AJR.05.1063.
Rampinelli, Cristiano, Elvio De Fiori, Sara Raimondi, Giulia Veronesi, and Massimo Bellomi. 2009. “In Vivo Repeatability of Automated Volume Calculations of Small Pulmonary Nodules with CT.” AJR. American Journal of Roentgenology 192 (6): 1657–61. https://doi.org/10.2214/AJR.08.1825.
Rampinelli, Cristiano, Sara Raimondi, Mauro Padrenostro, Elvio De Fiori, Stefano Meroni, Giulia Veronesi, and Massimo Bellomi. 2010. “Pulmonary Nodules: Contrast-Enhanced Volumetric Variation at Different CT Scan Delays.” AJR. American Journal of Roentgenology 195 (1): 149–54. https://doi.org/10.2214/AJR.09.3212.
Reeves, Anthony P., Alberto M. Biancardi, Tatiyana V. Apanasovich, Charles R. Meyer, Heber MacMahon, Edwin J. R. van Beek, Ella A. Kazerooni, et al. 2007. “The Lung Image Database Consortium (LIDC): A Comparison of Different Size Metrics for Pulmonary Nodule Measurements.” Academic Radiology 14 (12): 1475–85. https://doi.org/10.1016/j.acra.2007.09.005.
Revel, Marie-Pierre, Alvine Bissery, Marie Bienvenu, Laetitia Aycard, Catherine Lefort, and Guy Frija. 2004. “Are Two-Dimensional CT Measurements of Small Noncalcified Pulmonary Nodules Reliable?” Radiology 231 (2): 453–58. https://doi.org/10.1148/radiol.2312030167.
Siegelman, Jenifer W., Mark P. Supanich, and Marios A. Gavrielides. 2015. “Pulmonary Nodules with Ground-Glass Opacity Can Be Reliably Measured with Low-Dose Techniques Regardless of Iterative Reconstruction: Results of a Phantom Study.” AJR. American Journal of Roentgenology 204 (6): 1242–47. https://doi.org/10.2214/AJR.14.13820.
van Klaveren, Rob J., Matthijs Oudkerk, Mathias Prokop, Ernst T. Scholten, Kristiaan Nackaerts, Rene Vernhout, Carola A. van Iersel, et al. 2009. “Management of Lung Nodules Detected by Volume CT Scanning.” The New England Journal of Medicine 361 (23): 2221–29. https://doi.org/10.1056/NEJMoa0906085.
Wang, Ying, Rob J. van Klaveren, Hester J. van der ZaagLoonen, Geertruida H. de Bock, Hester A. Gietema, Dong Ming Xu, Anne L. M. Leusveld, et al. 2008a. “Effect of Nodule Characteristics on Variability of Semiautomated Volume Measurements in Pulmonary Nodules Detected in a Lung Cancer Screening Program.” Radiology 248 (2): 625–31. https://doi.org/10.1148/radiol.2482070957.
———, et al. 2008b. “Effect of Nodule Characteristics on Variability of Semiautomated Volume Measurements in Pulmonary Nodules Detected in a Lung Cancer Screening Program.” Radiology 248 (2): 625–31. https://doi.org/10.1148/radiol.2482070957.
Way, Ted W., Heang-Ping Chan, Mitchell M. Goodsitt, Berkman Sahiner, Lubomir M. Hadjiiski, Chuan Zhou, and Aamer Chughtai. 2008. “Effect of CT Scanning Parameters on Volumetric Measurements of Pulmonary Nodules by 3d Active Contour Segmentation: A Phantom Study.” Physics in Medicine and Biology 53 (5): 1295–1312. https://doi.org/10.1088/0031-9155/53/5/009.
Willemink, Martin J., Jaap Borstlap, Richard A. P. Takx, Arnold M. R. Schilham, Tim Leiner, Ricardo P. J. Budde, and Pim A. de Jong. 2013. “The Effects of Computed Tomography with Iterative Reconstruction on Solid Pulmonary Nodule Volume Quantification.” PloS One 8 (2): e58053. https://doi.org/10.1371/journal.pone.0058053.
Wormanns, Dag, Gerhard Kohl, Ernst Klotz, Anke Marheine, Florian Beyer, Walter Heindel, and Stefan Diederich. 2004. “Volumetric Measurements of Pulmonary Nodules at Multi-Row Detector CT: In Vivo Reproducibility.” European Radiology 14 (1): 86–92. https://doi.org/10.1007/s00330-003-2132-0.
Xie, Xueqian, Martin J. Willemink, Pim A. de Jong, Peter M. A. van Ooijen, Matthijs Oudkerk, Rozemarijn Vliegenthart, and Marcel J. W. Greuter. 2014. “Small Irregular Pulmonary Nodules in Low-Dose CT: Observer Detection Sensitivity and Volumetry Accuracy.” AJR. American Journal of Roentgenology 202 (3): W202–209. https://doi.org/10.2214/AJR.13.10830.
Xie, Xueqian, Yingru Zhao, Roland A. Snijder, Peter M. A. van Ooijen, Pim A. de Jong, Matthijs Oudkerk, Geertruida H. de Bock, Rozemarijn Vliegenthart, and Marcel J. W. Greuter. 2013. “Sensitivity and Accuracy of Volumetry of Pulmonary Nodules on Low-Dose 16- and 64-Row Multi-Detector CT: An Anthropomorphic Phantom Study.” European Radiology 23 (1): 139–47. https://doi.org/10.1007/s00330-012-2570-7.
Zhao, Ying Ru, Peter M. A. van Ooijen, Monique D. Dorrius, Marjolein Heuvelmans, Geertruida H. de Bock, Rozemarijn Vliegenthart, and Matthijs Oudkerk. 2014. “Comparison of Three Software Systems for Semi-Automatic Volumetry of Pulmonary Nodules on Baseline and Follow-up CT Examinations.” Acta Radiologica (Stockholm, Sweden: 1987) 55 (6): 691–98. https://doi.org/10.1177/0284185113508177.