У нас было 2 аптеки, 45 тысяч записей в журналах за год, 5 видов форм, полгода на сбор данных и целое множество прописей всех сортов и расцветок, болтушки, а также порошки, суспензии, ящик мазей, пинта чистого спирта и 2 дюжины на глазные капли. Не то чтобы это был необходимый запас для дипломной, но если начал собирать дурь, становится трудно остановиться. Единственное, что вызывало у меня опасение — это порошки. Ничто в мире не бывает более беспомощным, безответственным и порочным, чем дозирование порошков. Я знал, что рано или поздно мы перейдем и на эту дрянь.*

Что имеем…

Есть рецептурные журналы из 3 аптек (рецептурный журнал гродно 2016.xls.xlsx, рецептурный журнал могилев, Рецептурный журнал чериков январь-ноябрь), в общей сложности за 10 месяцев 2016 года. 24860 записей, помимо стандартных полей формы 17-АП, размеченных по виду ЛФ и по агрегатному состоянию.

Видовое разнообразие потока требований:

Вид.ЛФ минимум* первый квáртиль среднее медиана максимум третий квáртиль
водный раствор 0 3 6.427119 6.0 21 9.00
глазные капли 0 1 3.059459 2.5 11 4.00
ингаляционный раствор 0 1 1.312500 1.0 3 2.00
коллоидный раствор 0 1 1.222222 1.0 4 1.00
мазь 0 2 14.886454 10.5 72 25.00
микстура 0 1 2.271552 2.0 7 3.00
назальные капли 0 1 2.886364 2.0 11 4.00
настой 0 1 1.000000 1.0 1 1.00
паста 0 1 1.630137 1.0 5 2.00
порошок 0 1 2.988796 2.0 39 4.00
раствор 0 3 14.210744 8.0 110 25.00
спиртовой раствор 0 3 6.783019 7.0 17 10.00
спирт этиловый 0 1 1.444444 1.0 4 1.75
суспензия 0 5 11.280075 9.0 40 18.00
ушные капли 0 1 1.583333 1.0 6 2.00
* Ну кто бы сомневался.

Можно сделать вывод о начительной асимметри в распределении потока требований по значительному отличию между медианой и средним. Пооэтому эффективной мерой средней тенденции может служить только медиана, или среднее, преобразованое логарифмированием. Поскольку задача состоит в определении границ вариации потока трабований, делить данные по аптекам нет необходимости, так-как в худшем случае мы просто получим бóльшую дисперсию и более широкие ДИ.

На впорос: «какая разница?» отвечать будет госодин Краскел.

p-значение \(5.2549172\times 10^{-63}\), — говорит нам господин Краскел. А это никак не больше полюбившихся нам 0.05, так что разница есть. Потеребим первую сигнальную систему, то есть нарисуем боксплотцев, для уменьшения шума оставим тлько те ЛФ, по которым у нас есть данные замеров длительности изготовления:

Есть протоколы наблюдения за изготовлением ЛФ в аптеке №157 г. Витебска и в ХХХ аптеке г. Гродно. 1 случаев приготовления разнообразных ЛФ с указанием времени, затраченного на каждый вид операций, выполенных в процессе.

Различия затрат времени на изготовление по видам ЛФ приведены в таблице:

вид ЛФ число случаев минимум первый квáртиль среднее медиана максимум третий квáртиль
мазь 3 1517.80 1593.5450 1750.2133 1669.290 2063.55 1866.4200
порошок 5 334.32 2608.5300 2586.0520 3021.660 3598.61 3367.1400
раствор 16 311.10 424.4175 623.0438 504.385 1950.16 639.3250
суспензия 24 548.44 713.3450 774.9333 783.500 1011.50 839.3375

Симметричность распределения времен на изготовление в пределах одного вида сомнений не вызывает. Чтобы убедиться, можно взглянуть на гистограммы:

Впрочем, некоторые позиции не впечатляют широтой охвата. Тем не менее, мы и в данном случае рискуем только завышенными доверительными нитервалами.

Опять-таки, зададимcя вопросом о разнице: «Есть она?»

«Кто здесь?», — говорит снова Краскел, но потом поправляется и вещает: «p-значение равно \(2.5731932\times 10^{-4}\)», что, безусловно, тоже меньше пресловутых 0.05. Картиночку?

То считаем*!

А теперь о главном. Доверительные интервалы. Сначала ДИ на время изготовления, в секундах:

вид ЛФ y ymin ymax
мазь 1750.2133 1050.3554 2450.0713
порошок 2586.0520 955.7409 4216.3631
раствор 623.0438 408.7491 837.3384
суспензия 774.9333 726.2507 823.6160

Далее ДИ на среднее количество поступающих в день рецептов:

Вид.ЛФ y ymin ymax
мазь 14.886454 13.582297 16.19061
порошок 2.988796 2.672761 3.30483
раствор 14.210744 12.418252 16.00324
суспензия 11.280075 10.615043 11.94511

Но, поскольку распределение ассимметрично, лучше взять ДИ на медианное количество:

Вид.ЛФ y ymin ymax
мазь 10.5 8.431342 12.56866
порошок 2.0 2.000000 2.00000
раствор 8.0 5.868550 10.13145
суспензия 9.0 7.965671 10.03433

И в финале рассчитаем пессимистичные и оптимистичне оценки трудозатрат провизора-технолога в день на обслуживание всех заказов, в часах:

## Warning in left_join_impl(x, y, by$x, by$y, suffix$x, suffix$y): joining
## factor and character vector, coercing into character vector
вид ЛФ mn avg mx
мазь 2.4599739 5.104789 8.553919
порошок 0.5309672 1.436696 2.342424
раствор 0.6663236 1.384542 2.356514
суспензия 1.6069651 1.937333 2.295676

Что это все значит? Эначит это, что в 95 процентах случаев наблюдения за изготовлением, в указанных аптеках, медианное время (то есть такое, что половина дней наблюдения покажут меньшее или такое же количество заявок), будет находиться для каждого вида ЛФ в соответствующих интервалах. Аналогичные показатели можно рассчитать для, например, 75-процентного квáнтиля:

## Warning in left_join_impl(x, y, by$x, by$y, suffix$x, suffix$y): joining
## factor and character vector, coercing into character vector
вид ЛФ mn avg mx
мазь 6.690572 12.154259 18.422261
порошок 1.061934 2.873391 4.684848
раствор 2.596528 4.326693 6.310612
суспензия 3.422592 3.874667 4.354716