Вступ

Рак стравоходу є одним із найнебезпечніших видів онкологічних захворювань, що характеризується високим рівнем смертності. Одними з найімовірніших чинників, що впливають на розвиток раку стравоходу, є споживання алкоголю та тютюну. Для кількісного аналізу цього взаємозв’язку датасет esoph містить дані клініко-епідеміологічного дослідження, проведеного у Великій Британії, і спрямований на оцінку ризику раку стравоходу залежно від інтенсивності вживання алкоголю та тютюну.


Datatable_metadata

Дані представлені у вигляді таблиці з 88 спостережень, кожне з яких відображає певну групу пацієнтів, що розділені за такими критеріями:
- вікова група обстежених,
- рівень споживання алкоголю,
- рівень споживання тютюну,
- кількість зареєстрованих випадків раку стравоходу,
- кількість контрольних осіб без раку.

Опис результатів дослідження

Box Plot

Ця таблиця показує співвідношення випадків раку до різних вікових категорій обстежених пацієнтів. Аналіз даних показує максимальну кількість випадків у віковій групі 55-64 роки. Також велика кількість випадків раку зафіксована в групах 45-54 та 65-74.

Scater Plot

Цей графік показує, що ризик виникнення раку стравоходу зростає із підвищенням рівня споживання тютюну. Групи з найвищим рівнем тютюнового навантаження мають більшу кількість зареєстрованих випадків.

Bar Plot

Цей графік показує співвідношення кількості контролів до кількості випадків раку в різних вікових категоріях і, як і в попередніх графіках, видно кореляцію між старшим віком та більшим відсотком хвороб до здорових контролів. Найбільш вразливими групами є 45+ років люди.

Density Plot

На графіку зображено розподіл щільності для двох показників: кількості випадків раку стравоходу (червона область) та кількості контрольних осіб (синя область). Обидва розподіли мають виражений пік у діапазоні малих значень (приблизно 0–10), що свідчить про те, що більшість спостережень у вибірці стосуються груп із невеликою кількістю як випадків, так і контрольних осіб. При цьому червона крива є більш різкою і концентрованою біля нуля, що означає, що випадки раку зустрічаються рідко і спостерігаються лише у невеликій частині груп.

Correlation Plot

На графіку показано взаємозв’язок між кількістю випадків раку стравоходу та кількістю контрольних осіб для різних груп спостереження. Спостерігається, що більшість точок зосереджені у нижній лівій частині графіка, тобто у більшості груп зафіксовано низьку кількість випадків і помірну кількість контрольних осіб. Лінія регресії має невеликий позитивний нахил, що свідчить про слабку пряму кореляцію: із незначним зростанням кількості випадків раку частково зростає і кількість контрольних осіб у вибірці. Проте цей зв’язок є досить слабким, оскільки точки розташовані розсіяно, без чіткої лінійної залежності.

Heatmap

Дана теплова карта показує взаємозвязок між кількістю випадків раку та віком і вживанням алкоголю: найбільша кількість випадків у віці понад 45-50 років та при регулярному прийомі алкоголю. Це може показувати довтривалу дію алкоголю, та те, що регулярне його вживання протягом тривалого часу підвищує ризик виникнення раку стравоходу. Люди які не вживали алкоголь, або вживали мало мають меншу вірогідність онкозахворювання. Однак дані також вказують, що надмірне вживання алкоголю може підвищувати ймовірність виникнення раку навіть в середньому віці (35-40 років).

Висновки

Аналіз даних датасету esoph показав, що ризик розвитку раку стравоходу істотно зростає зі збільшенням споживання алкоголю та тютюну, причому обидва фактори діють синергічно. Також підтверджено вікову залежність — найбільша кількість випадків спостерігається серед людей середнього та похилого віку. Отримані результати підкреслюють необхідність профілактичних заходів, спрямованих на зменшення споживання алкоголю і тютюну, а також важливість ранньої діагностики у групах підвищеного ризику.