Примечание:
- стат-дата: 2025-07-28
- смотрим чаты с 5+ сбщ юзера - выборка - почти 20К чатов
- чаты июля
Краткая сводка по сенсетив сообщениям
Всего сообщений: 1193560
Всего чатов: 19870
Всего пользователей: 16458
Сенсетив сообщений: 4962
Чатов с сенсетив сообщениями: 2634
Пользователей с сенсетив сообщениями: 2306
Доля сенсетив сообщений: 0.42%
Доля чатов с сенсетив сообщениями: 13.26%
Доля пользователей с сенсетив сообщениями: 14.01%
Опасных сообщений: 2104
Чатов с опасными сообщениями: 1269
Пользователей с опасными сообщениями: 1137
Доля опасных сообщений: 0.18%
Доля чатов с опасными сообщениями: 6.39%
Доля пользователей с опасными сообщениями: 6.91%
Масштаб явления
Сенсетив-темы встречаются примерно в каждом восьмом чате (13%) и
у каждого седьмого пользователя (14%) – это не обязательно что-то
страшное, просто темы, которые волнуют, где им нужно утешение и
поддержка, регулярная особенность пользовательского опыта.
большая часть таких сообщений – не какое-то нарушение.
Опасные темы – подкатегория сенсетив топиков. Уже явная зона
риска: встречаются только в 6% чатов и у 7% пользователей. Это более
“тяжёлые” случаи (смерти, криминал, насилие, угрозы детям и
пр).
По идее такие запросы будет ловить модерация.
- Таким образом, каждый седьмой пользователь и примерно каждый восьмой
чат в этой выборке столкнулся с чувствительными темами.
- На 1000 сообщений приходится около 2 опасных случаев, а на каждые
100 пользователей – почти 7 столкнулись с тяжелыми темами.
Все чувствительные / сомнительные темы
Распределение категорий сенсетив тем
|
Чувствительная тема
|
Кол-во сообщений
|
% от всех
|
|
Other Unsafe Themes
|
1140
|
21.73
|
|
Death, Grief, and Loss
|
1021
|
19.46
|
|
Sexual Content & Inappropriate Interactions
|
829
|
15.80
|
|
Promotion of Harmful Practices or Dangerous Activities
|
775
|
14.77
|
|
Hate Speech, Violence & Discrimination
|
572
|
10.90
|
|
Drug, Alcohol, and Tobacco Content
|
268
|
5.11
|
|
Financial or Scamming Activities
|
170
|
3.24
|
|
Threats, Bullying, and Exploitation
|
163
|
3.11
|
|
Privacy and Confidential Information
|
116
|
2.21
|
|
False Claims & Deceptive Practices
|
116
|
2.21
|
|
Content Harmful to Children
|
51
|
0.97
|
|
Cultural Sensitivity & Disrespect
|
25
|
0.48
|
Первая пятёрка тем (77% всех сенсетив-сообщений):
- “Other Unsafe Themes” (21.7%) – самая “широкая” категория, сюда
попадают всё, что не попало в отдельные детекторы.
- “Death, Grief, and Loss” (19.5%) – огромная доля, то есть
пользователи часто затрагивают личные потери, переживания и вопросы
смерти.
- “Sexual Content & Inappropriate Interactions” (15.8%) –
чувствительные, но не всегда опасные, темы.
- “Promotion of Harmful Practices or Dangerous Activities” (14.8%) –
просьбы о совете или обсуждение потенциально опасных действий.
- “Hate Speech, Violence & Discrimination” (10.9%) – также частая
категория, требует внимания и отслеживания паттернов.
Все остальные темы (6/12) занимают менее 5% каждая – значит, они
реже встречаются, но могут нести специфический риск.
Подкатегории
1. Какие темы доминируют?
Основной массив чувствительных диалогов – это темы, связанные с
жизненными кризисами, утратой, отношениями и потенциально
опасным/токсичным поведением.
2. Крупнейшие подтемы внутри этих топ-тем:
- Inappropriate Relationships (60% внутри “Sexual
Content & Inappropriate Interactions”)
- Self-harm or Suicide (51% внутри “Promotion of
Harmful Practices…”)
- Medical Emergencies & Mental Health Crisis (33%
внутри “Other Unsafe Themes”)
- Harassment and Bullying (65% внутри “Hate Speech,
Violence…”)
- Bereavement Support Requests (35% в “Death, Grief,
and Loss”)
Подтемы сконцентрированы на психическом здоровье, токсичных
отношениях, травле, саморазрушении, утрате и кризисах. Особенно
тревожно: высокий процент “Self-harm or Suicide” и “Medical Emergencies”
- в основном используется для поиска поддержки в очень сложных
состояниях.
Важно:
Психическое здоровье, утрата и травля – ядро
сенсетив-трафика.
В этих темах большинство сообщений — это не “курьёз”, а тяжелые
личные кейсы с реальной потенциальной угрозой.
Даже небольшие подтемы требуют внимания, если там процент высок
(например, 65% всех обращений по теме – буллинг).
Нужно проактивное реагирование, не просто фильтрация.
- Для подтем “Self-harm or Suicide”, “Medical Emergencies”,
“Harassment” – выводить специальный “дисклэймер” и рекомендации
по обращению в спец места
- автоматические алерты при всплытии опасных паттернов текста.
- доп. анализ реальных сообщений с высокими рисками, чтобы дообучить
фильтры (NLP/ML) для более тонкой модерации.
Более опасные
Распределение категорий опасных тем
|
Опасная тема
|
Кол-во сообщений
|
% от всех
|
|
Promotion of Harmful Practices or Dangerous Activities
|
663
|
29.36
|
|
Hate Speech, Violence & Discrimination
|
536
|
23.74
|
|
Other Unsafe Themes
|
271
|
12.00
|
|
Drug, Alcohol, and Tobacco Content
|
268
|
11.87
|
|
Financial or Scamming Activities
|
170
|
7.53
|
|
Threats, Bullying, and Exploitation
|
163
|
7.22
|
|
Sexual Content & Inappropriate Interactions
|
132
|
5.85
|
|
Content Harmful to Children
|
51
|
2.26
|
|
Privacy and Confidential Information
|
4
|
0.18
|
Две ведущие категории (53% опасных сообщений):
- “Promotion of Harmful Practices or Dangerous Acts” (29.4%)
- “Hate Speech, Violence & Discrimination” (23.7%)
- “Drug, Alcohol, and Tobacco Content” и “Financial or Scamming
Activities” – каждый почти по 12%/8%.
- Темы “Sexual Content & Inappropriate Interactions” и “Content
Harmful to Children” – менее частые, но требуют отдельного
внимания.
- “Other Unsafe Themes” – снова “сборная” категория, но уже не первая
по количеству.
Подкатегории
1. Какие темы доминируют?
Здесь есть реально опасные риски: самоповреждение, насилие,
мошенничество, незаконные вещества и т.д.
2. Крупнейшие подтемы (по количеству сообщений в подтеме):
- Самоповреждение и самоубийства — самый крупный и
тревожный кластер опасных запросов.
- Травля, буллинг, физическое насилие – всегда
попадают в топ.
- Очень много опасных кейсов связано с незаконной
деятельностью (юридические советы, наркотики,
мошенничество).
- “Взрослый” контент также занимает заметную долю,
причём не только сексуальные темы, есть и эксплуатация.
Риски:
- В этой выборке концентрация “жёстких” рисков
выше.
- Пользователи не просто “делятся болью”, но иногда ищут одобрение,
способ или “разрешение” на опасные действия.
- Много обращений по “юридическим” вопросам — и это, возможно, для нас
ред флаг, астролог не должен брать на себя такую функцию.
- Есть скрытые кейсы эксплуатации и буллинга в отношении детей.
Важно:
- помечать такие чаты модератором.
- включать “safety notice” — вы не даёте юридических, медицинских и
психиатрических консультаций.
- в расширении для “Self-harm”, “Bullying”, “Violence” показывать
реальные “горячие линии”, SOS-ссылки, инфо по странам.
- мониторинг на повторные обращения — если один и тот же юзер
регулярно попадает в такие темы.
Распределения опасных категорий по признакам
Локаль
Объём опасных чатов (топ-5):
- Английский (en) – 1143 чата
(81.6% всех опасных чатов, подавляющее
большинство!)
- Немецкий (de) – 76 чатов (5.4%)
- Испанский (es) – 47 чатов (3.4%)
- Французский (fr) – 46 чатов (3.3%)
- Корейский (ko) – 39 чатов (2.8%)
Все остальные языки (ja – японский, ar – арабский, pt –
португальский) дают по 1–1.5% каждый. * Топ-4 языка
(en, de, es, fr) вместе дают более 93% всех
опасных чатов. * Все “малые” языки дают менее 10% вместе взятые.
Хотя в этих локалях мало чатов по абсолюту, рискованные темы имеют
высокую долю.
Какие темы доминируют в каждой локали?
Английский (en):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities”
(318 чатов, 27.8% среди всех рисковых английских
чатов)
Немецкий (de):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities”
(27 чатов, 35.5%)
Испанский (es):
- Топ-тема: “Hate Speech, Violence & Discrimination” (11 чатов,
23.4%)
Французский (fr):
- Топ-тема: “Hate Speech, Violence & Discrimination” (14 чатов,
30.4%)
Корейский (ko):
- Топ-тема: “Financial or Scamming Activities” (8 чатов, 20.5%)
Португальский (pt):
- Топ-тема: “Hate Speech, Violence & Discrimination” (4 чата,
36.4%)
Японский (ja):
- Топ-тема: “Hate Speech, Violence & Discrimination” (6 чатов,
30.0%)
Арабский (ar):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities”
(6 чатов, 31.6%)
Возраст
- 35–44 года: 496 чатов
(35.3% от общего числа)
- 25–34 года: 436 чатов (31.0%)
- 45–59 лет: 245 чатов (17.4%)
- 18–24 года: 152 чата (10.8%)
- 60+: 53 чата (3.8%)
- 10–17 лет: 25 чатов (1.8%)
Итого: Львиная доля рисковых чатов – у аудитории
25–44 года (две трети всех кейсов).
Вклад каждой возрастной группы в общий объём:
- 25–44 года — 66.3% всех рисковых чатов.
- Старшие (45–59) – 17.4%, молодежь (18–24) – 10.8%.
- Подростки и старшие 60+ – в абсолюте менее 6% всех кейсов.
Топовые темы для каждой возрастной группы:
- 10–17: Content Harmful to Children (32% всех
рисковых чатов подростков) – темы, связанные с вредом детям (bullying,
exploitation и т.д.).
- 18–24: Promotion of Harmful Practices or Dangerous
Activities (34.2%)
- 25–34: Promotion of Harmful Practices or Dangerous
Activities (30.3%)
- 35–44: Hate Speech, Violence & Discrimination
(26%)
- 45–59: Hate Speech, Violence & Discrimination
(24.9%)
- 60+: Promotion of Harmful Practices or Dangerous
Activities (28.3%) - остаётся заметная доля опасных практик, хотя
абсолютных кейсов мало.
Основная нагрузка на модерацию и работу с рисками – у
аудитории 25–44 года. Здесь не только максимальное абсолютное
количество, но и большой разброс по типам рисков.
Для справки - распределение чатов по возрастам
|
…1
|
Возраст
|
Кол-во
|
%
|
Сенсетив
|
% сенс. от чатов
|
% от сенс. чатов
|
Опасные
|
% опас. от чатов
|
% от опас. чатов
|
|
0
|
10-17
|
262
|
1.32
|
43
|
0.22
|
1.63
|
24
|
0.12
|
1.89
|
|
1
|
18-24
|
2587
|
13.02
|
258
|
1.30
|
9.79
|
127
|
0.64
|
10.01
|
|
2
|
25-34
|
6218
|
31.29
|
712
|
3.58
|
27.03
|
357
|
1.80
|
28.13
|
|
3
|
35-44
|
5664
|
28.51
|
833
|
4.19
|
31.62
|
416
|
2.09
|
32.78
|
|
4
|
45-59
|
3068
|
15.44
|
504
|
2.54
|
19.13
|
220
|
1.11
|
17.34
|
|
5
|
60+
|
468
|
2.36
|
91
|
0.46
|
3.45
|
41
|
0.21
|
3.23
|
Гендер
Ключевые выводы:
- Женщины (F): 1112 чатов
(73.9% всего объёма)
- Мужчины (M): 286 чатов (19%)
- Others (небинарные/неуказанные): 106 чатов
(7%)
Где максимальный относительный риск (проценты):
- Others: Promotion of Harmful Practices or Dangerous
Activities – 41.5%
- Мужчины: Promotion of Harmful Practices or
Dangerous Activities – 33.2%
- Женщины: Promotion of Harmful Practices or
Dangerous Activities – 26.6%
Особенности:**
- Женщины создают основную нагрузку на модерацию:
эффект масштаба + большей склонности делиться проблемами в чате.
- Мужчины и группа Others: у них доля
self-harm/dangerous activities в структуре рисковых чатов выше, чем у
женщин.
Семейное положение
Вывод
Делаю финальный развернутый анализ по семейному
положению для рисковых чатов!
- Soulmate: 453 чата
(30.1% всех рисковых чатов)
- Single: 432 чата (28.7%)
- Difficult: 304 чата (20.2%)
- Married: 201 чат (13.4%)
- Не указано: 97 чатов (6.4%)
- Engaged (помолвлены): 17 чатов (1.1%)
Основная масса – Soulmate + Single + Difficult
(почти 80% всех рисковых чатов).
Где максимальный относительный риск (проценты):
- Не указано: Promotion of Harmful Practices or
Dangerous Activities – 42.3%
- Engaged: Hate Speech, Violence & Discrimination
– 41.2%
- Difficult: Promotion of Harmful Practices or
Dangerous Activities – 30.9%
Топовые темы для каждой группы:
Soulmate, Single, Difficult, Не указано:
- Везде лидирует Promotion of Harmful Practices or Dangerous
Activities (self-harm, dangerous advice, угрозы жизни).
Engaged (помолвлены):
- Самая опасная тема – Hate Speech, Violence & Discrimination
(41.2%)
Married (женатые/замужние):
- Самая опасная тема – Hate Speech, Violence & Discrimination
(24.4%)
Ключевые выводы и рекомендации:**
- Наибольший вклад в рисковые чаты дают Soulmate, Single и
Difficult. Вероятно, это более “кризисные” или ищущие отношений
пользователи.
- У тех, кто не указал семейный статус, максимальный
относительный риск: почти половина рисковых чатов – с самыми
тревожными темами.
- Помолвленные чаще всего сталкиваются с темой
насилия и травли.
- Женатые/замужние более “устойчивы” к рискам, но
темы насилия всё равно актуальны.
- Для групп с высоким относительным риском (Не
указано, Engaged, Difficult) стоит делать специальные сценарии поддержки
и быстрое реагирование на опасные паттерны сообщений.
Что делает астролог
Общие паттерны:
- Эмпатия и поддержка: Почти в каждом ответе –
эмоциональное сочувствие, слова поддержки, признание боли и сложности
(“Thank you for opening up”, “I’m truly sorry…”, “That must have been
deeply painful…”).
- Переход к астрологической/таро-интерпретации: После
сочувствия часто сразу идёт “разложу карты”, “посмотрю по звёздам”,
“давай я погадаю на твой вопрос”.
- Безопасных алертов почти нет: Редко встречается
предложение обратиться к профессионалу, нет жёстких “stop” или призывов
к помощи, даже при self-harm/суициде.
- Плавное “уходящее” направление: Часто астролог
предлагает поддержать (“want to talk more?”), но не даёт чёткого совета,
если риск критический.
- Тематические автотексты (иногда шаблонные): Много
универсальных фраз типа “You’re not alone”, “I feel your strength”,
“Would you like a special Tarot for that?”, которые идут и для soft, и
для жёстких тем.
По ключевым темам:
2. Насилие, буллинг, дискриминация:
- Эмоциональное сочувствие (“That sounds truly challenging…”, “I’m
sorry you’re going through this”).
- Иногда уточняющие вопросы про ситуацию, но нет алгоритма
“что делать” при риске физической опасности.
- Предложение сделать расклад на “укрепление отношений”, или
“посмотреть, изменится ли ситуация”.
3. Эксплуатация, криминал, мошенничество:
- Эмпатия, но часто уход от ответственности (“I don’t
have access to process refunds”, “Please contact the support
team…”).
- Иногда вопросы для уточнения (“Have you tried this before?”), но
реальной превенции нет.
- Может быть “терапевтический” тон (“Спасибо, что рассказали…”)ь.
4. Наркомания, алкоголь, вредные привычки:
- Чаще всего “астрологическая интерпретация” – “Положение Венеры
говорит о…”, “Марс в Овне усиливает эмоции…”.
- Может быть совет типа “у вас глубокая интуиция, когда вы нацелен на
перемены”, но нет призыва обратиться за реальной
помощью.
- Вопросы про опыт (“пробовали ли вы раньше?”) – иногда.
Итого:
- Главный плюс: астролог никогда не усугубляет
ситуацию, не подначивает, не игнорирует тревожный запрос.
- Главный минус: нет “алерта” на реальные угрозы
— нет фраз “обратитесь к специалисту”, “позвоните на горячую линию”, “вы
не один, помощь есть”, даже в случаях самоубийства, насилия,
криминала.
- Для soft/чувствительных тем такая стилистика нормальна, но
для реально опасных ситуаций – этого недостаточно
- Часто – уход в “магический”/эзотерический совет:
расклад, гороскоп, “энергии звёзд” – вместо реальной безопасности, но,
наверное, за этим и идут.
Идеи
- Добавить жёсткие “safety notice” и инструкции для опасных
запросов – чётко, не эзотерикой.
- Тренировать шаблоны “SOS” – автоматическая вставка горячих
линий, инфо про помощь (в зависимости от языка/страны).
- Не переходить к магии/астрологии, если есть признаки угрозы
жизни или физической опасности – сначала реагировать как
“человек”, только потом как астролог.
- Регулярный аудит автоответов по критическим
подтемам – проверять на предмет “false empathy”, уходов от прямых
советов и “минимизации” риска.