Примечание:

стат-дата: 2025-07-28
смотрим чаты с 5+ сбщ юзера - выборка - почти 20К чатов
чаты июля

Краткая сводка по сенсетив сообщениям

Всего сообщений: 1193560
Всего чатов: 19870
Всего пользователей: 16458

Сенсетив сообщений: 4962
Чатов с сенсетив сообщениями: 2634
Пользователей с сенсетив сообщениями: 2306

Доля сенсетив сообщений: 0.42%
Доля чатов с сенсетив сообщениями: 13.26%
Доля пользователей с сенсетив сообщениями: 14.01%

Опасных сообщений: 2104
Чатов с опасными сообщениями: 1269
Пользователей с опасными сообщениями: 1137

Доля опасных сообщений: 0.18%
Доля чатов с опасными сообщениями: 6.39%
Доля пользователей с опасными сообщениями: 6.91%

Масштаб явления

Сенсетив-темы встречаются примерно в каждом восьмом чате (13%) и у каждого седьмого пользователя (14%) – это не обязательно что-то страшное, просто темы, которые волнуют, где им нужно утешение и поддержка, регулярная особенность пользовательского опыта.
большая часть таких сообщений – не какое-то нарушение.
Опасные темы – подкатегория сенсетив топиков. Уже явная зона риска: встречаются только в 6% чатов и у 7% пользователей. Это более “тяжёлые” случаи (смерти, криминал, насилие, угрозы детям и пр).
По идее такие запросы будет ловить модерация.

Таким образом, каждый седьмой пользователь и примерно каждый восьмой чат в этой выборке столкнулся с чувствительными темами.

На 1000 сообщений приходится около 2 опасных случаев, а на каждые 100 пользователей – почти 7 столкнулись с тяжелыми темами.

Все чувствительные / сомнительные темы

Распределение категорий сенсетив тем

Чувствительная тема	Кол-во сообщений	% от всех
Other Unsafe Themes	1140	21.73
Death, Grief, and Loss	1021	19.46
Sexual Content & Inappropriate Interactions	829	15.80
Promotion of Harmful Practices or Dangerous Activities	775	14.77
Hate Speech, Violence & Discrimination	572	10.90
Drug, Alcohol, and Tobacco Content	268	5.11
Financial or Scamming Activities	170	3.24
Threats, Bullying, and Exploitation	163	3.11
Privacy and Confidential Information	116	2.21
False Claims & Deceptive Practices	116	2.21
Content Harmful to Children	51	0.97
Cultural Sensitivity & Disrespect	25	0.48

Первая пятёрка тем (77% всех сенсетив-сообщений):

“Other Unsafe Themes” (21.7%) – самая “широкая” категория, сюда попадают всё, что не попало в отдельные детекторы.
“Death, Grief, and Loss” (19.5%) – огромная доля, то есть пользователи часто затрагивают личные потери, переживания и вопросы смерти.
“Sexual Content & Inappropriate Interactions” (15.8%) – чувствительные, но не всегда опасные, темы.
“Promotion of Harmful Practices or Dangerous Activities” (14.8%) – просьбы о совете или обсуждение потенциально опасных действий.
“Hate Speech, Violence & Discrimination” (10.9%) – также частая категория, требует внимания и отслеживания паттернов.

Все остальные темы (6/12) занимают менее 5% каждая – значит, они реже встречаются, но могут нести специфический риск.

Подкатегории

1. Какие темы доминируют?

Основной массив чувствительных диалогов – это темы, связанные с жизненными кризисами, утратой, отношениями и потенциально опасным/токсичным поведением.

2. Крупнейшие подтемы внутри этих топ-тем:

Inappropriate Relationships (60% внутри “Sexual Content & Inappropriate Interactions”)
Self-harm or Suicide (51% внутри “Promotion of Harmful Practices…”)
Medical Emergencies & Mental Health Crisis (33% внутри “Other Unsafe Themes”)
Harassment and Bullying (65% внутри “Hate Speech, Violence…”)
Bereavement Support Requests (35% в “Death, Grief, and Loss”)

Подтемы сконцентрированы на психическом здоровье, токсичных отношениях, травле, саморазрушении, утрате и кризисах. Особенно тревожно: высокий процент “Self-harm or Suicide” и “Medical Emergencies” - в основном используется для поиска поддержки в очень сложных состояниях.

Важно:

Психическое здоровье, утрата и травля – ядро сенсетив-трафика.
В этих темах большинство сообщений — это не “курьёз”, а тяжелые личные кейсы с реальной потенциальной угрозой.
Даже небольшие подтемы требуют внимания, если там процент высок (например, 65% всех обращений по теме – буллинг).
Нужно проактивное реагирование, не просто фильтрация.
- Для подтем “Self-harm or Suicide”, “Medical Emergencies”, “Harassment” – выводить специальный “дисклэймер” и рекомендации по обращению в спец места
- автоматические алерты при всплытии опасных паттернов текста.
- доп. анализ реальных сообщений с высокими рисками, чтобы дообучить фильтры (NLP/ML) для более тонкой модерации.

Более опасные

Распределение категорий опасных тем

Опасная тема	Кол-во сообщений	% от всех
Promotion of Harmful Practices or Dangerous Activities	663	29.36
Hate Speech, Violence & Discrimination	536	23.74
Other Unsafe Themes	271	12.00
Drug, Alcohol, and Tobacco Content	268	11.87
Financial or Scamming Activities	170	7.53
Threats, Bullying, and Exploitation	163	7.22
Sexual Content & Inappropriate Interactions	132	5.85
Content Harmful to Children	51	2.26
Privacy and Confidential Information	4	0.18

Две ведущие категории (53% опасных сообщений):

“Promotion of Harmful Practices or Dangerous Acts” (29.4%)
“Hate Speech, Violence & Discrimination” (23.7%)
“Drug, Alcohol, and Tobacco Content” и “Financial or Scamming Activities” – каждый почти по 12%/8%.
Темы “Sexual Content & Inappropriate Interactions” и “Content Harmful to Children” – менее частые, но требуют отдельного внимания.
“Other Unsafe Themes” – снова “сборная” категория, но уже не первая по количеству.

Подкатегории

1. Какие темы доминируют?

Здесь есть реально опасные риски: самоповреждение, насилие, мошенничество, незаконные вещества и т.д.

2. Крупнейшие подтемы (по количеству сообщений в подтеме):

Самоповреждение и самоубийства — самый крупный и тревожный кластер опасных запросов.
Травля, буллинг, физическое насилие – всегда попадают в топ.
Очень много опасных кейсов связано с незаконной деятельностью (юридические советы, наркотики, мошенничество).
“Взрослый” контент также занимает заметную долю, причём не только сексуальные темы, есть и эксплуатация.

3. Примеры сообщений из самой опасной темы (“Promotion of Harmful Practices or Dangerous Activities – Self-harm or Suicide”):

Встречаются сообщения о реальных суицидах, угрозах жизни, тяжелых семейных ситуациях.
Есть обращения не только за поддержкой, но и с “юридическим” подтекстом – пользователи хотят советов, как поступить в опасных и кризисных ситуациях.
Часто заходит речь о зависимости, “сломанных” отношениях и острых психических проблемах.

Риски:

В этой выборке концентрация “жёстких” рисков выше.
Пользователи не просто “делятся болью”, но иногда ищут одобрение, способ или “разрешение” на опасные действия.
Много обращений по “юридическим” вопросам — и это, возможно, для нас ред флаг, астролог не должен брать на себя такую функцию.
Есть скрытые кейсы эксплуатации и буллинга в отношении детей.

Важно:

помечать такие чаты модератором.
включать “safety notice” — вы не даёте юридических, медицинских и психиатрических консультаций.
в расширении для “Self-harm”, “Bullying”, “Violence” показывать реальные “горячие линии”, SOS-ссылки, инфо по странам.
мониторинг на повторные обращения — если один и тот же юзер регулярно попадает в такие темы.

Распределения опасных категорий по признакам

Локаль

Объём опасных чатов (топ-5):

Английский (en) – 1143 чата (81.6% всех опасных чатов, подавляющее большинство!)
Немецкий (de) – 76 чатов (5.4%)
Испанский (es) – 47 чатов (3.4%)
Французский (fr) – 46 чатов (3.3%)
Корейский (ko) – 39 чатов (2.8%)

Все остальные языки (ja – японский, ar – арабский, pt – португальский) дают по 1–1.5% каждый. * Топ-4 языка (en, de, es, fr) вместе дают более 93% всех опасных чатов. * Все “малые” языки дают менее 10% вместе взятые.

Хотя в этих локалях мало чатов по абсолюту, рискованные темы имеют высокую долю.

Какие темы доминируют в каждой локали?

Английский (en):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (318 чатов, 27.8% среди всех рисковых английских чатов)
Немецкий (de):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (27 чатов, 35.5%)
Испанский (es):
- Топ-тема: “Hate Speech, Violence & Discrimination” (11 чатов, 23.4%)
Французский (fr):
- Топ-тема: “Hate Speech, Violence & Discrimination” (14 чатов, 30.4%)
Корейский (ko):
- Топ-тема: “Financial or Scamming Activities” (8 чатов, 20.5%)
Португальский (pt):
- Топ-тема: “Hate Speech, Violence & Discrimination” (4 чата, 36.4%)
Японский (ja):
- Топ-тема: “Hate Speech, Violence & Discrimination” (6 чатов, 30.0%)
Арабский (ar):
- Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (6 чатов, 31.6%)

Возраст

35–44 года: 496 чатов (35.3% от общего числа)
25–34 года: 436 чатов (31.0%)
45–59 лет: 245 чатов (17.4%)
18–24 года: 152 чата (10.8%)
60+: 53 чата (3.8%)
10–17 лет: 25 чатов (1.8%)

Итого: Львиная доля рисковых чатов – у аудитории 25–44 года (две трети всех кейсов).

Вклад каждой возрастной группы в общий объём:

25–44 года — 66.3% всех рисковых чатов.
Старшие (45–59) – 17.4%, молодежь (18–24) – 10.8%.
Подростки и старшие 60+ – в абсолюте менее 6% всех кейсов.

Топовые темы для каждой возрастной группы:

10–17: Content Harmful to Children (32% всех рисковых чатов подростков) – темы, связанные с вредом детям (bullying, exploitation и т.д.).
18–24: Promotion of Harmful Practices or Dangerous Activities (34.2%)
25–34: Promotion of Harmful Practices or Dangerous Activities (30.3%)
35–44: Hate Speech, Violence & Discrimination (26%)
45–59: Hate Speech, Violence & Discrimination (24.9%)
60+: Promotion of Harmful Practices or Dangerous Activities (28.3%) - остаётся заметная доля опасных практик, хотя абсолютных кейсов мало.

Основная нагрузка на модерацию и работу с рисками – у аудитории 25–44 года. Здесь не только максимальное абсолютное количество, но и большой разброс по типам рисков.

Для справки - распределение чатов по возрастам

…1	Возраст	Кол-во	%	Сенсетив	% сенс. от чатов	% от сенс. чатов	Опасные	% опас. от чатов	% от опас. чатов
0	10-17	262	1.32	43	0.22	1.63	24	0.12	1.89
1	18-24	2587	13.02	258	1.30	9.79	127	0.64	10.01
2	25-34	6218	31.29	712	3.58	27.03	357	1.80	28.13
3	35-44	5664	28.51	833	4.19	31.62	416	2.09	32.78
4	45-59	3068	15.44	504	2.54	19.13	220	1.11	17.34
5	60+	468	2.36	91	0.46	3.45	41	0.21	3.23

Гендер

Ключевые выводы:

Женщины (F): 1112 чатов (73.9% всего объёма)
Мужчины (M): 286 чатов (19%)
Others (небинарные/неуказанные): 106 чатов (7%)

Где максимальный относительный риск (проценты):

Others: Promotion of Harmful Practices or Dangerous Activities – 41.5%
Мужчины: Promotion of Harmful Practices or Dangerous Activities – 33.2%
Женщины: Promotion of Harmful Practices or Dangerous Activities – 26.6%

Особенности:**

Женщины создают основную нагрузку на модерацию: эффект масштаба + большей склонности делиться проблемами в чате.
Мужчины и группа Others: у них доля self-harm/dangerous activities в структуре рисковых чатов выше, чем у женщин.

Семейное положение

Вывод

Делаю финальный развернутый анализ по семейному положению для рисковых чатов!

Soulmate: 453 чата (30.1% всех рисковых чатов)
Single: 432 чата (28.7%)
Difficult: 304 чата (20.2%)
Married: 201 чат (13.4%)
Не указано: 97 чатов (6.4%)
Engaged (помолвлены): 17 чатов (1.1%)

Основная масса – Soulmate + Single + Difficult (почти 80% всех рисковых чатов).

Где максимальный относительный риск (проценты):

Не указано: Promotion of Harmful Practices or Dangerous Activities – 42.3%
Engaged: Hate Speech, Violence & Discrimination – 41.2%
Difficult: Promotion of Harmful Practices or Dangerous Activities – 30.9%

Топовые темы для каждой группы:

Soulmate, Single, Difficult, Не указано:
- Везде лидирует Promotion of Harmful Practices or Dangerous Activities (self-harm, dangerous advice, угрозы жизни).
Engaged (помолвлены):
- Самая опасная тема – Hate Speech, Violence & Discrimination (41.2%)
Married (женатые/замужние):
- Самая опасная тема – Hate Speech, Violence & Discrimination (24.4%)

Ключевые выводы и рекомендации:**

Наибольший вклад в рисковые чаты дают Soulmate, Single и Difficult. Вероятно, это более “кризисные” или ищущие отношений пользователи.
У тех, кто не указал семейный статус, максимальный относительный риск: почти половина рисковых чатов – с самыми тревожными темами.
Помолвленные чаще всего сталкиваются с темой насилия и травли.
Женатые/замужние более “устойчивы” к рискам, но темы насилия всё равно актуальны.
Для групп с высоким относительным риском (Не указано, Engaged, Difficult) стоит делать специальные сценарии поддержки и быстрое реагирование на опасные паттерны сообщений.

Что делает астролог

Общие паттерны:

Эмпатия и поддержка: Почти в каждом ответе – эмоциональное сочувствие, слова поддержки, признание боли и сложности (“Thank you for opening up”, “I’m truly sorry…”, “That must have been deeply painful…”).
Переход к астрологической/таро-интерпретации: После сочувствия часто сразу идёт “разложу карты”, “посмотрю по звёздам”, “давай я погадаю на твой вопрос”.
Безопасных алертов почти нет: Редко встречается предложение обратиться к профессионалу, нет жёстких “stop” или призывов к помощи, даже при self-harm/суициде.
Плавное “уходящее” направление: Часто астролог предлагает поддержать (“want to talk more?”), но не даёт чёткого совета, если риск критический.
Тематические автотексты (иногда шаблонные): Много универсальных фраз типа “You’re not alone”, “I feel your strength”, “Would you like a special Tarot for that?”, которые идут и для soft, и для жёстких тем.

По ключевым темам:

1. Self-harm, опасные практики (“Promotion of Harmful Practices or Dangerous Activities”):

В ответах эмпатия и вопросы про чувства, иногда – лёгкое ободрение (“Thank you for opening up”, “It’s natural to worry…”).
Может переходить к таро (“разложить на будущее”), но прямого указания обратиться к специалисту нет.
Иногда совет “больше заботиться о себе”, но часто выглядит “мягко”.

2. Насилие, буллинг, дискриминация:

Эмоциональное сочувствие (“That sounds truly challenging…”, “I’m sorry you’re going through this”).
Иногда уточняющие вопросы про ситуацию, но нет алгоритма “что делать” при риске физической опасности.
Предложение сделать расклад на “укрепление отношений”, или “посмотреть, изменится ли ситуация”.

3. Эксплуатация, криминал, мошенничество:

Эмпатия, но часто уход от ответственности (“I don’t have access to process refunds”, “Please contact the support team…”).
Иногда вопросы для уточнения (“Have you tried this before?”), но реальной превенции нет.
Может быть “терапевтический” тон (“Спасибо, что рассказали…”)ь.

4. Наркомания, алкоголь, вредные привычки:

Чаще всего “астрологическая интерпретация” – “Положение Венеры говорит о…”, “Марс в Овне усиливает эмоции…”.
Может быть совет типа “у вас глубокая интуиция, когда вы нацелен на перемены”, но нет призыва обратиться за реальной помощью.
Вопросы про опыт (“пробовали ли вы раньше?”) – иногда.

Итого:

Главный плюс: астролог никогда не усугубляет ситуацию, не подначивает, не игнорирует тревожный запрос.
Главный минус: нет “алерта” на реальные угрозы — нет фраз “обратитесь к специалисту”, “позвоните на горячую линию”, “вы не один, помощь есть”, даже в случаях самоубийства, насилия, криминала.
Для soft/чувствительных тем такая стилистика нормальна, но для реально опасных ситуаций – этого недостаточно
Часто – уход в “магический”/эзотерический совет: расклад, гороскоп, “энергии звёзд” – вместо реальной безопасности, но, наверное, за этим и идут.

Идеи

Добавить жёсткие “safety notice” и инструкции для опасных запросов – чётко, не эзотерикой.
Тренировать шаблоны “SOS” – автоматическая вставка горячих линий, инфо про помощь (в зависимости от языка/страны).
Не переходить к магии/астрологии, если есть признаки угрозы жизни или физической опасности – сначала реагировать как “человек”, только потом как астролог.
Регулярный аудит автоответов по критическим подтемам – проверять на предмет “false empathy”, уходов от прямых советов и “минимизации” риска.

Стата по чувствительным темам в чатах

2025-07-28

Примечание:

Краткая сводка по сенсетив сообщениям

Масштаб явления

Все чувствительные / сомнительные темы

Распределение категорий сенсетив тем

Первая пятёрка тем (77% всех сенсетив-сообщений):

Подкатегории

1. Какие темы доминируют?

2. Крупнейшие подтемы внутри этих топ-тем:

Важно:

Более опасные

Распределение категорий опасных тем

Две ведущие категории (53% опасных сообщений):

Подкатегории

1. Какие темы доминируют?

2. Крупнейшие подтемы (по количеству сообщений в подтеме):

3. Примеры сообщений из самой опасной темы (“Promotion of Harmful Practices or Dangerous Activities – Self-harm or Suicide”):

Риски:

Важно:

Распределения опасных категорий по признакам

Локаль

Объём опасных чатов (топ-5):

Какие темы доминируют в каждой локали?

Возраст

Вклад каждой возрастной группы в общий объём:

Топовые темы для каждой возрастной группы:

Для справки - распределение чатов по возрастам

Гендер

Ключевые выводы:

Где максимальный относительный риск (проценты):

Особенности:**

Семейное положение

Вывод

Где максимальный относительный риск (проценты):

Топовые темы для каждой группы:

Ключевые выводы и рекомендации:**

Что делает астролог

Общие паттерны:

По ключевым темам:

1. Self-harm, опасные практики (“Promotion of Harmful Practices or Dangerous Activities”):

2. Насилие, буллинг, дискриминация:

3. Эксплуатация, криминал, мошенничество:

4. Наркомания, алкоголь, вредные привычки:

Итого:

Идеи