Примечание:

  • стат-дата: 2025-07-28
  • смотрим чаты с 5+ сбщ юзера - выборка - почти 20К чатов
  • чаты июля

Краткая сводка по сенсетив сообщениям

Всего сообщений: 1193560
Всего чатов: 19870
Всего пользователей: 16458


Сенсетив сообщений: 4962
Чатов с сенсетив сообщениями: 2634
Пользователей с сенсетив сообщениями: 2306


Доля сенсетив сообщений: 0.42%
Доля чатов с сенсетив сообщениями: 13.26%
Доля пользователей с сенсетив сообщениями: 14.01%


Опасных сообщений: 2104
Чатов с опасными сообщениями: 1269
Пользователей с опасными сообщениями: 1137


Доля опасных сообщений: 0.18%
Доля чатов с опасными сообщениями: 6.39%
Доля пользователей с опасными сообщениями: 6.91%


Масштаб явления

  • Сенсетив-темы встречаются примерно в каждом восьмом чате (13%) и у каждого седьмого пользователя (14%) – это не обязательно что-то страшное, просто темы, которые волнуют, где им нужно утешение и поддержка, регулярная особенность пользовательского опыта.

  • большая часть таких сообщений – не какое-то нарушение.

  • Опасные темы – подкатегория сенсетив топиков. Уже явная зона риска: встречаются только в 6% чатов и у 7% пользователей. Это более “тяжёлые” случаи (смерти, криминал, насилие, угрозы детям и пр).

  • По идее такие запросы будет ловить модерация.

  • Таким образом, каждый седьмой пользователь и примерно каждый восьмой чат в этой выборке столкнулся с чувствительными темами.
  • На 1000 сообщений приходится около 2 опасных случаев, а на каждые 100 пользователей – почти 7 столкнулись с тяжелыми темами.

Все чувствительные / сомнительные темы

Распределение категорий сенсетив тем


Чувствительная тема Кол-во сообщений % от всех
Other Unsafe Themes 1140 21.73
Death, Grief, and Loss 1021 19.46
Sexual Content & Inappropriate Interactions 829 15.80
Promotion of Harmful Practices or Dangerous Activities 775 14.77
Hate Speech, Violence & Discrimination 572 10.90
Drug, Alcohol, and Tobacco Content 268 5.11
Financial or Scamming Activities 170 3.24
Threats, Bullying, and Exploitation 163 3.11
Privacy and Confidential Information 116 2.21
False Claims & Deceptive Practices 116 2.21
Content Harmful to Children 51 0.97
Cultural Sensitivity & Disrespect 25 0.48

Первая пятёрка тем (77% всех сенсетив-сообщений):

  • “Other Unsafe Themes” (21.7%) – самая “широкая” категория, сюда попадают всё, что не попало в отдельные детекторы.
  • “Death, Grief, and Loss” (19.5%) – огромная доля, то есть пользователи часто затрагивают личные потери, переживания и вопросы смерти.
  • “Sexual Content & Inappropriate Interactions” (15.8%) – чувствительные, но не всегда опасные, темы.
  • “Promotion of Harmful Practices or Dangerous Activities” (14.8%) – просьбы о совете или обсуждение потенциально опасных действий.
  • “Hate Speech, Violence & Discrimination” (10.9%) – также частая категория, требует внимания и отслеживания паттернов.

Все остальные темы (6/12) занимают менее 5% каждая – значит, они реже встречаются, но могут нести специфический риск.


Подкатегории


1. Какие темы доминируют?

Основной массив чувствительных диалогов – это темы, связанные с жизненными кризисами, утратой, отношениями и потенциально опасным/токсичным поведением.


2. Крупнейшие подтемы внутри этих топ-тем:

  • Inappropriate Relationships (60% внутри “Sexual Content & Inappropriate Interactions”)
  • Self-harm or Suicide (51% внутри “Promotion of Harmful Practices…”)
  • Medical Emergencies & Mental Health Crisis (33% внутри “Other Unsafe Themes”)
  • Harassment and Bullying (65% внутри “Hate Speech, Violence…”)
  • Bereavement Support Requests (35% в “Death, Grief, and Loss”)

Подтемы сконцентрированы на психическом здоровье, токсичных отношениях, травле, саморазрушении, утрате и кризисах. Особенно тревожно: высокий процент “Self-harm or Suicide” и “Medical Emergencies” - в основном используется для поиска поддержки в очень сложных состояниях.


Важно:

  • Психическое здоровье, утрата и травля – ядро сенсетив-трафика.

  • В этих темах большинство сообщений — это не “курьёз”, а тяжелые личные кейсы с реальной потенциальной угрозой.

  • Даже небольшие подтемы требуют внимания, если там процент высок (например, 65% всех обращений по теме – буллинг).

  • Нужно проактивное реагирование, не просто фильтрация.

    • Для подтем “Self-harm or Suicide”, “Medical Emergencies”, “Harassment” – выводить специальный “дисклэймер” и рекомендации по обращению в спец места
    • автоматические алерты при всплытии опасных паттернов текста.
    • доп. анализ реальных сообщений с высокими рисками, чтобы дообучить фильтры (NLP/ML) для более тонкой модерации.


Более опасные

Распределение категорий опасных тем


Опасная тема Кол-во сообщений % от всех
Promotion of Harmful Practices or Dangerous Activities 663 29.36
Hate Speech, Violence & Discrimination 536 23.74
Other Unsafe Themes 271 12.00
Drug, Alcohol, and Tobacco Content 268 11.87
Financial or Scamming Activities 170 7.53
Threats, Bullying, and Exploitation 163 7.22
Sexual Content & Inappropriate Interactions 132 5.85
Content Harmful to Children 51 2.26
Privacy and Confidential Information 4 0.18

Две ведущие категории (53% опасных сообщений):

  • “Promotion of Harmful Practices or Dangerous Acts” (29.4%)
  • “Hate Speech, Violence & Discrimination” (23.7%)
  • “Drug, Alcohol, and Tobacco Content” и “Financial or Scamming Activities” – каждый почти по 12%/8%.
  • Темы “Sexual Content & Inappropriate Interactions” и “Content Harmful to Children” – менее частые, но требуют отдельного внимания.
  • “Other Unsafe Themes” – снова “сборная” категория, но уже не первая по количеству.

Подкатегории


1. Какие темы доминируют?

Здесь есть реально опасные риски: самоповреждение, насилие, мошенничество, незаконные вещества и т.д.


2. Крупнейшие подтемы (по количеству сообщений в подтеме):

  • Самоповреждение и самоубийства — самый крупный и тревожный кластер опасных запросов.
  • Травля, буллинг, физическое насилие – всегда попадают в топ.
  • Очень много опасных кейсов связано с незаконной деятельностью (юридические советы, наркотики, мошенничество).
  • “Взрослый” контент также занимает заметную долю, причём не только сексуальные темы, есть и эксплуатация.

3. Примеры сообщений из самой опасной темы (“Promotion of Harmful Practices or Dangerous Activities – Self-harm or Suicide”):

  • Встречаются сообщения о реальных суицидах, угрозах жизни, тяжелых семейных ситуациях.
  • Есть обращения не только за поддержкой, но и с “юридическим” подтекстом – пользователи хотят советов, как поступить в опасных и кризисных ситуациях.
  • Часто заходит речь о зависимости, “сломанных” отношениях и острых психических проблемах.

Риски:

  • В этой выборке концентрация “жёстких” рисков выше.
  • Пользователи не просто “делятся болью”, но иногда ищут одобрение, способ или “разрешение” на опасные действия.
  • Много обращений по “юридическим” вопросам — и это, возможно, для нас ред флаг, астролог не должен брать на себя такую функцию.
  • Есть скрытые кейсы эксплуатации и буллинга в отношении детей.

Важно:

  • помечать такие чаты модератором.
  • включать “safety notice” — вы не даёте юридических, медицинских и психиатрических консультаций.
  • в расширении для “Self-harm”, “Bullying”, “Violence” показывать реальные “горячие линии”, SOS-ссылки, инфо по странам.
  • мониторинг на повторные обращения — если один и тот же юзер регулярно попадает в такие темы.

Распределения опасных категорий по признакам

Локаль



Объём опасных чатов (топ-5):

  • Английский (en)1143 чата (81.6% всех опасных чатов, подавляющее большинство!)
  • Немецкий (de) – 76 чатов (5.4%)
  • Испанский (es) – 47 чатов (3.4%)
  • Французский (fr) – 46 чатов (3.3%)
  • Корейский (ko) – 39 чатов (2.8%)

Все остальные языки (ja – японский, ar – арабский, pt – португальский) дают по 1–1.5% каждый. * Топ-4 языка (en, de, es, fr) вместе дают более 93% всех опасных чатов. * Все “малые” языки дают менее 10% вместе взятые.

Хотя в этих локалях мало чатов по абсолюту, рискованные темы имеют высокую долю.


Какие темы доминируют в каждой локали?

  • Английский (en):

    • Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (318 чатов, 27.8% среди всех рисковых английских чатов)
  • Немецкий (de):

    • Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (27 чатов, 35.5%)
  • Испанский (es):

    • Топ-тема: “Hate Speech, Violence & Discrimination” (11 чатов, 23.4%)
  • Французский (fr):

    • Топ-тема: “Hate Speech, Violence & Discrimination” (14 чатов, 30.4%)
  • Корейский (ko):

    • Топ-тема: “Financial or Scamming Activities” (8 чатов, 20.5%)
  • Португальский (pt):

    • Топ-тема: “Hate Speech, Violence & Discrimination” (4 чата, 36.4%)
  • Японский (ja):

    • Топ-тема: “Hate Speech, Violence & Discrimination” (6 чатов, 30.0%)
  • Арабский (ar):

    • Топ-тема: “Promotion of Harmful Practices or Dangerous Activities” (6 чатов, 31.6%)

Возраст



  • 35–44 года: 496 чатов (35.3% от общего числа)
  • 25–34 года: 436 чатов (31.0%)
  • 45–59 лет: 245 чатов (17.4%)
  • 18–24 года: 152 чата (10.8%)
  • 60+: 53 чата (3.8%)
  • 10–17 лет: 25 чатов (1.8%)

Итого: Львиная доля рисковых чатов – у аудитории 25–44 года (две трети всех кейсов).


Вклад каждой возрастной группы в общий объём:

  • 25–44 года — 66.3% всех рисковых чатов.
  • Старшие (45–59) – 17.4%, молодежь (18–24) – 10.8%.
  • Подростки и старшие 60+ – в абсолюте менее 6% всех кейсов.

Топовые темы для каждой возрастной группы:

  • 10–17: Content Harmful to Children (32% всех рисковых чатов подростков) – темы, связанные с вредом детям (bullying, exploitation и т.д.).
  • 18–24: Promotion of Harmful Practices or Dangerous Activities (34.2%)
  • 25–34: Promotion of Harmful Practices or Dangerous Activities (30.3%)
  • 35–44: Hate Speech, Violence & Discrimination (26%)
  • 45–59: Hate Speech, Violence & Discrimination (24.9%)
  • 60+: Promotion of Harmful Practices or Dangerous Activities (28.3%) - остаётся заметная доля опасных практик, хотя абсолютных кейсов мало.

Основная нагрузка на модерацию и работу с рисками – у аудитории 25–44 года. Здесь не только максимальное абсолютное количество, но и большой разброс по типам рисков.


Для справки - распределение чатов по возрастам

…1 Возраст Кол-во % Сенсетив % сенс. от чатов % от сенс. чатов Опасные % опас. от чатов % от опас. чатов
0 10-17 262 1.32 43 0.22 1.63 24 0.12 1.89
1 18-24 2587 13.02 258 1.30 9.79 127 0.64 10.01
2 25-34 6218 31.29 712 3.58 27.03 357 1.80 28.13
3 35-44 5664 28.51 833 4.19 31.62 416 2.09 32.78
4 45-59 3068 15.44 504 2.54 19.13 220 1.11 17.34
5 60+ 468 2.36 91 0.46 3.45 41 0.21 3.23

Гендер



Ключевые выводы:

  • Женщины (F): 1112 чатов (73.9% всего объёма)
  • Мужчины (M): 286 чатов (19%)
  • Others (небинарные/неуказанные): 106 чатов (7%)

Где максимальный относительный риск (проценты):

  • Others: Promotion of Harmful Practices or Dangerous Activities – 41.5%
  • Мужчины: Promotion of Harmful Practices or Dangerous Activities – 33.2%
  • Женщины: Promotion of Harmful Practices or Dangerous Activities – 26.6%

Особенности:**

  • Женщины создают основную нагрузку на модерацию: эффект масштаба + большей склонности делиться проблемами в чате.
  • Мужчины и группа Others: у них доля self-harm/dangerous activities в структуре рисковых чатов выше, чем у женщин.

Семейное положение



Вывод

Делаю финальный развернутый анализ по семейному положению для рисковых чатов!

  • Soulmate: 453 чата (30.1% всех рисковых чатов)
  • Single: 432 чата (28.7%)
  • Difficult: 304 чата (20.2%)
  • Married: 201 чат (13.4%)
  • Не указано: 97 чатов (6.4%)
  • Engaged (помолвлены): 17 чатов (1.1%)

Основная масса – Soulmate + Single + Difficult (почти 80% всех рисковых чатов).


Где максимальный относительный риск (проценты):

  • Не указано: Promotion of Harmful Practices or Dangerous Activities – 42.3%
  • Engaged: Hate Speech, Violence & Discrimination – 41.2%
  • Difficult: Promotion of Harmful Practices or Dangerous Activities – 30.9%

Топовые темы для каждой группы:

  • Soulmate, Single, Difficult, Не указано:

    • Везде лидирует Promotion of Harmful Practices or Dangerous Activities (self-harm, dangerous advice, угрозы жизни).
  • Engaged (помолвлены):

    • Самая опасная тема – Hate Speech, Violence & Discrimination (41.2%)
  • Married (женатые/замужние):

    • Самая опасная тема – Hate Speech, Violence & Discrimination (24.4%)

Ключевые выводы и рекомендации:**

  • Наибольший вклад в рисковые чаты дают Soulmate, Single и Difficult. Вероятно, это более “кризисные” или ищущие отношений пользователи.
  • У тех, кто не указал семейный статус, максимальный относительный риск: почти половина рисковых чатов – с самыми тревожными темами.
  • Помолвленные чаще всего сталкиваются с темой насилия и травли.
  • Женатые/замужние более “устойчивы” к рискам, но темы насилия всё равно актуальны.
  • Для групп с высоким относительным риском (Не указано, Engaged, Difficult) стоит делать специальные сценарии поддержки и быстрое реагирование на опасные паттерны сообщений.

Что делает астролог

Общие паттерны:

  • Эмпатия и поддержка: Почти в каждом ответе – эмоциональное сочувствие, слова поддержки, признание боли и сложности (“Thank you for opening up”, “I’m truly sorry…”, “That must have been deeply painful…”).
  • Переход к астрологической/таро-интерпретации: После сочувствия часто сразу идёт “разложу карты”, “посмотрю по звёздам”, “давай я погадаю на твой вопрос”.
  • Безопасных алертов почти нет: Редко встречается предложение обратиться к профессионалу, нет жёстких “stop” или призывов к помощи, даже при self-harm/суициде.
  • Плавное “уходящее” направление: Часто астролог предлагает поддержать (“want to talk more?”), но не даёт чёткого совета, если риск критический.
  • Тематические автотексты (иногда шаблонные): Много универсальных фраз типа “You’re not alone”, “I feel your strength”, “Would you like a special Tarot for that?”, которые идут и для soft, и для жёстких тем.

По ключевым темам:

1. Self-harm, опасные практики (“Promotion of Harmful Practices or Dangerous Activities”):

  • В ответах эмпатия и вопросы про чувства, иногда – лёгкое ободрение (“Thank you for opening up”, “It’s natural to worry…”).
  • Может переходить к таро (“разложить на будущее”), но прямого указания обратиться к специалисту нет.
  • Иногда совет “больше заботиться о себе”, но часто выглядит “мягко”.

2. Насилие, буллинг, дискриминация:

  • Эмоциональное сочувствие (“That sounds truly challenging…”, “I’m sorry you’re going through this”).
  • Иногда уточняющие вопросы про ситуацию, но нет алгоритма “что делать” при риске физической опасности.
  • Предложение сделать расклад на “укрепление отношений”, или “посмотреть, изменится ли ситуация”.

3. Эксплуатация, криминал, мошенничество:

  • Эмпатия, но часто уход от ответственности (“I don’t have access to process refunds”, “Please contact the support team…”).
  • Иногда вопросы для уточнения (“Have you tried this before?”), но реальной превенции нет.
  • Может быть “терапевтический” тон (“Спасибо, что рассказали…”)ь.

4. Наркомания, алкоголь, вредные привычки:

  • Чаще всего “астрологическая интерпретация” – “Положение Венеры говорит о…”, “Марс в Овне усиливает эмоции…”.
  • Может быть совет типа “у вас глубокая интуиция, когда вы нацелен на перемены”, но нет призыва обратиться за реальной помощью.
  • Вопросы про опыт (“пробовали ли вы раньше?”) – иногда.

Итого:

  • Главный плюс: астролог никогда не усугубляет ситуацию, не подначивает, не игнорирует тревожный запрос.
  • Главный минус: нет “алерта” на реальные угрозы — нет фраз “обратитесь к специалисту”, “позвоните на горячую линию”, “вы не один, помощь есть”, даже в случаях самоубийства, насилия, криминала.
  • Для soft/чувствительных тем такая стилистика нормальна, но для реально опасных ситуаций – этого недостаточно
  • Часто – уход в “магический”/эзотерический совет: расклад, гороскоп, “энергии звёзд” – вместо реальной безопасности, но, наверное, за этим и идут.

Идеи

  1. Добавить жёсткие “safety notice” и инструкции для опасных запросов – чётко, не эзотерикой.
  2. Тренировать шаблоны “SOS” – автоматическая вставка горячих линий, инфо про помощь (в зависимости от языка/страны).
  3. Не переходить к магии/астрологии, если есть признаки угрозы жизни или физической опасности – сначала реагировать как “человек”, только потом как астролог.
  4. Регулярный аудит автоответов по критическим подтемам – проверять на предмет “false empathy”, уходов от прямых советов и “минимизации” риска.