Каждый день информации о психическом здоровье (10 октября) наблюдается пик поискового интереса по запросу «психическое здоровье» в Google Trends. Однако в октябре прошлого года наблюдался самый высокий поисковый интерес за всю историю. Психическое здоровье в Соединенных Штатах растет как часть глобального разговора - частично из-за его дестигматизации, но в основном из-за его значимости для технологий (в первую очередь социальных сетей), внутреннего терроризма и наркомании.

Несмотря на то, что на эту тему было проведено множество ранее существовавших анализов, проведенных как кагглерами, так и некоммерческими организациями, я надеюсь использовать методы обнаружения аномалий временных рядов для другой точки зрения на наборы данных статистики самоубийств.

Данные ВОЗ по статистике самоубийств

Всемирная организация здравоохранения собирает данные о самоубийствах по странам и предоставляет разбивку по возрасту, году, стране, поколению и полу. Число самоубийств часто занижается, и даже в этом случае это лишь очень небольшой процент попыток самоубийств. Тем не менее впечатляет, что ВОЗ может собирать информацию по более чем 100 странам с одинаковой степенью детализации.

Их набор данных форматируется по строкам по странам, годам, полу и возрасту. Когда мы сводим таблицу для агрегирования по странам и годам, мы обнаруживаем некоторые пробелы в отчетности каждой страны. Используя библиотеку missingno, мы можем легко визуализировать недействительность любого набора данных. На изображении ниже каждый столбец представляет собой страну, а белые квадраты обозначают нулевое значение для этого года.

Мы удалили из нашего анализа страны, в которых высока нулевая ставка (отсутствует более 50% лет): сюда входят Босния и Герцеговина, Кипр, Доминика, Фиджи, Кирибати, Макао, Мальдивы, Монголия и многие другие. В остальном мы просто заполним недостающие данные, используя среднее вменение (заменим нули на средний уровень самоубийств для этой страны с 1985 по 2016 год).

IMHE, Набор данных о глобальном бремени болезней

Институт показателей и оценки здоровья (IMHE) также выпустил еще один набор данных о самоубийствах, который использовался в отчете Наш мир в данных: самоубийства. Он предоставляет показатели самоубийств за определенный период времени (с 1990 по 2017 год) без пропущенных записей по каждой из опрошенных стран. Имея эти полные данные, они смогли создать визуализацию карты с течением времени:

Обнаружение аномалий

Теперь, когда мы просмотрели данные, мы воспользуемся алгоритмом кластеризации, чтобы определить уровень самоубийств в какой стране с 1985 по 2016 год является отклонением от всех остальных. Для этого мы превращаем каждый временной ряд (1 точка данных на каждый год - 32 на страну) в вектор длиной 32 для каждой страны. Оттуда мы можем использовать метод кластеризации на основе плотности (DBSCAN) для выявления аномальных временных рядов.

И, запустив ту же кластеризацию для набора данных IMHE, мы получаем аналогичные результаты. Гренландия объединена с Королевством Дания в наборе данных ВОЗ, поэтому она отображается только в наборе данных IMHE как отдельная страна.

Выбросы, которые мы определили с помощью DBSCAN, по-видимому, подпадают под две тенденции:

№1: Страны с высоким уровнем самоубийств, которые улучшаются.

Гренландия известна самым высоким в мире уровнем самоубийств, особенно среди коренного населения. В 2016 году NPR даже записало эпизод подкаста, чтобы глубже понять этот феномен и поговорить с исследователями. Хотя существует множество факторов, многие исследовательские статьи связывают это явление с столкновением между инуитской и датской культурой. Совсем недавно в статье Гардиан кризис психического здоровья увязывается с изменением климата и его влиянием на их образ жизни. Снижение количества самоубийств, показанное в данных, может указывать на то, что вмешательство правительства работает, хотя это противоречит этой статье из WikiTribune (основанной на беседах с Тиной Эвальдсен).

Высокий уровень самоубийств в Восточной Европе (Россия, Литва и т. д.) был вызван главным образом распадом Советского Союза, который начался во второй половине 1980-х годов. Фактически, почти 800 000 россиян покончили жизнь самоубийством с момента распада СССР. Этот период был отмечен экономическим кризисом и национальными волнениями. К счастью, с улучшением экономики Восточной Европы повысился и уровень самоубийств.

№2. Резкое увеличение количества самоубийств в последнее время.

Суринам + Гайана - граничащие с Южной Америкой страны, в которых проживает большое количество хиндустани (восточно-индийских). В Гайане индуисты составляют 40% населения, но в период с 2010 по 2013 год на их долю приходилось 80% самоубийств. Ключевые факторы могут включать стигматизацию психических заболеваний в индийской культуре, нелеченные травмы или посттравматическое стрессовое расстройство. В сельских общинах люди могут быть изолированы и самостоятельно справляться с проблемами психического здоровья. Сегодня усилия направлены на то, чтобы нарушить молчание о психическом здоровье и домашнем насилии.

В Южной Корее самоубийства занимают 4-е место среди причин смерти . Сначала я предположил, что самоубийства будут распространены среди молодежи, но данные показали, что на самом деле они в основном затрагивают пожилое население.

Согласно W ikipedia, это население склонно к самоубийству, поскольку половина пожилых людей в стране живет за чертой бедности.

В сочетании с плохо финансируемой сетью социальной защиты пожилых людей это может привести к тому, что они убьют себя, чтобы не стать финансовым бременем для своих семей, поскольку старая социальная структура, когда дети заботились о своих родителях, в значительной степени исчезла в 21 веке. .