Разве не было бы более поэтичным иметь возможность выбрать следующую покупку ETF на основе форм и цветов, а не бесконечных чисел в электронной таблице?

Спасибо Ширли Ву и ее замечательной книге Наброски данных: путешествие во воображение, исследования и прекрасные визуализации данных [1] , художественные визуализации данных стали более доступными для нас, компьютерных ботаников.

В этой статье я подробно покажу вам, как я применил одну главу этой книги на практике для проверки ETF.

Упражнение требует небольшого понимания языка Python и формата SVG.

Подождите, что такое ETF?

ETF - это биржевой торгуемый фонд, то есть своего рода пассивный паевой инвестиционный фонд, отслеживающий базовый актив и торгующийся на фондовой бирже.

Один из типов активов, отслеживаемых ETF, - это индексы акций, такие как MSCI World, которые сами состоят из компаний (холдингов).

У фондовых ETF есть несколько характеристик, которые следует учитывать перед покупкой, в том числе:

  • географический район владений,
  • активы под управлением, или, другими словами, размер ETF, который очень важен с точки зрения его ликвидности,
  • количество холдингов в базовых активах и их бизнес-секторах, которые обуславливают диверсификацию ETF.

Вы уже догадались, что мы переведем эти четыре характеристики на атрибуты цветка.

Шаг 1: Загрузите набор данных.

Первая часть упражнения - получить набор данных.

Самый простой способ получить список из нескольких ETF - это очистить данные из хорошо известного средства проверки ETF, например https://etfdb.com/screener/, и сохранить их в электронной таблице.

Если вам нужна помощь в очистке данных из Интернета, на шаге 1 следующего рассказа вы найдете методологию:



Три из четырех представляющих интерес атрибутов ETF могут быть непосредственно извлечены из скринера: географическая область, активы под управлением и количество холдингов.

Что касается весов секторов, библиотека Python yahooquery снова стала нашим спасителем, как показано в приведенном ниже коде.

На этом этапе мы получаем фрейм данных, содержащий всю информацию, необходимую для начала создания наших цветов (рисунок 1).

Шаг 2: Сформируйте лепестки.

Начнем с рисования лепестков цветов в формате SVG. Мы не пишем необработанный SVG напрямую, а используем пакет Python: svgwrite.

Принцип формата SVG заключается в указании путей с помощью различных команд, таких как перейти к (M), линия к (L) и кривая к (C).

Поскольку в нашем наборе данных присутствует пять географических зон, каждой зоне назначена одна форма (рисунок 2).

Пути для каждого лепестка прямо навеяны книгой Ширли Ву и указаны во фрагменте 2.

Шаг 3: Подберите цвета.

Теперь, когда у нас есть формы лепестков, пришло время подумать, какой цвет использовать, чтобы воплотить их в жизнь.

Для этого мы перечисляем одиннадцать возможных секторов, представленных нашими ETF, и назначаем им один цвет, выбранный вручную (рисунок 3 и фрагмент 3).

Шаг 4: Определите размер.

Наконец, нам нужно определиться с размерами наших цветов. К счастью, у нас есть еще два атрибута ETF, которые нужно представить:

  • активы под управлением, которые мы будем использовать для определения размера цветка,
  • количество холдингов в базовом активе, от которого будет зависеть количество лепестков.

По эстетическим соображениям мы ограничиваем количество возможных размеров до 4, а количество лепестков - от 2 до 9.

Метод quantile в Pandas позволяет нам равномерно распределять набор данных по различным категориям (фрагмент 4 и рисунок 4).

Шаг 5: Создайте цветы.

Последний шаг, очевидно, наиболее удовлетворительный: объединить все наши составляющие для создания цветов для всего набора данных.

Код для решения этой задачи довольно прост и представлен ниже (фрагмент 5).

Вот несколько деталей, которые необходимо пояснить:

  • класс Petal был расширен, чтобы можно было создавать цветные лепестки,
  • для эстетического выбора используется фильтр размытия, а цветной лепесток немного отклоняется от своей формы, чтобы создать впечатление картины,
  • представлено максимум три сектора (цвета) при условии, что их веса составляют не менее одной трети основного сектора.

И последнее, но не менее важное: созерцайте свой сад.

Окончательный результат показан на рисунке 5.

Пришло время выбрать свой следующий ETF, обращая внимание на то, чтобы его атрибуты соответствовали моей инвестиционной стратегии.

Со своей стороны, теперь вы можете сделать свою интерпретацию работы Ширли Ву с вашим собственным набором данных. Повеселись!

использованная литература

[1] Путешествие воображения, исследования и красивой визуализации данных, Надие Бремер, Ширли Ву, 2021 г.