Выявление взаимосвязей между поведением криптокошельков: подход, основанный на данных

Изучение взаимосвязей между различными поведениями кошельков в блокчейне Ethereum с использованием методов анализа данных и кластеризации.

Введение

За последние несколько лет мир криптовалют значительно изменился, и теперь инвесторам и энтузиастам доступен широкий спектр цифровых активов. От основных криптовалют и платформ смарт-контрактов до нишевых категорий, таких как DeFi, NFT и мемкойны, криптоэкосистема никогда не была более разнообразной.

В этом посте мы углубимся в поведение пользователей кошелька Ethereum в сети, чтобы обнаружить интересные корреляции и закономерности. Мы будем использовать набор данных, содержащий информацию о различных типах поведения кошельков, таких как типы удерживаемых активов и возраст учетной записи пользователя, для кластеризации данных и предоставления уникальных идей.

Подготовка данных и предварительная обработка

Прежде чем погрузиться в анализ, нам сначала нужно было предварительно обработать набор данных, чтобы обеспечить его удобство использования. Это включало обработку пропущенных значений, преобразование временных меток в возраст учетной записи и время с момента последнего действия, а также масштабирование числовых характеристик для подготовки данных к кластеризации.

Кластеризация поведения кошелька

Для кластеризации данных мы использовали алгоритм KMeans, популярный метод обучения без учителя для разделения наборов данных на отдельные группы. Мы выбрали оптимальное количество кластеров, используя коэффициент силуэта, который измеряет, насколько хорошо каждая точка данных вписывается в назначенный кластер. Визуализируя оценки силуэта, мы стремились найти решение кластеризации с высокой средней оценкой силуэта, относительно равномерными размерами кластеров и согласованными оценками силуэта по кластерам.

Основные выводы из корреляционного анализа

После кластеризации данных мы рассчитали коэффициенты корреляции для различных поведений кошельков, чтобы понять взаимосвязь между ними. Некоторые из наиболее интересных находок включают в себя:

Сильная положительная корреляция между основными криптовалютами и платформами смарт-контрактов, DeFi, NFT и игровыми категориями позволяет предположить, что пользователи, инвестирующие в эти области, склонны диверсифицировать свои инвестиции по этим типам активов.

Очень сильная положительная корреляция между стейблкоинами и мемкойнами, указывающая на то, что пользователи, которые держат большое количество стейблкоинов, также склонны держать значительное количество мемкойнов в своих кошельках.

Сильная положительная корреляция между балансом Ethereum в долларах США и активами в основных криптовалютах и ​​платформах смарт-контрактов, DeFi, NFT и играх, а также служебных токенах. Это говорит о том, что пользователи, владеющие этими активами, как правило, имеют более высокий баланс Ethereum в долларах США.

Заключение

Анализируя корреляции между поведением различных кошельков, мы можем глубже понять, как пользователи взаимодействуют с разнообразной криптоэкосистемой. Этот подход, основанный на данных, может дать ценную информацию для предприятий, разработчиков и инвесторов в криптопространстве, чтобы лучше адаптировать свои предложения, стратегии и инвестиционные решения. Поскольку мир криптовалют продолжает расти и развиваться, использование возможностей данных и аналитики будет иметь решающее значение для того, чтобы оставаться впереди в этом постоянно меняющемся ландшафте.