Часть нашей работы в IntoTheBlock - это попытка использовать передовые методы машинного / глубокого обучения для получения максимально возможного интеллекта из наборов данных блокчейна. Мы живем в золотую эру исследований в области машинного обучения, когда крупные технологические лаборатории и академические учреждения расширяют границы возможного с помощью систем искусственного интеллекта (ИИ). В результате у нас есть новый арсенал методов и приемов, которые можно использовать с наборами данных блокчейна. Несколько дней назад я написал о нескольких новых методах машинного обучения, которые могут быть эффективны при решении задач аналитики блокчейна. Сегодня я хотел бы глубоко погрузиться в парочку методов, которые являются относительно новыми в теории машинного обучения, но которые кажутся очень применимыми к сценариям аналитики блокчейн. Я имею в виду методы обучения с частично контролируемым и всесторонним контролем.

Методы полу- и всенаправленного обучения с учителем могут показаться чуждыми даже для экспертов в области машинного обучения. Оба типа моделей были созданы с одной целью: работать в средах без большого количества помеченных данных. Такова природа моделей анализа цепочки блоков. В то время как блокчейны обеспечивают невероятно богатую данными среду для моделей машинного обучения, тот факт, что данные являются полуанонимными, создает уровень сложности, который не может быть преодолен большинством приложений анализа данных. Неудивительно, что большинство аналитических моделей блокчейнов фокусируются на общих конструкциях, таких как адреса или транзакции, которые предлагают ограниченную информацию о поведении криптоактивов. Отсутствие помеченных наборов данных, которые квалифицируют информацию в сетях блокчейнов, остается важным препятствием для внедрения моделей машинного обучения, и, как следствие, нам нужно полагаться на методы, которые могут эффективно работать в этих обстоятельствах.

Понимание проблемы отсутствия маркированных данных в аналитических приложениях блокчейн

Предположим, что мы пытаемся создать модель машинного обучения, которая решает традиционную задачу аналитических приложений блокчейна, такую ​​как идентификация злоумышленников или централизованный обмен. Традиционная школа мысли диктует следующий рабочий процесс:

1) Создайте модель на основе определенного метода, такого как классификация или линейная регрессия.

2) Обучите модель, используя набор данных, который включает вредоносные транзакции или централизованные обмены.

3) Протестируйте модель на аналогичном наборе данных, чтобы оценить ее эффективность.

4) Примените модель к новому набору данных блокчейна, чтобы определить записи, соответствующие нашей целевой классификации.

Этот традиционный рабочий процесс контролируемого обучения звучит великолепно на практике, но что произойдет, если у нас нет большого помеченного набора данных для обучения нашей модели заранее? В конце концов, количество высококачественных маркированных наборов данных в пространстве цепочки блоков чрезвычайно ограничено.

Проблема ограниченных помеченных данных характерна не только для аналитических приложений блокчейна. Многие сценарии машинного обучения уязвимы из-за его зависимости от больших объемов помеченных наборов данных, что довольно часто делает невозможным масштабирование в реальных сценариях. Это была проблема, которая вдохновила такие компании, как Google, Microsoft или Facebook, искать альтернативные идеи в исследованиях машинного обучения. Среди этих идей методы полууправляемого и всенаправленного обучения стали одними из наиболее жизнеспособных моделей для работы с ограниченными размеченными наборами данных.

Полу-контролируемое обучение

В спектре моделей машинного обучения полу-контролируемое обучение находится посередине между контролируемым и неконтролируемым обучением. Концептуально полу-контролируемое обучение пытается использовать обучение моделей машинного обучения с использованием небольшого количества помеченных данных и большего количества немаркированных данных. Истоки полуконтролируемого обучения можно проследить еще в 1970-х годах с работами таких ученых, как Владимир Вапник. Однако в 1995 году Джоэл Рэтсаби и Сантош С. Венкатеш опубликовали основополагающую статью о полууправляемом обучении, в которой они исследовали компромисс между помеченными и немаркированными наборами данных при изучении правила классификации.

Основная цель обучения с учителем - преодоление недостатков обучения как с учителем, так и без него. Для контролируемого обучения требуется огромное количество обучающих данных для классификации тестовых данных, что является рентабельным и трудоемким процессом. С другой стороны, обучение без учителя не требует каких-либо помеченных данных, которые группируют данные на основе сходства в точках данных, используя либо метод кластеризации, либо метод максимального правдоподобия. Главный недостаток этого подхода в том, что он не может точно кластеризовать неизвестные данные. Чтобы преодолеть эти проблемы, исследовательское сообщество предложило полууправляемое обучение, которое может обучаться с небольшим объемом обучающих данных, может маркировать неизвестные (или) данные теста. Полу-контролируемое обучение строит модель с несколькими помеченными шаблонами в качестве обучающих данных, а остальные шаблоны обрабатываются как тестовые. Модели полууправляемого обучения будут определять связи близости между записями немаркированных данных и группами немаркированных данных.

Взаимосвязь между контролируемыми и частично контролируемыми моделями можно проиллюстрировать на следующем рисунке. В режимах с низким объемом данных полу-контролируемое обучение действительно может дать невероятный прирост производительности во время обучения по сравнению с контролируемыми альтернативами.

Возвращаясь к нашему сценарию классификации цепочки блоков, можно сказать, что полу-контролируемое обучение можно использовать для обучения модели с использованием набора данных, который содержит несколько помеченных адресов и большой объем немаркированных. Полуконтролируемые модели будут устанавливать связи между этими записями, создавая более богатый набор обучающих данных. На практике все намного сложнее, но, надеюсь, вы уловили идею.

Всенаправленное обучение

Омни-контролируемое обучение - это довольно недавний метод машинного обучения, впервые разработанный исследовательской группой Facebook AI Research (FAIR). Концептуально обучение с учителем пытается устранить некоторые практические ограничения подходов с постоянным учителем. Частично проблема заключается в том, что методы полууправляемого обучения зависят от смоделированных помеченных / немаркированных данных путем разделения полностью аннотированного набора данных и, следовательно, могут быть ограничены сверху за счет полностью контролируемого обучения со всеми аннотациями. Другими словами, полу-контролируемое обучение будет так же хорошо, как эквивалентный полностью контролируемый метод обучения, работающий с помеченным набором данных.

Для решения некоторых проблем, связанных с моделями обучения с полу-контролируемым обучением, подход с универсальным контролем опирается на концепцию, называемую дистилляцией данных. Методы дистилляции данных пытаются «извлечь» знания из немаркированных данных без необходимости обучения большого набора моделей. Концептуально дистилляция данных включает четыре этапа:

(1) обучение модели на вручную размеченных данных (как при обычном обучении с учителем).

(2) применение обученной модели к нескольким преобразованиям немаркированных данных.

(3) преобразование прогнозов для немаркированных данных в метки путем объединения нескольких прогнозов.

(4) переобучение модели на объединении помеченных вручную данных и автоматически помеченных данных.

В контексте анализа цепочки блоков всенаправленное обучение может применяться к тем же сценариям, что и полу-контролируемый подход.

Обе модели обучения с частично контролируемым и всесторонним контролем выглядят многообещающими для решения некоторых проблем, связанных с данными в наборах данных блокчейна. С практической точки зрения, полууправляемые подходы нашли гораздо больше практических применений, и их легче реализовать с использованием текущего поколения фреймворков глубокого обучения. Тем не менее, некоторые идеи, впервые реализованные в Facebook в области обучения с учителем, выглядели невероятно многообещающими. По крайней мере, наборы данных блокчейнов предлагают чистый холст для экспериментов со всевозможными интересными методами машинного обучения, которые могут обеспечить новый уровень интеллекта в этом развивающемся классе активов.