Книга значительно расширилась по сравнению с версией 1.0. Он начался с синтетических данных в качестве одного из основных компонентов, но также углубился в объяснимый ИИ, интуитивно понятное/интерпретируемое машинное обучение и генеративный ИИ. Теперь с 272 страницами (по сравнению со 156 в первой версии) основное внимание уделяется синтетическим данным. Конечно, я все еще обсуждаю объяснимый и генеративный ИИ: эти концепции тесно связаны с синтезом данных.

Однако было добавлено много новых глав, охватывающих различные аспекты синтетических данных — в частности, работу с более диверсифицированными наборами реальных данных, способы их синтеза, способы генерации высококачественных случайных чисел с помощью очень быстрого алгоритма, основанного на цифрах иррациональных чисел, с визуальными эффектами. иллюстрации и код Python во всех главах. В дополнение к недавно добавленному агентному моделированию вы найдете материалы о

  • GAN — генеративно-состязательные сети, применяемые с использованием методов, отличных от нейронных сетей.
  • GMM — смешанные гауссовские модели и альтернативы, основанные на многомерных стохастических и решетчатых процессах.
  • Расстояние Хеллингера и другие показатели для измерения качества ваших синтетических данных, а также ограничения этих показателей.
  • Использование копул с подробными объяснениями того, как это работает, код Python и приложение для имитации реального набора данных.
  • Недостатки, связанные с синтетическими данными, в частности склонность к повторению предвзятости алгоритма, которую синтез должен устранить (и как этого избежать).
  • Техника, несколько похожая на ансамблевые методы / повышение дерева, но специфичная для синтеза данных, для дальнейшего повышения ценности синтетических данных при смешивании с реальными данными; цель состоит в том, чтобы сделать прогнозы более надежными и применимыми к более широкому диапазону наблюдений, действительно отличных от тех, которые были в вашем исходном обучающем наборе.
  • Синтез ближайших соседей и графов столкновений, локально случайных перестановок, форм и введение в искусство ИИ

Недавно добавленные приложения включают работу с многочисленными типами данных и наборами данных, включая время океана в Дублине (синтетические временные ряды), температуру в районе Чикаго (геопространственные данные) и набор страховых данных (табличные данные). Я также включил некоторые материалы из курса, который я преподаю по этому вопросу.

В настоящее время книга доступна только в формате PDF в моем интернет-магазине здесь, с многочисленными ссылками, обратными ссылками, указателем, глоссарием, большой библиографией и функциями навигации, облегчающими просмотр. Эта книга представляет собой компактный, но всеобъемлющий ресурс по этой теме, первый в своем роде. Качество форматирования и цветных иллюстраций необычайно высокое. В будущем я планирую добавить новые книги: следующая будет о хаотических динамических системах с приложениями. Тем не менее, книга по синтетическим данным была принята крупным издателем, и ее печатная версия будет доступна. Но это может занять некоторое время, прежде чем он будет выпущен, и версия PDF имеет полезные функции, которые не могут быть хорошо отображены в печати или на таких устройствах, как Kindle. После публикации в серии компьютерных наук соответствующим издателем версия в формате PDF может быть недоступна. Вы можете ознакомиться с содержимым моего репозитория GitHub, здесь, где также находится код Python, примеры глав и наборы данных.