После прокрастинации более года я наконец решил написать о вещах, которые меня интересуют больше всего. Я внимательно следил за областью генеративного ИИ задолго до того, как революционные DALL-E и ChatGPT штурмом захватили мир. Честно говоря, это заставляет меня чувствовать себя старым, учитывая, что я думал, что GAN были самыми амбициозными попытками людей смоделировать искусственное творчество внутри мертвых машин. Не слишком ли далеко мы продвинулись в области ИИ? - Да. Генеративный ИИ? - Определенно да! Повышенная доступность вычислительных ресурсов графического процессора, высококачественные гигантские наборы данных и новые архитектуры моделей + оптимизация обучения и модели с открытым исходным кодом — все это стало катализатором бурного развития в области ИИ. Каждую неделю появляются новые модели. Люди, не имеющие опыта в машинном обучении или даже в компьютерных науках, удивляют искусство и техническое сообщество своими творениями. Это эпоха генеративного ИИ.

Google и Microsoft делают все возможное, чтобы генеративный ИИ стал основой их будущего. В 2022 году наибольшее финансирование было обеспечено стартапами, работающими напрямую или поверх генеративного ИИ. Компании с оборотом в триллион долларов меняют всю свою стратегию и фокус. Microsoft ведет переговоры о потенциальных инвестициях в размере 10 миллиардов долларов с OpenAI, чтобы предложить программный доступ к очень популярному чату GPT в своей собственной службе Azure. Это может быть крупнейший альянс в области ИИ.

Присоединяйтесь ко мне, чтобы исследовать путь от диалоговых систем, основанных на правилах, до передовых технологий ChatGPT, от оригинальной GAN до моделей генерации изображений следующего поколения, таких как DALLE-2, Imagen, Make-a-Scene. От автозаполнения до написания полнофункционального кода, от OpenAI CodeX до самого младшего ребенка в блоке, ChatGPT. Генерация ограничивается не только текстом и изображениями, но и речью (VALL-E), 3D-моделями (Point-E, Get3D, DreamFusion), складчатыми структурами синтетических белков, табличными данными, данными временных рядов, графическими данными и так далее.

Что это значит для обычного человека? для художника? для рынка труда? для технологической отрасли? Что означает художественное творчество с когнитивной точки зрения? Что пробуждает творческий потенциал в этих строках кода? Кто имеет право собственности и должное признание за созданную работу?

С появлением эмергентных способностей открывается огромный потенциал и безграничные возможности для инноваций, стартапов, предприятий, автоматизации, отсутствия кода и интернет-культуры.

Есть так много вещей, которые нужно охватить, и прорывная тенденция на стероидах, за которой нелегко угнаться. Как однажды сказал один из аспирантов-исследователей, получивший награду за лучшую работу: «День или два это было ультрасовременно».

Так что пристегните ремни и возьмите попкорн: