Что произошло на этой неделе в AI by Louie

На этой неделе агенты ИИ оказались в центре внимания сообщества ИИ и LLM из-за таких проектов, как Auto-GPT. Концепция заключается в том, что языковые модели, такие как GPT-4, могут «самоподсказки» или «автоподсказки», то есть они могут генерировать и выполнять свои собственные подсказки на основе начального ввода. При таком подходе нескольким экземплярам этих моделей могут быть назначены разные роли, и они будут совместно работать для достижения общей цели, такой как выполнение ряда задач, проверка и исправление ошибок и даже разработка и отладка собственного кода. Хотя текущие проекты агентов ИИ все еще находятся на ранних стадиях и требуют дальнейшей доработки, мы видим огромный потенциал для агентов ИИ. Более того, предоставляя языковым моделям доступ к другим инструментам, таким как веб-поисковики, математические машины и системы поиска информации, мы считаем, что многие новые и возникающие возможности могут быть разблокированы.

После того, как мы стали свидетелями быстрого прогресса и непрерывного потока новостей о новых моделях НЛП, мы были рады увидеть, как некоторые из этих концепций применяются для развития компьютерного зрения, как это продемонстрировала новая Модель Сегмента Любого (SAM) от Meta. Выпуск этого проекта с открытым исходным кодом заслуживает особого внимания, и мы надеемся, что он поможет снизить затраты и барьеры для входа на многие задачи компьютерного зрения. Модель Segment Anything служит оперативной базовой моделью для сегментации изображений, позволяя изучать общее понятие объектов и создавать маски для любого объекта на изображениях или видео. Более того, его можно связать с другими задачами и другими генеративными моделями. Например, его можно подключить к стабильной диффузии для создания потрясающих сквозных моделей редактирования изображений, таких как Grounded Segment Anything, недавно опубликованный на GitHub. Мы считаем, что это только первый из многих проектов, в котором SAM интегрируется в более крупный и применимый в реальном мире проект.

– Луи Питерс, соучредитель и генеральный директор компании Towards AI

Горячие новости

  1. 4-летний план Anthropic на 5 миллиардов долларов по борьбе с OpenAI

Согласно документам, полученным TechCrunch, Anthropic планирует привлечь до 5 миллиардов долларов в ближайшие два года, чтобы бросить вызов конкуренту OpenAI, используя свою новую модель искусственного интеллекта Claude-Next. Компания также планирует выйти более чем в десяток крупных отраслей.

2. Meta представила Segment Anything

Meta представила Segment Anything, целью которой является демократизация сегментации. Модель Segment Anything — это универсальная модель с подсказками, обученная на разнообразном наборе данных. Он доступен под разрешительной лицензией с открытым исходным кодом (Apache 2.0).

3. Оклеветанный ChatGPT: мой собственный причудливый опыт с искусственностью «искусственного интеллекта»

Было обнаружено, что программа искусственного интеллекта ChatGPT сгенерировала ложное заявление о сексуальных домогательствах без фактической основы. Этот инцидент подчеркивает предвзятость и опасность использования ИИ для борьбы с дезинформацией. ChatGPT опирался на процитированную статью, которая никогда не была написана, и процитировал заявление, которое газета никогда не делала.

4. Приложение Poe для чат-ботов с искусственным интеллектом теперь позволяет вам создавать своих ботов с помощью подсказок

Poe, созданный сайтом вопросов и ответов Quora, позволяет пользователям экспериментировать с передовыми технологиями искусственного интеллекта через мобильный интерфейс. С Poe пользователи могут создавать своих собственных чат-ботов, используя подсказки и существующий бот в качестве основы. Кроме того, у пользователей есть возможность заплатить за доступ к более продвинутым ботам, основанным на новых языковых моделях, таких как GPT-4 и Claude+.

5. Мысли о сумасшедшей неделе в AI News

Темой прошлой недели были опасения, связанные с последними достижениями в таких системах, как ChatGPT и GPT-4. В связи со значительными новостями об ИИ, в том числе письмом и публикацией в журнале Times Magazine, растет потребность в большей прозрачности внутренней работы этих крупных систем ИИ, включая процессы их обучения и оценки.

Три 5-минутных чтения/видео, чтобы вы продолжали учиться

  1. StackLLaMA: практическое руководство по обучению LLaMA с RLHF

В этом сообщении в блоге демонстрируются различные этапы обучения модели LlaMa ответам на вопросы о Stack Exchange с использованием RLHF. Этот подход сочетает в себе контролируемую точную настройку (SFT), моделирование вознаграждения / предпочтений (RM) и обучение с подкреплением на основе обратной связи с человеком (RLHF). Используя эти методы, HuggingFace выпустила модель StackLLaMA.

2. Рецепт для обучения больших моделей

В этом отчете содержится ценная подборка практических советов, которые следует учитывать при обучении более крупной модели машинного обучения. В нем обсуждаются важные темы, такие как стратегии инициализации и экспериментирования, и предлагаются различные примеры полезных инструментов, которые могут пригодиться.

3. ИИ может не украсть вашу работу, но может изменить ее

ИИ может повлиять на около 300 миллионов рабочих мест по всему миру. Юридическая отрасль входит в число тех областей, где искусственный интеллект обещает автоматизировать работу, основанную на языке, но руководство человека по-прежнему имеет важное значение. В этой статье представлен непредвзятый анализ того, как ИИ может повлиять на различные отрасли.

4. ML статьи недели

Это тщательно подобранный и высококачественный список документов по машинному обучению (ML), на которые можно регулярно ссылаться. При таком ажиотаже вокруг ML в онлайн-дискуссиях важно вернуться к первоисточнику и понять текущие тенденции.

5. 5 уроков, извлеченных из добавления ChatGPT к зрелому продукту

Мито поделился конкретными уроками, которые они извлекли из запуска своей функции искусственного интеллекта. Самый большой урок заключался в том, что добавить чат-бота, который генерирует код, легко, но на самом деле выяснить, как этот код взаимодействует с вашим существующим продуктом, гораздо сложнее.

Бумаги и репозитории

  1. Торантулино/Авто-ГПТ

Это экспериментальный проект с открытым исходным кодом, направленный на то, чтобы сделать GPT-4 полностью автономным. Auto-GPT — это приложение, демонстрирующее возможности GPT-4 в автономном управлении предприятиями для увеличения их собственного капитала.

2. mayooear/gpt4-pdf-chatbot-langchain

Это чат-бот на базе GPT-4 и LangChain, предназначенный для обработки больших PDF-документов. С помощью этой технологии пользователи могут создать чат-бота, отвечающего на вопросы, который может обрабатывать несколько больших PDF-файлов. Используемый стек технологий включает LangChain, Pinecone, Typescript, Openai и Next.js.

3. HuggingGPT: решение задач ИИ с помощью ChatGPT и его друзей в HuggingFace

HuggingGPT — это платформа, которая использует LLM для подключения различных моделей ИИ в сообществах машинного обучения для решения задач ИИ. Он использует ChatGPT для планирования задач при получении запроса пользователя, выбора моделей на основе их доступных описаний функций в Hugging Face, выполнения каждой подзадачи с использованием выбранной модели ИИ и суммирования ответов в соответствии с результатами выполнения.

4. Резюме исследования ChatGPT/GPT-4

В этом документе представлен всесторонний обзор ChatGPT и GPT-4 и их потенциальных приложений в различных областях. Исследование направлено на то, чтобы дать представление о возможностях ChatGPT, потенциальных последствиях и этических проблемах, а также предложить направление для будущих достижений в этой области.

5. Опрос ChatGPT: производительность наборов данных NLP

Это обзор 141 статьи arXiv, в которой ChatGPT сравнивается с другими моделями НЛП. Выяснилось, что производительность ChatGPT оказалась ниже ожидаемой. Причины этого включали неоптимальное использование, предвзятые результаты и неполную многоязычную оценку.

Понравились эти статьи и сводки новостей? Получайте ежедневный обзор на почту!

Раздел сообщества Learn AI Together!

Анонсирование нашей доски объявлений Discord

Мы запустили новую доску вакансий в Сообществе Learn AI Discord, которая позволяет любой компании делиться своими вакансиями напрямую с нашим сообществом, и вы можете подать заявку в Discord. Просто прокрутите канал вверх, чтобы просмотреть все предложения о работе. Эта доска объявлений поддерживается нашими друзьями из @Freeflow, и как только вы поделитесь вакансией, вы также можете поделиться ею с другими партнерскими серверами, чтобы привлечь больше потенциальных кандидатов. Мы надеемся, что вы найдете этот ресурс полезным.

Если у вас есть вакансия, которой вы можете поделиться, и вы ищете кандидатов, загляните на доску объявлений здесь и рассмотрите возможность поделиться ею с нашим сообществом.

Еженедельный подкаст об искусственном интеллекте

В подкасте Что такое ИИ на этой неделе Луи Бушар взял интервью у Джереми Коэна, основателя и генерального директора Think Autonomous. Это интервью посвящено индустрии беспилотных автомобилей и различным ролям в ней, связанным с машинным обучением, включая обсуждение того, как стать инженером по беспилотным автомобилям. Разговор также затрагивает такие темы, как технология LiDAR и ее функциональность, сравнение между использованием LiDAR и камерами в беспилотных автомобилях и демистификация отраслевых мифов, таких как зарплата инженера по компьютерному зрению в размере 200 000 долларов. Слушайте на YouTube, Spotify или Apple Podcasts!

Мем недели!

Мем поделился DrDub#0108

Избранный пост сообщества из Discord

rmarquet # 2048 поделился репозиторием GitHub, содержащим коллекцию проектов искусственного интеллекта, а также подробную документацию и код. Он охватывает различные темы и методы в области ИИ, включая компьютерное зрение и обучение с подкреплением. Проверьте это здесь и поддержите другого члена сообщества. Поделитесь своим отзывом в теме здесь!

AI-опрос недели!

Присоединяйтесь к обсуждению в Discord.

TAI Кураторский раздел

Статья недели

Раскрытие различий: машинное обучение в исследовательских и производственных средах, автор Юссеф Хосни

В этой статье рассматриваются различия между машинным обучением в исследовательских и производственных средах. Реализация машинного обучения существенно различается в зависимости от контекста, в котором оно используется. Кроме того, он углубляется в компоненты производственного машинного обучения и проблемы, которые он ставит, чтобы обеспечить лучшее понимание связанных с этим сложностей.

Наши обязательные к прочтению статьи

Полное руководство по расширению нейронных сетей от Ali Moezzi

Подобие косинусов для 1 триллиона пар векторов Родриго Агундеса

Если вы заинтересованы в публикации с помощью Towards AI, ознакомьтесь с нашими рекомендациями и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашим редакционным политикам и стандартам.

Предложения о работе

Старший/главный инженер-программист — диалоговый ИИ @NinjaTech AI (Пало-Альто, Калифорния)

Ведущий инженер по надежности сайта @ASAPP (удаленно)

Сотрудник технического персонала, сбор данных @Cohere (удаленно)

Инженер полного стека (Frontend Focus) @Cresta (Remote)

Старший бэкэнд-инженер Python @Chattermill (удаленно)

Менеджер по науке о данных @Angi (удаленно)

Старший инженер по машинному обучению — Computer Vision @BenchSci (удаленно)

Хотите поделиться здесь вакансией? Обращайтесь по адресу [email protected].

Если вы готовитесь к следующему собеседованию по машинному обучению, обязательно посетите наш ведущий веб-сайт для подготовки к собеседованию, confetti!