Этот информационный бюллетень AI - все, что вам нужно # 53

На наш углубленный практический курс по генеративному ИИ подписались тысячи человек!

На прошлой неделе мы запустили курс Наш практический генеративный ИИ и очень довольны его положительными отзывами. Тысячи людей уже записались на курс, а некоторые уже применяют свои новые навыки на практике, развертывая свои модели от имени клиентов!

Этот курс является первым из многих курсов Towards AI и основан на нашей четырехлетней истории предоставления образовательного и обучающего контента по искусственному интеллекту. Этот первый курс был выпущен в сотрудничестве с Activeloop и Intel Disruptor Initiative. Курс посвящен LangChain и Deep Lake, векторной базе данных для всех данных ИИ в производстве, и выделяется своей глубиной и акцентом на практические навыки. С более чем 50 уроками, включая 10 практических проектов в 8 модулях и 5 полных учебных дней, курс предлагает глубокое погружение в технологию искусственного интеллекта, помогая вам создавать инновационные и промышленные инструменты и решения искусственного интеллекта.

Зарегистрируйтесь сегодня бесплатно на learn.activeloop.ai.

Что произошло на этой неделе в AI by Louie

На этой неделе в разделе о разработках в области ИИ мы отмечаем приобретение MosaicML компанией Databricks, которое, по нашему мнению, демонстрирует быструю потенциальную скорость зрелости стартапов в области ИИ, а также потенциал моделей с открытым исходным кодом для LLM.

Databricks, компания, занимающаяся данными и искусственным интеллектом, объявила о своем окончательном соглашении объединить усилия с MosaicML, ведущей генерирующей платформой искусственного интеллекта. Это сотрудничество направлено на демократизацию генеративного ИИ и предоставление организациям возможности создавать, владеть и защищать модели генеративного ИИ с помощью собственных данных. MosaicML стоит за ведущими LLM с открытым исходным кодом, такими как MPT-7B и MPT-30B, и хорошо известен своим экономичным обучением моделям.

Сделка была оценена примерно в 1,3 миллиарда долларов и свидетельствует о быстром темпе стартапов в области ИИ, поскольку компания достигла статуса выхода всего через 2,5 года после своего основания и после того, как привлекла всего ~ 64 миллиона долларов капитала. Это приобретение следует за недавними крупными раундами финансирования стартапов в области ИИ, такими как Adept AI, привлекший 350 миллионов долларов, и Claude, привлекший 450 миллионов долларов, и еще раз подчеркивает значительные инвестиции в это пространство и объем капитала, вкладываемого для сохранения конкурентоспособности. Это приобретение также подчеркивает, как небольшое количество людей может создать богатство в парадигме искусственного интеллекта, как продемонстрировала MosaicML со своими 62 сотрудниками.

Мы считаем, что приобретение MosaicML компанией Databricks служит подтверждением модели LLM с открытым исходным кодом, и компании могут выбирать для обучения своих собственных моделей с использованием данных, специфичных для клиента, для сохранения полного понимания обучающего набора моделей и контроля развертывания.

– Луи Питерс, соучредитель и генеральный директор компании Towards AI

Горячие новости

Представляем Voicebox: первую генеративную модель искусственного интеллекта для речи, позволяющую обобщать задачи с высочайшей производительностью

Meta AI создал Voicebox, новую модель, в которой используется подход Flow Matching для обучения обширным и разнообразным наборам данных. Это позволяет ему воспроизводить первоклассную синтезированную речь без необходимости специального обучения. Модель может сопоставлять различные звуковые стили, читать текстовые фрагменты на нескольких языках и даже редактировать речевые сегменты в аудиозаписях. Несмотря на то, что исследовательская работа и образцы аудио доступны, модель и код хранятся в тайне, чтобы предотвратить неправомерное использование.

2. ElevenLabs запускает новые продукты для генеративного голосового искусственного интеллекта и объявляет о раунде раунда A на сумму 19 миллионов долларов

ElevenLabs, исследовательская компания в области голосовых технологий и мировой лидер в области программного обеспечения для звукового ИИ, получила 19 миллионов долларов в рамках серии A для своей технологии синтетического голоса на основе ИИ. Эта технология позволяет создателям контента легко управлять аудиоконтентом, созданным искусственным интеллектом. У компании есть дальнейшие планы по запуску инструмента дублирования ИИ и классификатора речи ИИ, чтобы обеспечить прозрачность и безопасность в генеративных медиа.

3. RoboCat: Самосовершенствующийся робот-агент

Агент искусственного интеллекта DeepMind, RoboCat, может быстро адаптировать и улучшать свои навыки с помощью различных роботов-манипуляторов, генерируя новые обучающие данные. Всего за 100 демонстраций он может научиться управлять новыми роботами-манипуляторами в течение нескольких часов. Последняя версия RoboCat значительно улучшилась, а ее успешность в новых задачах увеличилась более чем в два раза по сравнению с ее первоначальной версией благодаря растущему опыту.

4. Microsoft продвигает современные технологии обучения и обслуживания LLM

DeepSpeed — это алгоритм и система, используемые для обучения массивных открытых моделей. Чтобы преодолеть существующие ограничения, Microsoft представила ZeRO++ с улучшениями памяти, пропускной способности и удобства использования.

5. Видение Amazon: модель ИИ для всего

Amazon стремится создать единый шлюз для предприятий, чтобы получить доступ к генеративным моделям искусственного интеллекта как с открытым, так и с закрытым исходным кодом. В интервью с Мэттом Вудом, вице-президентом AWS по продуктам, он подробно рассказал о взглядах Amazon на рынок ИИ, их стратегии по превосходству других технологических гигантов в конкуренции с ИИ, будущем Интернета и многом другом.

Пять 5-минутных чтений/видео, чтобы вы продолжали учиться

LangChain и векторные базы данных в производственном курсе

На прошлой неделе мы объявили о сотрудничестве с Activeloop и Intel Disruptor Initiative для создания бесплатного курса LangChain по искусственному интеллекту «LangChain и векторные базы данных в производстве». Курс предназначен для того, чтобы сделать искусственный интеллект практичным и доступным, предназначенным как для опытных разработчиков, так и для энтузиастов. Он предлагает более 50 уроков и более 10 проектов, охватывающих интеграцию API, быстрое проектирование и использование в производстве.

2. Карта рынка и анализ: поисковые компании Gen AI

Компании, занимающиеся генеративным искусственным интеллектом, улучшают свои услуги, чтобы конкурировать с Google, Microsoft и Baidu. В статье обсуждаются ведущие компании по поиску ИИ, такие как You.com и Perplexity.ai, в сфере потребительского поиска, а также Vectara, Dashworks, Nuclia, Metaphor и Hebbia в корпоративной среде.

3. Новые архитектуры для приложений LLM

В статье представлена эталонная архитектура для стека приложений LLM с использованием контекстного обучения. Он состоит из трех частей: предварительная обработка и встраивание данных, оперативное построение и поиск и оперативное выполнение. Контекстное обучение упрощает ИИ и особенно полезно для небольших наборов данных, позволяя вводить данные в режиме реального времени.

4. Как работает GPT: метафорическое объяснение ключа, значения, запроса внимания с использованием рассказа о зелье

В статье объясняется концепция ключа, значения и запроса во внимании с использованием метафоры зелья, чтобы проиллюстрировать их роль в предсказании следующего слова в тексте в рамках функционирования GPT. Он призван помочь читателям развить более интуитивное понимание внутренней работы GPT от начала до конца.

5. ИИ и бремя знаний

Исследователи переключают внимание с более крупных моделей на повышение эффективности моделей ИИ, учитывая высокие затраты на их создание и развертывание. Это может привести к новой эре развития ИИ, когда модели смогут достигать сверхчеловеческой производительности, не требуя огромного количества ресурсов.

Бумаги и репозитории

Объединение больших языковых моделей и графов знаний: дорожная карта

В этой работе предлагается дорожная карта по унификации языковых моделей (LLM) и графов знаний (KG) в ИИ. В нем представлены платформы LLM с расширенным KG, расширенные KG с LLM и синергетические платформы LLM + KG для улучшения представления знаний и рассуждений для улучшения последующих задач.

2. Учебники — это все, что вам нужно

В этой статье представлена Phi-1, новая модель языка кодирования, которая использует данные «качества учебников». Несмотря на свой меньший размер, Phi-1 демонстрирует замечательную точность на HumanEval и MBPP. Он превосходен в кодировании Python и превосходит более крупные модели, используя высококачественные примеры.

3. Простой и эффективный подход к сокращению больших языковых моделей

Эта статья представляет Wanda, новый подход к сокращению для LLM. Ванда достигает разреженности, не требуя переобучения или обновления веса. Он эффективно идентифицирует эффективные разреженные сети из предварительно обученных моделей, превосходя подходы к сокращению и сопоставляя или превосходя производительность других современных методов при минимальных вычислительных затратах.

4. FastSAM: более быстрая альтернатива модели Segment Anything

Этот репозиторий представляет собой быстрый метод, который соответствует производительности недавно предложенной модели Segment Anything (SAM). SAM используется в компьютерном зрении для таких задач, как сегментация изображений и создание субтитров. Однако в этой новой методике используется стандартный подход, называемый сегментацией экземпляров, обеспечивающий сопоставимые результаты со скоростью, в 50 раз превышающей скорость.

5. Тарт: Повышение мыслительных способностей LLM

Это исследование показывает, что, хотя LLM преуспевают в различных задачах, они сталкиваются с проблемами вероятностного мышления, что приводит к ограничениям производительности. Чтобы решить эту проблему, в документе представлен TART, решение, которое расширяет возможности рассуждений LLM с помощью синтетически обученного модуля рассуждений на основе Transformer.

Понравились эти статьи и сводки новостей? Получайте ежедневный обзор на почту!

Раздел сообщества Learn AI Together!

Еженедельный подкаст об искусственном интеллекте

В выпуске подкаста Что такое ИИ на этой неделе Луи Бушар берет интервью у Джея Аламмара, широко известного в области ИИ и НЛП своим исключительным блогом о трансформерах и внимании. Они погружаются в мир Трансформеров, эволюцию ИИ, этапы обучения LLM и многое другое. Джей делится своими мыслями о создании приложений LLM и связанных с ними проблемах. Настройтесь на выпуск на YouTube, Spotify или Apple Podcasts.

Предстоящие события сообщества

Сообщество Learn AI Together Discord проводит еженедельные семинары по искусственному интеллекту, чтобы помочь сообществу учиться у отраслевых экспертов, задавать вопросы и получать более глубокое представление о последних исследованиях в области искусственного интеллекта. Присоединяйтесь к нам на бесплатных интерактивных видеосеансах, которые еженедельно проводятся в прямом эфире на Discord, посещая наши предстоящие мероприятия.

1. Группа чтения временных рядов: конформное предсказание и его подробное применение

В критически важных областях, таких как медицинские диагнозы и критически важные для безопасности системы, количественная оценка неопределенности прогнозов в машинном обучении имеет решающее значение. Конформное предсказание предлагает надежную основу для этой цели. Это позволяет количественно оценить неопределенность для любой модели машинного обучения в качестве уровня постобработки, не требуя перенастройки модели. Присоединяйтесь к нам для предстоящего выступления, в котором мы углубимся в приложения конформного предсказания. Участникам рекомендуется ознакомиться с идеями, опубликованными на канале MLBoost на YouTube, до начала мероприятия.

Присоединяйтесь к мероприятию здесь и узнайте, как конформное прогнозирование повышает надежность принятия решений, обеспечивая меру неопределенности по сравнению с традиционными точечными прогнозами.

Дата и время: 7 июля 2023 г., 10:00 по восточному поясному времени

Добавьте наш календарь Google, чтобы увидеть все наши бесплатные мероприятия по искусственному интеллекту!

Мем недели!

Мем поделился bigbuxchungus

Избранный пост сообщества из Discord

Компания Марклинген внесла свой вклад в разработку langfuse, экспериментальной платформы с открытым исходным кодом для приложений на основе LLM. Langfuse позволяет пользователям быть в курсе тенденций качества вывода и функций, отслеживать использование токенов, удобно сегментировать выполнение, сравнивать низкокачественные исполнения и многое другое. Проверьте это на GitHub и поддержите другого члена сообщества. Делитесь своими вопросами и отзывами в теме здесь.

AI-опрос недели!

Присоединяйтесь к обсуждению в Discord.

TAI Кураторский раздел

Статья недели

(Vision) Transformers: Rise of the Chimera от Quadric

В этой статье делается попытка ответить на такие вопросы, как: Что делает Vision Transformers (ViT) такими особенными по сравнению с их аналогами CNN, почему эти уникальные архитектурные особенности ViT «ломают» почти все аппаратные ускорители NPU и AI, ориентированные на рынок высокопроизводительных периферийных устройств. и как архитектура Quadric Chimera GPNPU может сегодня запускать ViT с пропускной способностью в режиме реального времени ~1,2 Вт.

Наши обязательные к прочтению статьи

Графическое Обучение: Часть 1 от Анурага Тангри

PatchTST — шаг вперед в прогнозировании временных рядов автора М. Хасиб Хассан

Bootstrap: введение для начинающих на примере Python от Janik and Patrick Tinz

5 мощных методов перекрестной проверки для резкого повышения надежности ваших моделей машинного обучения от Bex T.

Если вы хотите публиковаться с помощью Towards AI, ознакомьтесь с нашими рекомендациями и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашим редакционным политикам и стандартам.

Предложения о работе

Главный инженер по искусственному интеллекту, Deep Learning/LLMs @Cynch AI (Сан-Франциско, Калифорния, США)

Старший разработчик Python и машинного обучения @Patona (удаленно)

Инженер API @Move.ai (Лондон, Великобритания)

Аналитик данных @Kido (Мумбаи, Индия)

Ведущий специалист по данным @Rising Academies (удаленно/фрилансер)

Аналитик данных (стажировка) @Infosys (Сингапур)

Младший инженер по машинному обучению @SWORD Health (удаленно)

Хотите поделиться здесь вакансией? Обращайтесь по адресу [email protected].

Если вы готовитесь к следующему собеседованию по машинному обучению, обязательно посетите наш ведущий веб-сайт для подготовки к собеседованию, confetti!