На наш углубленный практический курс по генеративному ИИ подписались тысячи человек!
На прошлой неделе мы запустили курс Наш практический генеративный ИИ и очень довольны его положительными отзывами. Тысячи людей уже записались на курс, а некоторые уже применяют свои новые навыки на практике, развертывая свои модели от имени клиентов!
Этот курс является первым из многих курсов Towards AI и основан на нашей четырехлетней истории предоставления образовательного и обучающего контента по искусственному интеллекту. Этот первый курс был выпущен в сотрудничестве с Activeloop и Intel Disruptor Initiative. Курс посвящен LangChain и Deep Lake, векторной базе данных для всех данных ИИ в производстве, и выделяется своей глубиной и акцентом на практические навыки. С более чем 50 уроками, включая 10 практических проектов в 8 модулях и 5 полных учебных дней, курс предлагает глубокое погружение в технологию искусственного интеллекта, помогая вам создавать инновационные и промышленные инструменты и решения искусственного интеллекта.
Зарегистрируйтесь сегодня бесплатно на learn.activeloop.ai.
Что произошло на этой неделе в AI by Louie
На этой неделе в разделе о разработках в области ИИ мы отмечаем приобретение MosaicML компанией Databricks, которое, по нашему мнению, демонстрирует быструю потенциальную скорость зрелости стартапов в области ИИ, а также потенциал моделей с открытым исходным кодом для LLM.
Databricks, компания, занимающаяся данными и искусственным интеллектом, объявила о своем окончательном соглашении объединить усилия с MosaicML, ведущей генерирующей платформой искусственного интеллекта. Это сотрудничество направлено на демократизацию генеративного ИИ и предоставление организациям возможности создавать, владеть и защищать модели генеративного ИИ с помощью собственных данных. MosaicML стоит за ведущими LLM с открытым исходным кодом, такими как MPT-7B и MPT-30B, и хорошо известен своим экономичным обучением моделям.
Сделка была оценена примерно в 1,3 миллиарда долларов и свидетельствует о быстром темпе стартапов в области ИИ, поскольку компания достигла статуса выхода всего через 2,5 года после своего основания и после того, как привлекла всего ~ 64 миллиона долларов капитала. Это приобретение следует за недавними крупными раундами финансирования стартапов в области ИИ, такими как Adept AI, привлекший 350 миллионов долларов, и Claude, привлекший 450 миллионов долларов, и еще раз подчеркивает значительные инвестиции в это пространство и объем капитала, вкладываемого для сохранения конкурентоспособности. Это приобретение также подчеркивает, как небольшое количество людей может создать богатство в парадигме искусственного интеллекта, как продемонстрировала MosaicML со своими 62 сотрудниками.
Мы считаем, что приобретение MosaicML компанией Databricks служит подтверждением модели LLM с открытым исходным кодом, и компании могут выбирать для обучения своих собственных моделей с использованием данных, специфичных для клиента, для сохранения полного понимания обучающего набора моделей и контроля развертывания.
– Луи Питерс, соучредитель и генеральный директор компании Towards AI
Горячие новости
Meta AI создал Voicebox, новую модель, в которой используется подход Flow Matching для обучения обширным и разнообразным наборам данных. Это позволяет ему воспроизводить первоклассную синтезированную речь без необходимости специального обучения. Модель может сопоставлять различные звуковые стили, читать текстовые фрагменты на нескольких языках и даже редактировать речевые сегменты в аудиозаписях. Несмотря на то, что исследовательская работа и образцы аудио доступны, модель и код хранятся в тайне, чтобы предотвратить неправомерное использование.
ElevenLabs, исследовательская компания в области голосовых технологий и мировой лидер в области программного обеспечения для звукового ИИ, получила 19 миллионов долларов в рамках серии A для своей технологии синтетического голоса на основе ИИ. Эта технология позволяет создателям контента легко управлять аудиоконтентом, созданным искусственным интеллектом. У компании есть дальнейшие планы по запуску инструмента дублирования ИИ и классификатора речи ИИ, чтобы обеспечить прозрачность и безопасность в генеративных медиа.
3. RoboCat: Самосовершенствующийся робот-агент
Агент искусственного интеллекта DeepMind, RoboCat, может быстро адаптировать и улучшать свои навыки с помощью различных роботов-манипуляторов, генерируя новые обучающие данные. Всего за 100 демонстраций он может научиться управлять новыми роботами-манипуляторами в течение нескольких часов. Последняя версия RoboCat значительно улучшилась, а ее успешность в новых задачах увеличилась более чем в два раза по сравнению с ее первоначальной версией благодаря растущему опыту.
4. Microsoft продвигает современные технологии обучения и обслуживания LLM
DeepSpeed — это алгоритм и система, используемые для обучения массивных открытых моделей. Чтобы преодолеть существующие ограничения, Microsoft представила ZeRO++ с улучшениями памяти, пропускной способности и удобства использования.
5. Видение Amazon: модель ИИ для всего
Amazon стремится создать единый шлюз для предприятий, чтобы получить доступ к генеративным моделям искусственного интеллекта как с открытым, так и с закрытым исходным кодом. В интервью с Мэттом Вудом, вице-президентом AWS по продуктам, он подробно рассказал о взглядах Amazon на рынок ИИ, их стратегии по превосходству других технологических гигантов в конкуренции с ИИ, будущем Интернета и многом другом.
Пять 5-минутных чтений/видео, чтобы вы продолжали учиться
На прошлой неделе мы объявили о сотрудничестве с Activeloop и Intel Disruptor Initiative для создания бесплатного курса LangChain по искусственному интеллекту «LangChain и векторные базы данных в производстве». Курс предназначен для того, чтобы сделать искусственный интеллект практичным и доступным, предназначенным как для опытных разработчиков, так и для энтузиастов. Он предлагает более 50 уроков и более 10 проектов, охватывающих интеграцию API, быстрое проектирование и использование в производстве.
2. Карта рынка и анализ: поисковые компании Gen AI
Компании, занимающиеся генеративным искусственным интеллектом, улучшают свои услуги, чтобы конкурировать с Google, Microsoft и Baidu. В статье обсуждаются ведущие компании по поиску ИИ, такие как You.com и Perplexity.ai, в сфере потребительского поиска, а также Vectara, Dashworks, Nuclia, Metaphor и Hebbia в корпоративной среде.
3. Новые архитектуры для приложений LLM
В статье представлена эталонная архитектура для стека приложений LLM с использованием контекстного обучения. Он состоит из трех частей: предварительная обработка и встраивание данных, оперативное построение и поиск и оперативное выполнение. Контекстное обучение упрощает ИИ и особенно полезно для небольших наборов данных, позволяя вводить данные в режиме реального времени.
В статье объясняется концепция ключа, значения и запроса во внимании с использованием метафоры зелья, чтобы проиллюстрировать их роль в предсказании следующего слова в тексте в рамках функционирования GPT. Он призван помочь читателям развить более интуитивное понимание внутренней работы GPT от начала до конца.
Исследователи переключают внимание с более крупных моделей на повышение эффективности моделей ИИ, учитывая высокие затраты на их создание и развертывание. Это может привести к новой эре развития ИИ, когда модели смогут достигать сверхчеловеческой производительности, не требуя огромного количества ресурсов.
Бумаги и репозитории
В этой работе предлагается дорожная карта по унификации языковых моделей (LLM) и графов знаний (KG) в ИИ. В нем представлены платформы LLM с расширенным KG, расширенные KG с LLM и синергетические платформы LLM + KG для улучшения представления знаний и рассуждений для улучшения последующих задач.
2. Учебники — это все, что вам нужно
В этой статье представлена Phi-1, новая модель языка кодирования, которая использует данные «качества учебников». Несмотря на свой меньший размер, Phi-1 демонстрирует замечательную точность на HumanEval и MBPP. Он превосходен в кодировании Python и превосходит более крупные модели, используя высококачественные примеры.
3. Простой и эффективный подход к сокращению больших языковых моделей
Эта статья представляет Wanda, новый подход к сокращению для LLM. Ванда достигает разреженности, не требуя переобучения или обновления веса. Он эффективно идентифицирует эффективные разреженные сети из предварительно обученных моделей, превосходя подходы к сокращению и сопоставляя или превосходя производительность других современных методов при минимальных вычислительных затратах.
4. FastSAM: более быстрая альтернатива модели Segment Anything
Этот репозиторий представляет собой быстрый метод, который соответствует производительности недавно предложенной модели Segment Anything (SAM). SAM используется в компьютерном зрении для таких задач, как сегментация изображений и создание субтитров. Однако в этой новой методике используется стандартный подход, называемый сегментацией экземпляров, обеспечивающий сопоставимые результаты со скоростью, в 50 раз превышающей скорость.
5. Тарт: Повышение мыслительных способностей LLM
Это исследование показывает, что, хотя LLM преуспевают в различных задачах, они сталкиваются с проблемами вероятностного мышления, что приводит к ограничениям производительности. Чтобы решить эту проблему, в документе представлен TART, решение, которое расширяет возможности рассуждений LLM с помощью синтетически обученного модуля рассуждений на основе Transformer.
Понравились эти статьи и сводки новостей? Получайте ежедневный обзор на почту!
Раздел сообщества Learn AI Together!
Еженедельный подкаст об искусственном интеллекте
В выпуске подкаста Что такое ИИ на этой неделе Луи Бушар берет интервью у Джея Аламмара, широко известного в области ИИ и НЛП своим исключительным блогом о трансформерах и внимании. Они погружаются в мир Трансформеров, эволюцию ИИ, этапы обучения LLM и многое другое. Джей делится своими мыслями о создании приложений LLM и связанных с ними проблемах. Настройтесь на выпуск на YouTube, Spotify или Apple Podcasts.
Предстоящие события сообщества
Сообщество Learn AI Together Discord проводит еженедельные семинары по искусственному интеллекту, чтобы помочь сообществу учиться у отраслевых экспертов, задавать вопросы и получать более глубокое представление о последних исследованиях в области искусственного интеллекта. Присоединяйтесь к нам на бесплатных интерактивных видеосеансах, которые еженедельно проводятся в прямом эфире на Discord, посещая наши предстоящие мероприятия.
1. Группа чтения временных рядов: конформное предсказание и его подробное применение
В критически важных областях, таких как медицинские диагнозы и критически важные для безопасности системы, количественная оценка неопределенности прогнозов в машинном обучении имеет решающее значение. Конформное предсказание предлагает надежную основу для этой цели. Это позволяет количественно оценить неопределенность для любой модели машинного обучения в качестве уровня постобработки, не требуя перенастройки модели. Присоединяйтесь к нам для предстоящего выступления, в котором мы углубимся в приложения конформного предсказания. Участникам рекомендуется ознакомиться с идеями, опубликованными на канале MLBoost на YouTube, до начала мероприятия.
Присоединяйтесь к мероприятию здесь и узнайте, как конформное прогнозирование повышает надежность принятия решений, обеспечивая меру неопределенности по сравнению с традиционными точечными прогнозами.
Дата и время: 7 июля 2023 г., 10:00 по восточному поясному времени
Мем недели!
Мем поделился bigbuxchungus
Избранный пост сообщества из Discord
Компания Марклинген внесла свой вклад в разработку langfuse, экспериментальной платформы с открытым исходным кодом для приложений на основе LLM. Langfuse позволяет пользователям быть в курсе тенденций качества вывода и функций, отслеживать использование токенов, удобно сегментировать выполнение, сравнивать низкокачественные исполнения и многое другое. Проверьте это на GitHub и поддержите другого члена сообщества. Делитесь своими вопросами и отзывами в теме здесь.
AI-опрос недели!
Присоединяйтесь к обсуждению в Discord.
TAI Кураторский раздел
Статья недели
(Vision) Transformers: Rise of the Chimera от Quadric
В этой статье делается попытка ответить на такие вопросы, как: Что делает Vision Transformers (ViT) такими особенными по сравнению с их аналогами CNN, почему эти уникальные архитектурные особенности ViT «ломают» почти все аппаратные ускорители NPU и AI, ориентированные на рынок высокопроизводительных периферийных устройств. и как архитектура Quadric Chimera GPNPU может сегодня запускать ViT с пропускной способностью в режиме реального времени ~1,2 Вт.
Наши обязательные к прочтению статьи
Графическое Обучение: Часть 1 от Анурага Тангри
PatchTST — шаг вперед в прогнозировании временных рядов автора М. Хасиб Хассан
Bootstrap: введение для начинающих на примере Python от Janik and Patrick Tinz
5 мощных методов перекрестной проверки для резкого повышения надежности ваших моделей машинного обучения от Bex T.
Если вы хотите публиковаться с помощью Towards AI, ознакомьтесь с нашими рекомендациями и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашим редакционным политикам и стандартам.
Предложения о работе
Старший разработчик Python и машинного обучения @Patona (удаленно)
Инженер API @Move.ai (Лондон, Великобритания)
Аналитик данных @Kido (Мумбаи, Индия)
Ведущий специалист по данным @Rising Academies (удаленно/фрилансер)
Аналитик данных (стажировка) @Infosys (Сингапур)
Младший инженер по машинному обучению @SWORD Health (удаленно)
Хотите поделиться здесь вакансией? Обращайтесь по адресу [email protected].
Если вы готовитесь к следующему собеседованию по машинному обучению, обязательно посетите наш ведущий веб-сайт для подготовки к собеседованию, confetti!