Публикации по тегам language-model

Публикации по теме 'language-model'

Языковое моделирование для (తెలుగు) телугу

Вы когда-нибудь читали Анандо Брамха ( ఆనందో బ్రహ్మ ) Яндамури? В противном случае вам следует. Книга (роман на телугу) была впервые опубликована в 1980 году и намного опередила свое время. Действие происходит в 2054 году в Андхра-Десаме, Соединенные Штаты Индии. Эта история представляет собой попурри из ностальгии, фэнтези, романтики и футурологии. В нем автор описывает (вымышленный) компьютер 12-го поколения , который читает в романе и предсказывает, насколько хорошо он..

Новый подход CMU «Реструктурированное предварительное обучение» НЛП набирает на 40 баллов больше среднего учащегося по…

Парадигмы обработки естественного языка (NLP) быстро развиваются — от полностью контролируемого обучения до предварительного обучения и точной настройки, а в последнее время — предварительного обучения с быстрым прогнозированием. Захватывающий прогресс и применимость систем НЛП в реальном мире мотивировали больше ИИ…

Управление LLM без обучения

В последнее время было много разговоров о некоторых новых формах поведения, которые наблюдаются при обучении LLM на данных в масштабе Интернета. Одним из таких типов поведения, которые делают LLM очень полезными, является «контекстное обучение». Представьте, что вы создаете приложение, которое фильтрует новости на основе предпочтений пользователей. Пользователь решает, что ему хотелось бы видеть только положительные новости, и его интересуют только новости о технологиях. Создание этого..

НЛП для тематического моделирования с помощью техники LDA

Скрытое распределение Дирихле, полученное из Gensim Обработка естественного языка Обработка естественного языка за последние годы добилась значительных успехов и стала более распространенной в современных приложениях из-за возросшей вычислительной мощности, позволяющей создавать более динамичные модели и приложения на основе искусственного интеллекта. В этой статье мы продемонстрируем создание модели для тематического моделирования , а затем применение метода скрытого..

Развлекайтесь с Linkedin — с НЛП и «Улицей Сезам»

Используя концепции scikit-learn и NLP, мы улучшим наш опыт работы с LinkedIn, превратив описание профиля в этой социальной сети в персонажа Улицы Сезам! Мы попросили ChatGPT создать синтетические профили LinkedIn для определенных профессий: HR, криптоэнтузиасты, гуру бизнеса и финансов и инженеры-программисты . Мы связали эти профили с персонажем и обучили модель с результатом: Лоуренс Дикерсон, ИТ-специалист, обладающий навыками работы с Microsoft Excel, Microsoft Word,..

AlphaCode от DeepMind генерирует код на уровне, конкурентоспособном с программистами-людьми

В последние годы системы искусственного интеллекта достигли или превзошли производительность человеческого уровня в таких играх, как Go и StarCraft, в задачах прогнозирования в медицинской визуализации и даже в оптимизации архитектуры микрочипов. Может ли кодирование быть следующим? Идея автоматизации кодирования не нова, и сегодняшние мощные крупномасштабные языковые модели уже…

Разговор с моделями: метод Стэнфордского университета и Microsoft позволяет разработчикам исправлять ошибки моделей с помощью…

Вместо того, чтобы полагаться исключительно на размеченные обучающие данные, исследователи машинного обучения все чаще обращаются к входным данным на естественном языке для предоставления инструкций, контроля и индуктивных предубеждений при обучении языковых моделей. Можно ли также использовать естественный язык для упрощения и улучшения…