Публикации по тегам language-model

Публикации по теме 'language-model'

Слова в векторах

Учебник по встраиванию слов Слова в векторах Понятия для встраивания слов Эта статья является второй в серии Учебник по встраиванию слов: 1. Что стоит за Word2vec | 2. Слова в векторах | 3. Статистическая теория обучения | 4. Классификатор Word2vec | 5. Гиперпараметры Word2vec | 6. Характеристики встраивания слов Первая статья, Что стоит за Word2vec , представила серию статей и заложила основу для встраивания слов. В этой статье мы рассмотрим..

Захватывающие разработки с GPT-4: инновации в языке и визуальной модели дополняют каждую…

Наблюдение за языковой моделью, обучающейся игре в шахматы

Результаты обучения модели GPT2 шахматной нотации В предыдущей статье (Chess2Vec) я проанализировал, какие ходы в шахматной партии близки, в том смысле, что они часто встречаются в подобных ситуациях в играх. Если два или более хода следуют или предшествуют друг другу, они считаются связанными каким-то образом. Источником для моего анализа послужили файлы партий, сыгранных на интернет-шахматном сервере Lichess . В этой статье я хотел бы пойти еще дальше и выяснить, можно ли..

AI PLAYBOOK: доверие к языковым моделям для бизнеса

Как бизнес-лидеры могут легко преодолеть недостатки модели необработанного языка, чтобы создать интеграцию мирового класса для дифференциации бизнеса s (*не написано с помощью генеративного ИИ) TL;DR: В этой статье мы исследуем потенциал больших языковых моделей, риски, связанные с использованием необработанных языковых моделей в бизнес-целях, а также методы, используемые iSolutionsAI для устранения этих рисков и легко создавать безопасные и надежные бизнес-приложения...

Word2Vec, GloVe и FastText, объяснение

Как компьютеры понимают слова Компьютеры не понимают слова так, как мы. Они предпочитают работать с цифрами. Итак, чтобы помочь компьютерам понять слова и их значения, мы используем так называемые вложения. Эти вложения численно представляют слова как математические векторы. Самое интересное в этих вложениях заключается в том, что если мы их выучим должным образом, слова, имеющие сходные значения, будут иметь схожие числовые значения. Другими словами, их номера будут ближе друг к..

Запуск Falcon на процессоре с Hugging Face Pipelines

Запуск Falcon на процессоре с Hugging Face Pipelines Узнайте, как выполнять логические выводы с помощью 7-миллиардного и 40-миллиардного Falcon на процессоре Xeon 4-го поколения с конвейерами Hugging Face. Легко предположить, что единственный способ, которым мы можем выполнять логические выводы с помощью LLM, состоящих из миллиардов параметров, — это использование графического процессора. Хотя графические процессоры действительно обеспечивают значительное ускорение по сравнению с..

Предварительное обучение больших языковых моделей в масштабе

Языковое моделирование является ключевым компонентом современных систем НЛП. В простейшем смысле языковая модель — это распределение вероятностей по словам в языке, т. е. она фиксирует семантический контекст словарного запаса языка. Имея хорошую модель данного языка, мы можем добиться высокой производительности во многих нижестоящих задачах НЛП, таких как обработка речи, понимание прочитанного, машинный перевод и так далее. Предупреждение, однако, заключается в том, что языки сложны, и..