Вопросы по теме 'glove'

Добавление дополнительных слов в word2vec или Glove (возможно, используя gensim)
У меня есть два предварительно обученных вложения слов: Glove.840b.300.txt и custom_glove.300.txt Один прошел предварительную подготовку в Стэнфорде, а другой - я. Оба имеют разный словарный запас. Чтобы уменьшить oov, я хотел бы добавить...
1586 просмотров
schedule 01.07.2022

Можно ли заморозить только определенные веса вложения в слое вложения в pytorch?
При использовании встраивания GloVe в задачи НЛП некоторые слова из набора данных могут не существовать в GloVe. Поэтому мы создаем случайные веса для этих неизвестных слов. Можно ли заморозить веса, полученные от GloVe, и тренировать только новые...
3348 просмотров
schedule 10.07.2022

Создавайте вложения слов, не сохраняя векторный файл fastText в репозитории.
Я пытаюсь встроить предложение с помощью Infersent , а Infersent использует fastText для встраивания слов. Размер векторного файла fastText близок к 5 ГиБ. Когда мы храним векторный файл fastText вместе с репозиторием кода, размер репозитория...
108 просмотров
schedule 29.08.2023

Можем ли мы сравнить векторы слов из разных моделей, используя трансферное обучение?
Я хочу обучить две модели word2vec/GLoVe на разных корпусах, а затем сравнить векторы одного слова. Я знаю, что это не имеет смысла, так как разные модели начинаются с разных случайных состояний, но что, если мы используем предварительно обученные...
84 просмотров
schedule 13.10.2022

Bi-LSTM с перчаткой - проблема лемматизации
Попытка реализовать двунаправленную модель LSTM с встраиванием перчаток в Python с использованием keras. Архитектура модели следующая: Модель отлично работает при запуске без какой-либо предварительной обработки входных данных. На...
253 просмотров
schedule 25.04.2024

Использование torch.nn.Embedding для GloVe: следует ли настраивать вложения или просто использовать их как есть?
в то время как перенос обучения / тонкой настройки последних языковых моделей, таких как BERT и XLNET, на сегодняшний день является очень распространенной практикой, как это обстоит с GloVe? По сути, я вижу два варианта использования GloVe для...
2063 просмотров
schedule 17.05.2023

Предварительно обученные векторы, nlp, word2vec, встраивание слов для определенной темы?
есть ли какой-либо предварительно обученный вектор только для определенной темы? например "java", поэтому я хочу, чтобы в файле были векторы, связанные с java. означает, что если я даю входное наследование, то сходство косинусов покажет мне только...
254 просмотров
schedule 08.04.2023

ValueError: не удалось преобразовать строку в число с плавающей запятой: '.' во время заделки перчаток
Я пытаюсь кодировать векторы слов с помощью Glove и получаю указанную выше ошибку. Данные состоят из двух текстовых столбцов с целью определения сходства предложений. Не могли бы вы помочь мне решить эту ошибку? [код] embeddings_index =...
394 просмотров
schedule 31.10.2022

Разбор Glove6b50d: не удалось преобразовать строку в число с плавающей запятой: '-'
Я пытаюсь проанализировать данные Glove6b50d из Kaggle через Google Colab, а затем запустить их через word2vec (извините за огромный URL - это самая быстрая ссылка, которую я нашел). Однако я сталкиваюсь с ошибкой, из-за которой токены «-»...
362 просмотров
schedule 21.10.2022

как вычислить среднее значение встраивания слов в предложение
Я загрузил матрицу, обученную перчаткам, и использовал ее в слое Keras. однако мне нужно вложение предложения для другой задачи. Я хочу вычислить среднее значение всех вложений слов в этом предложении. как это сделать наиболее эффективно,...
581 просмотров
schedule 11.07.2023