Вопросы по теме 'glove'
Добавление дополнительных слов в word2vec или Glove (возможно, используя gensim)
У меня есть два предварительно обученных вложения слов: Glove.840b.300.txt и custom_glove.300.txt
Один прошел предварительную подготовку в Стэнфорде, а другой - я. Оба имеют разный словарный запас. Чтобы уменьшить oov, я хотел бы добавить...
1586 просмотров
schedule
01.07.2022
Можно ли заморозить только определенные веса вложения в слое вложения в pytorch?
При использовании встраивания GloVe в задачи НЛП некоторые слова из набора данных могут не существовать в GloVe. Поэтому мы создаем случайные веса для этих неизвестных слов.
Можно ли заморозить веса, полученные от GloVe, и тренировать только новые...
3348 просмотров
schedule
10.07.2022
Создавайте вложения слов, не сохраняя векторный файл fastText в репозитории.
Я пытаюсь встроить предложение с помощью Infersent , а Infersent использует fastText для встраивания слов. Размер векторного файла fastText близок к 5 ГиБ.
Когда мы храним векторный файл fastText вместе с репозиторием кода, размер репозитория...
108 просмотров
schedule
29.08.2023
Можем ли мы сравнить векторы слов из разных моделей, используя трансферное обучение?
Я хочу обучить две модели word2vec/GLoVe на разных корпусах, а затем сравнить векторы одного слова. Я знаю, что это не имеет смысла, так как разные модели начинаются с разных случайных состояний, но что, если мы используем предварительно обученные...
84 просмотров
schedule
13.10.2022
Bi-LSTM с перчаткой - проблема лемматизации
Попытка реализовать двунаправленную модель LSTM с встраиванием перчаток в Python с использованием keras. Архитектура модели следующая:
Модель отлично работает при запуске без какой-либо предварительной обработки входных данных. На...
253 просмотров
schedule
25.04.2024
Использование torch.nn.Embedding для GloVe: следует ли настраивать вложения или просто использовать их как есть?
в то время как перенос обучения / тонкой настройки последних языковых моделей, таких как BERT и XLNET, на сегодняшний день является очень распространенной практикой, как это обстоит с GloVe?
По сути, я вижу два варианта использования GloVe для...
2063 просмотров
schedule
17.05.2023
Предварительно обученные векторы, nlp, word2vec, встраивание слов для определенной темы?
есть ли какой-либо предварительно обученный вектор только для определенной темы? например "java", поэтому я хочу, чтобы в файле были векторы, связанные с java. означает, что если я даю входное наследование, то сходство косинусов покажет мне только...
254 просмотров
schedule
08.04.2023
ValueError: не удалось преобразовать строку в число с плавающей запятой: '.' во время заделки перчаток
Я пытаюсь кодировать векторы слов с помощью Glove и получаю указанную выше ошибку. Данные состоят из двух текстовых столбцов с целью определения сходства предложений. Не могли бы вы помочь мне решить эту ошибку?
[код]
embeddings_index =...
394 просмотров
schedule
31.10.2022
Разбор Glove6b50d: не удалось преобразовать строку в число с плавающей запятой: '-'
Я пытаюсь проанализировать данные Glove6b50d из Kaggle через Google Colab, а затем запустить их через word2vec (извините за огромный URL - это самая быстрая ссылка, которую я нашел). Однако я сталкиваюсь с ошибкой, из-за которой токены «-»...
362 просмотров
schedule
21.10.2022
как вычислить среднее значение встраивания слов в предложение
Я загрузил матрицу, обученную перчаткам, и использовал ее в слое Keras. однако мне нужно вложение предложения для другой задачи.
Я хочу вычислить среднее значение всех вложений слов в этом предложении.
как это сделать наиболее эффективно,...
581 просмотров
schedule
11.07.2023