Вопросы по теме 'sentence-similarity'
Как рассчитать семантическое сходство слов в двух строках с помощью алгоритма пути WordNet
У меня есть одна строка слов, скажем, s1. У меня также есть несколько строк в другом наборе, например, s2, s3, s4.
Я хочу сопоставить слова в строке s1 с каждой из строк s2, s3 и так далее. Основываясь на максимальной оценке сходства, я хочу...
1116 просмотров
schedule
27.09.2023
Как перейти от сходства слов к общему сходству предложений
Я реализовал метод подобия предложений, используя WS4J.
Я читал о сходстве предложений в статьях, основанных на сходстве слов в двух предложениях. Но я не смог найти метод, который вычисляет и возвращает одно значение общего сходства предложений...
893 просмотров
schedule
03.06.2022
Нахождение семантической связности между предложениями в тексте
Мне нужна помощь в написании программы на основе кода из этих ссылок ссылка1 и ссылка2 , который автоматически рассчитает семантическое сходство между a. Последовательные предложения и б. Предложения разделяются 1 промежуточной фразой в целом...
845 просмотров
schedule
10.11.2022
Подобие группы текстовых документов
Я ищу алгоритм, который пытается проверить
1) сходство предложений (около 5000) друг с другом в документе
2) сходство нескольких документов (около 5000) по отношению друг к другу
Мне нужно то же самое, потому что я пытаюсь оценить, похожи ли...
367 просмотров
schedule
24.05.2022
Сиамская сеть с LSTM для схожести предложений в Керасе периодически дает один и тот же результат
Я новичок в Керасе, и я пытаюсь решить задачу подобия предложений, используя NN в Керасе. Я использую word2vec для встраивания слов, а затем Siamese Network, чтобы предсказать, насколько похожи два предложения. Базовая сеть для сиамской сети - это...
3377 просмотров
schedule
06.05.2022
НЛП - Как определить, относятся ли 2 текста к одному и тому же объекту
Я ищу некоторые общие рекомендации здесь.
Вариант использования высокого уровня таков, что я получаю некоторые документы продукта, из которых мне нужно извлечь некоторую информацию и обработать ее. Прежде чем сделать это, мне нужно убедиться,...
115 просмотров
schedule
09.05.2023
TypeError: массив аргументов выборки имеет недопустимый тип numpy.ndarray, должен быть строкой или тензором. (Невозможно преобразовать ndarray в тензор или операцию.)
Я пытаюсь воспроизвести результаты в siaseme LSTM, чтобы сравнить семантическое сходство двух предложений отсюда: - https://github.com/dhwajraj/deep-siamese-text-similarity
Я использую tenorflow 1.4 и python 2.7
Train.py работает правильно....
4994 просмотров
schedule
05.02.2023
Подходы к текстовому сходству не отражают реального сходства между текстами.
Я сравниваю содержание резюме (файлы .txt с уже удаленными стоп-словами) с действительно компактными описаниями должностей (JD), например:
управление проектами, лидерство, продажи, SAP, маркетинг
В резюме около 600 слов, а в JD — только...
309 просмотров
schedule
30.08.2023
Как найти похожий текст в большой строке?
У меня есть большая нить ул и игла ндл. Теперь мне нужно найти аналогичный текст ndl из строки str. Например,
ИСТОЧНИК: «Это демонстрационный текст, и я люблю вас за это».
ИГЛА: "Я тебя люблю"
ВЫВОД: «Я люблю тебя»...
306 просмотров
schedule
27.09.2022
оценка сходства между фразами
Расстояние Левенштейна — это подход к измерению разницы между словами, но не для фраз.
Существует ли хорошая метрика расстояния для измерения различий между фразами?
Например, если фраза 1 состоит из n слов x1 x2 x_n, а фраза 2 состоит из m слов...
334 просмотров
schedule
10.11.2022
Как найти сходство текста среди миллионов записей?
Используя Spacy, чтобы найти сходство в нескольких текстах, теперь я пытаюсь найти похожие тексты в миллионах записей (мгновенно).
У меня есть приложение с миллионами текстов, и я хотел бы предоставить пользователю похожие тексты, если они...
168 просмотров
schedule
17.09.2022
вычисление семантического сходства между наборами предложений
У меня есть два набора коротких сообщений, я хочу вычислить сходство между этими двумя наборами и определить, говорят ли они об одной и той же подтеме, на основе их семантического сходства. Я знаю, как использовать попарное сходство, моя проблема. Я...
148 просмотров
schedule
10.02.2023
Можно ли переобучить универсальный кодировщик предложений Google таким образом, чтобы он учитывал ключевые слова при кодировании предложений?
Я немного запутался в том, что означает установить trainable = True при загрузке универсального кодировщика предложений 3. У меня есть небольшой корпус (3000 различных предложений), для которого я хочу найти 10 наиболее похожих предложений. Мой...
955 просмотров
schedule
31.10.2022
Берт настроен на семантическое сходство
Я хотел бы применить точную настройку Берта для вычисления семантического сходства между предложениями. Я ищу на многих сайтах, но я почти не нашел об этом ниже по течению.
Я только что нашел тест STS . Интересно, могу ли я использовать набор...
2590 просмотров
schedule
23.06.2023
Какие дополнительные функции использовать помимо встраиваний Doc2Vec для схожести документов?
Итак, я делаю проект по подобию документов, и сейчас мои функции - это только вложения из Doc2Vec. Поскольку это не дает никаких хороших результатов после оптимизации гиперпараметров и встраивания слов перед встраиванием документа ... Какие еще...
409 просмотров
schedule
18.07.2022
Как извлечь предложения, имеющие схожее значение/намерение, по сравнению с примерным списком предложений
У меня есть взаимодействие в чате [Высказывания] между Клиентом и Консультантом, и я хотел бы знать, содержит ли взаимодействие консультанта определенные предложения или похожие предложения в приведенном ниже списке:
Примеры предложений, которые я...
388 просмотров
schedule
23.02.2022
Подсчет предложений с использованием NLTK (5400) и Spacy (5300) дает разные ответы. Нужно знать почему?
Я новичок в НЛП. Использование Spacy и NLTK для подсчета предложений из файла JSON, но есть большая разница в обоих ответах. Я думал, что ответы будут такими же. Кто-нибудь может мне это сказать ?? или любая веб-ссылка, которая поможет мне в этом....
54 просмотров
schedule
16.03.2023
Встраивание предложений BERT с использованием предварительно обученных моделей для неанглийского текста
Я пытаюсь применить BERT вложения предложений, чтобы найти похожие предложения для фрагмента текста на шведском языке из корпуса текстовых строк на шведском языке. Предложение BERT из предложения_преобразователи ( SBERT ) кажется идеальным...
768 просмотров
schedule
19.11.2022
эффективный алгоритм сравнения двух списков
Я строю матрицу подобия списка элементов. Наивный подход состоит в том, чтобы повторять список дважды, но это без необходимости будет сравнивать A:B и B:A, когда они одинаковы.
for A in items:
for B in items:
if A==B: continue...
67 просмотров
schedule
20.12.2022
как работает fuzzywuzzy python - когда между предложениями нет совпадающих слов?
Я использую fuzzywuzzy match, чтобы найти сходство между предложениями.
когда я сравниваю эти два предложения: «пользователь пытается войти в систему» и «критерии принятия»
fuzz.token_set_ratio («пользователь пытается войти в систему», «критерии...
42 просмотров
schedule
23.05.2024