Вопросы по теме 'sentence-similarity'

Как рассчитать семантическое сходство слов в двух строках с помощью алгоритма пути WordNet
У меня есть одна строка слов, скажем, s1. У меня также есть несколько строк в другом наборе, например, s2, s3, s4. Я хочу сопоставить слова в строке s1 с каждой из строк s2, s3 и так далее. Основываясь на максимальной оценке сходства, я хочу...
1116 просмотров

Как перейти от сходства слов к общему сходству предложений
Я реализовал метод подобия предложений, используя WS4J. Я читал о сходстве предложений в статьях, основанных на сходстве слов в двух предложениях. Но я не смог найти метод, который вычисляет и возвращает одно значение общего сходства предложений...
893 просмотров

Нахождение семантической связности между предложениями в тексте
Мне нужна помощь в написании программы на основе кода из этих ссылок ссылка1 и ссылка2 , который автоматически рассчитает семантическое сходство между a. Последовательные предложения и б. Предложения разделяются 1 промежуточной фразой в целом...
845 просмотров

Подобие группы текстовых документов
Я ищу алгоритм, который пытается проверить 1) сходство предложений (около 5000) друг с другом в документе 2) сходство нескольких документов (около 5000) по отношению друг к другу Мне нужно то же самое, потому что я пытаюсь оценить, похожи ли...
367 просмотров

Сиамская сеть с LSTM для схожести предложений в Керасе периодически дает один и тот же результат
Я новичок в Керасе, и я пытаюсь решить задачу подобия предложений, используя NN в Керасе. Я использую word2vec для встраивания слов, а затем Siamese Network, чтобы предсказать, насколько похожи два предложения. Базовая сеть для сиамской сети - это...
3377 просмотров

НЛП - Как определить, относятся ли 2 текста к одному и тому же объекту
Я ищу некоторые общие рекомендации здесь. Вариант использования высокого уровня таков, что я получаю некоторые документы продукта, из которых мне нужно извлечь некоторую информацию и обработать ее. Прежде чем сделать это, мне нужно убедиться,...
115 просмотров

TypeError: массив аргументов выборки имеет недопустимый тип numpy.ndarray, должен быть строкой или тензором. (Невозможно преобразовать ndarray в тензор или операцию.)
Я пытаюсь воспроизвести результаты в siaseme LSTM, чтобы сравнить семантическое сходство двух предложений отсюда: - https://github.com/dhwajraj/deep-siamese-text-similarity Я использую tenorflow 1.4 и python 2.7 Train.py работает правильно....
4994 просмотров

Подходы к текстовому сходству не отражают реального сходства между текстами.
Я сравниваю содержание резюме (файлы .txt с уже удаленными стоп-словами) с действительно компактными описаниями должностей (JD), например: управление проектами, лидерство, продажи, SAP, маркетинг В резюме около 600 слов, а в JD — только...
309 просмотров

Как найти похожий текст в большой строке?
У меня есть большая нить ул и игла ндл. Теперь мне нужно найти аналогичный текст ndl из строки str. Например, ИСТОЧНИК: «Это демонстрационный текст, и я люблю вас за это». ИГЛА: "Я тебя люблю" ВЫВОД: «Я люблю тебя»...
306 просмотров

оценка сходства между фразами
Расстояние Левенштейна — это подход к измерению разницы между словами, но не для фраз. Существует ли хорошая метрика расстояния для измерения различий между фразами? Например, если фраза 1 состоит из n слов x1 x2 x_n, а фраза 2 состоит из m слов...
334 просмотров

Как найти сходство текста среди миллионов записей?
Используя Spacy, чтобы найти сходство в нескольких текстах, теперь я пытаюсь найти похожие тексты в миллионах записей (мгновенно). У меня есть приложение с миллионами текстов, и я хотел бы предоставить пользователю похожие тексты, если они...
168 просмотров

вычисление семантического сходства между наборами предложений
У меня есть два набора коротких сообщений, я хочу вычислить сходство между этими двумя наборами и определить, говорят ли они об одной и той же подтеме, на основе их семантического сходства. Я знаю, как использовать попарное сходство, моя проблема. Я...
148 просмотров

Можно ли переобучить универсальный кодировщик предложений Google таким образом, чтобы он учитывал ключевые слова при кодировании предложений?
Я немного запутался в том, что означает установить trainable = True при загрузке универсального кодировщика предложений 3. У меня есть небольшой корпус (3000 различных предложений), для которого я хочу найти 10 наиболее похожих предложений. Мой...
955 просмотров

Берт настроен на семантическое сходство
Я хотел бы применить точную настройку Берта для вычисления семантического сходства между предложениями. Я ищу на многих сайтах, но я почти не нашел об этом ниже по течению. Я только что нашел тест STS . Интересно, могу ли я использовать набор...
2590 просмотров

Какие дополнительные функции использовать помимо встраиваний Doc2Vec для схожести документов?
Итак, я делаю проект по подобию документов, и сейчас мои функции - это только вложения из Doc2Vec. Поскольку это не дает никаких хороших результатов после оптимизации гиперпараметров и встраивания слов перед встраиванием документа ... Какие еще...
409 просмотров

Как извлечь предложения, имеющие схожее значение/намерение, по сравнению с примерным списком предложений
У меня есть взаимодействие в чате [Высказывания] между Клиентом и Консультантом, и я хотел бы знать, содержит ли взаимодействие консультанта определенные предложения или похожие предложения в приведенном ниже списке: Примеры предложений, которые я...
388 просмотров

Подсчет предложений с использованием NLTK (5400) и Spacy (5300) дает разные ответы. Нужно знать почему?
Я новичок в НЛП. Использование Spacy и NLTK для подсчета предложений из файла JSON, но есть большая разница в обоих ответах. Я думал, что ответы будут такими же. Кто-нибудь может мне это сказать ?? или любая веб-ссылка, которая поможет мне в этом....
54 просмотров
schedule 16.03.2023

Встраивание предложений BERT с использованием предварительно обученных моделей для неанглийского текста
Я пытаюсь применить BERT вложения предложений, чтобы найти похожие предложения для фрагмента текста на шведском языке из корпуса текстовых строк на шведском языке. Предложение BERT из предложения_преобразователи ( SBERT ) кажется идеальным...
768 просмотров

эффективный алгоритм сравнения двух списков
Я строю матрицу подобия списка элементов. Наивный подход состоит в том, чтобы повторять список дважды, но это без необходимости будет сравнивать A:B и B:A, когда они одинаковы. for A in items: for B in items: if A==B: continue...
67 просмотров

как работает fuzzywuzzy python - когда между предложениями нет совпадающих слов?
Я использую fuzzywuzzy match, чтобы найти сходство между предложениями. когда я сравниваю эти два предложения: «пользователь пытается войти в систему» ​​и «критерии принятия» fuzz.token_set_ratio («пользователь пытается войти в систему», «критерии...
42 просмотров