Публикации по тегам sentence-similarity [path, algorithm, sentence-similarity, wordnet, java]

Вопросы по теме 'sentence-similarity'

Как рассчитать семантическое сходство слов в двух строках с помощью алгоритма пути WordNet

У меня есть одна строка слов, скажем, s1. У меня также есть несколько строк в другом наборе, например, s2, s3, s4. Я хочу сопоставить слова в строке s1 с каждой из строк s2, s3 и так далее. Основываясь на максимальной оценке сходства, я хочу...

1116 просмотров

27.09.2023

Как перейти от сходства слов к общему сходству предложений

Я реализовал метод подобия предложений, используя WS4J. Я читал о сходстве предложений в статьях, основанных на сходстве слов в двух предложениях. Но я не смог найти метод, который вычисляет и возвращает одно значение общего сходства предложений...

893 просмотров

java stanford-nlp sentence-similarity wordnet ws4j

03.06.2022

Нахождение семантической связности между предложениями в тексте

Мне нужна помощь в написании программы на основе кода из этих ссылок ссылка1 и ссылка2 , который автоматически рассчитает семантическое сходство между a. Последовательные предложения и б. Предложения разделяются 1 промежуточной фразой в целом...

845 просмотров

python vector sentence-similarity tf-idf latent-semantic-analysis

10.11.2022

Подобие группы текстовых документов

Я ищу алгоритм, который пытается проверить 1) сходство предложений (около 5000) друг с другом в документе 2) сходство нескольких документов (около 5000) по отношению друг к другу Мне нужно то же самое, потому что я пытаюсь оценить, похожи ли...

367 просмотров

text-mining sentence-similarity data-mining

24.05.2022

Сиамская сеть с LSTM для схожести предложений в Керасе периодически дает один и тот же результат

Я новичок в Керасе, и я пытаюсь решить задачу подобия предложений, используя NN в Керасе. Я использую word2vec для встраивания слов, а затем Siamese Network, чтобы предсказать, насколько похожи два предложения. Базовая сеть для сиамской сети - это...

3377 просмотров

python-3.x keras lstm word2vec sentence-similarity

06.05.2022

НЛП - Как определить, относятся ли 2 текста к одному и тому же объекту

Я ищу некоторые общие рекомендации здесь. Вариант использования высокого уровня таков, что я получаю некоторые документы продукта, из которых мне нужно извлечь некоторую информацию и обработать ее. Прежде чем сделать это, мне нужно убедиться,...

115 просмотров

nlp sentence-similarity similarity semantics

09.05.2023

TypeError: массив аргументов выборки имеет недопустимый тип numpy.ndarray, должен быть строкой или тензором. (Невозможно преобразовать ndarray в тензор или операцию.)

Я пытаюсь воспроизвести результаты в siaseme LSTM, чтобы сравнить семантическое сходство двух предложений отсюда: - https://github.com/dhwajraj/deep-siamese-text-similarity Я использую tenorflow 1.4 и python 2.7 Train.py работает правильно....

4994 просмотров

python tensorflow lstm sentence-similarity

05.02.2023

Подходы к текстовому сходству не отражают реального сходства между текстами.

Я сравниваю содержание резюме (файлы .txt с уже удаленными стоп-словами) с действительно компактными описаниями должностей (JD), например: управление проектами, лидерство, продажи, SAP, маркетинг В резюме около 600 слов, а в JD — только...

309 просмотров

python nlp text-mining sentence-similarity similarity

30.08.2023

Как найти похожий текст в большой строке?

У меня есть большая нить ул и игла ндл. Теперь мне нужно найти аналогичный текст ndl из строки str. Например, ИСТОЧНИК: «Это демонстрационный текст, и я люблю вас за это». ИГЛА: "Я тебя люблю" ВЫВОД: «Я люблю тебя»...

306 просмотров

php string sentence-similarity similarity

27.09.2022

оценка сходства между фразами

Расстояние Левенштейна — это подход к измерению разницы между словами, но не для фраз. Существует ли хорошая метрика расстояния для измерения различий между фразами? Например, если фраза 1 состоит из n слов x1 x2 x_n, а фраза 2 состоит из m слов...

334 просмотров

python sentence-similarity similarity levenshtein-distance

10.11.2022

Как найти сходство текста среди миллионов записей?

Используя Spacy, чтобы найти сходство в нескольких текстах, теперь я пытаюсь найти похожие тексты в миллионах записей (мгновенно). У меня есть приложение с миллионами текстов, и я хотел бы предоставить пользователю похожие тексты, если они...

168 просмотров

python-3.x python machine-learning spacy sentence-similarity

17.09.2022

вычисление семантического сходства между наборами предложений

У меня есть два набора коротких сообщений, я хочу вычислить сходство между этими двумя наборами и определить, говорят ли они об одной и той же подтеме, на основе их семантического сходства. Я знаю, как использовать попарное сходство, моя проблема. Я...

148 просмотров

nlp word2vec cosine-similarity sentence-similarity tf-idf

10.02.2023

Можно ли переобучить универсальный кодировщик предложений Google таким образом, чтобы он учитывал ключевые слова при кодировании предложений?

Я немного запутался в том, что означает установить trainable = True при загрузке универсального кодировщика предложений 3. У меня есть небольшой корпус (3000 различных предложений), для которого я хочу найти 10 наиболее похожих предложений. Мой...

955 просмотров

python nlp sentence-similarity tensorflow-hub

31.10.2022

Берт настроен на семантическое сходство

Я хотел бы применить точную настройку Берта для вычисления семантического сходства между предложениями. Я ищу на многих сайтах, но я почти не нашел об этом ниже по течению. Я только что нашел тест STS . Интересно, могу ли я использовать набор...

2590 просмотров

nlp cosine-similarity sentence-similarity pearson-correlation

23.06.2023

Какие дополнительные функции использовать помимо встраиваний Doc2Vec для схожести документов?

Итак, я делаю проект по подобию документов, и сейчас мои функции - это только вложения из Doc2Vec. Поскольку это не дает никаких хороших результатов после оптимизации гиперпараметров и встраивания слов перед встраиванием документа ... Какие еще...

409 просмотров

nlp data-science sentence-similarity doc2vec

18.07.2022

Как извлечь предложения, имеющие схожее значение/намерение, по сравнению с примерным списком предложений

У меня есть взаимодействие в чате [Высказывания] между Клиентом и Консультантом, и я хотел бы знать, содержит ли взаимодействие консультанта определенные предложения или похожие предложения в приведенном ниже списке: Примеры предложений, которые я...

388 просмотров

python-3.x nlp gensim sentence-similarity doc2vec

23.02.2022

Подсчет предложений с использованием NLTK (5400) и Spacy (5300) дает разные ответы. Нужно знать почему?

Я новичок в НЛП. Использование Spacy и NLTK для подсчета предложений из файла JSON, но есть большая разница в обоих ответах. Я думал, что ответы будут такими же. Кто-нибудь может мне это сказать ?? или любая веб-ссылка, которая поможет мне в этом....

54 просмотров

python nlp spacy nltk sentence-similarity

16.03.2023

Встраивание предложений BERT с использованием предварительно обученных моделей для неанглийского текста

Я пытаюсь применить BERT вложения предложений, чтобы найти похожие предложения для фрагмента текста на шведском языке из корпуса текстовых строк на шведском языке. Предложение BERT из предложения_преобразователи ( SBERT ) кажется идеальным...

768 просмотров

python nlp bert-language-model cosine-similarity sentence-similarity

19.11.2022

эффективный алгоритм сравнения двух списков

Я строю матрицу подобия списка элементов. Наивный подход состоит в том, чтобы повторять список дважды, но это без необходимости будет сравнивать A:B и B:A, когда они одинаковы. for A in items: for B in items: if A==B: continue...

67 просмотров

python sorting algorithm matrix sentence-similarity

20.12.2022

как работает fuzzywuzzy python - когда между предложениями нет совпадающих слов?

Я использую fuzzywuzzy match, чтобы найти сходство между предложениями. когда я сравниваю эти два предложения: «пользователь пытается войти в систему» и «критерии принятия» fuzz.token_set_ratio («пользователь пытается войти в систему», «критерии...

42 просмотров

python nlp sentence-similarity fuzzywuzzy

23.05.2024