Публикации по теме 'similarity'
Trendyol Search: за коробкой
Алгоритмы и стратегии
Когда вы заходите в любое из приложений Trendyol в качестве пользователя, вы видите простое текстовое поле, которое можно рассматривать как ворота, позволяющие получить доступ к продуктам, которые вас больше всего интересуют. Вы вводите ключевое слово, а затем просматриваете страницу, полную продуктов, как показано на рисунке ниже.
Как команда Search & Smartlisting, мы - команда, главная цель которой - сделать пользователей счастливыми, перечисляя для них..
Руководство для начинающих по сопоставлению схожести с помощью spaCy
Использование spaCy и Python для обнаружения сходства между предложениями
В этом разделе описаны основные шаги по определению сходства между двумя предложениями с использованием модуля обработки естественного языка под названием spaCy. Следующее руководство основано на реализации Python. Это особенно полезно для сопоставления вводимых пользователем данных с доступными вопросами для FAQ-бота.
Учитывая следующие предложения:
Как мне вступить в гильдию? Как мне добавить друзей?..
Пересмотренный индекс подобия
Часть 5 из 5: Пересмотр концепции индекса сходства и введение нового игрока.
Отношения состоят из двух вещей. Во-первых, ценить сходство и, во-вторых, уважать различия
Индексы подобия и их свойства инвариантности
Для обученной нейронной сети матрицу активаций M можно записать в виде:
где s — количество примеров, использованных для обучения m нейронов.
Индекс сходства s(X, Y) , таким образом, будет относиться к двум матрицам активации X и Y , где X содержит активации..
Вопросы по теме 'similarity'
Текстовые нарушения
Кто-нибудь знает о библиотеке или программном обеспечении, которое обнаружит неточности в тексте? Например, допустим, у меня есть ...
1. Name 1, Comment
2. Name 2, Comment
3. Name 3 , Comment
5. Name 10, Comment
Это программное обеспечение...
134 просмотров
schedule
06.05.2022
Вычисление схожести двоичных данных
Я видел здесь несколько вопросов, связанных с определением сходства файлов, но все они связаны с определенной областью (изображения, звуки, текст и т. Д.). Методы, предлагаемые в качестве решений, требуют знания основного формата сравниваемых файлов....
10582 просмотров
schedule
17.10.2022
Алгоритм сходства (по теме) новостей
Я хочу определить сходство содержания двух новостей, похожих на новости Google, но разных в том смысле, что я хочу иметь возможность определить, каковы основные темы, а затем определить, какие темы связаны.
Итак, если статья была о Саддаме Хусейне,...
1757 просмотров
schedule
28.03.2023
Подобие косинуса против расстояния Хэмминга
Чтобы вычислить сходство между двумя документами, я создаю вектор признаков, содержащий термин частоты. Но затем, для следующего шага, я не могу выбрать между " подобие косинуса " и " Расстояние Хэмминга ".
Мой вопрос: есть ли у вас опыт работы с...
13737 просмотров
schedule
05.04.2023
Найдите сходство двух векторных фигур
Поиск любой информации/алгоритмов, касающихся сравнения векторной графики. Например. скажем, есть две точечные коллекции или векторные файлы с двумя почти одинаковыми фигурами. Я хочу определить, что первая цифра примерно на 90% похожа на вторую.
2826 просмотров
schedule
07.07.2022
Пакет для сравнения LSA, TFIDF, косинусных метрик и языковых моделей
Я ищу пакет (на самом деле, на любом языке), который я могу использовать в корпусе из 50 документов для выполнения проверки сходства между документами по различным показателям, таким как tfidf, okapi, языковые модели, lsa и т. д.
В результате я...
839 просмотров
schedule
16.06.2022
сходство tf idf
Я использую TF/IDF для вычисления сходства. Например, если у меня есть следующие два файла doc.
Doc A => cat dog
Doc B => dog sparrow
Это нормально, что сходство составляет 50%, но когда я вычисляю его TF/IDF. Это следующее...
5844 просмотров
schedule
07.01.2023
Подходящие метрики сходства для нескольких наборов 2D-координат
У меня есть коллекция наборов 2D-координат (в масштабе 100–500 000 точек в каждом наборе), и я ищу наиболее эффективный способ измерить сходство одного набора с другим. Я знаю обычные: косинус, Жаккард/Танимото и т. д. Однако я надеюсь на некоторые...
1816 просмотров
schedule
04.06.2023
Как эффективно внедрить систему поиска по сходству документов?
Как реализовать систему «похожих товаров» для товаров, описываемых набором тегов?
В моей базе данных есть три таблицы: Article, ArticleTag и Tag. Каждая статья связана с рядом тегов отношением «многие ко многим». Для каждой статьи я хочу найти...
2494 просмотров
schedule
25.03.2024
о косинусном подобии
Я нахожу косинусное сходство между документами .. Я сделал это вот так
D1 = (8,0,0,1), где 8,0,0,1 - оценки tf-idf терминов t1, t2, t3, t4
D2=(7,0,0,1)
cos (тета) = (56 + 0 + 0 + 1) / sqrt (64 + 49) sqrt (1 +1)
что оказывается
соз...
1352 просмотров
schedule
25.12.2023
Поиск ближайшего совпадения
У меня есть объект с набором параметров, например:
var obj = new {Param1 = 100; Param2 = 212; Param3 = 311; param4 = 11; Param5 = 290;}
С другой стороны у меня есть список объектов:
var obj1 = new {Param1 = 1221 ; Param2 = 212 ; Param3 =...
5175 просмотров
schedule
16.08.2022
Что такое статья Oliver [1993], описывающая PHP-алгоритм для вычисления сходства текста?
В библиотеке PHP есть функция Similar_text(). Документация ( http://php.net/manual/en/function.similar-text.php ) говорит мне, что «это вычисляет сходство между двумя строками, как описано в Oliver [1993]».
Несмотря на обширные поиски, я не могу...
5387 просмотров
schedule
09.04.2022
Найти похожий символ ASCII в Unicode
Кто-нибудь знает простой способ найти символы в Unicode, похожие на символы ASCII. Примером может служить " СТРОЧНАЯ КИРИЛЛИЧНАЯ БУКВА DZE (ѕ)" . Я хотел бы выполнить поиск и заменить похожие символы. Под подобным я подразумеваю удобочитаемый для...
5991 просмотров
schedule
06.04.2022
Скорректированное косинусное сходство
Я пытаюсь закодировать скорректированное косинусное сходство в PHP.
Я построил свои данные следующим образом:
$data[UserID][ItemID] = Rating
пример данных:
$data[1][1] = 5;
$data[1][2] = 3;
$data[1][3] = 4;
$data[2][1] = 3;...
2700 просмотров
schedule
07.11.2023
Вычисление сходства между нарисованными линиями
Мне нужен алгоритм для численного вычисления степени сходства между двумя нарисованными линиями. Линии рисуются с помощью мыши и сохраняются в виде набора декартовых координат перед фильтрацией и сглаживанием с использованием отдельных алгоритмов....
4194 просмотров
schedule
29.11.2022
Сходство предложений n-граммов с измерением сходства косинусом
Я работал над проектом о схожести предложений. Я знаю, что об этом много раз спрашивали в SO, но я просто хочу знать, может ли моя проблема быть решена с помощью метода, который я использую тем, как я это делаю, или я должен изменить свой подход к...
7789 просмотров
schedule
25.07.2022
Как создать матрицу подобия в MATLAB?
Я работаю над сравнением нескольких изображений. У меня есть эти данные изображения в виде векторов-столбцов матрицы, называемой «изображения». Я хочу оценить сходство изображений, сначала вычислив их евклидово расстояние. Затем я хочу создать...
8340 просмотров
schedule
04.03.2023
Как обнаружить похожие изображения в PHP?
У меня есть много файлов с одним и тем же изображением в разном разрешении, подходящих для всех устройств, таких как мобильный телефон, компьютер, psp и т. Д. Теперь я пытаюсь отображать на странице только уникальные изображения, но не знаю, как это...
9641 просмотров
schedule
19.03.2022
Технология поиска python: сходство слов
Я хочу получить процент схожести двух слов, например)
abcd versus zzabcdzz == 50% similarity
Не нужно быть очень точным. Есть ли способ сделать это? Я использую Python, но не стесняйтесь рекомендовать другие языки.
2955 просмотров
schedule
07.07.2022
Сходство Wordnet в Java: JAWS, JWNL или Java WN::Similarity?
Мне нужно использовать Wordnet в приложении на основе Java. Я бы хотел:
поиск синсетов
найти сходство/родство между синсетами
В моем приложении используются графики RDF, и я знаю, что есть конечные точки SPARQL с Wordnet, но я думаю,...
16719 просмотров
schedule
18.06.2023