Публикации по тегам similarity-search

Публикации по теме 'similarity-search'

Алгоритмы фонетического сопоставления

Давайте сразу перейдем к вопросу: у вас есть бизнес-задача сопоставить похожие строковые значения. Алгоритм фонетического сопоставления может помочь вам в этом, однако с некоторыми ограничениями: они основаны на произношении и не нацелены на предоставление вам соответствующей оценки. Следовательно, что вам нужно сделать, так это применить алгоритм, а затем вычислить некоторую оценку соответствия для остатков (элементы без 100% совпадения). Это краткое изложение охватывает только обзор..

Представляем Quaterion: платформу для тонкой настройки моделей обучения по сходству

Мы рады поделиться результатом работы, которой мы занимались в течение последних месяцев — Quaterion . Это платформа для точной настройки моделей обучения на основе подобия, которая оптимизирует процесс обучения, делая его значительно быстрее и экономичнее. Для разработки Quaterion мы использовали PyTorch Lightning, применяя высокоэффективный подход к исследованию ИИ для создания обучающих циклов для моделей машинного обучения. Эта структура расширяет возможности векторного поиска..

FAISS: краткое руководство по эффективному поиску сходства

Эффективный поиск сходства для крупномасштабного набора векторов Введение Если вы занимаетесь машинным обучением или специалистом по данным, то чаще всего сталкиваетесь с ситуацией, когда требуется кластеризация и/или поиск в большом массиве многомерных числовых векторов. Например, элементом из такого набора векторов может быть числовое представление изображения, его скрытое представление, сгенерированное нейронной сетью, или любое другое вложение. FAISS — отличная библиотека с открытым..

Как найти сходство между элементами в ваших данных

Как найти сходство между элементами в ваших данных ( Статья 1 из 2 ) Многие задачи интеллектуального анализа данных включают поиск похожих элементов в наборе данных. Под термином «данные» я подразумеваю точки данных с реальными значениями, категориальные данные или текстовые данные (в задачах НЛП). Есть несколько способов, с помощью которых мы можем справиться с этой задачей подобия. Эти методы можно использовать в соответствии с потребностями вашего приложения и данными, с..

Система поиска сходства для миллионов математических задач

Для всех разработчиков, деловых людей, технологических компаний, которым интересно, как снизить затраты в задачах, где бизнес-процесс требует ручной обработки различных документов или изображений, и для тех, кто ищет ответ на вопрос, как быстро и легко создайте свою собственную поисковую систему на основе текста , тогда это то, что вам нужно. В Photomath у нас была одна проблема оптимизации, которую мы решили с помощью одной такой подходящей поисковой системы по сходству...

Максимальный внутренний поиск продукта с использованием алгоритмов поиска ближайшего соседа

Максимальный внутренний поиск продукта с использованием алгоритмов поиска ближайшего соседа Простое сокращение, которое позволяет использовать библиотеки для поиска ближайшего соседа для эффективного обнаружения векторов с большим внутренним произведением Мотивация Поиск ближайшего соседа - одна из самых фундаментальных проблем в науке о данных. Приложения варьируются от сегментации пользователей до обнаружения почти дублированных данных. Неудивительно, что большинство языков..

Потоковый поиск сходства для обнаружения мошенничества

Введение Плохие актеры в Интернете часто притворяются тем, кем они не являются. Но если внимательно присмотреться к их действиям, можно увидеть, кто они на самом деле. В Smyte мы стремимся определить, кто эти злоумышленники, и остановить их, прежде, чем они смогут причинить вам или вашей компании значительный вред. В этом кратком посте мы исследуем один из этих методов: поиск по сходству. Проблема В Интернете существует большое количество псевдонимов злоумышленников, но..