Как измерить расстояние между вектором Фишера для поиска изображений?

Я читал кое-что о Fisher Vector и все еще учусь. Это лучшее представление, чем классическое представление BoF, использующее GMM (или k-средних, даже если это обычно называют VLAD).

Однако я видел, что обычно они используются для задач классификации, например, с SVM.

Но как насчет поиска изображений? Я видел, что они также использовались для поиска изображений (здесь), но я не понимаю одного момента: учитывая два FV, представляющих 2 изображения, как мы вычисляем их расстояния и, следовательно, «насколько похожи два изображения?»

Разумно ли использовать их в таком контексте?


person justHelloWorld    schedule 27.06.2016    source источник
comment
Обратите внимание, что для доступа к документу требуется регистрация — мягкое требование, но все же неожиданное.   -  person Prune    schedule 27.06.2016


Ответы (1)


Как видно из двух статей ниже, евклидово расстояние кажется наиболее популярным. Есть также ссылки на использование скалярного произведения в качестве меры подобия; косинусное сходство (тесно связанное) — обычно популярная метрика сходства ML.

http://link.springer.com/article/10.1007/s11263-013-0636-x

http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf

Достаточно ли этого, чтобы позволить вам выбрать то, что соответствует вашим потребностям?

person Prune    schedule 27.06.2016
comment
Большое спасибо, это определенно то, что соответствует моим потребностям :) Поскольку я реализую общую структуру, в которой приближенные похожие элементы находятся через LSH, вы думаете, что это приемлемое решение для поиска похожих FV? Обычно я знаю, что используется инвертированный индекс, но здесь я использую не более 50 000 МОЖЕТ БЫТЬ 100 000 изображений, а не 100 М, как в статьях, где описаны эти решения. - person justHelloWorld; 27.06.2016
comment
В частности, согласно вашему ответу, современный FALCONN, предназначенный для косинусного сходства и расстояний L2, был бы идеальным. - person justHelloWorld; 27.06.2016
comment
Да. Поскольку LSH специально сохраняет чувство подобия, любой из простых методов должен сослужить вам хорошую службу. На самом деле, поскольку у вас так мало изображений (по моим меркам :-)), вы можете попробовать и косинус, и L2; сравните результаты и посмотрите, что вам больше подходит. - person Prune; 28.06.2016