Добавление совпадения префикса в pg_search

Я слежу за этим эпизодом Railscasts.

Если я ищу «Кербер», он возвращает правильную статью. Но если я ищу «Ке», он не возвращает ту же статью.

Есть способ исправить это?

class Item < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search, against: [:description, :about, :link, :twitterhandle, :builtby],
  using: {tsearch: {dictionary: "english"}}

  def self.text_search(query)
    if query.present?
      search(query)
    else
      scoped
    end
  end

Sullivan 21.04.2013 источник

Ответы (2)

arrow_upward
7
arrow_downward

Я автор и сопровождающий pg_search.

Вы можете добавить prefix: true в конфигурацию функции поиска :tsearch, чтобы pg_search автоматически добавлял :* в конец ваших запросов.

https://github.com/Casecommons/pg_search#prefix-postgresql-84-and-newer-only

class Item < ActiveRecord::Base
  include PgSearch
  pg_search_scope :search, against: [:description, :about, :link, :twitterhandle, :builtby],
  using: {tsearch: {prefix: true, dictionary: "english"}}

  def self.text_search(query)
    if query.present?
      search(query)
    else
      scoped
    end
  end
end

Grant Hutchins 23.04.2013

comment

Handy, спасибо, что следите за этим. Так много postgresql вопросов о стольких различных наборах инструментов, языках и т. д. ... не могут знать подробности о них всех. - Craig Ringer; 24.04.2013

arrow_upward
3
arrow_downward

Этот результат имеет смысл для меня. Ke и Kerber — разные слова, поэтому они не совпадают при полнотекстовом поиске.

Полнотекстовый поиск выполняет только выборку корней — удаление множественного числа и т. д., чтобы cats соответствовало cat. Даже это не совсем умно - нетипичные формы множественного числа, такие как dice, не обрабатываются. Это также работает только для слов, распознаваемых в словаре целевого языка, поэтому, даже если Kerber было множественным числом от Ke, оно не было бы ограничено, когда язык установлен на english.

См. tsquery и tsvectors:

regress=> SELECT to_tsvector('Kerber'), to_tsquery('Kerber'), to_tsvector('ke'), to_tsquery('ke');
 to_tsvector | to_tsquery | to_tsvector | to_tsquery 
-------------+------------+-------------+------------
 'kerber':1  | 'kerber'   | 'ke':1      | 'ke'
(1 row)

и совпадения:

regress=> SELECT to_tsvector('Kerber') @@ to_tsquery('Kerber'), to_tsvector('kerber') @@ to_tsquery('ke');
 ?column? | ?column? 
----------+----------
 t        | f                                                                                                                                                                  
(1 row)

Я подозреваю, что вам нужен префикс tsearch. Это выражается подстановочным знаком :*:

regress=> SELECT to_tsvector('kerber') @@ to_tsquery('ke:*');
 ?column? 
----------
 t
(1 row)

Это работает только для сопоставления префиксов. Это может повлиять на эффективность поиска, но я не думаю, что это серьезно.

Craig Ringer 21.04.2013

comment

Это именно то, что я имел в виду. Добавление Prefix Match в модель Items решило мою проблему. Большое спасибо! - Sullivan; 22.04.2013

Вопросы по теме

Как правильно переопределить недоступный HTML-контент с помощью CSS?
Emacs тормозит и создает 0-байтовые файлы в рабочем каталоге
Скрытое переполнение элементов с переменной высотой?
отправить электронное письмо в качестве параметра в URL-адресе в ошибке Rails
Ханойские башни с использованием списков Prolog
Хранение подписей в кодировке base64 в базе данных
Редактирование CSV-файла — удаление всей строки похожих значений на основе условия VIA Powershell
Как начать новый подсчет, когда значение категориальной переменной изменилось в R
Настройте параметры прокси-сервера HTTP в инструменте командной строки Android
Разбор кода JavaScript в модуле Node.js
Почему в С++ возврат указателя частной переменной разных объектов приводит к ошибке сегментации?
Рассчитать минимальное, максимальное и среднее значение в столбце данных
Как применить несколько фильтров в таблице данных угловых материалов?
Конфигурация конкретного узла в JBoss Clustering
Подчеркивания не считываются компонентом сценария в службах интеграции Microsoft
как настроить struts2 с помощью tomcat и apache с mod_jk?
Как использовать REST API RSA Archer для получения отчета?
JMH: не учитывать время внутреннего метода
Время жизни временного объекта, связанного с константной ссылкой (цепочка методов)
фильтр сканирования по подстроке