Инвертированный индекс в поисковике

Я пытаюсь написать код, чтобы сделать небольшое приложение для поиска текста в файлах.

Файлы надо сканировать, а мне нужно поставить инвертированный индекс для ускорения поиска.

Моя проблема в том, что у меня есть идеи о том, каким должен быть синтаксический анализатор; Я готов реализовать И, НЕ или ИЛИ в запросе.

Принимая во внимание, что я не мог понять, каким должен быть мой индекс... Я никогда не создавал инвертированный индекс, поэтому, если кто-нибудь может предложить реальный способ сделать это, я был бы очень благодарен. Теоретически я знаю, как это работает, но моя проблема в том, что я совершенно не знаю, как это сделать в MySql. Мне также нужно придать индексируемым ключевым словам вес.


person Ayman    schedule 28.12.2009    source источник
comment
Нужно ли вам делать это вручную или вы можете использовать существующее решение, такое как Lucene (lucene.apache.org< /а>)?   -  person Kaleb Brasee    schedule 28.12.2009


Ответы (2)


Вот простая реализация. http://rosettacode.org/wiki/Inverted_Index

person Naveen    schedule 20.04.2010

Вариант 1: Apache Solr/Lucene. Вариант 2: поддержка полнотекстового индекса mysql.

person bmargulies    schedule 28.12.2009
comment
Вариант 3: MySQL или поток XML в сочетании со sphinx (sphinxsearch.com) - person chris; 26.12.2010