Я разрабатываю онлайн-программу поиска Библии. Библия — довольно большая книга, занимающая почти 5 МБ в текстовом виде. Я планирую внедрить API в программу, а также позволить другим веб-сайтам включать свои собственные виджеты и программы поиска Библии без необходимости разрабатывать поисковые запросы или хранить Библии на своих собственных серверах.
Имея это в виду, я собираюсь ожидать, что в конечном итоге у меня будет умеренный поток запросов, проходящих через программу. Так же для тех, кто не знаком с Библией, в ней есть 2 метода форматирования текста. Он может содержать как красный текст, так и курсив. Мне нужен способ хранить Священные Писания вместе с красными буквами и курсивом, но позволяющий поисковым запросам игнорировать форматирование.
Он также должен быть быстрым и максимально эффективным (использование памяти и процессора). Будет рассмотрен любой формат хранения (текстовые файлы MySQL, JSON или XML и т. д.), если запросы могут выполняться без учета форматирования. Размер и количество файлов на самом деле не имеют значения, поэтому разделение книг или даже глав на отдельные файлы меня устраивает.
Еще одна важная вещь, о которой следует помнить, это то, что я хочу иметь какой-то метод поиска, который может выполнять поиск по нескольким стихам. Таким образом, поиск «иметь жизнь вечную, ибо Бог не послал Своего Сына» вернет Иоанна 3:16,17. Спасибо за все идеи!