Я смотрю на получение неструктурированных данных в виде файлов, их обработку и сохранение в database
для поиска. Данные будут на естественном языке, и запросы для получения информации также будут на естественном языке. Пример: данные могут быть "Розы красные", а запрос может быть "Какого цвета роза?"
Я просмотрел несколько nlp
систем, сосредоточившись больше на open-source
системе извлечения информации и извлечении отношений, и следующее кажется подходящим и простым для быстрого старта: https://www.npmjs.com/package/mitie
Это может дать данные в виде пар (слово, тип). Это также дает отношение в результате выполнения обработки (см. Пример сайта).
Я хочу знать, подходит ли sql
database
для сохранения этой информации. Для извлечения информации мне нужно будет также преобразовать запрос на естественном языке в какие-то пары (слово, значение), а для использования sql
мне придется написать слой, который преобразует естественный язык в sql
запросы.
Пожалуйста, предложите, есть ли какие-либо программы с открытым исходным кодом database
, которые хорошо работают в этой ситуации. Я открыт для предложений по базам данных, которые работают с другими open-source
системами извлечения информации и извлечения отношений, если не с MITIE.