Чат-бот для использования PDF-документов в качестве источника

Я собираюсь создать простого чат-бота, который может использовать PDF-файл в качестве источника. Например, входными данными для чат-бота может быть документ условий и положений банка, и чат-бот будет отвечать на вопрос, связанный с содержанием документа.

Примеры вопросов и ответов. В: Какова моя ежемесячная плата за мой сберегательный счет? О: Ваша ежемесячная плата за сберегательный счет составляет 5 долларов США, если сумма депозита не превышает 2000 долларов США, в противном случае - бесплатно.

Я использовал pdfminer для чтения PDF-документа и преобразования его в обработанные данные и spaCy для определения NER, POS и т. Д.

Я узнал о RASA, и все ссылки, которые я видел, используют определенный текстовый ответ и не используют какой-либо PDF-документ в качестве источника.

Может ли кто-нибудь дать какие-либо рекомендации относительно того, какой подход я могу использовать?

Я не хочу использовать Dialogflow или Lex и хочу быть в мире открытого исходного кода.


person Ashok KS    schedule 19.09.2019    source источник
comment
Это долгий процесс. Вам нужно будет выбросить и нормализовать эти документы. Вам также может потребоваться применить некоторый информационный процесс.   -  person tumbleweed    schedule 16.06.2020


Ответы (1)


То, что вы ищете, - это задача Ответ на вопрос, которую традиционно можно решить с помощью глубокого обучения. В Rasa вы можете в основном генерировать выходной текст на основе намерений из таблицы поиска. Но чтобы найти ответ на вопрос, вам потребуется дополнительная обработка.

Если вы ищете вопрос-ответ как услугу, вы можете взглянуть на QnA Maker и посмотрите это ветка, в которой также обсуждались другие подходы.

person Touhidul Alam    schedule 19.09.2019