Наличие комбинации предварительно обученных и контролируемых встраиваний в конвейер rasa nlu

Я новичок в rasa и начал создавать чат-бота для конкретной предметной области. Как часть этого, я понимаю, что лучше использовать контролируемые вложения как часть конвейера nlu, поскольку мой вариант использования зависит от домена.

У меня есть пример намерения в моем nlu.md

## create_system_and_config
- create a [VM](system) of [12 GB](config) 

Если я попытаюсь использовать контролируемый featurizer, он может нормально работать с объектами, зависящими от моей предметной области, но меня беспокоит, что, используя только контролируемое обучение, не потеряем ли мы преимущество предварительно обученных моделей? Например, в таком запросе, как add a (some_system) of (some_config). add и create очень тесно связаны. предварительно обученные модели смогут легко выбирать такие глаголы. Возможно ли иметь комбинацию предварительно обученной модели, а затем проводить контролируемое обучение поверх нее в нашем конвейере nlu, что-то вроде трансферного обучения?


person cvg    schedule 01.09.2020    source источник


Ответы (1)


Если вы создаете чат-бота для конкретного домена, всегда лучше использовать контролируемое встраивание вместо предварительно обученного

Например, в общеанглийском языке слово «баланс» тесно связано с «симметрией», но сильно отличается от слова «наличные». В банковской сфере «баланс» и «денежные средства» тесно связаны, и вы хотите, чтобы ваша модель отражала это.

В вашем случае также

ваша модель должна уловить, что слова «виртуальная машина» и «виртуальная машина» совпадают. Предварительно обученные featurizers не обучены улавливать это, и они более общие.

Преимущество использования предварительно обученных встраиваний слов в вашем конвейере заключается в том, что если у вас есть обучающий пример, например: «Я хочу купить яблоки», и Раса просят предсказать намерение «получить груши», ваша модель уже знает, что слова «яблоки» и «груши» очень похожи. Это особенно полезно, если у вас недостаточно данных для обучения.

Для получения дополнительных сведений см. документ Rasa.

person Sociopath    schedule 01.09.2020
comment
Я согласен, что контролируемые лучше подходят для домена. Мне просто интересно, возможна ли комбинация? И разве в случае глаголов не помогут предварительно обученные вложения слов? - person cvg; 01.09.2020
comment
@cvg да, это возможно. Вам нужно изменить свой config.yml файл. Вы можете выбрать компоненты конвейеров в соответствии с вашим доменом / приложением - person Sociopath; 01.09.2020