1. Наполнители в понимании разговорной речи: вычислительная и психолингвистическая перспективы (arXiv)

Автор: Танви Динкар, Хлоя Клавель, Иоана Василеску.

Аннотация: Нарушения (т. е. перерывы в регулярном потоке речи) повсеместно распространены в устной речи. Наполнители («эм», «гм») — это дисфлюэнтности, которые встречаются чаще всего по сравнению с другими видами дисфлюэнций. Тем не менее, насколько нам известно, не существует ресурса, объединяющего точки зрения исследований, влияющих на понимание разговорной речи (SLU) на эти речевые события. Эта цель этой статьи состоит в том, чтобы рассмотреть широту взглядов целостным образом; то есть от рассмотрения лежащей в основе (психо)лингвистической теории до их аннотации и рассмотрения в системах автоматического распознавания речи (ASR) и SLU и, наконец, их изучения с точки зрения поколения. Цель этой статьи — представить перспективы в доступной форме для сообщества SLU и разговорного ИИ, а также обсудить продвижение вперед, то, что мы считаем тенденциями и проблемами в каждой области.

2. HIT-SCIR на MMNLU-22: регуляризация согласованности для понимания многоязычной разговорной речи (arXiv)

Автор: Бо Чжэн, Чжоуян Ли, Фусюань Вэй, Цигуан Чен, Либо Цинь, Ваньсян Че.

Аннотация: Понимание многоязычной разговорной речи (SLU) состоит из двух подзадач, а именно обнаружения намерений и заполнения слотов. Чтобы повысить производительность этих двух подзадач, мы предлагаем использовать регуляризацию согласованности на основе гибридной стратегии увеличения данных. Регуляризация непротиворечивости обеспечивает согласованность предсказанных распределений для примера и его семантически эквивалентной аугментации. Мы проводим эксперименты с набором данных MASSIVE как с полным набором данных, так и с настройками нулевого выстрела. Экспериментальные результаты показывают, что предложенный нами метод повышает производительность как в задачах обнаружения намерений, так и в задачах заполнения слотов. Наша система\footnote{Код будет доступен по адресу \url{https://github.com/bozheng-hit/MMNLU-22-HIT-SCIR}.} заняла 1-е место в конкурсе MMNLU-22 с полным набором данных. .