Я выполняю генерацию биграмм для слов чешского языка. Я могу генерировать биграммы с помощью Python. Проблема с неанглийскими символами в чешском языке.
Вход:
Республиканская стратегия защиты Обамы.
Выполнение Biggram, вывод
[['республики\xc3\xa1n', 'стратегии'], ['стратегии', 'за'], ['проти', 'зновозволен\xc3\xad'], ['зновопущен\xc3\xad' , 'Обами']]
Специальные буквы чешского языка преобразуются в биграммы как \xc3\xad. Какие изменения нужно внести в код, чтобы специальные буквы выводились правильно