Правильно сохраненные слова с немецким умлаутом в личном словаре hunspell не распознаются как правильное написание emacs ispell или flyspell

У меня есть прекрасно работающая установка для hunspell с emacs (flyspell), использующая

("german”  "[[:alpha:]]" "[^[:alpha:]]" "[']" t ("-d" "de_DE_frami" ) nil utf-8)

как словарное определение для ispell-dictionary-alist.

Немецкие умлауты не проблема, если они содержатся в основном словаре «de_DE_frami». Однако, как только я помещаю слово с немецким умлаутом, например «Bestürzenste», в личный словарь hunspell, оно не признается правильным, тогда как все другие добавленные слова, которые не содержат немецкого умлаута, хорошо распознаются как правильные.

Вдобавок ко всему, если я проверю личный словарь hunspell, все слова появятся там в правильной кодировке utf8. Более того, hunspell, если он выполняется в командной строке с единственной опцией «-d de_DE_frami», распознает слова с умлаутом и, например, «Bestürzenste» считается правильным.

Так что я предполагаю, что проблема вызвана ispell или flyspell. Возможно, это ошибка, связанная только с поиском в личном словаре. У кого-нибудь была какая-то проблема? Есть ли обходной путь, который я не смог найти спустя несколько часов поиска в сети?

Спасибо за помощь здесь!

Кстати. Я также пробовал использовать кодировку iso-8859-1 вместо ut8 в приведенном выше определении dict --> не изменить.


person emelin    schedule 02.02.2014    source источник


Ответы (1)


У меня была аналогичная проблема с использованием hunspell в командной строке для создания списка слов с ошибками в текстовом файле с кодировкой utf-8: слова с умлаутом в основном словаре de_DE распознавались как правильные, но не в моем личном словаре.

Решением проблемы было наблюдение, что основной дикт был в кодировке latin1, персональный дикт в кодировке utf-8; поэтому я перекодировал свой личный dict на latin1, и все было в порядке.

Надеюсь это поможет.

person Klaus Horn    schedule 27.06.2014
comment
Спасибо за этот комментарий. Наконец, мне пришлось исправить hunspell, чтобы заставить его работать с utf-8 из-за этой (более или менее) известной ошибки: debbugs.gnu.org/cgi/bugreport.cgi?bug=7781#31 - person emelin; 29.06.2014