Преобразовать французский в ASCII (требуются франкоговорящие)

Мне нужно преобразовать французский текст в наиболее правильный аналог в ASCII. Позволь мне объяснить. В немецком надо конвертировать ä в ae, это не просто удаление диакритических знаков, это поиск наиболее правильного аналога. Помогите пожалуйста с французским. Я обнаружил, что нет программного способа сделать это, я создаю Dictionary<char, string>.

Преобразовать (+ прописные): é, à, è, ù, â, ê, î, ô, û, ë, ï, ü, ÿ, ç. и любой другой вы предлагаете! Пожалуйста, напишите предлагаемую замену в ascii.

Спасибо, Андрей.

PS: Пожалуйста, не указывайте на Как сделать Я удаляю диакритические знаки (ударения) из строки в .NET?. Этот метод великолепен, но немного не зависит от языка. Он просто удаляет диакритические знаки. Планирую использовать по умолчанию, если не будет хорошего аналога.

PPS: Пожалуйста, не закрывайте вопрос, он связан с программированием, так как я реализую многоязычное приложение


person Andrey    schedule 12.04.2010    source источник
comment
Когда stackoverflow стал механическим турком?   -  person Jason Punyon    schedule 13.04.2010
comment
ну, когда я ответил на вопрос об изменении часовых поясов в России, я не ошибся.   -  person Andrey    schedule 13.04.2010
comment
Я не могу ответить на вопрос о кодировке, но у вас есть один символ, который не является французским ( ÿ ), и отсутствуют два: æ, œ   -  person lkl    schedule 07.03.2014


Ответы (2)


Насколько мне известно, когда во французском языке нет акцентов (например, при преобразовании в ASCII), вы просто вводите эквивалентный символ ASCII (в отличие от немецкого, где вы можете добавить букву e после гласной с умляутом). Только из-за акцентов, которые вы указали, я никогда не видел, чтобы ÿ использовалось во французском языке. Не забывайте æ и œ.

person Cooper6581    schedule 12.04.2010
comment
æ переходит в ae, œ в oe. Как вы думаете, в случае акцентов (é, à, è, ù) я могу просто их убрать? Я хочу быть максимально удобным для пользователя. - person Andrey; 13.04.2010
comment
Да, мы бы так и сделали по-французски: просто сняли ударения, лучшего аналога не найти. - person Thomas Levesque; 13.04.2010

Обычно, когда акценты недоступны, мы их просто не пишем.

Если вы хотите сохранить информацию, вам нужно использовать какую-то кодировку, чтобы указать, какой набор символов используется, и использовать больше, чем ascii (то есть использовать символы от 128 до 255 набора символов).

в качестве альтернативы вы можете кодировать в своей собственной форме. У Sparcstations был способ ввода символов с диакритическими знаками:

à = \a`
â = \a^
ç = \c,
é = \e'
ë = \e"
etc.

Но это метод кодирования для хранения данных, а не метод транслитерации для их записи для французских читателей. Боюсь, мы еще не приняли альтернативу акцентам.

person boisvert    schedule 13.04.2011