Как мне форматировать URL-адреса со специальными/международными символами?
В настоящее время я стараюсь, чтобы URL-адреса «выглядели хорошо», чтобы:
www.myhost.com/this is a test, do you know how?
преобразуется в:
www.myhost.com/this_is_a_test_do_you_know_how
Я знаю, что некоторые международные буквы могут быть преобразованы (ü = ue, æ = ae, å = aa), некоторые символы могут быть удалены. Обычно я стараюсь, чтобы URL-адрес выглядел «хорошо», но разве это глупо?
Но что мне делать с китайскими, японскими, арабскими буквами, которые не имеют ничего общего с нашим западным форматом ASCII?
Мне действительно не нравится идея переписывать URL-адрес с помощью шестнадцатеричных кодов, поэтому сейчас я просто использую свой внутренний уникальный идентификатор, если URL-адрес содержит слишком много «неконвертируемых» символов.