Представление не-ASCII-символов в URL-адресах дает лучший рейтинг страницы в поисковых системах?

В большей части мира используются символы, отличные от ASCII. Но в некоторых идиомах используются такие вещи, как é, ö, á, ã, õ и т. Д., Которые можно «преобразовать» в ascii.

Предположим, заголовок поста такой:

Configuração é fácil!

Как представить это в URL-адресе?

www.myblog.com/post/1200/Configura__o-_-f_cil

Намного лучшее представление

www.myblog.com/post/1200/Configuracao-e-facil

В Википедии это делается так же, как в http://en.wikipedia.org/wiki/Deja_vu.

Улучшит ли это рейтинг страницы в поисковых системах?

Как это сделать на любимом языке?


person motobói    schedule 18.02.2009    source источник
comment
Так что вы собираетесь делать с китайскими иероглифами? Или японская кана? Или немецкие scharfes S (ß)? Я думаю, вам нужно подумать об этом, прежде чем реализовывать эту функцию.   -  person Tamas Czinege    schedule 18.02.2009
comment
Может быть, можно просто игнорировать конвертируемый символ, отличный от ascii.   -  person motobói    schedule 18.02.2009
comment
'Scharfes S' (ß) обычно разлагается на две s: Straße = ›Strasse.   -  person Markus Schnell    schedule 18.02.2009
comment
Проблема с транслитерацией заключается в том, что вы можете потерять или изменить значение слов. Возьмем, к примеру, немецкие слова Buße (англ. покаяние) и Busse (англ. busses) или Maße (англ. меры, размеры) и Masse (англ. масса).   -  person Gumbo    schedule 18.02.2009


Ответы (1)


В Perl

Используйте Text :: Unidecode:

#!/usr/bin/perl -w

use utf8;
use Text::Unidecode;
print unidecode(
    "áéíóú\n"
);

# That prints: aeiou 
person motobói    schedule 18.02.2009