Как я могу определить кодовую страницу последовательности текста, 2 байта для символа, это полировка

Как я могу определить кодовую страницу последовательного текста, 2 байта для символа, это полировка. А для обычного английского символа просто добавьте 0x00 к коду ansi, для специального польского символа два байта имеют особое значение. нет заголовка файла, просто поток байтов такой.

Образец здесь

строка: Polączenia

байты: 50 00/6f 00/42 01/05 01/63 00/7a 00/65 00/69 00/61 00

Я думаю, что это не юникод, потому что 0x4201 в юникоде - это китайский символ, а не польский.

Так кто-нибудь может мне помочь? Спасибо большое!


person thed    schedule 07.12.2017    source источник


Ответы (1)


Это UTF-16 с обратным порядком байтов.

$ echo -n "Połączenia" | iconv -f UTF8 -t UTF16BE | hexdump
0000000 5000 6f00 4201 0501 6300 7a00 6500 6e00
0000010 6900 6100
person el.pescado    schedule 07.12.2017
comment
Большое спасибо, чувак, я нашел себя только сейчас, но спасибо тебе за все. Я должен прийти сюда, чтобы спросить раньше, я трачу больше полдня, чтобы найти его. - person thed; 07.12.2017