какой тип кодировки представляет собой этот текст на английском языке, отличный от ISO, расширенный ASCII, с очень длинными строками, с разделителями строк CRLF?

Я пытаюсь экспортировать вывод запроса mssql, который должен использовать кодировку utf (я полагаю, utf-16) в соответствии с описание Я использую -W -u функции с sqlcmd. Ä по умолчанию преобразуется в символ z (с двумя точками или чем-то вроде перевернутого ^) и отображает его как набор символов ansi. когда я пытаюсь использовать блокнот ++ для преобразования этого файла utf в utf-8, он показывает мне некоторые странные выделенные символы (x8E) для Ä, а некоторые другие для других символов, таких как x86 и x94, не имеет значения, какую кодировку я использую по умолчанию в Nottepad++.

Когда я передал файл на машину Ubuntu 12.04 и с помощью команды file сказал, что его

user@user:~/Desktop/enc oding/checkencoding$ file convertit4.csv convertit4.csv: текст на английском языке, не соответствующий ISO, расширенный ASCII, с очень длинными строками, с разделителями строк CRLF.

user@user:~/Desktop/encoding/checkencoding$ chardet convertit4.csv convertit4.csv: ISO-8859-2 (достоверность: 0,77) Я не понимаю, какую кодировку он использует. цель состоит в том, чтобы преобразовать его в кодировку utf-8 без каких-либо ошибок, чтобы загрузить его в magmi импортер.

примечание: я использую эту команду для удаления подчеркивания после заголовков type c:\outfiles\convertit1.temp | findstr /r /v "^\-[;\-]*$" > c:\outfiles\convertit4.csv надеюсь, что эта строка кода не является проблемой.

Я надеюсь, что информация является полной для решения этой проблемы. Если вам нужна дополнительная информация, пожалуйста, дайте мне знать, С уважением.


person tough    schedule 25.09.2012    source источник
comment
Вы используете опцию -o? -u без него не действует.   -  person Neil    schedule 25.09.2012
comment
@ Нил, да, я тоже использую -o и получаю его в формате CSV.   -  person tough    schedule 25.09.2012
comment
Я не думаю, что FINDSTR поддерживает Unicode, извините.   -  person Neil    schedule 25.09.2012
comment
@Neil Спасибо за ваш ответ. Мне удалось удалить пунктирные линии под заголовками выходного файла. Не означает ли это, что FINDSTR поддерживает Unicode? ИЛИ наоборот, будет просто вывод sqlcmd не в кодировке Unicode. Пытаюсь решить этот вопрос.   -  person tough    schedule 25.09.2012
comment
@Neil Да, кажется, что FINDSTR не поддерживает unicode. Эта команда преобразовывала строку в странные наборы.   -  person tough    schedule 25.09.2012


Ответы (1)