Вопросы по теме 'utf-16'

findstr или grep, которые автоматически определяют кодировку символов (UTF-16)
Я хочу сделать это: findstr /s /c:some-symbol * или эквивалент grep grep -R some-symbol * но мне нужна утилита для автоматического обнаружения файлов, закодированных в UTF-16 (и друзей), и поиска их соответствующим образом. В моих...
15570 просмотров

Преобразование xml из UTF-16 в UTF-8 с помощью PowerShell
Какой самый простой способ преобразовать XML из UTF16 в файл с кодировкой UTF8?
21316 просмотров
schedule 13.08.2022

Печать кодовой точки Unicode Astral Plane на консоль с использованием int
См. здесь связанный вопрос . Однако char переходит к 0xffff (или 65535 ). Мне нужно написать 0xd800df46 (или 66374 ), готическую букву Faihu, поэтому преобразование int в char не сработает. Я делаю преобразование в порядке, то есть я...
273 просмотров
schedule 25.03.2023

Путеводитель по Unicode для пустышки
Может ли кто-нибудь дать мне краткое определение Юникод UTF7 UTF8 UTF16 UTF32 Кодовые страницы Чем они отличаются от Ascii/Ansi/Windows 1252 Мне не нужны ссылки на Википедию или невероятные подробности, а лишь краткая информация...
4093 просмотров
schedule 21.05.2022

Tcl для получения кода ASCII для каждого символа в строке
Мне нужно получить символ ASCII для каждого символа в строке. На самом деле это каждый символ в (небольшом) файле. Следующие первые 3 строки успешно преобразуют все содержимое файла в строку (в соответствии с этим рецептом ): set fp [open...
21731 просмотров
schedule 10.11.2023

Аспект кодека UTF-16
Исходя из этих вопросов о локалях и описанных в этот вопрос : я действительно хотел установить фасет codecvt в локаль, которая понимает файлы UTF-16. Я мог бы написать свой собственный. Но я не эксперт UTF, и поэтому я уверен, что понял бы это...
1966 просмотров
schedule 25.06.2022

преобразование utf8 и utf16
У меня есть строка wchar_t, например, L"hao123--我的上网主页", я могу преобразовать ее в utf8 кодировка, выходная строка "hao123锛嶏紞鎴戠殑涓婄綉涓婚〉", но, наконец, я должен написать это строку в обычный текстовый файл, его формат utf16 (я знаю это от других),...
2494 просмотров
schedule 09.01.2023

pyODBC и Юникод
Я работаю с pyODBC, общаюсь с сервером MS SQL 2005 Express. Таблица, в которую я пытаюсь сохранить данные, состоит из столбцов nvarchar. query = u"INSERT INTO tblPersons (name, birthday, gender) VALUES('" query = query + name + u"', '" query =...
2674 просмотров
schedule 25.12.2023

Эффективное форматирование двоичных файлов в строку (например, base64, но для UTF8/UTF16)?
У меня есть много пакетов двоичных данных размером от 16 до 4096 байт, которые необходимо хранить в базе данных и которые должны быть легко сравнимы как единое целое (например, два пакета данных, только если длина совпадает и все байты совпадают)....
1248 просмотров
schedule 26.07.2022

Как Microsoft обрабатывает тот факт, что UTF-16 является кодировкой переменной длины в их реализации стандартной библиотеки C++
Кодирование переменной длины косвенно запрещено стандартом. Итак, у меня есть несколько вопросов: Как обрабатывается следующая часть стандарта? 17.3.2.1.3.3 Последовательности расширенных символов Последовательность расширенных символов —...
933 просмотров
schedule 08.07.2023

Экспорт таблицы Microsoft Access в UTF-16 CSV
У меня есть таблица Access с некоторыми китайскими символами, которые мне нужно экспортировать в файл CSV с кодировкой UTF-16. Если это невозможно, я мог бы также попробовать экспортировать таблицу в файл XLS или CSV, а затем преобразовать кодировку...
1302 просмотров
schedule 26.06.2022

Какие проблемы могут возникнуть при обработке UTF-16 как фиксированной 16-битной кодировки?
Я читал несколько вопросов на SO о Unicode, и были некоторые комментарии, которые я не совсем понял, например этот: Дин Хардинг : UTF-8 — это кодировка переменной длины, которую сложнее обрабатывать, чем кодировку фиксированной длины. Также...
714 просмотров
schedule 05.02.2023

Как было выбрано положение Суррогатной зоны (UTF-16)?
Была ли позиция области суррогатов UTF-16 (U+D800..U+DFFF) выбрана случайно или есть какая-то логическая причина, по которой она находится в этом месте?
284 просмотров
schedule 13.06.2022

C: Самый эффективный способ определить, сколько байтов потребуется для строки UTF-16 из строки UTF-8.
Я видел какой-то очень умный код для преобразования между кодовыми точками Unicode и UTF-8, поэтому мне было интересно, есть ли у кого-нибудь (или понравится ли это придумывать). Учитывая строку UTF-8, сколько байтов необходимо для кодирования...
912 просмотров
schedule 08.03.2023

Нужна помощь в понимании кодировки UTF
Здравствуйте, я заметил, что когда я сохраняю текстовый файл с использованием кодировки UTF-8 (без спецификации), я могу отлично прочитать его, используя кодировку UTF-16 на C#. Теперь это меня немного смутило, потому что UTF-8 использует только 8...
685 просмотров
schedule 25.03.2022

почему mbstowcs возвращает недопустимый многобайтовый символ
"קמ"ד חיר!" — это копия входной строки, вставленная из печати переменной в gdb. Вызов mbstowcs возвращает -1 с другим вводом как NULL. Любые идеи о том, что не так/как это исправить? "\327\247\327\236"\327\223...
5340 просмотров
schedule 11.03.2023

grep поддержка юникода 16
Я использую TextEdit на macosx, создал два файла с одинаковым содержимым с разными кодировками, затем grep xxx filename_UTF-16 ничего такого grep xxx filename_UTF-8 ххххххххххххххххххх grep did not support UTF-16?
1974 просмотров
schedule 12.02.2023

Почему внутренний формат Python Unicode был реализован так, как описано в PEP 100?
http://www.python.org/dev/peps/pep-0100/ В PEP 100 указано, что внутренний формат Python Unicode содержит кодировку UTF-16, но адресует значения как UCS-2 (или UCS-4 при компиляции с флагом --enable-unicode=ucs4 ). Почему не был выбран UTF-16...
590 просмотров
schedule 05.11.2022

Строки JavaScript — UTF-16 против UCS-2?
В некоторых местах я читал, что строки JavaScript имеют кодировку UTF-16, а в других — UCS-2. Я немного поискал, чтобы попытаться понять разницу, и нашел это: В: В чем разница между UCS-2 и UTF-16? A: UCS-2 — это устаревшая...
10997 просмотров
schedule 28.12.2023

Преобразование UTF-8 с спецификацией в UTF-8 без спецификации в Python
Здесь два вопроса. У меня есть набор файлов, которые обычно UTF-8 с спецификацией. Я хотел бы преобразовать их (в идеале) в UTF-8 без спецификации. Похоже, что codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors) справится с этим....
130372 просмотров
schedule 09.12.2022