Публикации по теме 'unicode'


Как реализовать JavaScript String.length в Golang
Мне нужно было реализовать JavaScript .length в Golang, решение оказалось довольно интересным, поэтому я расскажу вам, как это сделать. Для некоторых строк подойдет функция len из Golang, например. "Hello World!".length // JS 12 len("Hello World!") // Golang 12 Проблемы начинаются, когда вы включаете любые символы Юникода, например. "👍".length // JS 2 len("👍") // Golang 4 Это связано с тем, что JavaScript реализован в UTF-16..

Описание спортзала picoCTF: трансформация
Развлекайтесь, взламывая строки Unicode с помощью CyberChef Американский стандартный код для обмена информацией , или ASCII, был основной схемой кодирования во второй половине двадцатого века, когда вычислительная техника была еще в зачаточном состоянии. Он отображает 127 буквенно-цифровых, не буквенно-цифровых и некоторых других управляющих символов в число. Но ASCII ограничен количеством символов, которые он может преобразовать в целое число. Поэтому были изобретены другие схемы..

Вы должны знать кодировку
Когда я выполняю простой поиск в Google по кодировке слова, один из повторяющихся результатов - convert into a coded form . Раньше я задавался вопросом, зачем мне кодированная форма текста. Что ж, если вы имеете дело с текстом на компьютере, вы обязательно должны знать, что такое кодировка. По крайней мере, наше частое использование электронных писем (отправка и получение), написание статей с кодом и все связанные с текстом проблемы подчеркивают тот факт, что мы должны знать, чтобы..

Введение в Unicode и UTF-8 в Python 2
UnicodeDecodeError: кодек ascii не может декодировать байт 0xc3 в позиции 0: порядковый номер не в диапазоне (128) Вы видели это исключение? Если вы знаете почему, можете пропустить это введение. Есть несколько замечательных статей и рассказов о Unicode и кодировании в Python, но я попытаюсь обобщить основные концепции. При работе со строками в Python вы должны знать, с каким типом строки вы работаете. В Python 3 все немного изменилось, поэтому сначала мы сосредоточимся на Python 2...

Смайлики, или почему нельзя просто вставить хот-дог?
Примечание. При переходе на Medium несколько фрагментов были повреждены, поэтому я либо удалил их, либо немного отредактировал. Просто зайдите на сайт прямо на «режиссерскую версию». Оказывается, это не так просто, как я надеялся! Давайте немного отмотаем назад, и в конце концов я объясню, что такое смайлик, поскольку может возникнуть соблазн подумать, что это просто изображение. Любой ASCII-код? Прежде чем мы углубимся в сложности кодирования, давайте узнаем об ASCII! Как и..

УТФ-8 против УТФ-16; Ни одно истинное кодирование
С тех пор уже давно пришли к единому мнению, что utf-8 является правильным выбором для файлов и сети, в то время как utf-16 может быть немного лучше для обработки в памяти. Однако добавление символов эмодзи в юникод ослабляет аргументы utf-16. Одним из типичных аргументов в пользу utf-16 является то, что он более эффективен для азиатских символов, потому что в основном это 2 байта на символ вместо 3–4 байтов в utf-8. Люди уже указывали, что для обычных файлов также есть много метаданных..

Использование наборов символов в Swift
Они не особенно распространены, и вы не встретите их в своем коде так часто, как массивы, словари или циклы. Но когда они вам действительно нужны , они могут оказаться чрезвычайно полезными. О чем я говорю? Наборы символов! Инициализация и реализация набора символов определенно озадачила меня, когда мне в первый раз действительно понадобилось его использовать, поэтому я определенно хотел изучить эту тему еще раз. Что такое набор символов? Apple сообщает нам, что набор символов - это..