Разделение строки JavaScript на «символы» может быть выполнено тривиально, но есть проблемы, если вы заботитесь о Unicode (и вам следует заботиться о Unicode).
JavaScript изначально обрабатывает символы как 16-битные объекты (UCS-2 или UTF-16), но это не позволяет использовать символы Юникода за пределами BMP (базовая многоязычная плоскость) .
Чтобы работать с символами Unicode помимо BMP, JavaScript должен учитывать "суррогатные пары", чего он не делает. изначально.
Я ищу, как разбить строку js по кодовой точке, независимо от того, требуется ли для кодовых точек один или два «символа» JavaScript (единицы кода).
В зависимости от ваших потребностей, разделения по кодовой точке может быть недостаточно, и вы можете захотеть разделить на " кластер графемы ", где кластер является базовой кодовой точкой, за которой следуют все его кодовые точки модификатора без пробелов, такие как сочетание ударений и диакритических знаков.
Для этого вопроса я не требую разбиения по кластерам графем.