Я хочу сопоставить графические/символические символы с более простой альтернативой Java, где это возможно, например:
- U1E36 латинская заглавная буква l с точкой внизу -> L
- U25B6 Черный треугольник, указывающий вправо -> >
- U25C0 Черный треугольник, указывающий влево -> ‹
- U25B2 Черный треугольник, указывающий вверх -> ^
Моя проблема в том, что я не знаю, что такое все символы, поэтому, хотя технически достаточно просто сопоставить конкретные символы выше, это сложно сделать для каждого, их могут быть сотни.
У меня уже есть этот код для удаления акцентов и так далее.
public static final Pattern DIACRITICS_AND_FRIENDS
= Pattern.compile("[\\p{InCombiningDiacriticalMarks}\\p{IsLm}\\p{IsSk}]+");
private static String stripDiacritics(String str) {
str = Normalizer.normalize(str, Normalizer.Form.NFD);
str = DIACRITICS_AND_FRIENDS.matcher(str).replaceAll("");
return str;
}
Поэтому мне было интересно, есть ли что-то подобное, чтобы помочь мне с этими символами символов, обратите внимание, что я не хочу когда-либо удалять их, просто замените их более простым представлением.