Пока я проверял RSS-канал, в браузере я вижу текст, как показано ниже:
装,配上超短迷你裙,太过暴露,也很不得体。大专学生的随性打扮...
Но то же представление исходного кода преобразуется в десятичное, как показано ниже:
#30701裤、迷你裙、吊带装、人字拖鞋......大
987学生的穿着打扮及潮流品味,一直都是是大家讨论的
8909门话题。&
Это связано с локализацией контента или файл сохранен в другой кодировке? Я вижу, что файл сохранен с использованием UTF-8.
Я пытаюсь разобрать RSS-канал с помощью Python. Но после синтаксического анализа я получаю только десятичные значения, а не фактические символы.