Я разрабатываю синтаксический анализатор, который принимает на вход JavaScript и создает сжатую версию этого JavaScript на выходе.
Первоначально я обнаружил, что парсер не смог прочитать введенный JavaScript. Я считаю, что это как-то связано с тем, что Visual Studio 2008 сохраняет свои файлы по умолчанию как UTF-8. И при этом VS включает пару скрытых символов в начало файла UTF-8.
В качестве обходного пути я использовал Visual Studio, чтобы сохранить файл как кодовая страница 1252. После этого мой парсер смог прочитать входной JavaScript.
Обратите внимание, что мне нужно использовать специальные европейские символы с диакритическими знаками.
Итак, вот мои вопросы:
- Что мне следует использовать кодовую страницу 1252 или UTF-8?
- Почему Visual Studio по умолчанию сохраняет файлы в формате UTF-8?
- Если я выберу сохранение файлов как 1252, это приведет к проблемам?
- Мне кажется, что Eclipse по умолчанию сохраняет файлы как кодовую страницу 1252. Это звучит правильно?