Я работаю над проектом, в котором отдельные изображения и текстовые файлы хранятся в одном месте, как капсула времени. Теперь почти каждый проект можно сохранить в виде одного файла, например, DOC, PPT и ODF. Но полные веб-страницы не могут — они сохраняются как отдельный HTML-файл и папка с данными. Я хочу сохранить веб-страницу в одном архиве, и хотя существует несколько решений, "стандартного" не существует. Какой формат лучше всего подходит для HTML-архивов?
У Microsoft есть MHTML — файл, закодированный точно как MIME HTML. сообщение электронной почты. Он уже основан на существующем стандарте, а собственный MHTML был предложен как rfc2557. Это отличная идея, и она существовала всегда, за исключением того, что она была «предложенным стандартом» с 1999 года. Кроме того, реализации, отличные от IE, просто громоздки. IE и Opera поддерживают его; Firefox и Safari с громоздким расширением.
В Mozilla есть формат архива Mozilla — в основном ZIP-файл с разметкой и изображениями, с метаданными, сохраненными в формате RDF. Это потрясающая идея — Winamp делает это для скинов, а ODF и OOXML — для встроенных изображений. Мне это нравится, за исключением того, что: 1. Никто, кроме Mozilla, не использует его, 2. Единственное расширение, поддерживающее его, не обновлялось с Firefox 1.5.
URI данных становятся все более популярными. Вместо ссылки на внешнее местоположение в стиле MHTML или MAF вы кодируете файл прямо в разметке HTML как base64. В зависимости от вашего представления это упрощается, поскольку файлы находятся правильно там, где есть разметка. Тем не менее, поддержка все еще несколько слаба. Firefox, Opera и Safari поддерживают его без ошибок; IE, лидер рынка, начал поддерживать его только в IE8, да и то с ограничениями.
Затем, конечно, есть "Сохранить всю веб-страницу", где HTML-разметка сохраняется как
"savedpage.html"
, а файлы — в отдельной папке"savedpage_files"
. Афаик, все так делают. Он хорошо поддерживается. Но работать с двумя отдельными элементами непросто и всегда проще. В моем проекте они должны быть в едином архиве.
Принимая во внимание поддержку браузера и простоту редактирования страницы, как вы думаете, какой лучший способ сохранить веб-страницы в одном архиве? Что? будет лучше в качестве "стандарта"? Или я должен просто пристегнуться и разобраться с файлом HTML и отдельной папкой? Ради моего проекта я мог бы это поддержать, но лучше этого избегать.