В этом сообщении Я спросил, есть ли какие-нибудь инструменты, которые сравнивают структуру (не фактическое содержание) двух HTML-страниц. Я спрашиваю, потому что получаю шаблоны HTML от наших дизайнеров и часто пропускаю незначительные изменения форматирования в своей реализации. Затем я трачу несколько часов дизайнерского времени на просеивание своих страниц, чтобы найти свои ошибки.
Тема предлагала несколько хороших предложений, но не было ничего, что отвечало бы всем требованиям. «Хорошо, тогда, — подумал я, — я просто сам прокачаю один. Я ведь наполовину приличный разработчик, верно?».
Ну, как только я начал думать об этом, я не мог понять, как это сделать. Я могу достаточно легко запустить веб-сайт, управляемый данными, или внедрить CMS, или весь день перебрасывать документы в BizTalk и обратно. Не могу понять, как сравнивать HTML-документы.
Ну, конечно, я должен читать DOM и перебирать узлы. Я должен сопоставить структуру с некоторой структурой данных (как??), а затем сравнить их (как??). Это задача разработки, которую я никогда не пробовал.
Итак, теперь, когда я обнаружил слабость в своих знаниях, мне еще труднее понять это. Любые предложения о том, как начать?
пояснение: я не хочу сравнивать фактический контент — творческие ребята заполняют свои страницы lorem ipsum, а я использую настоящий контент. Вместо этого я хочу сравнить структуру:
<div class="foo">lorem ipsum<div>
отличается от
<div class="foo">
<p>lorem ipsum<p>
<div>