Я хочу проанализировать некоторые сложные/тяжелые HTML-страницы. Недавно я прочитал о CsQuery и проверил сравнение производительности CsQuery и Html Agility. Упакуйте и выдохните . Согласно этим тестам, CsQuery оказывается медленнее при создании DOM из-за создания индекса.
Допустим, я хочу выбрать определенный элемент (без идентификатора) тяжелой html-страницы, и я знаю идентификатор его предка, который я буду использовать в качестве элемента контекста. Если я загружу этот тяжелый html в DOM, он будет медленным, поэтому мой выбор будет медленным. Однако, если я смогу КАК-ТО БЫСТРО предварительно обработать html и получить подстроку, содержащую элемент контекста (чей идентификатор я знаю), и загрузить его в DOM, это будет быстрее. В этом случае я избавился бы от множества ненужного HTML, для которого не будут создаваться индексаторы. Поэтому мой выбор будет быстрее.
Я использую CsQuery, потому что хочу что-то похожее на JQuery.
Мой вопрос:
Учитывая строку документа HTML: существует ли БЫСТРЫЙ СПОСОБ (например, линейный) для получения подстроки HTML элемента HTML с учетом его идентификатора?