Это продолжение предыдущего вопроса а>. У меня проблемы с этим фрагментом Nokogiri:
>> require 'nokogiri'
>> html = 'bad<p>markup</p>with<img src="foo.jpg">'
>> Nokogiri::HTML(html).at_css('body').children.map {|x| '<p>' + x.text + '</p>'}.join('')
=> "<p>bad</p><p>markup</p><p>with</p><p></p>"
Что случилось с моим тегом изображения? Похоже, что Nokogiri может удалить ВСЕ присутствующие теги HTML (включая мой оригинальный <p>
вокруг слова «разметка») и заменить их. Как предотвратить это? Все, что я хочу сделать, это убедиться, что полностью непомеченный текст заключен в тег <p>
...