Я использую open-uri
и nokogiri
с ruby для простого веб-сканирования. Есть одна проблема, иногда html читается до полной загрузки. В таких случаях я не могу получить какой-либо контент, кроме значка загрузки и панели навигации. Как лучше всего сказать open-uri
или nokogiri
дождаться полной загрузки страницы?
В настоящее время мой скрипт выглядит так:
require 'nokogiri'
require 'open-uri'
url = "https://www.the-page-i-wanna-crawl.com"
doc = Nokogiri::HTML(open(url, ssl_verify_mode: OpenSSL::SSL::VERIFY_NONE))
puts doc.at_css("h2").text