Я делаю проект в Maven. Я пытаюсь получить страницы из URL. До сих пор мне удается получать страницы из Интернета. Но у меня есть два вопроса,
Вопросы,
- Приведенный ниже код занимает около 14 секунд, чтобы получить любые две страницы URL, как я могу сократить это время, помогите мне оптимизировать это.
- После завершения выполнения он не выходит из кода. Почему ? Я закончил код на
driver.close()
. Тогда, почему, он не выходит успешно. Я добавил снимки перед началом и после завершения процесса. Пожалуйста, смотрите это.
Помогите мне в моей проблеме. Пожалуйста.
Мой код:-
package XXX.YYY.ZZZ.Template_Matching;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
import java.io.IOException;
import org.junit.Assert;
import org.junit.Test;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.phantomjs.PhantomJSDriver;
import org.openqa.selenium.phantomjs.PhantomJSDriverService;
import org.openqa.selenium.remote.DesiredCapabilities;
import org.w3c.dom.Document;
public class HtmlUnit {
public static void main(String[] args) throws Exception {
String url1 = "http://www.jabong.com/men/shoes/men-loafers/?source=home-leftnav";
String url2 = "http://www.jabong.com/fastrack-9915Pp36J-Black-Pink-Analog-Watch-198499.html";
DesiredCapabilities caps = new DesiredCapabilities();
caps.setCapability(PhantomJSDriverService.PHANTOMJS_EXECUTABLE_PATH_PROPERTY, "C://Users//jhamb//Desktop//phantomjs-1.9.0-windows//phantomjs.exe");
WebDriver driver = new PhantomJSDriver(caps);
driver.get(url1);
String hml1 = driver.getPageSource();
driver.get(url2);
String hml2 = driver.getPageSource();
driver.close();
//System.out.println(hml1);
//System.out.println(hml2);
Document doc1 = Jsoup.parse(hml1);
Document doc2 = Jsoup.parse(hml2);
// Some operations using these DOM tree, just like , comparing Templates of two URLS
}
}
Снимок перед запуском процесса
Снимок после завершения процесса, когда он без причины ожидает