Я пытаюсь написать программу Python для сбора данных из Google Trends (GT), в частности, я хочу автоматически открывать URL-адреса и получать доступ к определенным значениям, отображаемым в заголовке. Я написал код, и я могу успешно очистить данные. Но я сравниваю данные, возвращаемые кодом, и данные, присутствующие в URL-адресе, результаты возвращаются лишь частично. Например, на изображении ниже код возвращает первое название «Манчестер Юнайтед ФК • Тоттенхэм Хотспур ФК». Но на самом сайте есть 4 результата «Манчестер Юнайтед ФК • Тоттенхэм Хотспур ФК, Международный кубок чемпионов, Манчестер». изображение тенденций Google
В настоящее время мы перепробовали все возможные элементы поиска на странице, но по-прежнему не можем найти средства для исправления этой проблемы. Мы не хотели использовать для этого грязный или красивый суп.
import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
import time
from selenium import webdriver
links=["https://trends.google.com/trends/trendingsearches/realtime?geo=DE&category=s"]
for link in links:
Title_temp=[]
Titile=''
seleniumDriver = r"C:/Users/Downloads/chromedriver_win32/chromedriver.exe"
chrome_options = Options()
brow = webdriver.Chrome(executable_path=seleniumDriver, chrome_options=chrome_options)
try:
brow.get(link) ## getting the url
try:
content = brow.find_elements_by_class_name("details-top")
for element in content:
Title_temp.append(element.text)
Title=' '.join(Title_temp)
except:
Title=''
brow.quit()
except Exception as error:
print error
break
Final_df = pd.DataFrame(
{'Title': Title_temp
})
['Emanuel Buchmann • Tour de France • Enrico Poitschke', 'Alexander Zverev • Hamburg', 'Nairo Quintana • Tour de France • Col du Galibier • Race stage • France', 'Germany', 'Alexander Zverev • Jan-Lennard Struff • Nicolás Jarry • Tennis • Rothenbaum tournament', 'Hertha BSC • Bundesliga • Fenerbahçe S.K. • Berlin • Ante Čović', 'Tour de France • Tony Martin • Luke Rowe', 'Tottenham Hotspur F.C. • Manchester United F.C. • Manchester • International Champions Cup', 'Am Rothenbaum • Tennis • Hamburg • Association of Tennis Professionals']]
с помощью вашего кода. - person supputuri   schedule 25.07.2019