В этом руководстве я продемонстрирую, как использовать API Google Trends для получения актуальных тем в Интернете.
Вступление
Google Trends - это веб-сайт, который анализирует и перечисляет популярные результаты поиска в поиске Google для различных регионов и языков. Google Trends - это веб-сайт Google (очевидно). С помощью этого руководства вы можете получить результаты (и многое другое) с веб-сайта Google Trends с помощью Python. Вам не нужно вручную искать и копировать популярные результаты, Python API под названием pytrends
сделает всю работу за вас. Прежде чем начать, я хочу, чтобы все вы, ребята, ознакомились с официальной документацией по pytrends
API.
Перед началом работы весь код этого руководства доступен в моем репозитории GitHub, который приведен ниже. Пожалуйста, не стесняйтесь исследовать.
Установка
Первый шаг - установить библиотеку вручную. Итак, откройте свою любимую IDE или записную книжку и начните вводить следующий код. Я буду использовать Google Colab, потому что это мой любимый ноутбук.
Если вы используете блокнот jupyter, просто введите код как есть (убедитесь, что у вас есть "!" в начале)
!pip install pytrends
Или, если вы используете IDE, просто введите следующий код
pip install pytrends
После выполнения вышеуказанного кода вы должны получить успешное сообщение, как показано ниже:
Реализация
Подключение к Google
Сначала вы должны подключиться к Google, потому что, в конце концов, мы запрашиваем актуальные темы Google из Google Trends. Для этого нам нужно импортировать метод с именем TrendReq
из библиотеки pytrends.request
. Кроме того, я импортирую библиотеку pandas для хранения и визуализации данных, которые вы увидите в следующем руководстве.
import pandas as pd from pytrends.request import TrendReq pytrend = TrendReq()
Интерес по регионам
Давайте посмотрим на термины, которые популярны в регионе во всем мире. Я выберу слово, по которому будет выполняться поиск, как «Тейлор Свифт» (она мне так нравится…).
pytrend.build_payload(kw_list=[‘Taylor Swift’]) # Interest by Region df = pytrend.interest_by_region() df.head(10)
Теперь вы можете подумать, что это за значения, что они обозначают? Значения рассчитываются по шкале от 0 до 100, где 100 - это место с наибольшей популярностью в виде доли от общего числа поисков в этом месте, значение 50 указывает на местоположение, которое вдвое менее популярно. Значение 0 указывает место, где не было достаточно данных для этого термина. Источник → Google Trends.
Изобразим результат на гистограмме, потому что иногда визуальное представление дает четкую картину.
df.reset_index().plot(x=’geoName’, y=’Taylor Swift’, figsize=(120, 10), kind =’bar’)
Кроме того, вы используете параметр resolution = 'COUNTRY_NAME'
для фильтрации результатов.
Ежедневные тенденции поиска
Теперь давайте узнаем о самых популярных ежедневных поисковых тенденциях по всему миру. Для этого мы должны использовать метод trending_searches()
. Если вы хотите искать по всему миру, просто не передавайте никаких параметров.
# Get Google Hot Trends data df = pytrend.trending_searches(pn=’united_states’) df.head()
Убедитесь, что вы ввели название страны в нижнем регистре pn = "canada"
. Кроме того, вы можете сравнить приведенные выше результаты с результатом тренда Google. Чтобы получить актуальные сегодня темы, просто используйте:
df = pytrend.today_searches(pn=’US’)
Хит-парад
Давайте посмотрим, что было в тренде в 2019 году. С помощью метода top_charts
мы можем получить самые популярные запросы за год.
# Get Google Top Charts df = pytrend.top_charts(2019, hl='en-US', tz=300, geo='GLOBAL') df.head()
Чтобы сравнить результаты, просто посетите Google Trends. Мы можем указать год и страну, в которой мы хотим видеть популярные поисковые запросы.
Предложения по ключевым словам Google
Давайте посмотрим, как мы можем получить предложение Google по ключевым словам. Если вы не понимаете, о чем я говорю. Изображение ниже объясняет вещи более ясно.
# Get Google Keyword Suggestions keywords = pytrend.suggestions(keyword='Mercedes Benz') df = pd.DataFrame(keywords) df.drop(columns= 'mid') # This column makes no sense
Связанные запросы
Обычно, когда пользователь ищет тему, он также ищет что-то связанное с ней. Это так называемые связанные запросы. Давайте посмотрим, какие запросы связаны с темой «Коронавирус». Всегда помните, что если вы хотите изменить имя темы, просто запустите следующий код еще раз с новым именем в качестве параметра.
pytrend.build_payload(kw_list=['Coronavirus'])
Теперь давайте запустим метод related_queries
, который возвращает словарь, полный связанных запросов по теме «Коронавирус».
# Related Queries, returns a dictionary of dataframes related_queries = pytrend.related_queries() related_queries.values()
Точно так же вы также можете искать связанные темы, просто запустите для этого приведенный ниже код:
# Related Topics, returns a dictionary of dataframes related_topic = pytrend.related_topics() related_topic.values()
Это конец урока, надеюсь, вы кое-что узнали. Если у вас есть какие-либо сомнения относительно учебника, дайте мне знать через раздел комментариев. Хотя это краткое руководство, есть чему поучиться. Хорошо, увидимся в моем следующем уроке, хорошего дня !!!