Как извлечь текст комментариев из GitHub с помощью Python

Я хотел бы извлечь только тела комментариев по проблемам с API v3 (но я также открыт для новых решений).

Пока я пытался ввести этот адрес: (пример) https://api.github.com/repos/bitcoin/bitcoin/issues/comments?per_page=50&since=2018-02-19T00:00:00Z&until=2019-04-20T00:00 : 00Z

После ввода адреса я прочитал все данные (HTML), но GitHub не позволяет просматривать более 100 результатов за раз. Можно ли превысить этот лимит? Можно ли получить только тела комментариев?


person Pablo Picciau    schedule 20.02.2019    source источник


Ответы (1)


API GitHub предлагает нумерацию страниц. Вы не можете запросить более 100 комментариев в одном запросе, но вы можете сделать несколько запросов, чтобы получить более 100 комментариев:

Запросы, которые возвращают несколько элементов, по умолчанию будут разбиты на страницы до 30 элементов. Вы можете указать дополнительные страницы с помощью параметра ?page. Для некоторых ресурсов вы также можете установить собственный размер страницы до 100 с параметром ?per_page.

API также включает Link HTTP-заголовок, сообщающий об интересных страницах, например что такое страницы next и last.

Можно ли получить только тела комментариев?

Я не знаю, как это сделать с помощью v3/REST API. Это возможно с помощью v4/GraphQL API, но обратите внимание, что при этом используется совсем другая модель.

person Chris    schedule 20.02.2019