Основной вопрос: позволят ли ограничения скорости Твиттера выполнить анализ данных, необходимый для построения полного графа социальной сети со всеми направленными ребрами среди примерно 600 тысяч пользователей?
Вот идея:
Ребра/связи/отношения в сети будут отношениями последователя/следователя.
Начните с определенного списка примерно из 600 пользователей Twitter, выбранных потому, что все они представляют все новостные агентства большого города.
Соберите всех подписчиков и друзей (людей, на которых они подписаны) для всех 600 пользователей. Эти пользователи, вероятно, имеют среднее количество подписчиков 2000 каждый. Вероятно, у них в среднем 500 друзей (людей, на которых они подписаны).
Поскольку все эти подписчики из 600 находятся в одном городе, ожидается, что многие из этих подписчиков будут теми же пользователями, которые следят за этими 600 людьми. Итак, давайте прикинем и предположим, что у этих 600 пользователей в общей сложности примерно 600 000 подписчиков и друзей. Таким образом, это будет подграф/сеть из 600 600 пользователей Twitter.
Итак, как только я соберу всех 600 000 подписчиков и друзей всех этих 600 человек, я хочу иметь возможность построить социальную сеть из всех этих 600 600 человек И их подписчиков. Это потребовало бы от меня возможности найти по крайней мере все направленные ребра среди этих 600 600 пользователей (независимо от того, подписаны ли каждый из этих 600 600 пользователей друг на друга). С ограничениями скорости Twitter возможен ли такой интеллектуальный анализ данных?