Публикации по теме 'datastream'


Использование новых потоков данных в борьбе с COVID-19
Благодаря мерам социального дистанцирования большое количество дискуссий, касающихся COVID-19, теперь происходит в социальных сетях, таких как Twitter. Эти платформы содержат кладезь информации, которая может помочь нам ответить на такие вопросы, как у скольких людей сегодня проявляются симптомы коронавируса? Однако не вся информация одинакова — эти платформы также содержат много дезинформации, которая потенциально может причинить вред представителям общественности. Мы разработали..

Топ K частых элементов в скользящем по времени окне
TL;DR Я продемонстрировал алгоритм Наиболее часто встречающиеся элементы на стриме в Твиттере. Вы можете проверить исходный код проекта по адресу: https://github.com/efekaptan/top-k . Введение Поиск лучших элементов из конечного набора или живого потока — простой процесс. Но все становится сложнее, когда ваш расчет зависит от скользящего временного интервала. Хорошим примером такой проблемы может быть поиск «K самых частых слов из потока Twitter за последние 10 минут». Можем..