У нас есть проблема с повышением точности BigQuery, наш случай использования следующий: мы используем таблицу из 1 600 миллионов записей, таблицу не слишком большую для наших проблем, и мы пытаемся найти уникальных пользователей.
Сначала мы думали использовать «подсчет отдельных», но, как сказано в документации, для большого количества данных вы получаете приблизительный результат. Чтобы улучшить это, мы пытаемся использовать «count + group by» вместо оператора «count independent». Но результатом bigquery является слишком большой ответ. Сначала мы сгруппировали по UserID, и мы продолжили эту идею, но уменьшили количество данных, выбрали конкретную кампанию, значительно уменьшив количество данных. Но результат тот же, слишком большой отклик.
Есть идеи или мнения о том, как получить уникальных пользователей с высокой точностью в bigQuery?