Публикации по теме 'bigquery'


Современное построение конвейера данных с помощью BigQuery Dataform
Поскольку ELT становится все более популярным, BigQuery Dataform позволяет выполнять современные преобразования на основе SQL в среде BigQuery. Отказ от ответственности. Я инженер по работе с клиентами Google Cloud. Мнения являются моими собственными и не обязательно мнением Google. Это первая часть серии статей о Google Cloud Dataform. Недавно я начал использовать BigQuery Dataform. Dataform — это современный инструмент конвейера данных и приобретение Google Cloud, которое теперь..

Руководство для начинающих по GCP BigQuery (часть 2)
Нажмите здесь, чтобы перейти к первой части этой статьи Продолжение серии «Руководство для начинающих по GCP BigQuery»; во второй части мы рассмотрим преимущества и варианты использования ключевых функций BigQuery. Прочитав эту статью, вы получите четкое представление о секционированных таблицах, запланированных запросах, скалярных функциях и внешних таблицах, которые станут строительными блоками вашей карьеры, позволяя вам принимать правильные решения как специалисту по данным...

Изменение расписания Lambda, когда целевые данные за пределами AWS в настоящее время недоступны
Проблема. Вы хотите, чтобы лямбда-выражение инициировало прием данных через рабочий процесс AWS Glue из источника за пределами AWS. Данные могут быть доступны в любое время между часами X и Y, но вам необходимо принять их как можно скорее. В следующем примере я буду использовать таблицу в BigQuery в качестве источника данных за пределами AWS. Примечание. В этой статье предполагается, что вы знаете, как создавать и настраивать лямбда-выражения в AWS, и не будем описывать их пошагово...

Экспорт BigQuery в PSQL с помощью Python и Airflow
Введение В современных серверных ИТ-архитектурах почти необходимо работать с той или иной формой системы хранения. Это может быть внутреннее локальное файловое хранилище или нереляционная (или реляционная) база данных, которая установлена ​​на локальном сервере или (самое дорогое, но удобное решение) в облаке провайдерского сервиса типа Google или >Майкрософт . Данные очень важны для приложений и часто управляются и «экспортируются» между базами данных из-за требований к..

Работа с массивами и структурами в BigQuery
Как эффективно хранить свои данные Новые хранилища данных, такие как BigQuery, а также другие решения, часто работают с денормализованными данными, поскольку эти технологии лучше работают с таблицами на основе столбцов . Чтобы избежать дублирования наборов данных во время денормализации, используются структуры и массивы. В этой статье вы вскоре узнаете, что это значит, и…

6 SQL-функций BigQuery, которые должен знать каждый пользователь
Проверьте, есть ли они в вашей базе данных В моей предыдущей статье я обсуждал 4 сочетания клавиш BigQuery SQL, которые могут упростить ваши запросы . С тех пор я обнаружил еще 6 полезных функций SQL, о которых мне хотелось бы знать раньше и которыми я хотел бы поделиться сегодня. 1. СОЗДАТЬ МАССИВ Функция GENERATE_ARRAY позволяет создать массив с начальным и конечным значением, увеличенным на шаг. Это полезно, если вы хотите сгенерировать серию чисел с определенной..

Советы по эффективным SQL-запросам — Google BigQuery
Иногда запрос, который вы пишете, может быть одноразовым или для небольшого набора данных. Но часто вы можете запрашивать данные на веб-сайте с огромными наборами данных. Поэтому очень важно, чтобы вы писали оптимизированные и эффективные запросы, которые хорошо работают для вашего варианта использования. Давайте посмотрим, что мы можем сделать? Есть две важные функции, которые вы можете сохранить, чтобы заметить производительность вашего запроса. show_amount_of_data_scanned()..