Вопросы по теме 'amazon-deequ'

Как отфильтровать строки с ограничением столбца в Deequ ColumnProfileRunner?
Я новичок в Scala и Spark. Я изучаю библиотеку Amazon Deequ для профилирования данных. Как получить количество строк, имеющих определенное значение, при использовании ColumnProfilerRunner()? У AnalysisRunner есть опция «соответствие». Я ищу...
548 просмотров
schedule 13.04.2023

Динамический разбор правил Deequ из csv/таблицы
Я использую библиотеку amazon deequ и пытаюсь передать правила из таблицы csv или mysql. В моем CSV-файле будет столбец со значениями, как показано ниже. rules_column -------------------------------------------------------------------------...
246 просмотров

Как я могу сохранить предложения Deequ Contraint в файл для повторного использования?
Здравствуйте, я использую Amazon Deequ для создания набора ограничений для проверки качества моих данных. Я хочу сохранить объект предложения ограничения в HDS, чтобы я мог загрузить его и использовать для проверки в любое время, когда я хочу...
447 просмотров
schedule 27.11.2022

Добавление нового правила предложения в deequ
Я хотел бы добавить несколько новых правил в рабочий процесс предложений deequ. Например, deequ предлагает проверить, содержит ли столбец URL (containsURL). Я хотел бы сделать соответствующее правило предложения. Я был бы признателен за...
112 просмотров
schedule 24.01.2024

Pyspark версия Amazon Deequ
Я работаю над AWS Glue и использую API pyspark для своего ETL. Я считаю, что если мне нужно использовать Amazon Deequ, мне нужно переключиться на Scala. Однако я все еще хочу продолжать использовать API-интерфейсы Pyspark. Есть ли выход? Если да,...
1257 просмотров

Платформа тестирования данных для потоковой передачи данных (deequ vs Great Expectations)
Я хочу ввести тестирование качества данных (пустые поля/максимально-минимальные значения/регулярные выражения/и т. д.) в свой конвейер, который по существу будет потреблять темы kafta, проверяющие данные до того, как они будут зарегистрированы в БД....
1075 просмотров