Вопросы по теме 'amazon-deequ'
Как отфильтровать строки с ограничением столбца в Deequ ColumnProfileRunner?
Я новичок в Scala и Spark. Я изучаю библиотеку Amazon Deequ для профилирования данных.
Как получить количество строк, имеющих определенное значение, при использовании ColumnProfilerRunner()?
У AnalysisRunner есть опция «соответствие». Я ищу...
548 просмотров
schedule
13.04.2023
Динамический разбор правил Deequ из csv/таблицы
Я использую библиотеку amazon deequ и пытаюсь передать правила из таблицы csv или mysql. В моем CSV-файле будет столбец со значениями, как показано ниже.
rules_column
-------------------------------------------------------------------------...
246 просмотров
schedule
06.06.2023
Как я могу сохранить предложения Deequ Contraint в файл для повторного использования?
Здравствуйте, я использую Amazon Deequ для создания набора ограничений для проверки качества моих данных. Я хочу сохранить объект предложения ограничения в HDS, чтобы я мог загрузить его и использовать для проверки в любое время, когда я хочу...
447 просмотров
schedule
27.11.2022
Добавление нового правила предложения в deequ
Я хотел бы добавить несколько новых правил в рабочий процесс предложений deequ. Например, deequ предлагает проверить, содержит ли столбец URL (containsURL). Я хотел бы сделать соответствующее правило предложения.
Я был бы признателен за...
112 просмотров
schedule
24.01.2024
Pyspark версия Amazon Deequ
Я работаю над AWS Glue и использую API pyspark для своего ETL. Я считаю, что если мне нужно использовать Amazon Deequ, мне нужно переключиться на Scala. Однако я все еще хочу продолжать использовать API-интерфейсы Pyspark. Есть ли выход? Если да,...
1257 просмотров
schedule
09.02.2024
Платформа тестирования данных для потоковой передачи данных (deequ vs Great Expectations)
Я хочу ввести тестирование качества данных (пустые поля/максимально-минимальные значения/регулярные выражения/и т. д.) в свой конвейер, который по существу будет потреблять темы kafta, проверяющие данные до того, как они будут зарегистрированы в БД....
1075 просмотров
schedule
08.05.2023