Публикации по теме 'data-profiling'
Обеспечение качества данных в корпоративном озере данных
В этой статье описывается, как команда Enterprise Data Lake (EDL) в PayPal создала Rule Execution Framework (REF) для реализации возможностей на уровне предприятия: создание централизованной системы конфигурации общих правил на уровне предприятия для определения, управления, контроля и развертывания. правила и наборы правил структуры качества данных.
Почему нам нужна команда Rule Execution Framework
Команды, занимающиеся преобразованием данных в PayPal, должны соответствовать..
Вопросы по теме 'data-profiling'
Извлечь шаблон из набора данных
У меня есть таблица с несколькими столбцами, заполненными данными из разных параметров. Поскольку некоторые строки могут иметь одни и те же значения столбцов, я хотел бы извлечь наиболее повторяющиеся значения для каждого столбца, чтобы я мог...
78 просмотров
schedule
29.06.2023
Как обнаружить и преобразовать единицы значений столбца без использования цикла python?
Насколько мне известно, циклы Python медленные, поэтому предпочтительнее использовать встроенные функции pandas.
В моей задаче в одном столбце будут разные валюты, мне нужно конвертировать их в доллары. Как я могу обнаружить и преобразовать их в...
370 просмотров
schedule
21.02.2024