Это специально для сферы здравоохранения. Какие решения / инструменты вы используете для маскировки данных PHI при копировании данных из производственной среды в тестовую среду
Маскирование / скремблирование данных
Ответы (1)
Не только для отрасли здравоохранения, но у нас были аналогичные требования для клиентов телекоммуникационных компаний. Мы хотели иметь возможность предоставлять репрезентативные данные в тестовых системах, но при этом не копировать конфиденциальную информацию.
С этой целью мы попробовали несколько разных вещей, в том числе и то, что выбрали:
Представления, которые будут использоваться вместо прямого доступа к таблицам - эти представления в основном будут объединять неконфиденциальную информацию из реальной таблицы с фиктивной информацией из отдельных таблиц. Фиктивная информация заменила всю конфиденциальную информацию из реальной таблицы.
Данные передаются через очищающий фильтр. Это в основном выгружает производственную базу данных и пропускает ее через программу-анонимайзер, которая заменяет конфиденциальную информацию. В простых случаях такие вещи, как адреса, были настроены одинаково.
Подобно (2) выше, но фильтр может использовать данные из определенных данных поиска. Например, адрес может быть сформирован из 4-значного номера улицы, названия, выбранного из 1000 наиболее распространенных названий улиц, типа улицы (ST, RD, CRES, WAY, PLACE и т. Д.) И базы данных городов. Телефонный номер может быть любой последовательностью из десяти цифр (в соответствии с требованиями телефонной компании), но без дублирования.