1. В этом отчете мы постараемся осветить концепцию MDSBA, их методологию и связанную с ними работу, а также другие популярные методы анонимности, известные как К-анонимность [2]. Чтобы сделать его более понятным, мы кратко обсудим соответствующую работу, а затем обсудим преимущества и недостатки MBSBA. Для обычных данных был предложен известный метод анонимизации данных, идентифицированный как k-анонимность. Это размерный метод, который не подходит и нарушает анонимные данные и уменьшает полученную информацию. Для решения такой проблемы разные исследователи предлагают несколько анонимных методов, таких как ℓ-разнообразие [3] и (X, Y) анонимность [4]. Такие методы по-прежнему не могут решить реальную проблему, которая является одномерной, однако данные располагаются в многомерном шаблоне. Позже исследователем были предложены многомерные методы LKC-Privacy для преодоления одномерной структуры данных. Этот метод также известен как многомерная анонимизация сверху вниз, он специализируется на данных о лучших результатах [5]. Однако в случае больших данных процедуры и концепции отличаются тем, что они работают в параллельной распределенной среде, MapReduce является одним из методов, влияющих на масштабируемость и производительность. В двухэтапном Многомерном Сверху-вниз большие данные разбиваются на мелкие куски, что дает отрицательный эффект анонимизации информации и приводит к потере информации. Также в этом методе каждый фрагмент данных требует n раз итерации, чтобы получить лучший результат. Однако итерации блокируют узлы до конца процесса, что влияет на принцип параллельных вычислений и нарушает его. В [6] Многомерном методе анонимизации на основе чувствительности (MDSBA) он обеспечивает анонимизацию снизу вверх с распределенным параллельным процессом, а также уменьшает MapReduce. По словам автора и экспериментов, после сравнения с результатом этот метод дает владельцу данных многоуровневую анонимизацию для уровня множественного доступа пользователей. Также в этом методе он объединяет анонимизацию в одном домене. MDSBA обеспечивает безопасные вычисления при доступе пользователя и запущенных процессах, поскольку этот метод встроен в модель управления доступом на основе ролей (RBAC). RBAC предпочтительнее MAC из-за масштабируемости и гибкости на уровне пользователя для доступа и управления. Также в методе MDSBA используются четыре квазиидентификатора для анонимизации данных, а данные вертикально разделены на разные группы, эта функция помогает защитить пользователей от контекстуальных атак. Этот метод предназначен только для получения наилучшего результата, когда он используется для крупномасштабных данных, и его нельзя использовать для потоковой передачи данных. Метод MDSBA направлен на определение метода конфиденциальности и шаблона маскирования для каждого уровня доступа.

Ключевые слова:шифрование; Большие данные; "Облачные вычисления"; "Конфиденциальность данных"; Анонимизация;

Введение:

В последнее десятилетие, в связи с увеличением использования Интернета и веб-приложений, вопросы безопасности данных становятся важными, как никогда раньше. Большие данные дают множество возможностей для развития науки за счет улучшения здравоохранения, содействия экономическому росту и реформирования системы образования. В последнее время влияние моделей глубокого обучения связано с размером модели и набором обучающих данных. Кроме того, глубокое обучение широко используется при изучении не обучающих функций из сложных данных и широко используется в распознавании изображений, извлечении признаков, классификации и прогнозировании. Сбор разнородных данных в настоящее время более удобен. [1] Уязвимость вызывает серьезные опасения в средах, чувствительных к безопасности. Утечка личных данных вызвана сетевыми атаками или приемами прослушивания, однако эти возможности сопряжены с некоторыми проблемами, связанными с безопасностью и конфиденциальностью данных. Алгоритмы шифрования играют важную роль в системах защиты информации. Тем не менее, многие криптосистемы были разработаны и широко используются для защиты информации. Но несколько атак, таких как инициированные противником, прерывают процесс аналитики, что вредно и вызывает бесконечные циклы и последствия для пользователя. Для преодоления таких враждебных атак предлагается несколько методов сохранения конфиденциальности, основанных на анонимизации данных, список следующий;

К- Анонимность

L-разнообразие

Т- Близость

Рандомизация

Распределение данных

Анонимизация на основе многомерной конфиденциальности (MDSBA).

Алгоритм для MDBSA следующий [6]:

1. Владелец данных определяет Q-ID объекта и чувствительные атрибуты объекта S.

2. Владелец данных определяет значение объекта устаревания, процент участия в старении и возраст объекта.

3. Система определяет уровень чувствительности S на основе уровня доступа пользователя.

4. Система группирует записи в соответствии с эквивалентным конфиденциальным значением. 4

5. Система применяет MDSBA для поиска лучших анонимных Q-ID.

6. Система применяет MDSBA для определения подходящего шаблона маскирования.

7. RBAC защищает процессы анонимизации.

Определение MDBSA приведено ниже:

Уровень чувствительности (ψ) подразумевает шкалу значимости анонимизации данных, поэтому анонимизированные данные T делегируют многоуровневый уровень искаженных данных.

Определение 2: k-анонимность — это максимальное количество эквивалентных записей уровня владения k̄. Следовательно, k̄= k-i, где i ∈ ℤ, i = {k-1, …, 0} и k̄≤ k.

Чтобы сделать его более понятным, мы определим алгоритм, в котором MDBSA состоит из трех шагов, включающих группировку, вычисление чувствительности и применение надлежащего шаблона маскирования и специализации. На рис. 1 алгоритм объяснен автором шагов и функциональности. На начальном этапе они объединяют записи в соответствии с эквивалентными конфиденциальными значениями, тогда как каждая группа присоединяется к отдельному домену G, где G={G0,G1,G2…Gn}, и каждый домен Gi представляет одно конфиденциальное значение. Только.

Заключение

В этой статье мы сосредоточились на проблеме конфиденциальности больших данных и анонимизации, а также кратко обсудили К-анонимность. Также по сравнению с популярным методом многомерной конфиденциальности, известным MDTDS. MDSBA проверяется на масштабируемый уровень множественного доступа к обычным данным.

Ссылка:

[1] «https://mc.ai/overview-on-advanced-encryption-standard-aes/»

[2] К. Г. Шин, С. Джу, З. Чен и С. Ху, Защита конфиденциальности для пользователей услуг на основе определения местоположения, IEEE Wireless Communications, vol. 19, стр. 30–39, 2012.

[3] П. Рассом, «Аналитика больших данных», Отчет о передовой практике TDWI, Четвертый квартал, стр. 1–35, 2011 г.

[4] П. Самарати, «Защита личности респондентов при выпуске микроданных», Знание и разработка данных, IEEE Transactions on, vol. 13, стр. 1010–1027, 2001.

[5] L. T. Y. Xuyun Zhang, Chang Liu, Jinjun Chen, «Масштабируемый двухэтапный подход к нисходящей специализации для анонимизации данных с использованием MapReduce в облаке», IEEE, 2014.

[6] Аль-Зобби, Мохаммед, Сейед Шахрестани и Чун Руан. «Улучшение конфиденциальности MapReduce за счет реализации многомерной анонимизации на основе конфиденциальности». Журнал больших данных 4.1 (2017): 45.

Обзор анонимизации с многомерной анонимизацией на основе чувствительности