Эй, ты! Я только что понял, когда писал диссертацию и читал всю литературу, чтобы сформировать свои исследовательские вопросы, теорию и т. Д. С самого начала я столкнулся с проблемой обнаружения дипфейков как проблемой классификации.

В то время я не знал, как я буду поддерживать эту теорию и методы с точки зрения моделей машинного обучения. Итак, я сделал то, что умею делать лучше всего; Я перечитал всю литературу СНОВА! (Брух, это было тяжело!!!🤯) Но угадайте, кто получит от этого наибольшую выгоду!? ТЫ 😇

Давайте обсудим шаги, связанные с созданием системы обнаружения дипфейков с использованием алгоритмов машинного обучения и рассмотрением проблемы как задачи бинарной классификации.

Сбор и подготовка данных (самый сложный этап процесса🙌🏼)

Хороший набор данных должен иметь большое количество образцов и быть разнообразным с точки зрения людей, поз, условий освещения и других факторов, которые могут повлиять на качество дипфейков. Набор данных также должен быть сбалансированным, с равным количеством реальных и поддельных выборок.

После того, как набор данных собран, его необходимо подготовить для использования в модели машинного обучения. Это включает в себя разделение данных на наборы для обучения и тестирования и предварительную обработку данных для извлечения функций, которые можно использовать для обучения модели. (Ах мммм 🙆🏻‍♀️)

Извлечение признаков

Извлечение признаков — это процесс идентификации и выбора признаков в данных, которые имеют отношение к поставленной задаче. В случае обнаружения дипфейков цель состоит в том, чтобы извлечь функции, которые могут отличить настоящие видео от видео дипфейков. (такое черно-белое заявление😜)

Одним из подходов к извлечению признаков является использование предварительно обученных моделей глубокого обучения, таких как ResNet, Inception или VGG. Эти модели были обучены на больших наборах данных изображений и могут извлекать признаки, которые имеют отношение к задачам классификации изображений. Другой подход заключается в использовании созданных вручную функций, таких как преобразование Фурье, локальные двоичные шаблоны или гистограммы градиентов.

Обучение моделей

После извлечения признаков можно обучить модель машинного обучения на данных. Одним из популярных алгоритмов для задач бинарной классификации является машина опорных векторов (SVM), которая пытается найти гиперплоскость, разделяющую настоящие и поддельные образцы. Другим популярным алгоритмом является логистическая регрессия, которая моделирует вероятность того, что образец является реальным или поддельным.

В процессе обучения модель оценивается на проверочном наборе, чтобы определить наилучшие гиперпараметры для модели, такие как скорость обучения, параметр регуляризации и количество скрытых слоев.

Оценка модели

После того, как модель обучена, она оценивается на тестовом наборе, чтобы определить ее производительность. Производительность модели можно измерить с помощью таких показателей, как точность, точность, полнота и оценка F1. Матрица путаницы (поверьте мне, это проще, чем следует из названия!!😁)также можно использовать для визуализировать работу модели.

Заключение

Обнаружение дипфейков — сложная задача, требующая знаний в области машинного обучения, компьютерного зрения и анализа данных. Успех системы обнаружения дипфейков зависит от качества данных, релевантности функций и эффективности модели.



Подпишитесь на The Journey», чтобы узнать больше о машинном обучении! Жасмин Бхарадия