Гиперпараметры. Я хотел пролить свет на важность гиперпараметров и то, как они влияют на цель нашего обучения.

Существует разница между гиперпараметрами, определенными в статистике, и гиперпараметрами, определенными в машинном обучении. Машинное обучение имеет ряд гиперпараметров, и я расскажу немного о каждом из них простыми словами, но сначала давайте попробуем понять, почему гиперпараметры необходимы.

Гиперпараметры относятся к другому типу параметров, которые нельзя узнать непосредственно в процессе обучения и которые необходимо предварительно определить.
«Хороший выбор гиперпараметров действительно может сделать алгоритм блестящим».

Мы можем упростить гиперпараметры как шаги для выпечки торта, если вы немного уменьшите температуру или если вы используете немного разные порции ингредиентов, вкус торта может измениться. Это будет вкусно (дайте нам результаты), но в то же время это может быть немного неточно с точки зрения точности.

Давайте теперь перейдем к важным гиперпараметрам, которые нам нужно настроить, прежде чем мы начнем тренировочную цель.

  • Скорость обучения: это один из наиболее важных параметров, которые мы классифицируем и который имеет прямую зависимость от точности. Скорость обучения определяет, сколько данных модель будет потреблять и идентифицировать в каждую эпоху. Так что весь процесс обучения ориентирован на минимизацию общих потерь. Потери можно уменьшить, если мы уменьшим общую скорость обучения. Когда мы уменьшаем общую скорость обучения, это дает модели машинного обучения больше времени для обработки обучающих данных и, следовательно, повышает общую точность. Однако для очень большого набора данных мы не можем поддерживать очень низкую скорость обучения, потому что это будет стоить времени. В приведенном ниже видео очень кратко и просто рассказывается о гиперпараметрах.
  • Количество эпох. Под эпохами понимается количество раз, когда модель фактически обрабатывает все данные. Большее число эпох означает, что модель просматривает данные большее количество раз, что может обеспечить лучшее обучение, но в то же время основным недостатком установки очень большого числа эпох является то, что это может привести к переоснащению данных, о которых я обсуждали в моих предыдущих блогах.
  • Скрытые слои. Количество скрытых слоев определяет сложность нейронной сети.
    Каждый узел данного слоя связан со всеми узлами предыдущих слоев. И это происходит для n скрытых слоев, которые мы определили.
    Когда общая сложность нейронной сети высока, они влияют на общее обучение и точность данной модели. Посмотрите приведенное ниже видео, чтобы лучше понять слои нейронной сети.
  • Единицы активации. Самое важное, что нужно помнить при определении единицы активации, — это определить тип решаемой проблемы. Например, нам нужно знать, решаем ли мы проблему регрессии или классификации. В зависимости от типа проблемы мы определяем различные функции активации для наших входных, скрытых и выходных слоев. Я писал о модулях активации в одном из своих предыдущих блогов. Одно из видео, которое я нашел полезным, упомянуто ниже:

Это все на сегодня. Продолжай учиться.

Ваше здоровье.