Сегодня спрос на инженеров машинного обучения и специалистов по обработке данных значительно превышает предложение. Большинство студентов вначале пугаются, когда слышат термин «машинное обучение». Они думают, что это какая-то причудливая и сложная вещь, позвольте мне заверить вас, что это довольно просто, как только вы это поймете, и если вы просто прочитаете эту статью, она определенно поможет в запуске вашего машинного обучения. путешествие.

Хотите прочитать эту историю позже? Сохранить в журнале.

Начнем с определения. ML в основном означает разработку алгоритма, который может учиться на определенном наборе данных, который у вас есть, и обобщать его для новых данных.

Существует много типов алгоритмов машинного обучения, но в этой статье мы рассмотрим самый простой - линейная регрессия, так что приступим.

Предположим, у нас есть данные о наших 5 сотрудниках, которые говорят об их зарплате на основе их многолетнего опыта. Теперь мы хотели бы обобщить эти данные, предположим, если человек приходит на собеседование и хочет обсудить свою зарплату и имеет 7-летний опыт работы, но что, если у нас нет конкретных данных, которые говорят нам, какой должна быть зарплата за 7 лет опыта, поэтому мы хотели бы иметь модель, которая принимает в качестве исходных данных любое количество лет опыта и может выводить ожидаемую зарплату.

Для достижения этой цели мы хотели бы найти эту зеленую линию на приведенном выше рисунке, которая хорошо соответствует нашим данным. Теперь давайте немного вспомним школьную математику, каково уравнение любой линейной линии.

Надеюсь, вы смогли вспомнить уравнение y = mx + c, где m - наклон, c - точка пересечения, x - годы опыта (наши данные) и y это зарплата (выход). Теперь все, что нам нужно сделать, это найти эти правильные значения m и c, чтобы мы получили эту точную зеленую линию, мои поздравления, это все, что есть в линейной регрессии. Довольно просто, да, есть только одна проблема: как нам узнать, каковы правильные значения для этих m и c.

Что ж, есть способ, который называется Backpropagation. Не пугайтесь этого большого сложного слова, это на самом деле довольно простая концепция. Я предполагаю, что это ваша первая статья о машинном обучении, поэтому я не буду углубляться в нее, но в основном нам нужно выбрать какое-то случайное значение m и c в начале, и тогда мы получим действительно плохую модель, которая плохо справляются с предсказанием зарплаты, поэтому мы будем наказывать его за это и продолжать наказывать, пока он не начнет делать хорошие прогнозы, давайте посмотрим, как это сделать.

У нас будет функция стоимости, которая представляет собой просто сумму квадратов разностей между нашими прогнозируемыми значениями и фактическими значениями, и мы хотели бы минимизировать эту функцию, она будет минимизирована, когда разница между нашими прогнозируемыми значениями и фактическими значениями становится очень маленькой, в идеале близкой к 0.

Итак, сначала наша модель будет делать очень плохие прогнозы, поскольку мы выбираем случайные значения m и c, поэтому наша линия y = mx + c не будет хорошо соответствовать нашим данным. Следовательно, функция стоимости станет очень высокой, поэтому теперь наш алгоритм немного изменит значения m и c, чтобы уменьшить функцию стоимости, и этот процесс будет повторяться до тех пор, пока наши прогнозируемые значения не приблизятся к фактическим значениям, а функция стоимости не будет минимизирована, и мы получим наши наиболее подходящая линия. Еще одна вещь, если вы знакомы с расчетом, вы можете попробовать минимизировать эту функцию стоимости самостоятельно, а если нет, то не беспокойтесь об этом, есть несколько очень хороших библиотек, которые могут позаботиться об этом за вас. Спасибо, что дожили до конца, и если вы искренне прочитали эту статью, то теперь у вас есть базовое представление о машинном обучении и линейной регрессии.

Если у вас есть какие-либо сомнения или вы хотите оставить отзыв, свяжитесь со мной по адресу [email protected] и подпишитесь на меня в среде, чтобы получить мой будущий контент.

📝 Сохраните эту историю в Журнале.