Эта статья является последней в серии под названием Машинное обучение — это не чудо, в которой рассказывается, как начать работу с машинным обучением с помощью знакомых инструментов, таких как Excel, Python, Jupyter Notebooks и облачных сервисов от Azure и Amazon. Веб-сервисы. Заходите сюда каждую пятницу, чтобы узнать о будущих платежах.

В предыдущей части этой серии мы попытались решить проблему на основе нескольких предположений, сделанных на основе существующего набора данных. Теперь мы проверим эти предположения, проверив их в Microsoft Excel. Также пришло время сопоставить понятия, которые мы обсуждали до сих пор, с официальной терминологией машинного обучения.

Том М. Митчелл, известный американский ученый-компьютерщик и профессор Университета Карнеги-Меллона, широко цитируется за его определение машинного обучения: Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач. T и показатель производительности P, если его производительность при выполнении задач в T, измеряемая P, улучшается с опытом E.

Попробуем перевести вышеприведенное определение. Машинное обучение — это способность строить логику на основе существующих данных без необходимости явного программирования. Основываясь на определенных алгоритмах, программы машинного обучения могут выводить свою логику без явного написания кода программистом.

Алгоритмы машинного обучения могут работать с данными, имеющими достаточно четко определенную структуру. Наш набор данных о зарплате Stack Overflow имеет несколько столбцов, таких как категория, местоположение, опыт и зарплата. Хотя это меньший набор данных, почти все строки содержат полные данные, из которых алгоритмы могут делать выводы.

Читать всю статью на The New Stack

Janakiram MSV — аналитик, консультант и архитектор. Подпишитесь на него в Twitter, Facebook и LinkedIn.