Машинное обучение редко связано с глубоким обучением. И это нормально.

Начнем с того, почему я пишу эту статью. Человеку, который только начинает свой путь в науке о данных, легко потерять лес из-за деревьев. И нет, это не каламбур про деревья решений и случайные леса. Я имею в виду, что есть так много всего, что нужно узнать, так много того, что может вызвать восторг, но я думаю, что мы все должны сосредоточиться на детальном понимании основ. Глубокое обучение — это невероятный шаг вперед в области машинного обучения, это определенно область, которая вызывает интерес у многих людей, даже привлекая их в первую очередь к этой области исследований, но правда в том, что немногие компании на самом деле применяют эти методы. Чаще всего линейные модели прекрасно решают бизнес-задачи. Я хочу сказать, что вы более ценны для компании, если у вас есть четкое понимание фундаментальных алгоритмов машинного обучения, чем если вы слишком распыляетесь, сосредотачиваясь на новых инструментах.

Что такое машинное обучение?

Я решил добавить этот раздел сюда, так как существует так много определений, что легко запутаться в том, что является машинным обучением, а что нет.

Машинное обучение — это приложение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования. Основная цель — позволить компьютерам автоматически обучаться без вмешательства или помощи человека и соответствующим образом корректировать действия — Источник

Многие определения могут быть довольно многословными, но я думаю, что приведенная выше цитата подводит итог довольно хорошо. Машинное обучение — это подраздел ИИ, который направлен на то, чтобы дать системе возможность учиться на опыте (то есть учиться на данных) без явного программирования для поведения определенным образом.

Все это звучит довольно привлекательно, но модель линейной регрессии делает именно это и, следовательно, прочно относится к области машинного обучения. Для многих это может быть несколько обескураживающим.

Мы все видели, что Excel лучше всего подходит к некоторым данным, поэтому вы хотите сказать мне, что Excel применяет методы машинного обучения?

Ну да, на самом деле это так. Но это нормально. Линейная регрессия имеет репутацию простого и пресного инструмента, но это исключительно мощный инструмент, который исключительно недооценивают, особенно среди людей, относительно новых в этой области (включая меня до того, как я задумался над этой статьей). В качестве примера в этой статье я использую линейную регрессию, но многие другие фундаментальные алгоритмы имеют аналогичную репутацию.

Взгляд на тенденции…

Поскольку статья посвящена науке о данных, давайте взглянем на некоторые фактические данные. На приведенном ниже графике представлены данные из Google Trends, показывающие относительный интерес (количество поисковых запросов в Google) к машинному обучению, глубокому обучению и линейной регрессии за последние 15 лет.

Интерес к линейной регрессии оставался довольно стабильным в течение этого периода, что имеет смысл, так как она зародилась еще в начале 19 века либо Карлом Фридрихом Гауссом, либо Адрианом-Мари Лежандром (подробнее о ее спорном открытии можно прочитать здесь). Глубокое обучение, с другой стороны, стало по-настоящему популярным только в последние 5 лет.

Что дало мне «пищу для размышлений», так это то, что, несмотря на то, что глубокое обучение гораздо меньше используется в промышленности, его гораздо чаще ищут в Интернете. Это понятно, так как сейчас вокруг этой темы очень много шумихи, но я собираюсь нарушить правило науки о данных и предположить причинно-следственную связь этого.

Люди сосредотачиваются не на том. В любом случае интерес к самым интересным и передовым методам машинного обучения — это нормально. На самом деле, это здорово, так как это означает, что вы расширяете свои знания и демонстрируете живой интерес к темам, которые находятся на переднем крае вашей области. Но это нормально только до тех пор, пока мы не упускаем из виду основные алгоритмы, лежащие в основе области науки о данных.

Так кто же использует глубокое обучение, а кто нет?

Алгоритм глубокого обучения — это большая нейронная сеть с несколькими скрытыми слоями. Проблема с глубокими нейронными сетями заключается в том, что им требуются огромные объемы данных, чтобы получить преимущество перед традиционными алгоритмами машинного обучения.

На этом графике представлены общие тенденции производительности, которые мы наблюдаем при сравнении алгоритмов машинного обучения на наборах данных разного размера. Традиционные методы, как правило, превосходят нейронные сети, когда наборы данных меньше, и именно в этом заключается проблема.

Немногие компании располагают достаточным количеством данных, чтобы действительно воспользоваться преимуществами этих блестящих алгоритмов. Те, кто, как правило, являются технологическими гигантами, такими как Amazon, Facebook и Google. Дело в том, что большинство компаний все еще находятся на ранних этапах внедрения науки о данных и далеки от наличия ресурсов (данных, денег и опыта), необходимых им для использования преимуществ глубокого обучения.

Более того, бизнесу на самом деле нужно самое простое решение сложной проблемы. Даже если у компании есть ресурсы для глубокого обучения или любого другого сложного алгоритма, если проблема может быть решена с помощью более простой модели со сравнимой производительностью, можно поспорить, что они выберут эту более простую модель. Почему это?

Простые модели быстрее создаются, их проще внедрять, их легче интерпретировать и относительно легко обновлять. Важность этого не следует недооценивать. Чем проще алгоритм, тем он прозрачнее. Мы всегда должны избегать реализации моделей, которые являются «черными ящиками», поскольку это ограничивает область их применения, что в конечном итоге снижает их ценность для нас. Используя несложные модели, мы можем лучше исследовать и понимать взаимосвязи, существующие в решаемой нами проблеме.

Я закончу этот раздел цитатой, которая резюмирует суть моей точки зрения в довольно поэтической форме:

У сложных моделей есть ужасное искушение выжать лимон, пока он не высохнет, и представить картину будущего, которая благодаря своей точности и правдоподобию несет в себе убедительность. Тем не менее, человек, который использует воображаемую карту, думая, что это настоящая карта, скорее всего, окажется в худшем положении, чем тот, у кого вообще нет карты; ибо он не будет спрашивать всякий раз, когда он может, наблюдать за каждой деталью на своем пути и постоянно искать всеми своими чувствами и всем своим разумом указания, куда ему следует идти — Из малого — прекрасно» Э. Ф. Шумахера

Последнее замечание…

Пожалуйста, не поймите меня неправильно, сложно != плохо. Сложные подходы, безусловно, имеют место быть, и мы правы, что в восторге от них. Давайте просто удостоверимся, что основы покрыты в первую очередь. Не погружайтесь сразу в глубокую часть алгоритмического бассейна.

Кроме того, не расстраивайтесь, если вы не очень часто применяете передовые методы на рабочем месте. Сколько раз по телевизору мы видим адвокатов, спорящих перед присяжными, или врачей, проводящих экстренную операцию по спасению жизни?

Очень часто. Проблема в том, что это драматизированные представления реальности. Юристы редко делают это в своей повседневной работе, а врачи тратят большую часть своего времени на диагностику одних и тех же рутинных заболеваний каждый день. То же самое относится и к специалистам по данным.

Мы все время читаем о захватывающих разработках в этой области, которые могут заставить нас задуматься: «Почему моя работа кажется относительно обыденной?». Большую часть времени мы тратим на очистку и подготовку данных, а затем используем простые модели для решения поставленной задачи. Это все еще потрясающая работа. Управление ожиданиями — важная вещь, которую мы должны применять во многих аспектах нашей жизни, иначе мы можем навлечь на себя разочарование.

Спасибо, что дочитали до этого места! Буду рад услышать ваши мысли в комментариях. Если вы хотите связаться со мной напрямую, оставьте мне сообщение на LinkedIn.