С Новым годом, ребята!!

С каждым новым годом мы все пытаемся принимать решения, и я тоже… в прошлом году на самом деле J. В рамках моего решения и цели по приобретению знаний и развитию навыков я сделал «Науку о данных», в частности «Машинное обучение», в качестве своей основной области навыков. на 2021 год.

Когда я начал со знания теории и приблизился к большему пониманию алгоритмов, типов и т. Д., Я достиг предела, когда мое сознание попросило меня перейти к реализации и просто сделать это. Было легче сказать, чем сделать, когда я понял, что инженеру машинного обучения приходится работать со множеством библиотек с открытым исходным кодом, такими языками, как Python, Scala/Java или фреймворками, такими как R, PyCharm/Anaconda/VSCode Code IDE, инструментами сборки и модульного тестирования, диаграммами. инструменты для построения графиков и, самое главное, инфраструктура машинной памяти, процессора и жесткого диска.

Проблемная зона

В среднем инженеру машинного обучения нужно сделать следующее, чтобы дожить до суда!!!

· Сбор и понимание данных

· Очистка данных

· Исследование данных

· Маркировка и разработка функций

· Предварительная обработка данных для модели

· Базовое построение моделей и обучение

· Настройка и проверка модели

· Управление экспериментами и отслеживание

· Прогнозы и прогнозирование

Почти для всех вышеперечисленных шагов существуют разные инструменты для создания и развертывания моделей машинного обучения, начиная с ядра Python и заканчивая flask и Docker, но, как я упоминал ранее во введении, получение среды со всеми необходимыми параметрами вместе с необходимой инфраструктурой — это действительно большая проблема. ; так как это очень сложно, отнимает много времени, отклоняется от фокуса инженера по машинному обучению, дорого и подвержено ошибкам.

AWS SageMaker

SageMaker — это полностью управляемый сервис из облака Amazon (AWS), который помогает быстро подготавливать, создавать, обучать, управлять и развертывать модели машинного обучения, не тратя время на установку инструментов управления масштабированием машинного обучения и инфраструктуры.

Amazon SageMaker — это полностью управляемый сервис, который предоставляет каждому разработчику и специалисту по данным возможность быстро подготовить создание, обучение и развертывание моделей машинного обучения (ML). SageMaker избавляет от тяжелой работы на каждом этапе процесса машинного обучения, чтобы упростить разработку высококачественных моделей. SageMaker предоставляет все компоненты, используемые для машинного обучения, в одном наборе инструментов, поэтому модели быстрее внедряются в производство с гораздо меньшими усилиями и меньшими затратами.

Ссылка: https://aws.amazon.com/sagemaker/features/

Amazon SageMaker был запущен на AWS re:Invent 2017. В основе Amazon SageMaker лежит возможность создавать, обучать, оптимизировать и развертывать модели в полностью управляемой инфраструктуре и в любом масштабе. Это позволяет инженерам машинного обучения сосредоточиться на изучении и решении текущей проблемы машинного обучения, вместо того чтобы тратить время и ресурсы на создание инфраструктуры и управление ею.

Пример использования SageMaker

Ниже приведены некоторые общие примеры использования AWS SageMaker:

· Классификация машинного обучения

· Регрессия машинного обучения

· Кластеризация машинного обучения

· Распознавание изображений (Amazon Rekognition)

· Обработка изображений

· Преобразование текста в речь и наоборот

· НЛП

· Модели глубокого обучения

Пример архитектуры приложения SageMaker

  1. Как потребление API

2. Пользовательский интерфейс

3. Потоковая аналитика в реальном времени

4. Пакетный вывод

Заключение

Из своего личного опыта я понял, что вместо того, чтобы пытаться создавать свои машины для экспериментов с машинным обучением, лучше использовать облачные возможности AWS с SageMaker. Мало того, что вы получаете действительно большие машины с CPU/EA/GPU в соответствии с требованиями для обучения моделей, но и Notebook поможет просто так разобраться в коде!!!

Рекомендации