Стать инженером по машинному обучению | Шаг 3: выберите свой инструмент

Как инженеры, мы всю свою карьеру учимся использовать новые и более совершенные инструменты, чтобы создавать продукты, приносящие реальную пользу. Инструменты, которые мы используем, могут часто меняться, но все они выполняют определенную функцию и имеют варианты использования. Несмотря на то, что машинное обучение в его современной форме является очень новым явлением в отрасли, в распоряжении инженера имеется широкий спектр инструментов. В конце этой статьи вы должны лучше понять некоторые доступные инструменты и понять, подходит ли какой-либо из них для вас.

Основные инструменты

WEKA | Среда Вайкато для анализа знаний

WEKA - это современная рабочая среда для машинного обучения с множеством замечательных функций, которые понадобятся каждому инженеру по машинному обучению для исследования данных и применения алгоритмов. Все эти великолепные функции без необходимости писать ни одной строчки кода. Независимо от того, программист вы или нет, я рекомендую попробовать различные задачи с WEKA.

Я также часто использую его, когда знакомлюсь с новыми наборами данных, которые должны быть в процессе решения проблем (Стать инженером по машинному обучению | Шаг 2: Выберите процесс). Встроенные алгоритмы, инструменты построения графиков, простой импорт данных и простой в использовании графический интерфейс позволяют мне исследовать данные намного быстрее, чем писать быстрый скрипт на Python.

WEKA Download | Отличное руководство WEKA

Python + библиотеки

Python - доступный язык программирования, который на данный момент является самым быстрорастущим в отношении пользователей, документации и библиотек. Благодаря удивительным библиотекам, таким как NumPy, SciPy, Tensorflow, Pandas, Flask и многим другим, вы можете делать с Python все, что захотите.

Единственным недостатком python является то, что он может работать медленнее, чем другие языки, если вы не используете библиотеки эффективно. Возьмем, к примеру, матрицы и NumPy, вам очень редко придется использовать циклы для изменения значений, а если вы должны, то свести их к абсолютному минимуму.

Курс Python Coursera Мичиганского университета

R

R - это рабочая лошадка для статистического анализа и машинного обучения. Это платформа для понимания и изучения ваших данных с использованием статистических методов и графиков. Вдобавок ко всему есть большое количество алгоритмов машинного обучения и продвинутых реализаций, написанных разработчиками алгоритма.

Это отличный инструмент для всех разработчиков, но если вы новичок в машинном обучении, я бы посоветовал углубиться в Python. Вы можете не только разрабатывать офф-лайн, но и доводить свой проект до производства, что невозможно при использовании только R.

Курс Джона Хопкинса R Coursera

Другие отличные инструменты

Matlab / Octave

MATLAB / Octave отлично подходит для представления и работы с матрицами. Это программное обеспечение очень популярно в университетах, и непрограммистам легко попасть в него, но вы можете игнорировать это, если планируете практиковать машинное обучение в реальном мире.

Матлаб Скачать | Загрузка Octave

C

В производственных средах часто можно увидеть прототипы алгоритмов на R или Python, а затем реализованные на C для повышения скорости выполнения и надежности системы. Если вы планируете серьезно заняться реализацией алгоритмов машинного обучения, возможно, имеет смысл сосредоточиться на C.

Учебник по Си

Какие инструменты использовать?

Python и WEKA :)

Спасибо за чтение :) Если вам понравилось, нажмите кнопку хлопка внизу как можно больше раз! Это будет много значить для меня и побудит меня писать больше подобных историй

Давайте также подключимся к Twitter, LinkedIn или электронной почте