Машинное обучение - это изучение компьютерных алгоритмов, которые автоматически улучшаются по мере накопления опыта. Это рассматривается как часть искусственного интеллекта. Википедия

В машинном обучении и распознавании образов характеристика - это индивидуальное измеримое свойство или характеристика наблюдаемого явления. Выбор информативных, различающих и независимых признаков является важным шагом для эффективных алгоритмов распознавания, классификации и регрессии.

Эти главные прогнозы машинного обучения о будущем машинного обучения ясно указывают на более широкое применение машинного обучения в различных отраслевых вертикалях. Gartner прогнозирует, что к 2022 году 75% новых решений для конечных пользователей, использующих методы искусственного интеллекта и машинного обучения, будут построены с использованием рекламных роликов, а не платформ с открытым исходным кодом.

Лучшие приложения для машинного обучения

Оповещения о пробках.

Социальные сети.

Транспорт и поездки

Рекомендации по продуктам.

Виртуальные личные помощники.

Самостоятельно управляемые автомобили.

Динамическое ценообразование.

Переводчик Google.

В сегодняшней статье мы поговорим о пяти проектах 5 ML / репозитории на Github, которые помогут вам в реализации ваших проектов DataScience, чтобы улучшить ваши навыки в области науки о данных и искусственного интеллекта.

Примечание. В этой статье мы поговорим о некоторых действительно хороших проектах / репозиториях машинного обучения с открытым исходным кодом, которые вы можете использовать в своих проектах. Чтобы узнать больше о каждом из них, я рекомендую перейти по ссылке, указанной в проекте.

Обучение - это не просто повышение компетентности в своей работе, это гораздо больше. Datacamp позволяет мне учиться без ограничений.

Datacamp обеспечивает гибкость, необходимую для прохождения курсов в свободное время и приобретения основных навыков, необходимых для перехода к успешной карьере.

Datacamp научил меня быстро находить новые идеи и применять их к реальным проблемам. Пока я был на этапе обучения, Datacamp привлек меня ко всему, что происходило на курсах, от содержания курсов и отзывов ТА до встреч и лекций профессора в Твиттере.

Вот некоторые из моих любимых курсов, на которых я очень рекомендую вам учиться, когда это соответствует вашему расписанию и настроению. Вы можете напрямую применить концепции и навыки, полученные на этих курсах, в новом интересном проекте на работе или в вашем университете.

  1. Ученый-дата-с-питоном
  2. Дата-сайентист-с-р
  3. Ученый-машиностроитель-с-р
  4. Ученый-машинный с питоном
  5. Машинное обучение для всех
  6. Наука о данных для всех
  7. Дата-инженер-с-питоном
  8. Data-аналитик с питоном
  9. Основы больших данных через pyspark

Возвращаясь к теме -

1. TPOT

Github

Официальная документация

TPOT - это инструмент автоматизированного машинного обучения на Python, который оптимизирует машинное обучение конвейеры с использованием генетического программирования.

TPOT означает Инструмент оптимизации конвейера на основе дерева. Считайте TPOT своим помощником по науке о данных.

TPOT автоматизирует самое утомительное машинное обучение, разумно исследуя тысячи возможных конвейеров, чтобы найти лучший для вашего данные.

После того как TPOT завершит поиск (или вы устали ждать), он предоставит вам код Python для наилучшего конвейера , так что вы можете повозиться с конвейером оттуда.

Популярные статьи об ИИ:

1. Напишите свой первый проект AI за 15 минут

2. Создание озвучивания нейронного синтеза речи с помощью xVASynth

3. 5 основных тенденций в области искусственного интеллекта (ИИ) на 2021 год

4. Почему вы неправильно используете Spotify

2. FeatureTools

Github

Официальная документация

FeatureTools - это библиотека Python с открытым исходным кодом для автоматической разработки функций.

Инструменты объектов автоматически создают объекты из временных и реляционных наборов данных.

Глубокий синтез функций

Featuretools использует DFS для автоматизированной разработки функций. Вы можете комбинировать необработанные данные с тем, что вы знаете о своих данных, чтобы создать значимые функции для машинного обучения и прогнозного моделирования.

Точное управление временем

Featuretools предоставляет API, чтобы гарантировать, что для вычислений используются только действительные данные, сохраняя безопасность ваших векторов признаков от общих проблем с утечкой этикеток. Вы можете указать время прогнозирования построчно.

Многоразовые примитивы функций

Featuretools поставляются с библиотекой низкоуровневых функций, которые можно складывать для создания функций. Вы можете создавать и публиковать свои настраиваемые примитивы для повторного использования в любом наборе данных.

3. Авто-обучение

Github

Официальная документация

Auto-sklearn - это набор инструментов для автоматизированного машинного обучения и незаменимая замена для оценщика scikit-learn.

Автоматизированное машинное обучение в четырех строках кода

import autosklearn.classification
cls = autosklearn.classification.AutoSklearnClassifier()
cls.fit(X_train, y_train)
predictions = cls.predict(X_test)

Auto-sklearn освобождает пользователя машинного обучения от выбора алгоритма и настройки гиперпараметров. Он использует недавние преимущества в байесовской оптимизации, метаобучении и построении ансамблей.

Auto-sklearn 2.0 работает так же, как и обычный auto-sklearn.

4. OnnxRuntime

Github

Официальная документация

Onnxruntors » - это кроссплатформенный высокопроизводительный ускоритель логического вывода и обучения машинного обучения.

Он совместим со многими популярными фреймворками ML / DNN, включая PyTorch, TensorFlow / Keras, scikit-learn, и более.

Многие пользователи могут извлечь выгоду из ONNX Runtime, в том числе те, кто хочет:

  • Повышение эффективности вывода для широкого спектра моделей машинного обучения
  • Сократите время и стоимость обучения больших моделей
  • Обучение на Python, но развертывание в приложении C # / C ++ / Java
  • Различное оборудование и операционные системы
  • Поддержка моделей, созданных в нескольких других платформах

Используя INNXRUNTIME, вы можете:

  • Ускорьте процесс машинного обучения
  • Подключитесь к существующему стеку технологий
  • Создавайте с использованием проверенных технологий

5. Скорч

Github

Официальная документация

Skorch - это совместимая с scikit-learn библиотека нейронных сетей, которая является оболочкой PyTorch. Skorch требует Python 3.5 или выше. Skorch является духовным преемником nolearn, но вместо лазаньи и Theano он использует PyTorch.

Скорч не изобретает велосипед заново, чтобы не мешать вам по максимуму. Если вы знакомы со sklearn и PyTorch, вам не нужно изучать какие-либо новые концепции, а синтаксис должен быть хорошо известен.

Skorch также предоставляет множество удобных функций, в том числе:

Если вам нравится читать эту статью, я уверен, что мы разделяем схожие интересы и находимся / будем работать в схожих отраслях. Итак, подключимся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!

Не забудьте передать нам 👏!