Мы пишем этот пост для новичков, которые плохо знакомы с захватывающим миром машинного обучения. Этот пост даст вам полное представление об этой области.

Контент был собран из нескольких источников и представлен в наглядной форме, чтобы дать четкое представление о предметной области машинного обучения.

Глава 01
Давайте разберемся, где машинное обучение используется в реальном мире

Мы хотели бы выразить это таким образом, чтобы человек, не имеющий опыта в области машинного обучения (ML), также понял. Мы объясним несколько реальных приложений, которые используют люди, даже не подозревая, что это ML.

1. Делали ли вы когда-нибудь покупки в Интернете? Проверяя продукт, заметили ли вы, что он рекомендует продукт, аналогичный тому, что вы ищете? Или вы видели, что «человек, купивший этот продукт, также купил эту» комбинацию продуктов? Как они выполняют эту рекомендацию? Это машинное обучение.

2. Получали ли вы когда-нибудь звонок из любого банка или финансовой компании с просьбой взять ссуду или страховой полис? Кому они звонят? Нет, они звонят только избранным клиентам, которые, по их мнению, купят их продукт. Как они выбирают? Это целевой маркетинг, который можно применить с помощью кластеризации. Это машинное обучение.

3. Вы ходите в супермаркет за продуктами или чем-то еще? Вы когда-нибудь замечали, что чипсы кладут рядом с прохладительными напитками? Почему? Тот, кто купит холодный напиток, скорее всего, купит чипсы. Как они узнали об этой связи? Это майнинг ассоциативных правил (анализ рыночной корзины). Это машинное обучение.

4. Такие компании, как Google, Microsoft уже давно используют машинное обучение в большинстве своих продуктов. Компании, занимающиеся аналитикой данных, ежедневно используют концепции машинного обучения. Машинное обучение - одна из тех областей, которая окажет большое влияние на наше будущее.

5. Есть один практический пример Quora. Вам нравится читать, например, на такие темы, как информатика, технологии и психология. Среди множества других тем, за которыми вы следите, эти три являются темами, по которым вы обязательно откроете все вопросы и ответы. Иногда вы заходите на определенную тему или в профиль конкретного человека и читаете оттуда много чего, вы делаете это регулярно, потому что вам это нравится. Правильно? Между тем в базах данных на Quora хранятся шаблоны для вашего поискового запроса и ваших интересов в Интернете. Теперь, когда вы в следующий раз откроете Quora, вы получите контент, основанный на этих шаблонах. Это означает, что Quora будет показывать вам контент по теме или от человека, которого вы любите читать больше всего, например, информатики, технологий и психологии. Все это произошло благодаря машинному обучению. Quora проанализировала шаблоны на основе вашей истории просмотров и заставила свою машину (базу данных) узнать, что показывать в вашей ленте новостей. Это машинное обучение!

6. Поиск Google. Алгоритм машинного обучения просматривает ваши предыдущие поисковые данные, чтобы предоставить вам наилучшие результаты поиска в Google. Итак, если вы искали в Google такого актера, как Роберт Дауни-младший, он также перенесет вас на страницы о Железном человеке или других фильмах, над которыми он работал.

7. Прогнозы запасов. Алгоритмы машинного обучения используются для анализа старых данных о запасах и прогнозирования будущих значений.

8. Машинное обучение широко используется в области робототехники. Недавно был представлен робот по имени София, который действительно мог вести себя как люди.

Давайте разберемся с философией машинного обучения:

Две задачи, которые мы выполняем постоянно, как сознательно, так и подсознательно, - это категоризировать то, что мы воспринимаем своими органами чувств (например, горячее или холодный бумажный стаканчик, горячая или холодная керамическая кружка), чтобы предсказывать будущее на основе нашего прошлого опыта и выполнять новые действия, в которых предсказание и категоризация часто происходят в тандеме (например мы продолжаем увеличивать давление, удерживая бумажный стаканчик, пока не почувствуем, что это правильно, и остановимся задолго до того, как мы ее раздавим. Если бы это была керамическая кружка, ее можно было бы быстро схватить - не беспокойтесь о раздавливании). Действие обусловлено некоторой формой вознаграждения (например вкусом напитка).

Мы выполняем обе эти задачи - категоризацию и прогноз для

• простая повседневная операция - держать чашку
• и для сознательного долгосрочного планирования нашего будущего, основанного на нашем выборе.

Животные, в том числе насекомые, все время выполняют одни и те же две задачи - пчела в зависимости от определенных факторов решает, где и когда искать мед. Маленькая птичка готовится к зиме, храня семена в разных местах и ​​не забывая есть их последовательно, сначала самые старые, чтобы не испортиться.

Если бы мы грубо визуализировали категоризацию и прогнозы, они выглядели бы как две стороны одной медали, как показано на рисунке ниже.

  • В случае категоризации проводится линия, разделяющая точки данных - кошки и собаки.
  • В случае прогнозирования линия проводится через заданные точки данных и часто используется для оценки того, будет ли она продолжать расти / падать, как показано на изображении ниже.

Задача категоризации

  • Хотя мы не проводим в нашем мозгу линий, разделяющих кошек и собак (размещение кошек и собак на картинке выше было произвольным и чисто для иллюстративных целей), мы делаем нечто очень похожее.
  • Излишне говорить, что способ разделения кошек и собак намного сложнее, чем красная кривая выше.
  • Мы учитываем множество характеристик, таких как форма головы, размер тела, хвост и т. Д., Чтобы классифицировать кошку / собаку. Бывают случаи, когда нам может быть не так просто разделить кошку и собаку - например, если собака маленькая и пушистая. Таким образом, это не всегда четкая категоризация собак и кошек.
  • В детстве, когда мы классифицировали кошек и собак на основе их характеристик, мы можем классифицировать кошку или собаку, которых никогда раньше не видели - граница, которая символически представлена ​​красной кривой выше, помогает нам разместить собаку или кошку справа. категория.

Задача прогнозирования

  • Точно так же, если бы мы угадали направление кривой (рисунок вверху справа) на основе заданных точек данных, мы бы сказали, что она, скорее всего, будет расти, несмотря на это. это ухабистая траектория.
  • Кривая также является прогнозом для подгонки новой точки, которая находится в пределах диапазона существующих точек данных, то есть того, насколько близко новая точка будет к кривой.
  • Таким образом, красные точки на рисунке выше (справа) являются примерами обоих случаев - точки внутри и за заданными точками данных - кривая пытается предсказать оба из них (с небольшими ошибками в случае красных точек).

Таким образом, эти задачи, категоризация и прогнозирование сводятся к рисованию извилистых линий.

По сути, машинное обучение - не трудная для понимания концепция. Фактически, подавляющее большинство алгоритмов машинного обучения решает всего одну простую задачу: рисовать линии. В частности, машинное обучение - это построение линий с помощью данных.

Глава 02

Давайте теперь определим, что такое машинное обучение

Имея скромный опыт в области машинного обучения, я сейчас дам определение этому термину!

«Машинное обучение - это способ заставить машину учиться, очень похожий на то, как учатся люди».

Короче говоря, машинное обучение использует математические алгоритмы для изучения и анализа данных, чтобы делать прогнозы и / или принимать решения в будущем.

Что такое машинное обучение на примере?

Кто из вас заметил, что, посетив веб-сайт электронной коммерции, такой как Amazon, и просматривая определенные продукты, вы сразу же начнете видеть один и тот же продукт в своей ленте в социальных сетях? Будь то Facebook, Instagram, YouTube или даже Twitter, такая реклама играет с вами психологическую шутку и убеждает купить этот продукт.

Если вы посмотрите на это, машина убедила вас принять решение без участия человека.

«Машинное обучение вместе с искусственным интеллектом сформирует почти все отрасли в ближайшие десятилетия».

Посмотрите учебное пособие по машинному обучению на YouTube здесь (любезно предоставлено Simplilearn):

Что такое искусственный интеллект (ИИ)?

Теперь, когда вы знаете, что такое машинное обучение, давайте немного поговорим об искусственном интеллекте.

Искусственный интеллект - это супернабор машинного обучения. На следующей схеме показано, как связаны искусственный интеллект, машинное обучение и глубокое обучение.

Дополнительные примеры

Машинное обучение присутствует во всех сферах нашей повседневной жизни. От кондиционеров вашего умного дома, которые изменяют температуру в соответствии с теплом и пульсом вашего тела, до смартфона, который персонализирует вашу ленту новостей в соответствии с вашими интересами, до Uber, который вы заказали для работы, - машинное обучение полностью охватило нашу жизнь.

Как работает машинное обучение?

Машинное обучение - это приложение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования.

Рисунок Машинное обучение использует ИИ для обучения, прогнозирования и улучшения

Любой процесс в машинном обучении включает следующие шаги.

1. Сначала мы введем данные.

2. Проанализируйте данные с помощью модели машинного обучения, включающей алгоритм.

3. Найдите закономерности в данных и обучите модель.

4. Делайте прогнозы / принимайте решения на основе этой обученной модели на новых данных.

5. Сохраните обратную связь прогноза / решения, чтобы укрепить ее на более позднем этапе.

Типы машинного обучения

Ниже приведены наиболее популярные типы машинного обучения и его алгоритмы, используемые в отрасли вместе с их приложениями.

Машинное обучение можно разделить на 3 типа:

  1. Контролируемое обучение: системы могут предсказывать будущие результаты на основе прошлых данных. - Требуется, чтобы модели были предоставлены как входные, так и выходные данные для обучения.
  2. Обучение без учителя - системы могут определять скрытые закономерности на основе предоставленных входных данных. - Делая данные более удобочитаемыми и организованными, закономерности, сходства или аномалии становятся более очевидными.
  3. Обучение с подкреплением. Системы не обучаются. - Он учится на основе вознаграждения / наказания, полученного за выполнение своего последнего действия. - Это помогает повысить эффективность инструмента / функции или программы.

Пример использования из реальной жизни: приложения машинного обучения в Facebook

Машинное обучение широко используется в Facebook:

Uber полностью основан на машинном обучении!

Посмотрите видео, чтобы подробно изучить машинное обучение (предоставлено машинным обучением):

Что можно сделать с помощью машинного обучения?

Вы можете создать программу, которая может видеть изображение и говорить о нем предложение (хотя это задача, требующая большого количества данных): Чтобы получить более подробную информацию о проектах машинного обучения, посмотрите два видео ниже.

Как мы учим компьютеры понимать изображения

Вы можете сделать программу, которая играет в игру Марио:

Чем занимается специалист по машинному обучению?

• Проведение экспериментов по машинному обучению с использованием языка программирования и библиотек машинного обучения.

• Внедрение решений машинного обучения в производство.

• Улучшение решений для масштабируемости и производительности.

• Обеспечение отличного потока данных между серверными системами и базой данных.

• Развертывание собственного кода машинного обучения.

• Анализ данных и создание сценариев использования.

Теперь все поймете с помощью красивой визуализации:





В чем разница между машинным обучением, анализом данных, интеллектуальным анализом данных, наукой о данных и ИИ?

Вот краткое описание каждого из этих терминов:

Наука о данных: относится к целому ряду методов, с помощью которых вы пытаетесь извлечь информацию и идеи из данных. Это включает отчетность MIS на самом низком уровне для построения прогнозных моделей на более высоком уровне.

Интеллектуальный анализ данных - это наука о сборе всех прошлых данных и последующем поиске закономерностей в этих данных. Вы ищете согласованные закономерности и / или отношения между переменными. Как только вы найдете эти идеи, вы подтвердите результаты, применив обнаруженные закономерности к новым подмножествам данных. Конечная цель интеллектуального анализа данных - это прогнозирование, а прогнозный интеллектуальный анализ данных является наиболее распространенным типом интеллектуального анализа данных, имеющим наиболее непосредственные бизнес-приложения.

Анализ данных: это широко используемый термин. Люди, составляющие отчеты, также говорят, что они анализируют данные, как и разработчики прогнозного моделирования. Я бы просто принял это, поскольку любую попытку разобраться в данных можно назвать анализом данных.

Машинное обучение - это наука о создании алгоритмов и программ, которые обучаются сами по себе. Однажды спроектированные, они не нуждаются в человеке, чтобы стать лучше. Некоторые из распространенных приложений машинного обучения включают следующее: веб-поиск, фильтры спама, рекомендательные системы, размещение рекламы, кредитный рейтинг, обнаружение мошенничества, торговля акциями, компьютерное зрение и разработка лекарств. Легкий способ понять это - по-человечески невозможно создать модели для каждого возможного поиска или спама, поэтому вы делаете машину достаточно умной, чтобы учиться сама. Когда вы автоматизируете более позднюю часть интеллектуального анализа данных - это называется машинным обучением.

Глава 03

Давайте определим основу для разработки приложения для машинного обучения (проект)

Инструменты и технологии, используемые в машинном обучении

Есть несколько инструментов / пакетов, которые в последнее время стали очень популярными. Без сомнения, scikit-learn: машинное обучение на Python - лучший вариант.

Помимо Python, Проект R для статистических вычислений предоставляет отличный набор инструментов для использования больших данных.

Структура машинного обучения для разработки проектов

О процессе прикладного машинного обучения написано много. Мы следуем 6-этапному процессу классификации и регрессионного типа задач, которые являются общими типами проблем, лежащих в основе большинства проблем машинного обучения. Процесс выглядит следующим образом:

1. Определение проблемы: понять и четко описать решаемую проблему.

2. Анализировать данные: понять доступную информацию, которая будет использоваться для разработки модели.

3. Подготовить данные: откройте для себя структуру набора данных.

4. Оценить алгоритмы: разработать надежную систему тестирования и базовую точность для улучшения и выборочной проверки.

5. Улучшение результатов: используйте результаты для разработки более точных моделей.

6. Представьте результаты: опишите проблему и решение, чтобы третьи лица могли это понять.

Вышеупомянутые 6 шагов можно резюмировать на изображении ниже.

Рис.: Обзор процесса прикладного машинного обучения

Следуя описанному выше процессу решения каждой проблемы, над которой вы работаете, вы обеспечиваете минимальный уровень строгости и резко увеличиваете вероятность получения хороших (или, что более вероятно, отличных) результатов.

Используйте Weka Machine Learning Workbench

Программная платформа для начинающих - Weka Machine Learning Workbench.

Я думаю, что решение использовать Weka с самого начала не составляет труда, потому что:

Он предоставляет простой графический пользовательский интерфейс, который инкапсулирует процесс прикладного машинного обучения, описанный выше.

  • Это облегчает изучение алгоритмов и наборов данных, а также разработку и анализ строгих экспериментов.
  • Это бесплатный и открытый исходный код, работающий под лицензией GNU GPL.
  • Он кроссплатформенный и работает в Windows, Mac OS X и Linux (требуется виртуальная машина Java).
  • Он содержит современные алгоритмы с впечатляющим обилием деревьев решений, алгоритмов на основе правил и методов ансамбля, а также других.

Вы можете сами убедиться, насколько проста в использовании платформа, существует множество руководств Weka, таких как:

· Как запустить свой первый классификатор

· Как спланировать и провести свой первый эксперимент

· Как строго настроить алгоритм в запланированном эксперименте

· Как использовать ансамблевые методы в Weka

Кроме того, если вы попадете прямо в Weka, вы можете запускать алгоритмы из командной строки и интегрировать алгоритмы в свое приложение через интерфейс прикладного программирования. Это расширяемая платформа, и вы можете быстро и легко реализовать свои собственные алгоритмы в интерфейсе и использовать их в графическом интерфейсе.

Глава 04
Давайте обсудим самый простой алгоритм, который будет использоваться в машинном обучении - регрессия

Линейная регрессия - это самый базовый алгоритм машинного обучения для начала. Хотя это базовый, но довольно популярный среди специалистов по анализу данных.

Линейная регрессия - это математический подход к вычислению значения определенной переменной на основе других переменных.

Многие из вас могут быть знакомы с уравнением Y = mX + c, которое представляет собой уравнение для прямой линии, где:

· Y - зависимая переменная

· X - независимая переменная

Теперь, чтобы оценить эту переменную Y по отношению к переменной X, вам нужно знать два параметра «m» и «c». С помощью линейной регрессии вы оцениваете эти параметры «m» и «c», так что, если вам дан X, вы можете легко предсказать для него Y.

Ниже представлена ​​четкая картина того, что я намеревался объяснить:

Теперь, как результат приведенного выше уравнения, вы получите строку вроде:

Эта линия широко известна как Линия регрессии. Линия регрессии не создается за одну итерацию. Фактически, так называемые значения 'm' и 'c' вычисляются несколько раз, прежде чем прийти к этой Линии регрессии.

Теперь я хочу, чтобы вы сосредоточились на ключевом слове «Регрессия». Регресс в целом означает что-то принудительное.

Линия регрессии, полученная в результате оценки 'm' и '' c, на самом деле основана на методе, известном как LSE (оценка методом наименьших квадратов), который минимизирует сумму квадратов остатков, полученных как результат каждого уравнения.

Следовательно, линия регрессии также известна как линия наилучшего соответствия.

Хотя это классический статистический метод, но в настоящее время он используется с машинным обучением, в котором у вас есть набор значений X и Y, и вы строите модель линейной регрессии, используя эти значения X и Y, так что если вы предоставите модель с другим набором значений X он автоматически предсказывает для них Y.

Интеллектуальная карта алгоритмов машинного обучения

Существует множество алгоритмов машинного обучения, используемых для обучения моделей и прогнозирования с их помощью. Большинство алгоритмов машинного обучения можно обобщить на изображении ниже .

1. Машинное обучение с учителем

Большая часть практического машинного обучения использует обучение с учителем.

Контролируемое обучение - это когда у вас есть входные переменные (x) и выходная переменная (Y), и вы используете алгоритм для изучения функции сопоставления от входа к выходу.

Y = f(X)

Цель состоит в том, чтобы аппроксимировать функцию сопоставления настолько хорошо, чтобы, когда у вас есть новые входные данные (x), вы могли предсказать выходные переменные (Y) для этих данных.

Это называется обучением с учителем, потому что процесс обучения алгоритму на основе набора обучающих данных можно рассматривать как учителя, контролирующего процесс обучения. Мы знаем правильные ответы, алгоритм итеративно делает прогнозы на основе данных обучения и корректируется учителем. Обучение прекращается, когда алгоритм достигает приемлемого уровня производительности.

Задачи контролируемого обучения можно далее сгруппировать в задачи регрессии и классификации.

  • Классификация: проблема классификации возникает, когда выходной переменной является категория, например «красный» или «синий» или «болезнь» и «отсутствие болезни». Ниже приведены основные алгоритмы классификации.

Логистическая регрессия

кНН

SVM

Классификатор дерева решений

Классификатор случайного леса

  • Регрессия. Проблема регрессии возникает, когда выходной переменной является действительное значение, такое как «доллары» или «вес». В этой категории находятся следующие алгоритмы.

Линейная регрессия

Множественная регрессия

Полиномиальная регрессия

Регрессор дерева решений

Случайный лесной регрессор

СВР

2. Машинное обучение без учителя

Обучение без учителя - это когда у вас есть только входные данные (X) и нет соответствующих выходных переменных.

Цель обучения без учителя - смоделировать базовую структуру или распределение данных, чтобы узнать о них больше. Это называется обучением без учителя, потому что, в отличие от вышеуказанного обучения, здесь нет правильных ответов и нет учителя. Алгоритмы предоставлены сами себе, чтобы обнаруживать и представлять интересную структуру данных.

Проблемы неконтролируемого обучения можно далее сгруппировать в проблемы кластеризации и ассоциации.

  • Кластеризация. Проблема кластеризации заключается в том, что вы хотите обнаружить неотъемлемые группировки в данных, например группировку клиентов по покупательскому поведению. Kmeans ++ - наиболее часто используемый алгоритм кластеризации.
  • Ассоциация: проблема изучения правил ассоциации - это когда вы хотите найти правила, которые описывают большие части ваших данных, например, люди, которые покупают X, также склонны покупать Y. Алгоритм априори для проблем изучения правил ассоциации.

Глава 05
Как практиковать проекты машинного обучения

Существует множество онлайн-платформ, на которых вы можете начать работу над проектами и получить опыт в этой области.

1. https://www.hackerrank.com/

2. https://www.hackerearth.com/

3. https://www.kaggle.com/

Лучший способ быстро овладеть необходимыми навыками машинного обучения - это попрактиковаться в формировании навыков с помощью небольших простых для понимания наборов данных. Этот метод помогает создавать процессы с использованием интересных реальных данных, которые достаточно малы, чтобы их можно было просматривать в Excel или WEKA. В этой статье вы узнаете о высококачественной базе данных с большим количеством наборов данных и получите несколько советов, которые помогут вам сосредоточить свое время на том, что для вас важно!

Зачем практиковаться с наборами данных?

Следование онлайн-руководствам будет держать вас в ловушке зависимого мышления, которое будет ограничивать ваш рост, потому что вы не узнаете, КАК решать какие-либо проблемы. Вы учитесь применять конкретное решение к определенному типу проблемы. Это эквивалент переобучения, которое, как мы все знаем, приводит к плохим результатам в реальных условиях.

Если вы хотите стать инженером по машинному обучению, вам нужно убедиться, что вы можете обобщать реальные данные. Бросьте вызов самому себе каждый день и решайте проблемы, используя определенный процесс.

Практика использования наборов данных - лучший способ сделать это.

Где я могу получить наборы данных?

К счастью для всех, существует фантастический репозиторий проблем машинного обучения, к которому вы можете получить доступ бесплатно.

Репозиторий машинного обучения UCI

Центр машинного обучения и интеллектуальных систем Калифорнийского университета в Ирвине создал репозиторий машинного обучения UCI. Вот уже 30 лет сюда приезжают исследователи машинного обучения и студенты машинного обучения, которым для практики нужны наборы данных. Вы можете скачать все доступные наборы данных на их веб-странице. Они также перечисляют все подробности об этом, включая любые публикации, в которых он использовался, что действительно полезно, когда вы хотите узнать, что исследователи атаковали проблему. Наборы данных также можно загрузить несколькими способами (CSV / TXT).

У наборов данных UCI есть только два недостатка.

  • Другой недостаток в том, что они маленькие, поэтому у вас не будет большого опыта в крупномасштабных проектах, но это не имеет значения, потому что вы, ребята, в этом новичок! Начни с малого!
  • Самым существенным недостатком является то, что эти наборы данных очищаются и предварительно обрабатываются. Очистка и предварительная обработка - важные части процесса машинного обучения, с которыми вам придется столкнуться в своей карьере. Если вы не потратите время на отработку этого навыка, то в будущем вам будет больно.

Целенаправленная практика

Как вы целенаправленно тренируетесь, когда существует так много наборов данных? Начинающий инженер по машинному обучению лучше всего постарается выяснить, каковы их цели, и выбрать набор данных, который лучше всего поможет им достичь этой цели. Я разработал несколько вопросов, которые вы можете задать себе, чтобы сократить количество наборов данных.

  • Какую проблему вы хотите решить?
  • Регрессия, классификация, регрессия, кластеризация?
  • Какого размера это набор данных? Десятки точек данных или миллионы
  • Сколько функций в наборе данных?
  • Какие особенности?
  • Из какого домена этот набор данных?

Выясните, на каком типе наборов данных вы хотите сосредоточиться, чтобы соответствовать вашим более широким целям. Получив это, вы сможете фильтровать огромное количество наборов данных, доступных на платформе.

Примеры проблем

Не волнуйтесь, если вы не совсем уверены в том, чему пытаетесь научиться. Гораздо лучше не застревать, пытаясь найти идеальный план обучения. Я составил список некоторых наборов данных, которые могут вас заинтересовать. Здесь есть несколько типов проблем, так что попробуйте их все.

Регрессия: http://archive.ics.uci.edu/ml/datasets/Wine+Quality

Кластеризация: «https://archive.ics.uci.edu/ml/datasets/Bag+of+Words

Классификация: http://archive.ics.uci.edu/ml/datasets/Wine

Классификация работоспособности: https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29

Онлайн-курсы и видео

К счастью, в 2019 году есть ряд отличных онлайн-ресурсов, которые помогут вам быстро освоить машинное обучение.

Курс Coursera Эндрю Нг является здесь стандартом и отлично объясняет математику и теорию, лежащую в основе традиционного машинного обучения.

• Для более практичного подхода, основанного на коде, попробуйте Руководство по машинному обучению.

• Для глубокого обучения курс fast.ai

Офлайн-классы (занятия в классе)

Вы можете присоединиться к учебному лагерю по физическим классам Forsk Technologies в Джайпуре.

Forsk Technologies базируется в Джайпуре и работает с университетами, чтобы подготовить студентов к найму на основе навыков с использованием данных и технологий. В настоящее время специализируется на IoT, машинном обучении, глубоком обучении, облаке, больших данных, Fullstack и мобильных устройствах.

Присоединяйтесь к нашей предстоящей летней программе в 2019 году.

Книги

Практическое машинное обучение с помощью Scikit-Learn и Tensorflow (О’Рейли) - Благодаря серии недавних достижений глубокое обучение способствовало развитию всей области машинного обучения. Теперь даже программисты, которые почти ничего не знают об этой технологии, могут использовать простые и эффективные инструменты для реализации программ, способных обучаться на основе данных. В этой практической книге показано, как это сделать.

Машинное обучение в реальном мире (Manning) - Машинное обучение в реальном мире - это практическое руководство, призванное научить работающих разработчиков искусству выполнения проектов машинного обучения. Не перегружая вас академической теорией и сложной математикой, он знакомит с повседневной практикой машинного обучения, подготавливая вас к успешному созданию и развертыванию мощных систем машинного обучения ».

Programming Collective Intelligence (O’Reilly) - «Хотите использовать возможности рейтинга в поиске, рекомендаций по продуктам, создания закладок в социальных сетях и поиска партнеров в Интернете? Эта увлекательная книга демонстрирует, как можно создавать приложения Web 2.0 для добычи огромного количества данных, созданных людьми в Интернете. С помощью сложных алгоритмов, описанных в этой книге, вы можете писать интеллектуальные программы для доступа к интересным наборам данных с других веб-сайтов, сбора данных от пользователей ваших собственных приложений, а также анализа и понимания данных, как только вы их найдете.

Введение в статистическое обучение (Springer Texts in Statistics) - Введение в статистическое обучение предоставляет доступный обзор области статистического обучения, важный набор инструментов для понимания огромных и сложных наборов данных, которые появились. в области от биологии до финансов, от маркетинга до астрофизики за последние двадцать лет. В этой книге представлены некоторые из наиболее важных методов моделирования и прогнозирования, а также соответствующие приложения. "

Руководства

Ваш первый поэтапный проект машинного обучения на Python (Джейсон Браунли) - Вы хотите заниматься машинным обучением с использованием Python, но у вас возникли проблемы с началом работы? В этом посте вы завершите свой первый проект машинного обучения с использованием Python. Если вы новичок в машинном обучении и хотите, наконец, начать использовать Python, это руководство было разработано для вас .

Python Machine Learning: Scikit-Learn Tutorial (Datacamp) - Машинное обучение - это раздел в информатике, изучающий разработку алгоритмов, которые могут обучаться. Типичными задачами являются концептуальное обучение, функциональное обучение или «прогнозное моделирование, кластеризация и поиск прогнозных паттернов. Эти задачи можно понять с помощью доступных данных, которые были получены, например, на основе опыта или инструкций. »

Машинное обучение в Python: учебное пособие (Dataquest) - «В этом руководстве мы расскажем вам об основных принципах машинного обучения и расскажем, как начать работу с машинным обучением с помощью Python. К счастью для нас, Python имеет потрясающую экосистему библиотек, с которой легко начать работу с машинным обучением. В этом руководстве мы будем использовать отличные библиотеки Scikit-learn, Pandas и Matplotlib. "

Машинное обучение в R для начинающих (Datacamp) - Это небольшое руководство предназначено для ознакомления вас с основами машинного обучения в R: в частности, оно покажет вам, как использовать R для работы с хорошо- известный алгоритм машинного обучения под названием «KNN или k-ближайшие соседи. »