Курс машинного обучения в Дели — пожалуй, самая курящая тема 21-го века, поскольку мы генерируем информацию со скоростью, намного превышающей ту, которую мы можем реально обработать. Многие деловые и технологические фирмы в настоящее время используют ключевые преимущества, используя преимущества информационной науки. Из-за этого информатика сейчас действительно процветает.

В этом блоге мы глубоко окунемся во вселенную машинного обучения. Мы познакомим вас с основами машинного обучения и рассмотрим, как построить модель машинного обучения. Мы также создадим нерегулярную модель лесных угодий в Python, чтобы отменить процесс понимания.

Что такое машинное обучение?

Институт машинного обучения в Дели — это исследование, направленное на то, чтобы заставить ПК учиться и действовать, как люди, и улучшать свое обучение через некоторое время в самодостаточном стиле, предоставляя им информацию и информацию в типа восприятия и подлинного взаимодействия. Существует широкий спектр видов вычислений машинного обучения, сотни из которых распределяются каждый день, и они регулярно собираются либо по стилю обучения (например, регулируемое обучение, индивидуальное обучение, полууправляемое обучение), либо по сходству в структуре или мощности ( например, группировка, рецидив, дерево выбора, кластеризация, глубокое обучение и т. д.). Несмотря на стиль обучения или возможности, все комбинации вычислений машинного обучения включают следующее:

Изображение (множество классификаторов или язык, который понимает ПК)

Оценка (иначе известная как целевая/оценочная способность)

Улучшение (техника поиска; часто, например, классификатор с наивысшей оценкой; используются как готовые, так и настраиваемые стратегии оптимизации)

Шаги для построения модели машинного обучения

Вот пошаговый пример того, как медицинская клиника может использовать машинное обучение для улучшения результатов пациентов и возврата вложенных денег:

1. Определите венчурные направления

Начальным шагом цикла существования является признание шанса существенно улучшить задачи, повысить лояльность потребителей или, во всяком случае, вызвать уважение. В клинической индустрии выписанные пациенты то и дело создают условия, требующие их прибытия в медицинскую клинику. Несмотря на то, что эти повторные госпитализации опасны и проблематичны для пациента, они означают, что клиника будет вкладывать дополнительные силы и средства в лечение пациентов в последующем. Madrid Software Trainings в Дели.

2. Получите и изучите информацию

Следующим этапом является сбор и настройка всей важной информации для использования в машинном обучении. Это подразумевает консультации со специалистами в области клинической области, чтобы определить, какая информация может быть применима для прогнозирования частоты повторных госпитализаций, сбор этой информации из хронологических записей о понимании и преобразование ее в механизм, подходящий для изучения, по всей вероятности, в структуру документов уровня, например, файл . csv.

3. Информация о модели

Чтобы получить представление о вашей информации с помощью машинного обучения, вам необходимо определить свою целевую переменную, фактор которой вы пытаетесь получить более глубокое понимание. В этой ситуации клиника неотложной помощи выберет «повторно госпитализированный», который включается в качестве элемента в его проверяемый набор данных во время сбора информации. В этот момент они будут запускать вычисления машинного обучения в наборе данных, которые будут создавать модели, основанные на записанной информации. Наконец, клиника запускает обученные модели на основе информации, на которой модель не была обучена, чтобы предположить, будут ли новые пациенты, вероятно, повторно госпитализированы, что позволяет ей выбрать лучший вариант рассмотрения пациента.

4. Интерпретировать и передавать

Одна из самых хлопотных задач компаний, занимающихся машинным обучением, — объяснение результатов модели тем, у кого нет знаний в области информационных технологий, особенно в исключительно управляемых отраслях, например, в медицинских услугах. Обычно машинное обучение рассматривалось как «открытие» из-за того, что так сложно интерпретировать идеи и передавать их мотивы партнерам и административным органам. Чем более интерпретируема ваша модель, тем проще будет выполнить административные требования и передать ее стимулы совету директоров и другим ключевым партнерам.

5. Выполняйте, записывайте и поддерживайте

Последним достижением является выполнение, запись и поддержка проекта в области информационных технологий, чтобы медицинская клиника могла продолжать использовать и улучшать свои модели. Организация модели регулярно представляет собой проблему из-за необходимого опыта кодирования и информатики, а возможность выполнения с самой ранней начальной точки цикла с использованием обычных стратегий информатики является ограничительно долгой.

Заявление о выпуске

Некая организация по производству автомобилей X хочет сосредоточиться на своих клиентах в отношении их конкретной модели автомобиля. Клиентов узнают по возрасту, компенсации и сексуальной ориентации. Ассоциация должна знать или предвидеть, какие клиенты будут влиять на сделки с их новым автомобилем и действительно купят его.

Здесь у нас есть купленный сегмент, который содержит два качества, то есть 0 и 1. 0 указывает на то, что транспортное средство не было куплено определенным человеком. 1 указывает на предложение транспортного средства.

Использование кода

Импорт необходимых библиотек

Сначала вы должны импортировать все необходимые библиотеки, что облегчит нам создание частей модели. Мы используем Keras для изготовления произвольной модели леса. Мы используем библиотеку matplotlib для построения контуров и диаграмм и представления результатов. В конце концов, мы также импортируем возможности из модуля sklearn, которые могут помочь нам разделить нашу информацию на обучающую и тестовую части.

# Импорт библиотек

импортировать numpy как np

импортировать matplotlib.pyplot как plt

импортировать панд как pd

из sklearn.model_selection импорта train_test_split

из sklearn.ensemble импортировать RandomForestClassifier

Загрузка набора данных

В этой последовательности вы должны сложить свой набор данных в память. С этого момента мы выделяем подопечные и независимые факторы для обучения нашего классификатора. В большинстве случаев приходится изолировать палату и независимые факторы.

# Импорт набора данных

набор данных = pd.read_csv('Social_Network_Ads.csv')

X = набор данных.iloc[:, [2, 3]].значения

у = набор данных.iloc[:, 4].значения

Разделение набора данных для формирования обучающей и тестовой информации

Во всех случаях вы должны сделать несколько сегментов в своей информации. Значительная часть вашей информации используется в качестве тренировочного набора, а небольшая часть используется в качестве тестового набора. Нет четко определенных критериев объема обучения и набора тестов. Как бы то ни было, очень многие люди следуют стандарту 70–30 или 75–25, где больший кусок — это ваш тренировочный набор. Мы обучаем информацию на обучающем наборе и тестируем ее на тестовом наборе. Эта процедура известна как утверждение. Основная мысль, стоящая за этой причиной существования, заключается в том, что необходимо измерить присутствие модели на информации, которую модель никогда не наблюдала. В этих реальных ситуациях модель будет предвидеть значения скрытой информации. Кроме того, такие системы, как одобрение, помогают нам избежать переобучения или недообучения модели.

Переобучение намекает на ситуацию, когда наша модель усвоила конкретную информацию, на которой она обучалась. Он будет превосходно работать с тренировочной информацией, но будет иметь низкую точность для любой незаметной точки информации. Переобучение похоже на то, что ваша модель вполне уверена в информации, которую она имеет, и не имеет широких утверждений. Соответственно, недообучение — это когда ваша модель носит общий характер и не может хорошо предвидеть ваш конкретный вариант использования. Чтобы достичь наилучшей точности модели, вы должны найти некую гармонию между переоснащением и недообучением.

# Разделение набора данных на обучающий набор и тестовый набор

из sklearn.model_selection импорта train_test_split

X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0,25, random_state = 0)

Стандартизация оценки набора данных

из sklearn.preprocessing импортировать StandardScaler

  1. sc = Стандартный масштаб()

3. X_train = sc.fit_transform(X_train)

4. X_test = sc.transform(X_test)

Подгонка классификатора нерегулярной глуши

Для этой ситуации мы подгоняем нашу модель к обучающей информации. Мы используем модель нерегулярной глуши, раскрытую пакетом sklearn в python. Наконец, мы независимо передаем зависимые и независимые основные моменты, через которые наша модель выполняет внутреннее сопоставление между ними с использованием числовых коэффициентов.

  1. # Подгонка произвольного заказа Timberland к тренировочному набору

2. из sklearn.ensemble импортировать RandomForestClassifier

3. классификатор = RandomForestClassifier (n_estimators = 10, мера = «энтропия», random_state = 0)

4. classifier.fit(X_train, y_train)

Прогнозирование результатов с помощью классификатора

В этой части мы передаем нашей модели скрытые качества, на основе которых она делает прогнозы. Мы используем беспорядочную сеть для определения таких измерений, как точность, правильность и обзор для нашей модели. Эти измерения помогают нам понять выставку модели.

  1. # Прогнозирование результатов набора тестов

2. y_pred = классификатор.predict(X_test)

3. # Создание сетки беспорядка

4. из sklearn.metrics импортировать путаницу_матрицу

5. cm = матрица_путаний (y_test, y_pred)

Визуализация ожиданий

Кроме того, мы попытались представить ожидания нашей модели, используя приведенный ниже код.

1. # Визуализация результатов набора тестов

2. # Визуализация результатов набора тестов

из matplotlib.colors импортировать ListedColormap

3. X_набор, y_набор = X_тест, y_тест

4. X1, X2 = np.meshgrid(np.arange(начало = X_set[:, 0].min() — 1, стоп = X_set[:, 0].max() + 1, продвижение = 0,01),

5. np.arange(начало = X_set[:, 1].min() — 1, стоп = X_set[:, 1].max() + 1, продвижение = 0,01))

6. plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),

7. альфа = 0,75, cmap = ListedColormap((‘красный’, ‘зеленый’)))

8. plt.xlim(X1.min(), X1.max())

9. plt.ylim(X2.min(), X2.max())

10. для I, j в перечислении (np.unique (y_set)):

11. plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],

12. c = ListedColormap(('красный', 'зеленый'))(i), name = j)

13. plt.title('Случайное расположение Timberland (тестовый набор)')

14. plt.xlabel('Возраст')

15. plt.ylabel («Расчетная оплата»)

16. табл.легенда()

17. плт.показать()