Публикации по теме 'scikit-learn'


Обучение ранжированию с помощью XGBoost
научный комплект учиться и панды Я увлекся скачками. Я не конный человек, но я инженер. И, как любой инженер, я хотел разработать решение, которое помогло бы мне определить, какая лошадь могла бы выиграть скачку. Я решил попробовать использовать метод контролируемого машинного обучения под названием Learning to Rank , чтобы найти лошадей, которые с наибольшей вероятностью выиграют. В рамках этого проекта я пробовал разные модели для ранжирования. Когда я реализовал ранжирование..

Создание классификатора из набора данных UCI для прогнозирования риска диабета на ранней стадии
Для начала мы должны сначала пойти и загрузить набор данных из хранилища наборов данных UCI. Ссылку на набор данных можно найти ниже. https://archive.ics.uci.edu/ml/datasets/Early+stage+diabetes+risk+prediction+dataset . После загрузки набора данных, если он не слишком велик, мне нравится просматривать его в электронной таблице, чтобы понять, с чем я работаю. Как вы можете видеть, у нас есть всего 17 переменных со значениями двоичной записи для каждого поля, кроме «Возраст»...

Линейная регрессия с нуля в Python БЕЗ Scikit-learn
В этом руководстве я кратко ознакомлюсь с одним из наиболее часто используемых алгоритмов машинного обучения, линейной регрессией, а затем мы узнаем, как реализовать его с помощью метода наименьших квадратов с нуля в python без sci-kit. -учиться. Мы также рассмотрим интерпретацию R в квадрате в регрессионном анализе и то, как его можно использовать для измерения качества регрессионной модели. Линейная регрессия - это тип алгоритма прогнозного анализа, который показывает линейную связь..

Обучение ранжированию с помощью Python scikit-learn
Если вы управляете веб-сайтом электронной коммерции, то классической проблемой является ранжирование вашего продукта, предлагаемого на странице поиска, таким образом, чтобы максимизировать вероятность того, что ваши товары будут проданы. Например, если вы продаете обувь, вы хотите, чтобы первая пара обуви на странице результатов поиска была той, которая с наибольшей вероятностью будет куплена. Благодаря повсеместному внедрению машинного обучения теперь проще, чем когда-либо, создавать и..

Построение классификатора дерева решений
Использование NumPy в Python В мире машинного обучения дерево решений - это очень распространенный подход к прогнозному моделированию, используемый для прогнозирования категориальных (деревья классификации) или непрерывных (деревья регрессии) значений. В этой статье я буду обсуждать деревья классификации. В этом посте я расскажу, что такое дерево решений, как его можно применить для задач классификации и как реализовать его самостоятельно. Если вы просто хотите перейти к коду, Node..

Открытый курс машинного обучения. Тема 7. Обучение без учителя: PCA и кластеризация.
Добро пожаловать в седьмую часть нашего открытого курса машинного обучения! В этом уроке мы будем работать с методами обучения без учителя, такими как анализ главных компонентов (PCA) и кластеризация. Вы узнаете, почему и как мы можем уменьшить размерность исходных данных и каковы основные подходы к группировке похожих точек данных. Краткое содержание статьи Вступление Анализ главных компонентов Интуиция, теории и прикладные проблемы Примеры применения 3. Кластерный..

Обычное руководство по контролируемому обучению с помощью scikit-learn — Стохастический градиентный спуск — SGD…
Обычное руководство по контролируемому обучению с помощью scikit-learn — Стохастический градиентный спуск — Обобщенные линейные модели SGD (13) Это тринадцатая часть из 92 частей обычного руководства по обучению с учителем с помощью scikit-learn, написанного с целью научиться эффективно использовать алгоритмы и объяснить алгоритмическую логику, лежащую в их основе. Ссылки на все части смотрите в первой статье . Градиентный спуск На теоретическом уровне градиентный спуск — это..