XGBoost - это продвинутая реализация повышения градиента, которая используется для победы во многих соревнованиях по машинному обучению.

Это убедительно, но может быть трудно начать. Установка xgboost в Windows может быть очень утомительной задачей. В Windows пакет xgboost требует компиляции. Здесь я изложил ряд шагов, которые помогут успешно установить библиотеку.

Спецификация моей системы: Windows 10, 64-разрядная; Anaconda 5.2; Python 3.6.

1. Установите MingW64



После загрузки «mingw-w64-install.exe» запустите установку, дважды щелкнув файл.

При запуске mingw-64-install.exe вы должны выбрать x86_64 архитектуру на экране настроек. В этой архитектуре 64-разрядная версия также является целью по умолчанию. Не изменяйте другие параметры.

Затем нажмите «Далее» и убедитесь, что вы устанавливаете его в программные файлы, а не в программные файлы (x86).

Добавьте путь Windows к папке, в которую вы установили mingw-w64, как показано ниже:

я. Откройте Advanced System Settings, затем нажмите Environment Variables.

II. Выберите Путь и нажмите Редактировать.

iii. Добавьте путь в переменную среды, как показано ниже, а затем нажмите OK.

2. Загрузите и установите git для windows

Загрузите git для Windows. Следуйте инструкциям по ссылке.



Если терминал Git Bash открыт, закройте терминал Git Bash и снова запустите его. При этом будет учтена новая переменная Path. Чтобы убедиться, что с вами все в порядке, введите следующее

$ который mingw32-make

Он должен вернуть что-то вроде:

3. Установить xgboost

Чтобы установить xgboost, следуйте этим инструкциям: http://xgboost.readthedocs.io/en/latest/build.html

  • Вкратце, из командной строки git перейдите в каталог, в который вы хотите скопировать папку xgboost, и введите:
cd C:/
git clone --recursive https://github.com/dmlc/xgboost
  • cd в папку xgboost и введите в консоли git следующее:
cd C:\xgboost
git submodule init
git submodule update
alias make='mingw32-make'
cp make/mingw64.mk config.mk
make

Компиляция займет много времени. После завершения компиляции откройте командную строку anaconda.

4. Установите привязки python

Надеюсь, вы установили версию python для анаконды. Вы можете скачать анаконду с https://www.anaconda.com/download/.

Откройте приглашение Anaconda (командная строка) и перейдите в папку xgboost:

cd C:\xgboost 

Примечание. Здесь «C: \ xgboost» - это установочный каталог Xgboost на моем ПК.

Затем установите привязки python следующим образом:

cd python-package
python setup.py install

5. Демо-пример

Этот демонстрационный пример взят из http://xgboost.readthedocs.io/en/latest/get_started/index.html. Мы можем быстро опробовать xgboost на демонстрационном наборе данных в задаче двоичной классификации. Вы можете скопировать демонстрационную папку из установочного каталога xgboost в папку xgboost в Anaconda3 / LIb / site-packages / xgboost-0.6-py3.6.egg / xgboost, чтобы демонстрационные файлы были доступны в пакетах сайтов.

import os
mingw_path = 'C:\\Program Files\\mingw-w64\\x86_64-8.1.0-posix-seh-rt_v6-rev0\\mingw64\\bin'
xgboost_demo_path = 'C:\\ProgramData\\Anaconda3\\Lib\\site-packages\\xgboost-0.6-py3.6.egg\\xgboost\\demo\\data\\'
os.environ['PATH'] = mingw_path + ';' + os.environ['PATH']
import xgboost as xgb
# read in data
dtrain = xgb.DMatrix(xgboost_demo_path+"agaricus.txt.train")
dtest = xgb.DMatrix(xgboost_demo_path+"agaricus.txt.test")
# specify parameters via map
param = {'max_depth':2, 'eta':1, 'silent':1, 'objective':'binary:logistic' }
num_round = 2
bst = xgb.train(param, dtrain, num_round)
# make prediction
preds = bst.predict(dtest)
print (preds)
Output:
[0.28583017 0.9239239 0.28583017 … 0.9239239 0.05169873 0.9239239 ]