XGBoost - это продвинутая реализация повышения градиента, которая используется для победы во многих соревнованиях по машинному обучению.
Это убедительно, но может быть трудно начать. Установка xgboost в Windows может быть очень утомительной задачей. В Windows пакет xgboost требует компиляции. Здесь я изложил ряд шагов, которые помогут успешно установить библиотеку.
Спецификация моей системы: Windows 10, 64-разрядная; Anaconda 5.2; Python 3.6.
1. Установите MingW64
После загрузки «mingw-w64-install.exe» запустите установку, дважды щелкнув файл.
При запуске mingw-64-install.exe
вы должны выбрать x86_64
архитектуру на экране настроек. В этой архитектуре 64-разрядная версия также является целью по умолчанию. Не изменяйте другие параметры.
Затем нажмите «Далее» и убедитесь, что вы устанавливаете его в программные файлы, а не в программные файлы (x86).
Добавьте путь Windows к папке, в которую вы установили mingw-w64, как показано ниже:
я. Откройте Advanced System Settings, затем нажмите Environment Variables.
II. Выберите Путь и нажмите Редактировать.
iii. Добавьте путь в переменную среды, как показано ниже, а затем нажмите OK.
2. Загрузите и установите git для windows
Загрузите git для Windows. Следуйте инструкциям по ссылке.
Если терминал Git Bash открыт, закройте терминал Git Bash и снова запустите его. При этом будет учтена новая переменная Path. Чтобы убедиться, что с вами все в порядке, введите следующее
$ который mingw32-make
Он должен вернуть что-то вроде:
3. Установить xgboost
Чтобы установить xgboost, следуйте этим инструкциям: http://xgboost.readthedocs.io/en/latest/build.html
- Вкратце, из командной строки git перейдите в каталог, в который вы хотите скопировать папку xgboost, и введите:
cd C:/ git clone --recursive https://github.com/dmlc/xgboost
- cd в папку xgboost и введите в консоли git следующее:
cd C:\xgboost
git submodule init
git submodule update
alias make='mingw32-make'
cp make/mingw64.mk config.mk
make
Компиляция займет много времени. После завершения компиляции откройте командную строку anaconda.
4. Установите привязки python
Надеюсь, вы установили версию python для анаконды. Вы можете скачать анаконду с https://www.anaconda.com/download/.
Откройте приглашение Anaconda (командная строка) и перейдите в папку xgboost:
cd C:\xgboost
Примечание. Здесь «C: \ xgboost» - это установочный каталог Xgboost на моем ПК.
Затем установите привязки python следующим образом:
cd python-package python setup.py install
5. Демо-пример
Этот демонстрационный пример взят из http://xgboost.readthedocs.io/en/latest/get_started/index.html. Мы можем быстро опробовать xgboost на демонстрационном наборе данных в задаче двоичной классификации. Вы можете скопировать демонстрационную папку из установочного каталога xgboost в папку xgboost в Anaconda3 / LIb / site-packages / xgboost-0.6-py3.6.egg / xgboost, чтобы демонстрационные файлы были доступны в пакетах сайтов.
import os mingw_path = 'C:\\Program Files\\mingw-w64\\x86_64-8.1.0-posix-seh-rt_v6-rev0\\mingw64\\bin' xgboost_demo_path = 'C:\\ProgramData\\Anaconda3\\Lib\\site-packages\\xgboost-0.6-py3.6.egg\\xgboost\\demo\\data\\' os.environ['PATH'] = mingw_path + ';' + os.environ['PATH'] import xgboost as xgb # read in data dtrain = xgb.DMatrix(xgboost_demo_path+"agaricus.txt.train") dtest = xgb.DMatrix(xgboost_demo_path+"agaricus.txt.test") # specify parameters via map param = {'max_depth':2, 'eta':1, 'silent':1, 'objective':'binary:logistic' } num_round = 2 bst = xgb.train(param, dtrain, num_round) # make prediction preds = bst.predict(dtest) print (preds) Output: [0.28583017 0.9239239 0.28583017 … 0.9239239 0.05169873 0.9239239 ]