Инструменты для машинного обучения с Python в Windows. Часть 3: Код Visual Studio.

Это третье из трех руководств по настройке инструментов для разработки моделей машинного обучения с помощью Python в среде Windows.

Вот Часть 1: Анаконда и Часть 2: Блокнот Jupter

Обратите внимание, что с некоторыми настройками эти руководства также должны подходить для среды Linux или Mac.

Для тех, кто спешит, есть сообщение здесь с подробностями о быстрой настройке.

Разработка полного проекта в Jupyter Notebook не очень практична, и тогда возникает необходимость использовать IDE (интегрированную среду разработки). Visual Studio Code - это легкая среда IDE, которая обеспечивает большую гибкость с точки зрения множества доступных расширений. Поскольку вы по-прежнему будете использовать среды, предоставляемые Anaconda, важно знать, как сочетать эти две технологии.

Установка

Для начала скачайте и установите Visual Studio Code отсюда.

При установке стоит выбрать вариант «Открыть с помощью кода» в папке.

Создать проект

В проводнике создайте новую папку проекта в любом месте и откройте эту папку в VS Code, выбрав «Открыть папку…» на странице приветствия или выбрав пункт меню Файл - ›Открыть папку… или щелкнув правой кнопкой мыши внутри папки. и выбрав «Открыть с помощью кода».

Выберите «Новый файл» и дайте файлу имя «hello-world.py». Скопируйте и вставьте следующий код:

Установить расширение Python

Если вы впервые используете Visual Studio, вам необходимо добавить расширение Python.

Сначала нажмите кнопку расширений на левой боковой панели:

Затем введите «Python» в поле поиска и нажмите кнопку «Установить» на расширении Python. Для установки потребуется перезагрузка.

Запуск сценария: попытка 1

Вы заметите, что при доступе к файлу Python появляются некоторые предупреждения. Пока не обращайте на них внимания и откройте терминал. Вы можете сделать это с помощью пункта меню «Терминал» - ›« Новый терминал »или с помощью сочетания клавиш« Ctrl + Shift + «».

` называется обратным галочкой, и его положение на клавиатуре зависит от страны. Не путать с апострофом

Давайте запустим новый скрипт Python, выполнив в терминале следующее:

python hello-world.py

В зависимости от того, как вы настроили свою среду, вы можете получить сообщение:

‘python’ is not recognized as an internal or external command, operable program or batch file.

Скорее всего, вы также увидите следующее всплывающее сообщение:

Это означает, что Visual Studio не может найти экземпляр интерпретатора Python для использования с вашим кодом. Чтобы настроить это, используйте сочетание клавиш «Control + Shift + P» и введите слово «python». В отфильтрованном списке выберите «Python: Select Interpreter». В появившемся списке выберите

Запуск сценария: попытка 2

Visual Studio теперь настроена на использование интерпретатора Python в вашей среде Anaconda. Попробуем снова запустить python hello-world.py в терминале. Вы снова увидите ошибку о том, что «python» не распознается. В чем дело?

Итак, вы настроили интерпретатор, но вам также нужен терминал, настроенный для использования интерпретатора. Это требует двух шагов. Во-первых, вам нужно изменить терминал по умолчанию на «Командную строку» вместо Powershell. Для этого выберите «Control + Shift + P» и введите «оболочка по умолчанию», а затем выберите следующий вариант:

Затем выберите «Командная строка».

Теперь для второго шага: снова введите «Control + Shift + P», введите «python» и выберите «Python: Create Terminal». Будет создан новый терминал, и на этот раз вы должны увидеть префикс fun-with-python:

Запуск сценария: успешно

Снова запустите python hello-world.py, и на этот раз вы должны увидеть результат:

Теперь вы должны увидеть в папке вашего проекта папку с именем «.vscode». В этой папке выберите «settings.json». В этом файле вы увидите параметр pythonPath, в котором указан путь к python.exe вашей среды «fun-with-python».

Линтинг

На этом этапе вы все еще можете видеть сообщение, подобное этому:

Инструмент линтинга полезен для проверки вашего кода Python и выделения кода, который не соответствует стандартам кодирования или ссылки на несуществующие пакеты. Линтер Пилинт не идеален, но его стоит использовать. Я рекомендую вам устанавливать его для среды Anaconda, а не для каждого проекта. Для этого нажмите кнопку Установить во всплывающем окне, а затем выберите Установить с помощью Conda из списка опций:

Отладка

При использовании Python вы часто сталкиваетесь с ситуацией, когда часть кода не работает. Вы можете реализовать простую отладку, используя команду «print» для печати переменной в терминале, но лучший способ - отлаживать Python в среде IDE. В VS Code это относительно просто.

Сначала в нашем файле hello-world.py наведите указатель мыши слева от команды print(series). Должна стать видна красная точка. Нажмите на эту точку, и она станет выделенной. Это то, что называется точкой останова.

Чтобы запустить сценарий Python в режиме отладки, нажмите F5. Visual Studio укажет, что код выполняется, как в терминале, так и оранжевым цветом на панели внизу окна.

После запуска кода точка останова должна быть «достигнута», что будет обозначено выделением строки кода:

Теперь вы можете навести указатель мыши на переменную «series», чтобы увидеть свойства серии. Над файлом также есть всплывающая панель с кнопками для продолжения, пошагового выполнения кода и остановки (у них также есть соответствующие сочетания клавиш).

Вы также можете продолжить, снова нажав «F5».

Блокнот Jupyter

Вы также можете запустить приложение Jupyter Notebook из терминала VS Code, просто введите

jupyter notebook

Вы заметите, что терминал теперь используется, что не позволяет запускать дальнейший код. Вместо того, чтобы останавливать Jupyter Notebook, вы можете добавить новый терминал, нажав кнопку «плюс» над терминалом или используя «Control + Shift +« ».

Конда в VS Code

Поэтому при установке Anaconda НЕ рекомендуется добавлять Anaconda в ваш системный путь. Из-за этого единственное место для запуска команд conda - это приглашение Anaconda. Это означает, что команды conda не будут работать в терминале VS Code. Не стесняйтесь изменять это в своей системе, я предпочитаю использовать conda в командной строке Anaconda. Более подробную информацию можно найти здесь".

Заключение

Итак, если вы следовали всем трем моим руководствам, у вас должен быть арсенал инструментов для разработки моделей машинного обучения с помощью Python. Как я уже упоминал ранее, я настоятельно рекомендую посмотреть записные книжки, разработанные Джейком Вандерпласом, которые можно найти здесь. Он дает подробный обзор NumPy, Pandas, Matplotlib и общих принципов машинного обучения. Удачного взлома!