Google Colaboratory - это бесплатная среда для совместной работы в браузере, которая предоставляет интерактивную и простую в использовании платформу для исследователей и инженеров глубокого обучения, которые могут работать над своими проектами в области науки о данных.

Если вы здесь, потому что хотите использовать Google Colab и не знаете, с чего начать, этот учебник предоставит вам очень простое руководство, которое поможет вам приступить к реализации ваших проектов в области науки о данных и исследовательских идей. Вам не нужны какие-либо знания в области технологии ноутбуков, и все, что вам нужно, это немного программирования на Python. Даже если вы раньше использовали Colab, в этом руководстве есть что-то для вас. Итак, приступим!

Запуск блокнота Google Colab

Первое, что вам нужно сделать, это открыть новую вкладку в браузере и перейти на этот веб-сайт: https://colab.research.google.com.

После того, как вы создадите учетную запись, вам будет предложено предоставить Colab разрешение на доступ к вашему Google Диску. Продолжайте и сделайте это, поскольку вы можете хранить в нем наборы данных, чтобы максимально использовать это пустое свободное пространство на вашем диске😉.

Вы увидите следующие области, доступные для среды Colab:

Вкладка Примеры - отличное место для начала, так как там много руководств. Я очень рекомендую вам сначала прочитать эту записную книжку от Google Colab; руководство предоставит вам краткое руководство по использованию основных команд Python в среде Colab. Он также покажет вам, как использовать функции ноутбука и встроенные уловки с записной книжкой Colab. Я предполагаю, что после того, как вы изучите этот блокнот, вы должны быть готовы начать кодирование в Colab в кратчайшие сроки. Однако есть еще много вещей, которые вы, возможно, захотите узнать о Colab, чтобы эффективно использовать среду.

Markdown

Подобно записным книжкам Jupyter, Google Colab предлагает богатые функциональные возможности Markdown. Если вы тратите время на документирование кода, что я всегда рекомендую специалистам по обработке данных на практике, вы можете воспользоваться удобной функцией предварительного просмотра Colab. Функция предварительного просмотра позволяет увидеть предварительный просмотр вашего кода Markdown в реальном времени и ускоряет документирование. Однако учтите, что Colab не предлагает средства проверки правописания, без чего можно обойтись. Взгляните на предварительный просмотр Markdown в действии на рисунке ниже:

Импорт данных

Существуют различные способы импорта данных в Google Colab, такие как Google Cloud, Google Sheets, Google Drive и другие хорошо известные варианты. Однако самый простой способ - загрузить данные прямо с вашего компьютера. Вы можете импортировать наборы данных, введя следующие строки кода в среду Colab. Убедитесь, что вы добавили ячейку КОД, а не ячейку ТЕКСТ, чтобы код выполнялся с использованием среды выполнения Python. Ниже показано, как загрузить свои данные.

После того, как вы загрузили данные, пора приступить к исследованию данных - это так быстро и просто. Я называю это «наукой о данных о стероидах». Google Colab делает все возможное, чтобы сделать этот процесс как можно более плавным. Но имейте в виду, что вы также можете запускать команды терминала в самой среде Colab. Например, предположим, что мы хотим знать, доступен ли нам только что загруженный файл в среде. Мы можем сделать это с помощью команды ls, как показано на рисунке ниже:

Встроенные команды

Одним из больших преимуществ Google Colab является то, что он уже предварительно упаковывает несколько известных научных вычислительных библиотек, таких как Numpy, Pandas и TensorFlow. Однако, если вы хотите использовать что-то, чего нет в вашей среде, вы можете просто установить это прямо в Colab с помощью команды !pip install name_of_library. Например, если мы хотим установить PyTorch, еще один отличный набор инструментов для глубокого обучения, вы должны установить его, используя следующую команду:

Позвольте мне сообщить вам хорошие новости! Вы готовы начать рок-н-ролл с Google Colab. Вы только что узнали, как импортировать данные и как установить вычислительную библиотеку, такую ​​как PyTorch. Следующим шагом является начало исследования данных и создание глубоких нейронных сетей.

Клонирование

Я не буду вдаваться в примеры кода в этом руководстве, но если вы хотите начать работу с исследованием данных, нейронными сетями и рекуррентными нейронными сетями (RNN) с помощью Google Colab и PyTorch, вот несколько руководств по коду, чтобы вы могли начать работу. сразу. Вы можете клонировать любую записную книжку на свой диск, выполнив команду «Файл», а затем нажав «Сохранить копию на диске». В записных книжках ниже показано, как использовать Google Colab для создания мощных нейронных сетей для классификации с нуля и как создавать повторяющиеся нейронные сети для классификации изображений:

  • Создание вашего первого Wordcloud с помощью Google Colaboratory и Python (Medium | Colab)
  • Простая нейронная сеть с нуля с PyTorch и Google Colab (Medium | Colab)
  • Создание RNN - это весело с PyTorch и Google Colab (Medium | Colab)

Полный GPU!

На мой взгляд, одна из самых мощных функций Google Colab - это бесплатный графический процессор. В приведенной ниже анимации я демонстрирую, как его включить:

Представьте себе это! Вы можете загружать данные со своего компьютера в Google Colab в мгновение ока. Вы можете установить пакеты Python по своему выбору. И у вас есть доступ к бесплатному графическому процессору. Я должен сказать, что нет причин не начинать заниматься наукой о данных.

Передайте привет TPU!

Похоже, что Google Colab теперь предлагает TPU. Так что вы можете поиграть и с этим.

Другие интересные вещи, которые нужно знать

Со всеми этими инструкциями, которыми я поделился с вами до сих пор в этом руководстве, вы готовы глубоко погрузиться в мир кодирования навсегда. Есть и другие варианты использования, в которых можно использовать Google Colab. Например, это супер портативный, поскольку вам действительно не нужно ничего устанавливать, чтобы запустить ноутбук Colab. Все, что вам нужно, это браузер. В нем также есть функция комментирования, которой я не вижу, чтобы люди пользовались преимуществом, но она может служить хорошим способом обратной связи с командами или учащимися на случай, если вы используете ее для обучения. Кстати, пока вы это делаете, ознакомьтесь с этим невероятно популярным Учебником по GPU для пользователей Colab.

Что бы я хотел увидеть в будущем

Как активный пользователь Google Colab, я хотел бы, чтобы он стал более живым в том смысле, что он стал активной социальной платформой для разработчиков и учащихся. В нем уже есть все необходимое для разработчика, но, поскольку он доступен в браузере, этот инструмент может стать важным средством документирования, обмена и обучения темам науки о данных. Я чувствую, что в этом отношении этого еще нет, но я надеюсь, что команда Colab упорно трудится, чтобы это произошло.

Мне также хотелось бы получить дополнительную поддержку других инструментов для глубокого обучения и обработки данных, таких как PyTorch. Если вы, как и я, пользователь PyTorch, у вас могут возникнуть проблемы с версией CUDA по умолчанию в Colab, и в этом случае вы можете перейти здесь, чтобы узнать, как исправить эти проблемы.

Другие разработчики Google Colab

Я видел в сети нескольких влиятельных лиц Google Colab. Вот сжатый список разработчиков, которые часто пользуются Google Colab:

Обязательно ознакомьтесь с некоторыми из их замечательных работ. Если вы знаете каких-либо других разработчиков, часто использующих Colab, или вы один из них, прокомментируйте, пожалуйста, ниже, и я включу сюда их имена.

Известные записные книжки Colab

Помимо ноутбуков, которые я поделился выше, вот еще несколько впечатляющих и заметных ноутбуков Colab, с которыми я столкнулся:

Если вы знаете о каких-либо других драгоценных камнях Colab, прокомментируйте их ниже, и это должно помочь другим быстро найти интересные вещи.

Заключительные слова

Поздравляю! Вы дошли до конца учебника по Google Colab. Поверьте мне! Если вы нажимали на все ресурсы, которыми я поделился выше, и следовали каждому руководству, вы определенно на правильном пути, чтобы стать мастером Colab. И последнее замечание: я буду регулярно обновлять этот учебник с учетом будущих обновлений Colab, руководств Colab и предложений сообщества. Поэтому не забудьте добавить эту статью в закладки 🔖 и регулярно возвращайтесь к ней, чтобы узнавать больше об увлекательной работе, проводимой над Google Colab. Чтобы вам было проще, я буду публиковать обновления в своем Twitter @ omarsar0.