Colab от Google позволяет любому писать и публиковать блокноты Jupyter онлайн из любой точки мира.

Я довольно часто использовал Google Colab. Раньше он был моей средой Jupyter Notebook по умолчанию и отправной точкой для многих моих статей на Medium (сейчас я тоже использую VSCode, но это другая история).

Colab — это онлайн-среда Jupyter Notebooks от Google. Он делает все, что мог бы делать локальный ноутбук (и даже больше), но он находится в облаке, поэтому установка программного обеспечения не требуется, и он доступен с любого компьютера, подключенного к Интернету.

Это очень знакомо, похоже на среду Jupyter, которую вы могли установить на свой компьютер — позже мы рассмотрим некоторые отличия.

В настоящее время он работает только с Python 3 (хотя R и Scala упоминаются как возможные будущие разработки) и поставляется с уже установленными многими из самых популярных библиотек Python.

А если вам нужно установить какие-либо дополнительные пакеты, вы можете сделать это с помощью pip в ячейке блокнота.

!pip install a-new-package

И это останется загруженным на время вашего сеанса.

Гугл-аккаунт

Чтобы использовать Colab, вам потребуется учетная запись Google, в противном случае настройка не требуется, и любые созданные вами блокноты будут храниться на Диске Google, связанном с вашей учетной записью. Вы также можете поместить их в репозиторий Github, если хотите.

Google Colab предлагается на условиях freemium. Уровень бесплатной подписки имеет ограниченные ресурсы, хотя я думаю, что вам нужно будет делать довольно сложные вещи, чтобы достичь предела. Если вам нужно больше памяти или вычислительной мощности, вы можете подписаться на более высокий уровень.

Если у вас есть блокноты на локальном компьютере, вы можете загрузить их в Colab, а также загрузить блокноты Colab для их локального хранения.

Записные книжки Colab выполняются на виртуальной машине, которая автоматически завершает работу, если она какое-то время бездействовала, хотя, если вы случайно закроете браузер во время работы, вы, вероятно, обнаружите, что при повторном открытии записная книжка все еще работает. Максимальное время, в течение которого вы можете запускать виртуальную машину, ограничено, но Google предполагает, что оно может составлять до 12 часов.

Все это, по-видимому, означает, что для всех намерений и целей Colab бесплатен для личного использования, но если вам нужно использовать его в коммерческих целях, вам может потребоваться выкладывать несколько долларов каждый месяц.

Данные хранятся на вашем Google Диске. Предоставляются библиотеки для чтения и записи на Диск, и вы, конечно, можете загружать данные из Интернета, используя обычные пакеты Python.

Блокноты Jupyter отлично подходят для науки о данных, как и Colab, но, кроме того, если вы хотите запускать код машинного обучения в Tensorflow (конечно, в комплекте), тогда Colab предоставляет графические процессоры, чтобы лучше запускать ваш код.

Как это выглядит

Как вы можете видеть на изображениях ниже, макет очень похож на стандартный блокнот Jupyter. Но у Colab есть несколько отличий.

Основное отличие, которое вы видите, — это отсутствие значков в Colab, но все команды доступны из раскрывающихся меню или из панели значков, которая появляется над каждой ячейкой.

В Colab нет меню Kernel, так как есть только одно ядро ​​на выбор — перезапуск ядра осуществляется из меню Runtime.

Проверка данных

Одной из очень полезных функций Colab является панель Переменные, где вы можете увидеть типы и значения каждой из текущих переменных.

И еще более впечатляющим является то, как вы можете просматривать фрейм данных как интерактивную таблицу. Когда вы отображаете кадр данных из ячейки кода, как в ячейке ниже…

вы увидите бледно-голубой значок, при нажатии на который вызывается интерактивная таблица.

Вы можете не только видеть данные в таблице и все значения, вы также можете фильтровать эти данные по значениям в различных столбцах и сортировать их, щелкая заголовки столбцов.

Попробуй

Как я упоминал ранее, Colab раньше был моим редактором Jupyter, и одной из причин было то, что я хотел иметь возможность запускать и редактировать свой код из разных мест на разных машинах. Colab делает это очень легко.

Еще одним преимуществом является то, что вычислительная мощность, доступная для запуска блокнотов Colab в облаке, значительно превосходит мощность часто слабого оборудования, которое я использовал для редактирования блокнотов, а это означает, что они будут работать лучше и быстрее.

Я надеюсь, что это краткое введение в Google Colab было полезным, и вы попробуете его.

Как всегда, спасибо за чтение. Если хотите, можете подписаться на мою периодическую бесплатную рассылку Technofile, которая находится на Substack — я публикую там новые статьи. Вот, например, пост о куче статей Streamlit, которые я написал.