Сначала нужно узнать, что такое Google Colab?

Итак, Colaboratory, или сокращенно Colab, — это продукт Google Research. Colab позволяет любому писать и выполнять код Python через браузер и особенно хорошо подходит для машинного обучения, анализа данных и обучения. Некоторые из преимуществ Colab по сравнению с Jupyter включают более простую установку пакетов и совместное использование документов.

Google Colab делает все то же, что и ваш блокнот Jupyter, и даже немного больше. Немного больше в том, что вы можете использовать GPU и TPU бесплатно.

В этой статье я покажу вам, как вы можете использовать свой набор данных в блокноте Colab.

В основном существует два метода импорта наборов данных в Google Colab:

  1. Импорт набора данных в локальную систему
  2. Импорт набора данных с Google Диска

1.Импорт набора данных из локальной файловой системы

Это в основном для небольших наборов данных. Нажав кнопку «Выбрать файл» в своей записной книжке, с помощью которой вы можете загрузить свой набор данных в среду выполнения записной книжки.

В настоящее время,

Шаг 1. Запустите следующий код, чтобы импортировать данные из локальной системы.

from google.colab import files
uploaded = files.upload()

Это добавит кнопку «Выбрать файлы», и вы сможете загрузить свой набор данных. Это вызовет кнопку обзора:

Шаг 2.Просмотр каталогов в локальной системе:

files.upload возвращает словарь загруженных файлов. Словарь имеет ключ по имени файла, значением являются данные, которые были загружены.

Шаг 3. Мы можем прочитать данные с помощью библиотеки pandas:

import pandas as pd
pd.read_csv("Mall_Customers.csv")

2. Импорт набора данных с Google Диска

Перед импортом данных нам нужно смонтировать гугл диск.

Мы можем получить доступ к файлам на диске, используя монтирование Google Диска. Установка диска в Colab означает настройку учетной записи Google Drive в качестве виртуального диска.

Монтирование Google Диска:

Шаг 1. Чтобы подключить Google Диск (GDrive) к Colab, выполните следующий код:

from google.colab import drive
drive.mount("/content/gdrive")

Запуск оболочки вернет URL-ссылку и запросит код авторизации. Так что перейдите по этой ссылке.

Шаг 2. Перейдите по указанной ссылке, войдите в аккаунт Google и скопируйте код авторизации.

Шаг 3. Вставьте код авторизации в оболочку, и, наконец, Google Диск будет смонтирован по адресу /content/gdrive.

Шаг 4. Теперь мы можем импортировать файлы на Google Диск с помощью такой библиотеки, как Pandas.

Предположим, у нас есть набор данных с именем Mall_Customers.csv на нашем диске, где мы создали папку с именем data и поместили в нее наш файл.

Шаг 5. Теперь выполнение следующих двух строк кода импортирует данные в colab:

import pandas as pd
pd.read_csv('/content/gdrive/My Drive/data/Mall_Customers.csv')

Таким образом, мы можем загрузить наш набор данных в colab.

Надеюсь, вам понравился и понравился этот контент!