Сначала нужно узнать, что такое Google Colab?
Итак, Colaboratory, или сокращенно Colab, — это продукт Google Research. Colab позволяет любому писать и выполнять код Python через браузер и особенно хорошо подходит для машинного обучения, анализа данных и обучения. Некоторые из преимуществ Colab по сравнению с Jupyter включают более простую установку пакетов и совместное использование документов.
Google Colab делает все то же, что и ваш блокнот Jupyter, и даже немного больше. Немного больше в том, что вы можете использовать GPU и TPU бесплатно.
В этой статье я покажу вам, как вы можете использовать свой набор данных в блокноте Colab.
В основном существует два метода импорта наборов данных в Google Colab:
- Импорт набора данных в локальную систему
- Импорт набора данных с Google Диска
1.Импорт набора данных из локальной файловой системы
Это в основном для небольших наборов данных. Нажав кнопку «Выбрать файл» в своей записной книжке, с помощью которой вы можете загрузить свой набор данных в среду выполнения записной книжки.
В настоящее время,
Шаг 1. Запустите следующий код, чтобы импортировать данные из локальной системы.
from google.colab import files uploaded = files.upload()
Это добавит кнопку «Выбрать файлы», и вы сможете загрузить свой набор данных. Это вызовет кнопку обзора:
Шаг 2.Просмотр каталогов в локальной системе:
files.upload возвращает словарь загруженных файлов. Словарь имеет ключ по имени файла, значением являются данные, которые были загружены.
Шаг 3. Мы можем прочитать данные с помощью библиотеки pandas:
import pandas as pd pd.read_csv("Mall_Customers.csv")
2. Импорт набора данных с Google Диска
Перед импортом данных нам нужно смонтировать гугл диск.
Мы можем получить доступ к файлам на диске, используя монтирование Google Диска. Установка диска в Colab означает настройку учетной записи Google Drive в качестве виртуального диска.
Монтирование Google Диска:
Шаг 1. Чтобы подключить Google Диск (GDrive) к Colab, выполните следующий код:
from google.colab import drive drive.mount("/content/gdrive")
Запуск оболочки вернет URL-ссылку и запросит код авторизации. Так что перейдите по этой ссылке.
Шаг 2. Перейдите по указанной ссылке, войдите в аккаунт Google и скопируйте код авторизации.
Шаг 3. Вставьте код авторизации в оболочку, и, наконец, Google Диск будет смонтирован по адресу /content/gdrive.
Шаг 4. Теперь мы можем импортировать файлы на Google Диск с помощью такой библиотеки, как Pandas.
Предположим, у нас есть набор данных с именем Mall_Customers.csv на нашем диске, где мы создали папку с именем data и поместили в нее наш файл.
Шаг 5. Теперь выполнение следующих двух строк кода импортирует данные в colab:
import pandas as pd pd.read_csv('/content/gdrive/My Drive/data/Mall_Customers.csv')
Таким образом, мы можем загрузить наш набор данных в colab.
Надеюсь, вам понравился и понравился этот контент!