У вас есть CSV-файл, но вы не знаете, как его загрузить в записную книжку Python.

Эта статья поможет вам начать работу в области науки о данных, позволив вам загрузить файл в блокнот Python в Google Colab.

Google Colab - это облачный сервис, предлагаемый Google (бесплатно) на основе Jupyter Notebook. Эта платформа позволяет вам обучать модели машинного обучения прямо в облаке и все это бесплатно.

Некоторые из преимуществ Google Colab включают простую установку и совместное использование записных книжек между пользователями в режиме реального времени (как и другие документы в пакете G-cloud). Однако для загрузки файла CSV необходимо написать код. Я собираюсь показать вам два способа загрузки CSV-файла в Colab как Pandas DataFrame.

  1. Для начала войдите в свою учетную запись Google.
  2. Затем перейдите на https://colab.research.google.com и нажмите Новый блокнот Python 3.
  3. Оттуда добавьте ячейку кода и импортируйте Pandas, как показано ниже:
import pandas as pd

A. Загрузите данные с вашего локального диска

  1. Начните с написания следующего и запустите ячейку кода:
from google.colab import files
data_to_load = files.upload()

2. Вам будет предложено выбрать файл. Нажмите «Выбрать файлы», затем выберите и загрузите нужный CSV-файл. Вы должны увидеть имя файла, отображаемое после того, как Colab загрузит его.

3. Наконец, напишите следующий код для импорта файла в Pandas DataFrame (убедитесь, что имя файла совпадает с именем загруженного файла).

import io
df = pd.read_csv(io.BytesIO(data_to_load['filename.csv']))

Б. Загрузите данные с вашего Google Диска

На мой взгляд, этот метод более простой из двух.

  1. На своем Google Диске создайте папку.
  2. Загрузите CSV-файл на свой Google Диск в только что созданную папку.
  3. В своем Блокноте Colab напишите следующий код:
from google.colab import drive
drive.mount(‘/content/drive’)

4. Эта команда переведет вас на этап аутентификации Google. Вы должны увидеть экран с потоком файлов Google Диска, который хочет получить доступ к вашей учетной записи Google. После принятия условий скопируйте проверочный код и вставьте его в область, указанную в вашем Notebook Colab.

5. Затем щелкните значок ›в верхнем левом углу Блокнота Colab, а затем щелкните Файлы. Найдите папку, которую вы создали ранее, и найдите свой CSV-файл. Щелкните файл правой кнопкой мыши и выберите Копировать путь.

6. Наконец, скопируйте путь, как показано ниже:

path = “copy_path_here”
df_bonus = pd.read_csv(path)

Вот видео с подробностями о 2-м методе: