У вас есть CSV-файл, но вы не знаете, как его загрузить в записную книжку Python.
Эта статья поможет вам начать работу в области науки о данных, позволив вам загрузить файл в блокнот Python в Google Colab.
Google Colab - это облачный сервис, предлагаемый Google (бесплатно) на основе Jupyter Notebook. Эта платформа позволяет вам обучать модели машинного обучения прямо в облаке и все это бесплатно.
Некоторые из преимуществ Google Colab включают простую установку и совместное использование записных книжек между пользователями в режиме реального времени (как и другие документы в пакете G-cloud). Однако для загрузки файла CSV необходимо написать код. Я собираюсь показать вам два способа загрузки CSV-файла в Colab как Pandas DataFrame.
- Для начала войдите в свою учетную запись Google.
- Затем перейдите на https://colab.research.google.com и нажмите Новый блокнот Python 3.
- Оттуда добавьте ячейку кода и импортируйте Pandas, как показано ниже:
import pandas as pd
A. Загрузите данные с вашего локального диска
- Начните с написания следующего и запустите ячейку кода:
from google.colab import files data_to_load = files.upload()
2. Вам будет предложено выбрать файл. Нажмите «Выбрать файлы», затем выберите и загрузите нужный CSV-файл. Вы должны увидеть имя файла, отображаемое после того, как Colab загрузит его.
3. Наконец, напишите следующий код для импорта файла в Pandas DataFrame (убедитесь, что имя файла совпадает с именем загруженного файла).
import io df = pd.read_csv(io.BytesIO(data_to_load['filename.csv']))
Б. Загрузите данные с вашего Google Диска
На мой взгляд, этот метод более простой из двух.
- На своем Google Диске создайте папку.
- Загрузите CSV-файл на свой Google Диск в только что созданную папку.
- В своем Блокноте Colab напишите следующий код:
from google.colab import drive drive.mount(‘/content/drive’)
4. Эта команда переведет вас на этап аутентификации Google. Вы должны увидеть экран с потоком файлов Google Диска, который хочет получить доступ к вашей учетной записи Google. После принятия условий скопируйте проверочный код и вставьте его в область, указанную в вашем Notebook Colab.
5. Затем щелкните значок ›в верхнем левом углу Блокнота Colab, а затем щелкните Файлы. Найдите папку, которую вы создали ранее, и найдите свой CSV-файл. Щелкните файл правой кнопкой мыши и выберите Копировать путь.
6. Наконец, скопируйте путь, как показано ниже:
path = “copy_path_here” df_bonus = pd.read_csv(path)
Вот видео с подробностями о 2-м методе: