Когда вы создаете учетную запись в IBM Data Science Experience, мы предоставляем бесплатный кластер Apache Spark и 5 ГБ бесплатного IBM Object Storage. Некоторые из наших пользователей рассказали, что у них возникают проблемы с загрузкой данных в записные книжки из-за отсутствия опыта работы с Cloud Data Services. Большинство из них привыкли работать с данными, размещенными на их собственном ноутбуке. Мы хотим предоставить вам самый простой способ работы с вашими данными, а также с инструментами и библиотеками, которые вы уже знаете.

Мы рады объявить о новой функции в IBM Data Science Experience, которая поможет пользователям создавать фреймы данных одним щелчком мыши с помощью интерфейса Jupyter Notebooks.

Загрузить данные в объектное хранилище

Загрузить данные в объектное хранилище очень просто. Просто перетащите файл в блокнот и, Magic! ✨, файл загружен, и вы увидите, что он доступен в палитре Блокнота. Есть индикатор выполнения, показывающий, сколько времени займет процесс загрузки, который зависит от размера файла.

Создайте фреймы данных, чтобы начать анализ

Фрейм данных - это двумерная помеченная структура данных со столбцами потенциально разных типов. Вы можете думать об этом как о электронной таблице или таблице SQL.

После того, как ваш файл будет загружен, он появится в палитре записной книжки. Теперь нажмите Вставить код, откроется раскрывающееся меню с различными параметрами для создания различных типов фреймов данных в зависимости от ваших предпочтений и языка:

Блокнот Python

  • Фрейм данных Pandas
  • Фрейм данных Spark SQL
  • Искра RDD
  • Вставить учетные данные

Ноутбук R

  • Базовый фрейм данных R
  • Фрейм данных Spark SQL
  • Вставить учетные данные

Обратите внимание, что сегодня эта функция поддерживается только в файлах CSV, но если она вам понравится, мы быстро расширим ее и на другие форматы файлов!

Это действие создаст новую ячейку в записной книжке, которая будет выполнять четыре действия:

  1. Установите и импортируйте все необходимые библиотеки для загрузки данных. Это действие происходит только при первом использовании этой функции в записной книжке, поскольку вам нужно загрузить библиотеки только один раз.
  2. Подключитесь к объекту хранилища объектов, автоматически вставив учетные данные за вас.
  3. Загрузите фрейм данных.
  4. Предварительный просмотр фрейма данных.

Посмотрите демонстрацию в действии здесь: