Когда вы создаете учетную запись в IBM Data Science Experience, мы предоставляем бесплатный кластер Apache Spark и 5 ГБ бесплатного IBM Object Storage. Некоторые из наших пользователей рассказали, что у них возникают проблемы с загрузкой данных в записные книжки из-за отсутствия опыта работы с Cloud Data Services. Большинство из них привыкли работать с данными, размещенными на их собственном ноутбуке. Мы хотим предоставить вам самый простой способ работы с вашими данными, а также с инструментами и библиотеками, которые вы уже знаете.
Мы рады объявить о новой функции в IBM Data Science Experience, которая поможет пользователям создавать фреймы данных одним щелчком мыши с помощью интерфейса Jupyter Notebooks.
Загрузить данные в объектное хранилище
Загрузить данные в объектное хранилище очень просто. Просто перетащите файл в блокнот и, Magic! ✨, файл загружен, и вы увидите, что он доступен в палитре Блокнота. Есть индикатор выполнения, показывающий, сколько времени займет процесс загрузки, который зависит от размера файла.
Создайте фреймы данных, чтобы начать анализ
Фрейм данных - это двумерная помеченная структура данных со столбцами потенциально разных типов. Вы можете думать об этом как о электронной таблице или таблице SQL.
После того, как ваш файл будет загружен, он появится в палитре записной книжки. Теперь нажмите Вставить код, откроется раскрывающееся меню с различными параметрами для создания различных типов фреймов данных в зависимости от ваших предпочтений и языка:
Блокнот Python
- Фрейм данных Pandas
- Фрейм данных Spark SQL
- Искра RDD
- Вставить учетные данные
Ноутбук R
- Базовый фрейм данных R
- Фрейм данных Spark SQL
- Вставить учетные данные
Обратите внимание, что сегодня эта функция поддерживается только в файлах CSV, но если она вам понравится, мы быстро расширим ее и на другие форматы файлов!
Это действие создаст новую ячейку в записной книжке, которая будет выполнять четыре действия:
- Установите и импортируйте все необходимые библиотеки для загрузки данных. Это действие происходит только при первом использовании этой функции в записной книжке, поскольку вам нужно загрузить библиотеки только один раз.
- Подключитесь к объекту хранилища объектов, автоматически вставив учетные данные за вас.
- Загрузите фрейм данных.
- Предварительный просмотр фрейма данных.
Посмотрите демонстрацию в действии здесь: