RAPIDS 0.19 выйдет на GTC Spring 2021

Конференция NVIDIA по технологиям GPU (GTC) - это всегда особое событие для команды RAPIDS. Это не только пробуждает воспоминания о дебюте RAPIDS на GTC Munich 2018, но и дает возможность поразмышлять о его росте с тех пор. В этом духе команда представляет Состояние RAPIDS для каждого GTC, чтобы подчеркнуть рост проекта и сообщества, а также обсудить предстоящие улучшения и будущее направление.

Представляя Итерацию GTC 2021 года State of RAPIDS на прошлой неделе, Кейт Краус и Джон Зедлевски продемонстрировали постоянное развитие проекта, расширение сообщества и рост экосистемы на базе RAPIDS. Говоря об этих темах, в презентации были затронуты:

  • Вехи сообщества и взаимодействия, такие как достижение более 100 тысяч загрузок в месяц
  • Обновления и рост основных базовых библиотек RAPIDS (cuDF, cuML и cuGraph)
  • Расширение в новые области, такие как объяснимость, AutoML и ускоренный Node.js
  • Новые инициативы, включая интеграцию с NVIDIA Triton Inferencing и NVIDIA Morpheus

Когда GTC 2021 подходил к концу, участники последовали за ним с новейшим выпуском RAPIDS. С акцентом на производительность, удобство использования и доступность, RAPIDS 0.19 отражает постепенные улучшения, которые приводят к большему прогрессу, отмеченному каждым GTC.

Новое в RAPIDS 0.19

RAPIDS 0.19 добавляет новые обновления, функции и улучшения. На высоком уровне поддержка CUDA 11.2 была добавлена ​​во все библиотеки. CUDA 11.2 обеспечивает улучшенную совместимость с CUDA, которая значительно упрощает совместимость с будущими выпусками CUDA 11.x. Дополнительные обновления включены:

cuDF

cuDF теперь поддерживает вложенные типы, такие как списки и структуры. Команда выпустила запись в блоге, в которой подробно рассказывается. cuDF также поддерживает 32-битные и 64-битные типы данных Decimal с фиксированной точкой. Кроме того, cuDF расширил функциональность, предоставляемую их GroupBy. Для более детального ознакомления с обновлениями cuDF 0.19 просмотрите журнал изменений.

cuML

cuML теперь предлагает совместимую с scikit-learn предварительную обработку на графическом процессоре - раньше это была экспериментальная функция, но теперь она стала качественной. Точно так же универсальная объяснимость SHAP теперь готова к широкому использованию. Он ускоряет создание предсказаний для любой модели cuML или scikit-learn.

Кроме того, библиотека добавила иерархическую кластеризацию с единой связью и улучшила производительность и точность моделей классификации случайного леса по умолчанию. Кроме того, новые функции были добавлены в алгоритмы логистической регрессии, приблизительного ближайшего соседства и библиотеки выведения леса. Чтобы получить более подробную информацию об обновлениях cuML 0.19, ознакомьтесь с журналом изменений.

cuGraph

cuGraph теперь предоставляет алгоритм случайного блуждания и генератор данных графика рекурсивной матрицы. Они также улучшили свои существующие примитивы графа, схему разделения графа, многоузловой Egonet и многоузловой алгоритм Лувена с несколькими графическими процессорами, улучшив производительность алгоритмов. cuGraph теперь обеспечивает до 8 раз ускорение для большинства алгоритмов обхода. Чтобы получить более подробную информацию об обновлениях cuGraph 0.19, ознакомьтесь с журналом изменений.

РАПИДЫ + Даск

UCX улучшил свой код и документацию для повышения производительности и простоты использования соответственно. Dask-CUDA обновил свои функции, чтобы обеспечить улучшенную обработку утечки памяти. В Dask-CUDA также добавлены возможности для сброса журналов и ведения журналов RMM.

CLX

CLX теперь предоставляет функции для обнаружения конфиденциальных данных, крипто-майнинга в GFN, анализа рабочего процесса хоста и предоставления обратной связи. Теперь он также поддерживает вывод моделей cyBERT на ARM. Для более детального ознакомления с обновлениями CLX 0.19 ознакомьтесь с журналом изменений.

Процветающая экосистема, ускоряемая RAPIDS

За последние два с половиной года RAPIDS создал постоянно растущую экосистему библиотек и инструментов с ускорением на GPU. GTC 2021 продемонстрировал непрерывный рост благодаря широкому спектру захватывающих решений, ускоренных RAPIDS.

Одним из самых захватывающих технических превью, анонсированных на GTC на прошлой неделе, был Node-RAPIDS. Подобно тому, как RAPIDS ускорил сообщества PyData и Spark с помощью графических процессоров, Node-RAPIDS стремится распространить эту мощь на сообщество JavaScript Node.js. Node-RAPIDS открывает множество возможностей для веб-разработчиков, которые традиционно ограничены мощностью персонального компьютера и браузера. Он также упрощает встраивание операций, управляемых данными, в веб-приложения за счет общих привязок CUDA к библиотекам науки о данных RAPIDS. Чтобы узнать больше о Node-RAPIDS, ознакомьтесь с презентацией Аллана Энемарка GTC 2021.

RAPIDS также расширяется в сфере кибербезопасности. Благодаря своей мощности, удобству использования и гибкости CLX стал основным компонентом нового предложения NVIDIA по кибербезопасности, Morpheus. NVIDIA Morpheus упрощает создание и внедрение моделей кибербезопасности для организаций, перед которыми стоит непростая задача защиты от киберугроз. Splunk теперь также интегрирует CLX, Morpheus и Triton в свои продукты. Послушайте рассказ о Морфеусе Бартли Ричардсона, чтобы узнать больше.

По мере того, как RAPIDS привлекает все больше пользователей, больше внимания уделяется тому, чтобы упростить и упростить его использование. Основным толчком к повышению удобства использования стало улучшение доступности RAPIDS в облаке. GTC 2021 подчеркивает интеграцию RAPIDS в облачные платформы машинного обучения, такие как Amazon’s SageMaker и Google Cloud AI Platform, что упрощает начало работы в облаке. RAPIDS 0.19 также упрощает развертывание в собственных облачных инструментах, таких как Google Kubernetes Engine.

AWS также интегрировала RAPIDS cuML и XGBoost с ускорением на GPU в свою библиотеку AutoML с открытым исходным кодом, Auto-Gluon. Благодаря этой интеграции Auto-Gluon может повысить производительность в 25 раз, делая высокопроизводительный AutoML доступным для более широкой аудитории. Для получения дополнительной информации ознакомьтесь с презентацией GTC от Ника Эриксона из AWS.

Помимо Node-RAPIDS, мы добавили новую библиотеку cuCIM для ускорения обработки n-мерных изображений и ввода-вывода. Хотя библиотека новая, она показывает потрясающую производительность. Он предоставляет доступный интерфейс, аналогичный scikit-image, что позволяет исследователям и специалистам по обработке данных быстро переносить существующий код на базе процессора на графический процессор. Особая благодарность Quansight и команде NVIDIA Clara за сотрудничество в создании cuCIM. Посмотрите их недавние сообщения в блоге на cuCIM:

Захватывающие приложения RAPIDS

Самая полезная часть GTC - это увидеть творческие новаторские способы, с помощью которых пользователи и предприятия используют RAPIDS для решения сложных проблем. Было удивительно видеть все больше и больше выступлений, демонстрирующих использование RAPIDS на GTC 2021. Вот несколько захватывающих примеров:

Чтобы увидеть еще много уникальных и интересных приложений RAPIDS, ознакомьтесь с полным каталогом GTC 2021 здесь. Не волнуйтесь, регистрация бесплатна.

Ускоренное взаимодействие с сообществом

Сообщество RAPIDS растет. Количество скачиваний RAPIDS в 2021 году выросло до более чем 100 тысяч каждый месяц. Мы также только что достигли отметки в 10 тысяч для подписчиков в Твиттере. Сказать, что мы благодарны за поддержку сообщества, - значит ничего не сказать.

Мы также продолжаем увеличивать ресурсы для сообщества RAPIDS. Ноутбуки Colab возвращаются как для стабильных, так и для ночных выпусков, что упрощает ознакомление с новыми функциями. Том Драбас из BlazingSQL также подготовил множество руководств и шпаргалок по RAPIDS для новичков, чтобы они могли лучше познакомиться с библиотеками. Мы также поддерживаем Форумы разработчиков NVIDIA, где пользователи могут задавать свои вопросы по RAPIDS, ориентированным на NVIDIA.

Теперь, когда GTC 2021 завершился, мы обращаем наше внимание на Саммит Dask Distributed Summit 2021, на котором мы проводим учебное пособие и семинар. Саммит Dask обещает быть потрясающим… приходите, посмотрите наши переговоры вместе с другими потрясающими презентациями, которые гарантированно будут там.

Заворачивать

Было приятно видеть успех RAPIDS на GTC 2021, но теперь мы обращаем внимание на следующий выпуск. Между нами и GTC Fall 2021 есть еще около трех выпусков, и мы уже с нетерпением ждем, когда увидим, какие новые обновления, функции и улучшения RAPIDS приводят к потрясающим презентациям и обсуждениям.

Как всегда, найдите нас на GitHub, подпишитесь на нас в Twitter и ознакомьтесь с нашей документацией и ресурсами для начала работы. Мы рады, что вы присоединились к нам, и с нетерпением ждем еще одного замечательного года RAPIDS.