Контейнер Google Cloud DL, развернутый на GCE с помощью графического процессора, не может найти устройство CUDA

Я использую образ Pytorch для графических процессоров: gcr.io/deeplearning-platform-release/pytorch-gpu.1-2:latest. Я развертываю его на GCE с графическими процессорами K80 и V100.

import torch
torch.cuda.device_count()
#returns 0

Cuda установлена. Когда я использую ssh в контейнере докеров и запускаю следующую команду на терминале, я вижу это.

cat /usr/local/cuda/version.txt
CUDA Version 10.0.130

К вашему сведению, команда nvidia-smi из терминала не работает. Что я делаю неправильно? Или проблема с образами докеров?


person alan turing    schedule 14.11.2019    source источник


Ответы (1)


Похоже, что драйвер NVIDIA не был правильно установлен. Обратите внимание, что «для каждой версии CUDA требуется минимальный графический процессор. версия драйвера или более поздняя версия. »Чтобы проверить минимальный драйвер, необходимый для вашей версии CUDA, перейдите по этой ссылке: Набор инструментов и версии совместимых драйверов.

Вы можете перейти по этой ссылке, чтобы установить драйвер вручную . Также вы можете найти несколько библиотек , которые необходимо установлен по этой ссылке.

person Ahmad P    schedule 15.11.2019