Несовместимость среды выполнения/драйвера Cuda в контейнере докеров

Я пытаюсь запустить эту простую строку кода в док-контейнере, который поставляется с Pytorch.

import torch
torch.cuda.set_device(0)

Я получаю эту ошибку:

RuntimeError: cuda runtime error (35) : CUDA driver version is insufficient for CUDA runtime version at torch/csrc/cuda/Module.cpp:32

Выполнение torch.cuda.is_available() возвращает False.

На хост-компьютере установлены самые последние версии драйверов Nvidia. Pytorch поставляется с Cuda, поэтому проблем с совместимостью быть не должно.

Что может вызвать эту проблему?

Изменить: ответ @Patel Sunil на этот вопрос отвечает на мой вопрос, но я не сталкивался с этим вопросом в своем поиске, потому что их вопрос широк, в то время как мой вопрос относится к ошибке времени выполнения/драйвера cuda. Я разместил это как отдельный вопрос для тех, кто сталкивается с этой ошибкой, но не знает, что это за симптом (а именно, забывая использовать nvidia-docker).


person Jacob Stern    schedule 11.04.2019    source источник
comment
Я рада, что вы нашли решение своей проблемы! Но разве это не дубликат этого вопроса? Ну, nvidia-docker — это только последний ответ. Вероятно, главным образом потому, что ответ был написан после того, как вопрос был задан.   -  person BlameTheBits    schedule 12.04.2019
comment
Отредактировал свой пост, чтобы уточнить - спасибо!   -  person Jacob Stern    schedule 12.04.2019


Ответы (1)


Проблема заключалась в том, что я запускал контейнер с docker, а не nvidia-docker. Запуск контейнера докеров с nvidia-docker устранил проблему.

person Jacob Stern    schedule 11.04.2019