Как установить драйвер CUDA для TensorFlow (установка из исходников)

Я пытаюсь собрать TensorFlow из исходного кода и запустите его с поддержкой графического процессора. Для установки инструментария я использую файл запуска, для установки драйвера я использовал инструмент «Дополнительные драйверы», поскольку у меня не получилось загрузить Ubuntu в текстовом режиме, как указано в документация CUDA и stop lightdm и start lightdm тоже не работают, это дает мне (также с sudo):

Name com.ubuntu.Upstart does not exist

До сих пор я мог собрать релиз из репозитория TensorFlow. Однако, когда я пытаюсь запустить пример, как указано в инструкции

bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu

GPU, по-видимому, не может быть найден:

jonas@jonas-Aspire-V5-591G:~/Documents/repos/tensoflow_fork$ bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcudnn.so locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcurand.so locally
E tensorflow/stream_executor/cuda/cuda_driver.cc:491] failed call to cuInit: CUDA_ERROR_UNKNOWN
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:153] retrieving CUDA diagnostic information for host: jonas-Aspire-V5-591G
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:160] hostname: jonas-Aspire-V5-591G
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:185] libcuda reported version is: 352.63.0
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:356] driver version file contents: """NVRM version: NVIDIA UNIX x86_64 Kernel Module  352.63  Sat Nov  7 21:25:42 PST 2015 GCC version:  gcc version
    4.9.2 (Ubuntu 4.9.2-10ubuntu13)  """
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:189] kernel reported version is: 352.63.0
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:293] kernel version seems to match DSO: 352.63.0
I tensorflow/core/common_runtime/gpu/gpu_init.cc:81] No GPU devices available on machine.
F tensorflow/cc/tutorials/example_trainer.cc:125] Check failed: ::tensorflow::Status::OK() == (session->Run({{"x", x}}, {"y:0", "y_normalized:0"}, {}, &outputs)) (OK vs. Invalid argument: Cannot assign a device to node 'y': Could not satisfy explicit device specification '/gpu:0' because no devices matching that specification are registered in this process; available devices: /job:localhost/replica:0/task:0/cpu:0
     [[Node: y = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/gpu:0"](Const, x)]])
Aborted

Я использую чистую установку Ubuntu 15.04 на ноутбуке Acer с GTX950M.

Кто-нибудь может подсказать, как правильно установить драйвер?


person jns    schedule 19.08.2016    source источник
comment
см. неудачный вызов cuInit: CUDA_ERROR_UNKNOWN   -  person LF00    schedule 01.07.2018


Ответы (1)


Можете ли вы запустить deviceQuery (поставляется с установкой cuda)? Вы видите, что nvidia присутствует в lspci/lsmod/nvidia-smi?

lsmod |grep nvidia 
dmesg | grep -i nvidia
lspci | grep -i nvidia
nvidia-smi

Вы можете перезагрузить модуль nvidia и посмотреть сообщения об ошибках.

modprobe -r nvidia
dmesg | tail
sudo dmesg | grep NVRM

Связанная проблема https://github.com/tensorflow/tensorflow/issues/601

person Yaroslav Bulatov    schedule 19.08.2016
comment
Спасибо, но я, наконец, запустил его в Ubuntu 16.04, добавив ссылку репозиторий графических драйверов и установка последней стабильной версии через дополнительные драйверы... - person jns; 19.08.2016