Translate

2017年2月27日月曜日

リブートしたら nvidia-docker が起動しなくなった

週末 nvidia-docker をあげているマシンを止めて
今朝立ち上げてみたら..

Could not load uvm kernel module. Is nvidia-modprobe installed?

と出て、nvidia-docker だけ立ち上がらなくなってしまった。

Docker Engineのデーモンは動いているのに..


で調べたら、

  • ドライバの再インストール
  • nvidia-docker volume setup

せよという日本語の記事が幾つか..




どうもこの方法、ちょっと前までの
NVIDIA DockerのGitHubのREADME.mdにかかれていた
方法らしい..
今はその記述は消えている

でも..

nvidia-docker volume setup

なんてコマンド無いんですけど..

で、nvidia-docker volume のヘルプを見ていたら

nvidia-docker volume prune というコマンドを見つけた。

使っていないボリューム設定を削除するコマンドらしい。


ということで nvidia-docker volume prune を実行して
systemctl start nvidia-docker したらもとに戻った..


..これが正しいかはよくわからないけど、とりあえずご参考迄..


0 件のコメント:

既存アプリケーションをK8s上でコンテナ化して動かす場合の設計注意事項メモ

既存アプリをK8sなどのコンテナにして動かすには、どこを注意すればいいか..ちょっと調べたときの注意事項をメモにした。   1. The Twelve Factors (日本語訳からの転記) コードベース   バージョン管理されている1つのコードベースと複数のデプロイ 依存関係 ...