博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
跑对抗样本库 CleverHans 的例子时,遇到的问题
阅读量:6224 次
发布时间:2019-06-21

本文共 1816 字,大约阅读时间需要 6 分钟。

 

环境:Ubuntu+TensorFlow

首先是GPU被其他人占用了,怎么也跑不起来最简单的TensorFlow小例子.

所以先学会如何查看显卡使用情况,转去使用其他空闲显卡.

 

Linux查看Nvidia显卡信息及使用情况

nvidia-smi

结合top,查找进程号对应的用户

 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 

Temp:显卡内部的温度,单位是摄氏度;

Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;

Pwr:能耗表示; 

Bus-Id:涉及GPU总线的相关信息; 

Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 

Memory Usage:显存的使用率; 

Volatile GPU-Util:浮动的GPU利用率;

Compute M:计算模式;

 

周期性的输出显卡的使用情况(10s一次)

watch -n 10 nvidia-smi

 

直接查看哪个用户使用GPU最多  gpustat

pip install git+https://github.com/wookayin/gpustat.git@master --user

gpustat -cu

没有root权限,才加--user,个人觉得超好用!

 

shell分屏,终端复用软件  Tmux

sudo apt-get install tmux

https://www.cnblogs.com/kevingrace/p/6496899.html

 

指定空闲的GPU显卡(例如第2块卡)跑程序

在代码前加上:

import os

os.environ['CUDA_VISIBLE_DEVICES']='2'

 

或者命令行执行程序时:

CUDA_VISIBLE_DEVICES=2 python xxx.py

 


 

终于能用GPU了,然后跑了下MNIST with FGSM的例子:mnist_tutorial_tf.py

结果发现 报错了!!

(Loaded runtime CuDNN library: 7.0.4 but source was compiled with: 7.2.1.  CuDNN library major and minor version needs to match or have higher minor version in case of CuDNN 7.0 or later version. If using a binary install, upgrade your CuDNN library.  If building from sources, make sure the library loaded at runtime is compatible with the version specified during compile configuration.)

 

查看cuda版本

cat /usr/local/cuda/version.txt

 

查看cudnn版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如果显示没有该文件或该路径,就到对应文件中去找

 

解决方案

重新安装对应版本的TensorFlow(我安装的TensorFlow1.11.0太高了,cudnn7.04 估计是对应 TensorFlow1.5.0-1.9.0 吧)

pip install --upgrade --force-reinstall tensorflow-gpu==1.9.0 --user

或者安装错误提示中的cudnn对应版本(我没有服务器权限,所以此法较为麻烦)

 

终于能跑了!!

网上几乎也没有关于CleverHans跑实验的文章,痛苦....

 

TensorFlow版本对应图

https://www.tensorflow.org/install/source

 

 

 

如果觉得本文还不错的,能成功解决你问题的朋友,请随手点个赞吧~ 评论也可以。

版权声明:本文为博主自主原创,谢绝转载,请尊重个人成果,非常感谢!

 

 

 


 

转载于:https://www.cnblogs.com/tuji-sjp/p/10015634.html

你可能感兴趣的文章
Azure PowerShell (8) 使用PowerShell设置Azure负载均衡器规则
查看>>
lcd ram/半反穿技术解析【转】
查看>>
BSD vi/vim 命令大全(下)[转]
查看>>
EditText的属性介绍
查看>>
Unity3d dll 热更新 基础框架
查看>>
【Java开发技术之程序测试】Junit4 新功能学习总结
查看>>
接触C# 反射
查看>>
c#中const、static、readonly的区别
查看>>
在 Silverlight 项目中获取程序集的引用信息
查看>>
函数式编程(3) 幻灯片
查看>>
总结c#和javascript中常见的相关的"空"
查看>>
用DirectX实现粒子系统(二)
查看>>
六个人如何运维一万台服务器?
查看>>
nandflash学习1——导致nandflash反转的原因【转】
查看>>
Windows Phone 7发布啦
查看>>
租房新体验:AI机器人中介带你看房
查看>>
git版本控制&&github的使用
查看>>
权限设计之一
查看>>
如何使用网络库实现应用级消息收发
查看>>
Linux中断(interrupt)子系统之二:arch相关的硬件封装层【转】
查看>>