mats测试所有显存命令_解决矩池云GPU显存未释放问题

发布于:2021-11-27 06:10:09

很多用户反馈说终止程序之后,显存依然被占用,这里我们提供了两种解决方案,帮助用户解决这个问题。


nvidia-smi查看

我们可以先用如下命令 nvidia-smi 查看一下当前GPU进程情况。







_



GPU:GPU 编号;
Name:GPU 型号;
Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
Fan:风扇转速,从0到100%之间变动;
Temp:温度,单位是摄氏度;
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
Pwr:Usage/Cap:能耗;
Memory Usage:显存使用率;
Bus-Id:涉及GPU总线的东西,domain:bus:device.function;
Disp.A:Display Active,表示GPU的显示是否初始化;
Volatile GPU-Util:浮动的GPU利用率;
Uncorr. ECC:Error Correcting Code,错误检查与纠正;
Compute M:compute mode,计算模式。
Processes:表示每个进程对 GPU 的显存使用率


第一种方案

尝试使用Jupyter内的 shutdown and restart kernel 选项,如果无效的情况下使用使用第二种方案;






第二种方案

在终端内操作以下命令。



apt-get update





1 安装psmisc



apt install psmisc

2 查看运行在gpu上的所有程序,



fuser -v /dev/nvidia*

3 查看具体这个进程调用GPU的情况,也可以通过top命令查看



pmap -d PID

4 强行关掉所有当前并未执行的僵尸进程



kill -9 PID

参考文献:
1.[解决]GPU显存未释放问题
2.GPU状态监测 nvidia-smi 命令详解







相关资源:显卡维修 ATI显存检测 MATS显存检测

相关推荐

最新更新

猜你喜欢