pytorch网络训练gpu算力利用率忽高忽低。发现是dataload耗时较大,gpu等cpu。
解决方案:采用MultiEpochsDataLoader 和 CudaDataLoader (异步预先将数据从cpu加载到gpu中)进行加速。
最终训练速度快了一倍,之前gpu等待时间没有了,gpu能够一直保持计算

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐