pytorch报错:
RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250 #10

排查方法:
如果模型本身没有GPU存储不够的问题,那么考虑使用torch.nn.Embedding()除了问题。

embedding_layer = th.nn.Embedding(num_embeddings=3, embedding_dim= self.embedding_dim)

那么输入给embedding_layer的id的取值范围都应该在[0,num_embeddings)内,上面的问题很有可能是范围不在这里面导致的。

因此,确保输入的id在[0,num_embeddings)范围内。

另外,在调试bug的时候,不用使用gpu调试! 调试使用CPU跑模型。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐