RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250
pytorch报错:RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250 #10排查方法:如果模型本身没有GPU存储不够的问题,那么考虑使用torch.nn.Embedding()除了问题。embedding_layer = th.nn.Embedding(num_embeddin
·
pytorch报错:
RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250 #10
排查方法:
如果模型本身没有GPU存储不够的问题,那么考虑使用torch.nn.Embedding()除了问题。
embedding_layer = th.nn.Embedding(num_embeddings=3, embedding_dim= self.embedding_dim)
那么输入给embedding_layer的id的取值范围都应该在[0,num_embeddings)内,上面的问题很有可能是范围不在这里面导致的。
因此,确保输入的id在[0,num_embeddings)范围内。
另外,在调试bug的时候,不用使用gpu调试! 调试使用CPU跑模型。
更多推荐
所有评论(0)