SapBERT: Self-alignment pretraining for BERT的代码使用示例

【代码】SapBERT: Self-alignment pretraining for BERT的代码使用示例。

农民小飞侠

485人浏览 · 2023-02-10 23:13:01

农民小飞侠 · 2023-02-10 23:13:01 发布

最近在研究SapBERT来计算实体的相似度，发现官方的repo没有给使用示例，我仿照写了一下使用示例，方便直接把SapBERT用起来，我的环境是：

torch                   1.7.1+cu101
torchvision             0.11.3
transformers            4.16.2

下面是使用代码，知道SapBERT是抽取向量的就行了，然后就可以用一些类似faiss的近似向量检索工具进行检索了：

from transformers import AutoTokenizer, AutoModel
import numpy as np

tokenizer = AutoTokenizer.from_pretrained("cambridgeltl/SapBERT-from-PubMedBERT-fulltext")

model = AutoModel.from_pretrained("cambridgeltl/SapBERT-from-PubMedBERT-fulltext")

query = "cardiopathy"
query_toks = tokenizer.batch_encode_plus([query], 
                                       padding="max_length", 
                                       max_length=25, 
                                       truncation=True,
                                       return_tensors="pt")
print(query_toks)
query_output = model(**query_toks)
query_cls_rep = query_output[0][:,0,:]
print(query_cls_rep)

all_names = ['Neoplasm of anterior aspect of epiglottis']

toks = tokenizer.batch_encode_plus(all_names, 
                                       padding="max_length", 
                                       max_length=25, 
                                       truncation=True,
                                       return_tensors="pt")

output = model(**toks)
cls_rep = output[0][:,0,:]
print(cls_rep)

# for large-scale search, should switch to faiss
from scipy.spatial.distance import cdist

dist = cdist(query_cls_rep.cpu().detach().numpy(), cls_rep.cpu().detach().numpy())
nn_index = np.argmin(dist)
# print ("predicted label:", snomed_sf_id_pairs_100k[nn_index])

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI PPT免费使用技巧盘点：如何快速制作专业PPT？

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手