LangChain应用开发指南-大模型的知识外挂RAG
AI大模型能够处理广泛主题的文本生成,但模型知识只能基于它们训练时使用的公开数据。如果你想构建能够利用私有数据或实时数据进行推理的AI应用,你需要用特定的信息来增强模型的知识。将相关信息检索并插入到模型的输入中,即检索增强生成(Retrieval Augmented Generation,RAG)。在本文中,我们将介绍如何使用LangChain开发一个简单的RAG问答应用。我们将依次介绍典型的问答
AI大模型能够处理广泛主题的文本生成,但模型知识只能基于它们训练时使用的公开数据。如果你想构建能够利用私有数据或实时数据进行推理的AI应用,你需要用特定的信息来增强模型的知识。将相关信息检索并插入到模型的输入中,即检索增强生成(Retrieval Augmented Generation,RAG)。
在本文中,我们将介绍如何使用LangChain开发一个简单的RAG问答应用。我们将依次介绍典型的问答架构,讨论相关的LangChain组件,并展示如何跟踪和理解我们的应用。
RAG的基本概念
RAG是一种结合了检索和生成的技术,它可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。RAG的基本流程如下:
- 首先,给定一个用户的输入,例如一个问题或一个话题,RAG会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。
- 然后,RAG会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。
- 最后,RAG会从大模型的输出中提取或格式化所需的信息,返回给用户。
LangChain和RAG的结合
LangChain是一个专注于大模型应用开发的平台,它提供了一系列的组件和工具,帮助你轻松地构建RAG应用。LangChain提供了以下的组件来帮助你构建RAG应用:
- 数据加载器(DocumentLoader):数据加载器是一个对象,可以从一个数据源加载数据,并将其转换为文档(Document)对象。一个文档对象包含两个属性:page_content(str)和metadata(dict)。page_content是文档的文本内容,metadata是文档的元数据,例如标题、作者、日期等。
- 文本分割器(DocumentSplitter):文本分割器是一个对象,可以将一个文档对象分割成多个较小的文档对象。这样做的目的是为了方便后续的检索和生成,因为大模型的输入窗口是有限的,而且在较短的文本中更容易找到相关的信息。
- 文本嵌入器(Embeddings):文本嵌入器是一个对象,可以将文本转换为嵌入(Embedding),即一个高维的向量。文本嵌入可以用来衡量文本之间的相似度,从而实现检索的功能。
- 向量存储器(VectorStore):向量存储器是一个对象,可以存储和查询嵌入。向量存储器通常使用一些索引技术,例如Faiss或Annoy,来加速嵌入的检索。
- 检索器(Retriever):检索器是一个对象,可以根据一个文本查询返回相关的文档对象。检索器的一种常见实现是向量存储器检索器(VectorStoreRetriever),它使用向量存储器的相似度搜索功能来实现检索。
- 聊天模型(ChatModel):聊天模型是一个对象,可以根据一个输入序列生成一个输出消息。聊天模型通常基于大模型,例如GPT-3,来实现文本生成的功能。
使用LangChain构建RAG应用的一般流程如下:
- 首先,我们需要加载我们的数据。我们可以使用数据加载器来实现这一步,根据数据源的类型选择合适的数据加载器。例如,如果我们的数据源是一个网页,我们可以使用WebBaseLoader,它可以使用urllib和BeautifulSoup来加载和解析网页,返回一个文档对象。
- 然后,我们需要将我们的文档对象分割成较小的文档对象。我们可以使用文本分割器来实现这一步,根据文本的特点选择合适的文本分割器。例如,如果我们的文本是一个博客文章,我们可以使用RecursiveCharacterTextSplitter,它可以递归地使用常见的分隔符(如换行符)来分割文本,直到每个文档对象的大小符合要求。
- 接下来,我们需要将我们的文档对象转换为嵌入,并存储到向量存储器中。我们可以使用文本嵌入器和向量存储器来实现这一步,根据嵌入的质量和速度选择合适的文本嵌入器和向量存储器。例如,如果我们想要使用OpenAI的嵌入模型和Chroma的向量存储器,我们可以使用OpenAIEmbeddings和ChromaVectorStore。
- 然后,我们需要创建一个检索器,用于根据用户的输入检索相关的文档对象。我们可以使用向量存储器检索器来实现这一步,- 传递一个向量存储器对象和一个文本嵌入器对象作为参数,创建一个向量存储器检索器对象。
- 最后,我们需要创建一个聊天模型,用于根据用户的输入和检索到的文档对象生成一个输出消息。我们可以使用LangChain提供的聊天模型来实现这一步,根据模型的性能和成本选择合适的聊天模型。例如,如果我们想要使用OpenAI的GPT-3模型,我们可以使用OpenAIChatModel。
下面是一个使用LangChain构建RAG应用的示例代码:
python复制代码# 导入LangChain的库
from langchain import *
# 加载数据源
loader = WebBaseLoader()
doc = loader.load("https://xxx.html")
# 分割文档对象
splitter = RecursiveCharacterTextSplitter(max_length=512)
docs = splitter.split(doc)
# 转换文档对象为嵌入,并存储到向量存储器中
embedder = OpenAIEmbeddings()
vector_store = ChromaVectorStore()
for doc in docs:
embedding = embedder.embed(doc.page_content)
vector_store.add(embedding, doc)
# 创建检索器
retriever = VectorStoreRetriever(vector_store, embedder)
# 创建聊天模型
prompt = hub.pull("rlm/rag-prompt")
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
# 创建一个问答应用
def format_docs(docs):
return "\n\n".join(doc.page_content for doc in docs)
rag_chain = (
{"context": retriever | format_docs, "question": RunnablePassthrough()}
| prompt
| llm
| StrOutputParser()
)
# 启动应用
rag_chain.invoke("What is main purpose of xxx.html?")
LangChain和RAG的优势和应用场景
LangChain和RAG的结合可以带来以下的优势:
- 灵活性:你可以根据你的需求和数据源选择不同的组件和参数,定制你的RAG应用。你也可以使用自定义的组件,只要它们遵循LangChain的接口规范。
- 可扩展性:你可以使用LangChain的云服务来部署和运行你的RAG应用,无需担心资源和性能的限制。你也可以使用LangChain的分布式计算功能来加速你的RAG应用,利用多个节点的并行处理能力。
- 可视化:你可以使用LangSmith来可视化你的RAG应用的工作流程,查看每个步骤的输入和输出,以及每个组件的性能和状态。你也可以使用LangSmith来调试和优化你的RAG应用,发现和解决潜在的问题和瓶颈。
LangChain和RAG的结合可以应用于多种场景,例如:
- 专业问答(Professional Question Answering):你可以使用LangChain和RAG来构建一个专业领域的问答应用,例如医疗、法律或金融。你可以从专业领域的数据源中检索相关的信息,帮助大模型回答用户的问题。例如,你可以从医学文献中检索疾病的诊断和治疗方案,帮助大模型回答医疗相关的问题。
- 文本摘要(Text Summarization):你可以使用LangChain和RAG来构建一个文本摘要应用,例如新闻摘要或论文摘要。你可以从多个数据源中检索相关的文本,帮助大模型生成一个综合的摘要。例如,你可以从多个新闻网站中检索关于同一事件的报道,帮助大模型生成一个全面的摘要。
- 文本生成(Text Generation):你可以使用LangChain和RAG来构建一个文本生成应用,例如诗歌生成或故事生成。你可以从不同的数据源中检索灵感,帮助大模型生成更有趣和更有创意的文本。例如,你可以从诗歌、歌词或小说中检索相关的文本,帮助大模型生成一首诗、一首歌或一个故事。
结论
在本文中,我们介绍了如何使用LangChain开发一个简单的问答应用。我们介绍了RAG的基本概念和优势,讨论了相关的LangChain组件。我们还介绍了LangChain和RAG的结合的优势和应用场景。
我们希望本文能够帮助你了解LangChain和RAG的结合的潜力和价值,鼓励你尝试使用LangChain和RAG开发自己的应用。
如何学习大模型
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。
下面这些都是我当初辛苦整理和花钱购买的资料,现在我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来
,需要的小伙伴可以扫取。
一、AGI大模型系统学习路线
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。
二、AI大模型视频教程
三、AI大模型各大学习书籍
四、AI大模型各大场景实战案例
五、结束语
学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。
因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。
更多推荐
所有评论(0)