llamaindex实战-本地模型和Pandas数据对话

本文介绍如何使用llamaindex的 PandasQueryEngine引擎，通过使LLM将自然语言转换为 Pandas python 代码。PandasQueryEngine 的输入是 Pandas 数据帧，输出是响应。LLM 推断要执行的dataframe操作以检索结果。可以通过python接口把不同数据源的数据读取成Pandas结构中。注意：该引擎目前还处于实验阶段，有时候会出现语法错误。

一铭

338人浏览 · 2024-07-10 20:48:24

一铭 · 2024-07-10 20:48:24 发布

llamaindex实战-本地模型和Pandas数据对话

概述

本文介绍如何使用llamaindex的 PandasQueryEngine引擎，通过使LLM将自然语言转换为 Pandas python 代码。PandasQueryEngine 的输入是 Pandas 数据帧，输出是响应。 LLM 推断要执行的dataframe操作以检索结果。

可以通过python接口把不同数据源的数据读取成Pandas结构中。

注意：该引擎目前还处于实验阶段，有时候会出现语法错误。

实现步骤

（1）准备panda数据集；

（2）创建LLM大模型对象。这里可以使用不同大模型。我这里使用的是本地部署的Ollama中的模型。

（3）创建PandasQueryEngine查询对象；

（4）使用查询引擎对象来查询数据；

完整代码

import logging
import sys
import pandas as pd
from llama_index.experimental.query_engine import PandasQueryEngine
from llama_index.llms.ollama import Ollama

# 准备数据
df = pd.DataFrame(
    {
        "city": ["Toronto", "Tokyo", "Berlin"],
        "population": [2930000, 13960000, 3645000],
    }
)

## 构建LLM模型对象
llm = Ollama(model="llama3", request_timeout=360)

# 创建查询引擎
query_engine = PandasQueryEngine(df=df, llm=llm, verbose=True, synthesize_response=True)

# 查询最高人口数
response = query_engine.query(
    "What is the city with the highest population?",
)

#print(str(response.metadata["pandas_instruction_str"]))
print(str(response.metadata["raw_pandas_output"]))

# 查询平均数
response2 = query_engine.query(
    "What is the average population?",
)
print(str(response.metadata["raw_pandas_output"]))

小结

通过支持pandas，可以让查询引擎变得更加强大。pandas可以把不同数据源的数据变成标准的dataframe格式，这样间接的支持了多种数据源。

参考资料

Pandas Query Engine

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Js分割字符串(单个分割符、多个分割符、正则)

1.单个分割符1.1定义和用法split() 方法用于把一个字符串分割成字符串数组。1.2语法stringObject.split(separator,howmany)参数描述separator必需。字符串或正则表达式，从该参数指定的地方分割 stringObject。howmany可选。该参数可指定返回的数组的最大长度。如果设置了该参数，返回的子串不会多于这个参数指定的数组。如果没有设置该参数，

腾讯云开发者社区

curl

什么是curl命令？curl是利用URL语法在命令行方式下工作的开源文件传输工具。它被广泛应用在Unix、多种Linux发行版中，并且有DOS和Win32、Win64下的移植版本。如何在windows下使用curl命令？第一步：进入curl下载官网，下载合适的版本，我这里下载的是windows 64位的curl。其中我下载的zip文件。另外CAB文件也是压缩文件，这...

腾讯云开发者社区

Zynq7000 USB2.0协议解析及USB控制器详解

USB 2.0规范及控制器文章目录USB 2.0规范及控制器USB2.0Univerasl Serial BusUSBHostUSB总线接口标准总线信号USB拓扑结构数据流模型数据编解码和位填充USB逻辑部件USB时间基准USB 描述符USB设备USB设备供电方式USB设备分层USB设备插入检测机制USB设备状态USB总线枚举USB传输传输类型包(Packet)事务(transaction)传输(