豆包智能体Python SDK接入流程
然后,你就会回到模型推理页面,此时表格中会看到你刚才创建的名为“Doubao-pro-32k-240515”的接入点,名称下方有一串以 ep- 开头的、格式为 ep-xxxxxxxxxx-xxxxx 的文本,这就是我们需要的接入点 ID,复制后备用。Access Key(访问密钥)是访问火山引擎服务的安全凭证,包含Access Key ID(简称为AK)和Secret Access Key(简称为
模型与价格
豆包的模型介绍可以看豆包大模型介绍,模型价格可以看豆包定价文档里的“模型推理” - “大语言模型” - “字节跳动”部分。
推荐使用以下模型:
Doubao-lite-32k:每百万 token 的输入价格为 0.3 元,输出价格为 0.6 元
Doubao-pro-32k:每百万 token 的输入价格为 0.8 元,输出价格为 2 元
豆包的 6 个模型中,4k 和 32k 的价格是一样的,所以这里推荐用 32k 的模型。
每个模型都有 50 万 tokens 的免费额度,不会过期。
剩余免费额度见开通管理 | 火山方舟管理控制台里的“免费推理额度”。
豆包一共有 6 个模型,也就是说上面这两个模型的 token 用完之后,你还可以切换为别的模型使用。
8 月 30 日前会额外给每个模型赠送 5 亿 tokens,不会过期。领取方式见下文的可选步骤:领取 5 亿 tokens 的免费额度。
“输入”即你发送给模型的语音文字,“输出”即模型提供的回答,问答一次的最终花费 = 输入 token 数量 * 输入价格 + 输出 token 数量 * 输出价格。
1 个 token 大约对应 1 个汉字或 3 至 4 个字母。
5 亿 tokens 的免费额度申请步骤
第一步:注册账号
进入火山方舟管理控制台,根据提示注册或登陆账号。
创建 API Key
进入 API Key 管理,点击【创建 API Key】,填写名称后创建 API Key 备用。
创建接入点
豆包的模型不能直接使用,要先在平台内创建接入点了之后才能使用。
以 Doubao-pro-4k 为例:
点击【添加模型】按钮,会出现一个弹窗。
- 在模型广场中选择“Doubao-pro-4k”,然后右侧会出现模型版本。
- 模型版本一般只有一个,名称就是 6 个数字组成的日期(例如 240728),但也有可能会有带前缀的版本(例如 character-240728)。
- 模型版本要选择不带前缀的版本,即类似
240515
这样只有 6 个数字的版本。 - 选好模型版本后,点击页面右下角的【添加】。
- 名称建议就填写“接入模型”那里显示的文本,例如“Doubao-pro-32k-240515”(把斜线
/
改为短横线-
)。 - 点击页面右侧的【接入模型】按钮。
-
然后,你就会回到模型推理页面,此时表格中会看到你刚才创建的名为“Doubao-pro-32k-240515”的接入点,名称下方有一串以 ep- 开头的、格式为 ep-xxxxxxxxxx-xxxxx 的文本,这就是我们需要的接入点 ID,复制后备用。
获取豆包智能体Python api代码
点击“api调用”
apikey从这里获取
-
使用
官网Python sdk接入地址:GitHub - volcengine/volc-sdk-python
-
前置准备
服务开通
请确保您已开通了您需要访问的服务。您可前往火山引擎控制台,在左侧菜单中选择或在顶部搜索栏中搜索您需要使用的服务,进入服务控制台内完成开通流程。
获取安全凭证
Access Key(访问密钥)是访问火山引擎服务的安全凭证,包含Access Key ID(简称为AK)和Secret Access Key(简称为SK)两部分。您可登录火山引擎控制台,前往“访问控制”的“访问密钥”中创建及管理您的Access Key。更多信息可参考访问密钥帮助文档。
环境检查
Python版本需要不低于2.7。
获取与安装
使用pip安装SDK for Python:
pip install --user volcengine
如果已经安装volcengine包,则用下面命令升级即可:
pip install --upgrade volcengine
完整Python调用豆包智能体代码
import requests
import time
url = 'https://ark.cn-beijing.volces.com/api/v3/bots/chat/completions'
headers = {
'Authorization': 'Bearer xxxxxxxxx',
'Content-Type': 'application/json'
}
data = {
"model": "bot-xxx-xxx",
"stream": False,
"stream_options": {"include_usage": True},
"messages": [
{
"role": "user",
"content": "介绍下公司"
}
]
}
# 计算程序运行时间
start_time = time.time()
response = requests.post(url, headers=headers, json=data)
response_data = response.json()
content = response_data['choices'][0]['message']['content']
print(content)
# 计算程序运行时间
end_time = time.time()
print(f"程序运行时间:{end_time - start_time}秒")
最后一步,运行Python代码
更多推荐
所有评论(0)