当前位置: 首页 > news >正文

文心一言开发指南08——千帆大模型平台推理服务API


版权声明

  • 本文原创作者:谷哥的小弟
  • 作者博客地址:http://blog.csdn.net/lfdfhl

在这里插入图片描述

推理服务API概述

百度智能云千帆平台提供了丰富的推理服务API,包括对话Chat、续写Completions、向量Embeddings、批量预测等API能力。

  • 对话Chat:支持创建chat,用于发起一次对话。
  • 续写Completions:支持创建completion,用于发起一次续写请求,不支持多轮会话等。
  • 向量Embeddings:支持Embeddings,用于根据输入内容生成对应的向量表示。
  • 重排序Reranker:支持重排序Reranker,用于重新排序向量模型返回的top-k文档,优化语义搜索结果
  • 自定义模型:平台支持HuggingFace Transformer架构的自定义大模型导入,将自定义模型发布为服务,并支持通过相关API调用该服务。
  • 图像Images:提供图像相关API能力。
  • Token计算,根据输入计算token数。
  • 批量预测:提供创建批量预测任务、获取批量预测任务详情等能力。

千帆大模型平台推理服务API链接如下:

https://cloud.baidu.com/doc/WENXINWORKSHOP/s/qlgujhcpo

千帆大模型平台推理服务AP图示如下:

在这里插入图片描述

推理服务API调用方式

根据不同鉴权方式千帆大模型平台提供了2种API调用方式。

  • 1、使用access_token进行鉴权调用API流程

  • 2、基于安全认证AK/SK进行鉴权调用API流程

官方链接如下:

https://cloud.baidu.com/doc/WENXINWORKSHOP/s/yloieb01t

使用access_token鉴权调用API

使用访问凭证access_token进行鉴权,调用API 流程,如下图所示:
在这里插入图片描述
官方教程如下:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/dlv4pct3s

基本步骤如下:

  • 创建千帆应用。创建应用后,获取AppID、API Key、Secret Key 等信息。
  • API 授权。针对付费服务,需在千帆大模型平台-在线服务页面,点击开通付费。
  • 获取接口访问凭证 access_token。调用获取access_token接口获取 access_token ,通过 access_token 鉴权调用者身份。
  • 调用API接口。

请注意:access_token默认有效期30天,所以在生产环境注意及时刷新。

基于安全认证AK/SK鉴权调用API

基于安全认证AK/SK进行鉴权,调用API流程简介如下图所示:
在这里插入图片描述

官方教程如下:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Hlwerugt8

基本步骤如下:

  • API授权。千帆平台默认为应用开通所有API调用权限,无需申请授权。如需申请,可以在千帆平台-在线服务页面,点击开通付费。
  • 获取安全认证Access Key(即AK)/Secret Key(即SK)。
  • 生成鉴权认证信息Authorization。根据签名计算生成鉴权信息Authorization,具体流程请参考鉴权机制。
  • 调用API接口。

在线调试

千帆大模型平台提供了 API在线调试平台 ,用于帮助开发者调试接口,平台集成快速检索、查看开发文档、查看在线调用的请求内容和返回结果、复制和下载示例代码等功能,简单易用。

在线调试平台-示例代码中心官方链接如下:

https://console.bce.baidu.com/support/#/api

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

http://www.xdnf.cn/news/222535.html

相关文章:

  • 9.idea中创建springboot项目_jdk1.8
  • 无需下载,免费在线AI音乐生成器:爱狐AI详解与使用
  • C# 继承详解
  • LangChain4j +DeepSeek大模型应用开发——5 持久化聊天记忆 Persistence
  • 问题整理篇---(1)keil
  • Linux查看程序端口占用情况
  • Kubernetes in action-Kubernetes的pod
  • 使用Python将YOLO数据集拆分成固定文件数量的小数据集
  • Mixture-of-Experts(MoE)原理与在DeepSeek中的应用
  • HOOPS 2025全面适配Linux ARM64:性能突破、能耗优化与工业3D可视化部署场景全解析!
  • Samba-系统集成
  • 混淆矩阵(Confusion Matrix);归一化混淆矩阵(Confusion Matrix Normalized)
  • Mac配置Maven环境变量避坑
  • 无人机航拍牛羊检测数据集VOC+YOLO格式1021张3类别小目标
  • ROS2 学习
  • c#WebsocketSever
  • 浅析通用文字识别技术在档案管理中的未来发展趋势
  • 4. python3基本数据类型
  • 指针变量存放在哪?
  • 深度学习·经典模型·SwinTransformer
  • ISME|原生生物,顶刊是如何研究的
  • 网工笔记-传输层
  • 插值算法 - 双三次插值(Bicubic Interpolation)
  • 【无标题】四色定理研究团队的构建与实施路径——跨学科建模、编程与理论拓展的全流程方案
  • 实现一个简单回调列表
  • 代理对象的mock
  • 数据库所有知识
  • 随机游走之 个人的简单理解
  • 通义千问Qwen3全维度解析
  • Windows系统下,导入运行 RuoYi-Vue3 项目