国内有不少独立模型厂商提供 API 可供调用,几乎都会成为技术选择的可选项:
Moonshot AI:
- API 特点:其 API 与 OpenAI 兼容,方便开发者平滑迁移,开发者无需对代码做除基本参数外的“额外”修改,即可体验到 Moonshot 模型的能力。经过一段时间内测后已启动公开测试,所有开发者都可登录开放平台创建自己的 API key,将其模型能力接入到自己的产品中,或基于该模型能力打造全新产品。
- 应用场景:可用于聊天机器人、文本创作、智能客服等多种应用的开发。例如,开发者利用其能力打造了自动生成代码修改记录的工具、帮助高效刷论文的应用、智能聊天模拟器等。
智谱:推出了自主智能体 AutoGLM,但目前该智能体处于内测阶段,还未正式上线。若后续开放相关 API,将在多任务执行、智能操作等方面有很大应用潜力,比如可以实现代替人类控制电子设备,完成点外卖、朋友圈点赞、高铁购票等常见的手机操作。
零一万物:
- API 特点:发布了 YI 大模型 API 开放平台,提供了三个 YI 系列模型。其中,
yi-34b-chat-0205
支持通用聊天、问答、对话、写作、翻译等功能;yi-34b-chat-200k
拥有 200k 上下文窗口,擅长多文档阅读理解、超长知识库构建;yi-vl-plus
为多模态模型,支持文本、视觉多模态输入,在中文图表处理方面表现出色,体验超过 GPT-4V。 - 应用场景:适用于金融、司法、科研等对长文本处理和多模态交互有较高要求的 B 端场景,也可用于开发类 ChatGPT 的对话助手、智能办公工具等 C 端应用。
MiniMax:
- API 特点:推出了 Assistants API,目前处于内测阶段且已向部分头部客户开放。该 API 具有较高的效率和出色的语言理解能力,可应用于聊天机器人、内容创作、信息归纳总结等场景。
- 使用方式:开发者需在其官网上注册账号、申请内测资格,通过审核后创建和管理 API 密钥,然后根据 API 文档和示例代码编写客户端程序进行调用。
以下是对这几家公司及其产品的介绍:
DeepSeek:
- 公司背景:DeepSeek(深度求索)背后有幻方量化的支持,幻方是量化私募巨头,在人工智能领域有深厚的技术积累和强大的算力资源支持。
- 模型特点:DeepSeek-V2是其具有代表性的模型。该模型总参数量为2360亿,但每个token激活21亿参数,实现了性能与资源利用的平衡。它具有长上下文窗口,支持长达128k的文本处理。在性能方面,与之前的版本相比有显著提升,并且在一些标准基准测试中表现出色,比如在alignbench中排名前三,超越GPT-4,接近GPT-4-Turbo,在mt-bench中与Llama3-70b不相上下且胜过Mixtral8x22b。该模型专注于数学、编码和推理等任务,具有较高的效率和准确性。
- 开源及价格优势:DeepSeek-V2完全开源,可免费用于商业用途,其推理成本较低,被称为“AI界拼多多”,这为开发者和企业提供了高性价比的选择。
百川智能:
- 公司背景:由王小川、茹立云等人于2023年3月24日成立,是一家以研发及提供通用人工智能服务为主的企业,致力于打造中国版的OpenAI基础大模型及颠覆性上层应用。
- 模型产品:
- baichuan-7b:2023年6月推出的70亿参数量的中英文预训练大模型,已在多个平台发布。
- baichuan2:推出了具有192k超长上下文窗口的版本,采用搜索增强技术实现大模型与领域知识、全网知识的全面链接,支持多种文档上传及网址输入。
- baichuan3:2024年1月发布的超千亿参数的大语言模型,突破“迭代式强化学习”技术,在语义理解和生成能力上有较大提升,在诗词创作等方面表现优异。
- baichuan4:2024年5月发布的新一代基座模型,同期发布了旗下首款AI智能助手“百小应”。该公司还发布了baichuan4-turbo、baichuan4-air等改进版本,在性能和成本上进行了优化。
- 商业化进展:2023年9月开放了baichuan2的API接口,进军企业级市场,开启商业化进程。2024年推出了一站式大模型商业化解决方案,包括全链路优质通用训练数据、多个模型和全链路领域增强工具链,帮助企业以最低成本实现效果最佳的私有化部署。
Azure OpenAI:
- 合作背景:是微软与OpenAI合作的产物,微软利用Azure的基础设施和服务,将OpenAI的生成式AI模型功能与Azure的企业级功能相结合。
- 服务内容:目前通过Azure可以使用Azure OpenAI服务,主要包括预先训练的生成式AI模型、自定义功能、内置的有害用例检测和缓解工具以及企业级安全性保障等。支持许多常见的AI工作负载,如机器学习、计算机视觉、自然语言处理、对话AI等,还可以通过微调进行模型的训练和自定义,以更好地满足个性化需求。
- 模型系列:提供了多个系列的模型,如生成式预训练转换器(GPT)、Codex、DALL-E等,不同模型针对不同的任务进行了优化,用户可以根据自己的需求选择合适的模型。
阶跃智能:关于阶跃智能的公开信息相对较少,较为低调。
当然BAT势力依旧很强大,以下是对火山引擎、百度智能云、阿里百炼平台的介绍:
- 火山引擎:
- 平台背景:是字节跳动推出的面向企业的技术服务平台。字节跳动在人工智能领域有深厚的技术积累和丰富的应用场景经验,火山引擎将这些能力进行整合并向企业用户开放。
- 服务内容:
- 火山方舟:于2023 年 6 月 28 日正式发布的大模型服务平台。它是一个类似“行业大模型精选商店”的存在,为企业提供模型精调、评测、推理等全方位的平台服务。众多 AI 科技公司及科研院所的明星大模型已入驻该平台,企业可以在“模型广场”挑选不同版本和尺寸的模型,直接与模型交互、调用推理 API,并接入生产环境;通过“模型评估”环节基于业务需求挑选最合适的模型;还可以利用“模型精调”功能进行持续训练,建设和积累自己的精调数据集,降低推理成本。
- 模型优势:火山引擎的豆包模型具有价格优势,例如豆包 Pro32k 模型定价极低,为企业提供了高性价比的选择。同时,该平台还为客户提供了较高标准的 TPM(每分钟 tokens)和 RPM(每分钟请求数),每分钟处理 tokens 限额达到业内同规格模型的数倍,能够支持大量并发请求,有助于企业在生产系统中高效调用大模型。
- 百度智能云:
- 平台背景:百度是国内较早投入人工智能研发的企业,在自然语言处理、计算机视觉等领域拥有深厚的技术实力和丰富的研发经验。百度智能云依托百度的技术优势,为企业提供全面的人工智能解决方案和云计算服务。
- 服务内容:
- 千帆大模型平台:围绕大模型开发与应用,预置了基础 + 行业大模型,数量较多,为企业提供丰富的选择。平台提供数据统计分析、数据质量检查等功能,并结合数据清洗可视化 pipeline,构建面向大模型场景的高质量数据燃料。还推出了自动化 + 人工的双重模型评估机制,确保模型评估效率与质量。该平台已累计服务超过 4 万家企业用户,累计帮助企业用户精调近 1 万个大模型,使用千帆平台训练大模型的成本相比自建系统最高可下降 90%。
- AI 原生应用开发服务:提供千帆 AppBuilder,将大模型开发 AI 原生应用的常见模式、工具、流程沉淀成一个工作台,帮助开发者聚焦业务本身,提供代码态与低代码态两种产品形态,降低 AI 原生应用的开发难度和开发成本。
- 阿里百炼平台:
- 平台背景:阿里巴巴在云计算、大数据和人工智能领域具有强大的技术实力和丰富的实践经验。阿里百炼平台是阿里巴巴推出的企业级智能多模态大模型平台,旨在帮助企业快速构建和部署智能化应用。
- 服务内容:
- 多模态能力:具备多模态数据处理和理解能力,能够处理文本、图像、音频等多种类型的数据。例如,在电商领域,可以通过对商品图片、文字描述等多模态信息的理解,为用户提供更精准的商品推荐;在智能客服领域,可以同时理解用户的文字咨询和语音咨询,提供更全面的服务。
- 模型定制与优化:支持企业根据自身业务需求进行模型定制和优化。企业可以利用自己的数据集对模型进行进一步训练和调整,使其更符合特定业务场景的需求,提高模型的准确性和性能。
- 应用场景广泛:适用于多种行业和应用场景,如金融、电商、物流、制造等。在金融领域,可以用于风险评估、智能投顾等;在物流领域,可以用于智能仓储管理、物流路径规划等。