做AI大模型应用层产品研发，基本绕不开这几个大模型API

在这里插入图片描述

国内有不少独立模型厂商提供 API 可供调用，几乎都会成为技术选择的可选项：
Moonshot AI：

API 特点：其 API 与 OpenAI 兼容，方便开发者平滑迁移，开发者无需对代码做除基本参数外的“额外”修改，即可体验到 Moonshot 模型的能力。经过一段时间内测后已启动公开测试，所有开发者都可登录开放平台创建自己的 API key，将其模型能力接入到自己的产品中，或基于该模型能力打造全新产品。
应用场景：可用于聊天机器人、文本创作、智能客服等多种应用的开发。例如，开发者利用其能力打造了自动生成代码修改记录的工具、帮助高效刷论文的应用、智能聊天模拟器等。

智谱：推出了自主智能体 AutoGLM，但目前该智能体处于内测阶段，还未正式上线。若后续开放相关 API，将在多任务执行、智能操作等方面有很大应用潜力，比如可以实现代替人类控制电子设备，完成点外卖、朋友圈点赞、高铁购票等常见的手机操作。

零一万物：

API 特点：发布了 YI 大模型 API 开放平台，提供了三个 YI 系列模型。其中，yi-34b-chat-0205支持通用聊天、问答、对话、写作、翻译等功能；yi-34b-chat-200k拥有 200k 上下文窗口，擅长多文档阅读理解、超长知识库构建；yi-vl-plus为多模态模型，支持文本、视觉多模态输入，在中文图表处理方面表现出色，体验超过 GPT-4V。
应用场景：适用于金融、司法、科研等对长文本处理和多模态交互有较高要求的 B 端场景，也可用于开发类 ChatGPT 的对话助手、智能办公工具等 C 端应用。

MiniMax：

API 特点：推出了 Assistants API，目前处于内测阶段且已向部分头部客户开放。该 API 具有较高的效率和出色的语言理解能力，可应用于聊天机器人、内容创作、信息归纳总结等场景。
使用方式：开发者需在其官网上注册账号、申请内测资格，通过审核后创建和管理 API 密钥，然后根据 API 文档和示例代码编写客户端程序进行调用。

以下是对这几家公司及其产品的介绍：
DeepSeek：

公司背景：DeepSeek（深度求索）背后有幻方量化的支持，幻方是量化私募巨头，在人工智能领域有深厚的技术积累和强大的算力资源支持。
模型特点：DeepSeek-V2是其具有代表性的模型。该模型总参数量为2360亿，但每个token激活21亿参数，实现了性能与资源利用的平衡。它具有长上下文窗口，支持长达128k的文本处理。在性能方面，与之前的版本相比有显著提升，并且在一些标准基准测试中表现出色，比如在alignbench中排名前三，超越GPT-4，接近GPT-4-Turbo，在mt-bench中与Llama3-70b不相上下且胜过Mixtral8x22b。该模型专注于数学、编码和推理等任务，具有较高的效率和准确性。
开源及价格优势：DeepSeek-V2完全开源，可免费用于商业用途，其推理成本较低，被称为“AI界拼多多”，这为开发者和企业提供了高性价比的选择。

百川智能：

公司背景：由王小川、茹立云等人于2023年3月24日成立，是一家以研发及提供通用人工智能服务为主的企业，致力于打造中国版的OpenAI基础大模型及颠覆性上层应用。
模型产品：
- baichuan-7b：2023年6月推出的70亿参数量的中英文预训练大模型，已在多个平台发布。
- baichuan2：推出了具有192k超长上下文窗口的版本，采用搜索增强技术实现大模型与领域知识、全网知识的全面链接，支持多种文档上传及网址输入。
- baichuan3：2024年1月发布的超千亿参数的大语言模型，突破“迭代式强化学习”技术，在语义理解和生成能力上有较大提升，在诗词创作等方面表现优异。
- baichuan4：2024年5月发布的新一代基座模型，同期发布了旗下首款AI智能助手“百小应”。该公司还发布了baichuan4-turbo、baichuan4-air等改进版本，在性能和成本上进行了优化。
商业化进展：2023年9月开放了baichuan2的API接口，进军企业级市场，开启商业化进程。2024年推出了一站式大模型商业化解决方案，包括全链路优质通用训练数据、多个模型和全链路领域增强工具链，帮助企业以最低成本实现效果最佳的私有化部署。

Azure OpenAI：

合作背景：是微软与OpenAI合作的产物，微软利用Azure的基础设施和服务，将OpenAI的生成式AI模型功能与Azure的企业级功能相结合。
服务内容：目前通过Azure可以使用Azure OpenAI服务，主要包括预先训练的生成式AI模型、自定义功能、内置的有害用例检测和缓解工具以及企业级安全性保障等。支持许多常见的AI工作负载，如机器学习、计算机视觉、自然语言处理、对话AI等，还可以通过微调进行模型的训练和自定义，以更好地满足个性化需求。
模型系列：提供了多个系列的模型，如生成式预训练转换器（GPT）、Codex、DALL-E等，不同模型针对不同的任务进行了优化，用户可以根据自己的需求选择合适的模型。

阶跃智能：关于阶跃智能的公开信息相对较少，较为低调。

当然BAT势力依旧很强大，以下是对火山引擎、百度智能云、阿里百炼平台的介绍：

火山引擎：
- 平台背景：是字节跳动推出的面向企业的技术服务平台。字节跳动在人工智能领域有深厚的技术积累和丰富的应用场景经验，火山引擎将这些能力进行整合并向企业用户开放。
- 服务内容：
  - 火山方舟：于2023 年 6 月 28 日正式发布的大模型服务平台。它是一个类似“行业大模型精选商店”的存在，为企业提供模型精调、评测、推理等全方位的平台服务。众多 AI 科技公司及科研院所的明星大模型已入驻该平台，企业可以在“模型广场”挑选不同版本和尺寸的模型，直接与模型交互、调用推理 API，并接入生产环境；通过“模型评估”环节基于业务需求挑选最合适的模型；还可以利用“模型精调”功能进行持续训练，建设和积累自己的精调数据集，降低推理成本。
  - 模型优势：火山引擎的豆包模型具有价格优势，例如豆包 Pro32k 模型定价极低，为企业提供了高性价比的选择。同时，该平台还为客户提供了较高标准的 TPM（每分钟 tokens）和 RPM（每分钟请求数），每分钟处理 tokens 限额达到业内同规格模型的数倍，能够支持大量并发请求，有助于企业在生产系统中高效调用大模型。
百度智能云：
- 平台背景：百度是国内较早投入人工智能研发的企业，在自然语言处理、计算机视觉等领域拥有深厚的技术实力和丰富的研发经验。百度智能云依托百度的技术优势，为企业提供全面的人工智能解决方案和云计算服务。
- 服务内容：
  - 千帆大模型平台：围绕大模型开发与应用，预置了基础 + 行业大模型，数量较多，为企业提供丰富的选择。平台提供数据统计分析、数据质量检查等功能，并结合数据清洗可视化 pipeline，构建面向大模型场景的高质量数据燃料。还推出了自动化 + 人工的双重模型评估机制，确保模型评估效率与质量。该平台已累计服务超过 4 万家企业用户，累计帮助企业用户精调近 1 万个大模型，使用千帆平台训练大模型的成本相比自建系统最高可下降 90%。
  - AI 原生应用开发服务：提供千帆 AppBuilder，将大模型开发 AI 原生应用的常见模式、工具、流程沉淀成一个工作台，帮助开发者聚焦业务本身，提供代码态与低代码态两种产品形态，降低 AI 原生应用的开发难度和开发成本。
阿里百炼平台：
- 平台背景：阿里巴巴在云计算、大数据和人工智能领域具有强大的技术实力和丰富的实践经验。阿里百炼平台是阿里巴巴推出的企业级智能多模态大模型平台，旨在帮助企业快速构建和部署智能化应用。
- 服务内容：
  - 多模态能力：具备多模态数据处理和理解能力，能够处理文本、图像、音频等多种类型的数据。例如，在电商领域，可以通过对商品图片、文字描述等多模态信息的理解，为用户提供更精准的商品推荐；在智能客服领域，可以同时理解用户的文字咨询和语音咨询，提供更全面的服务。
  - 模型定制与优化：支持企业根据自身业务需求进行模型定制和优化。企业可以利用自己的数据集对模型进行进一步训练和调整，使其更符合特定业务场景的需求，提高模型的准确性和性能。
  - 应用场景广泛：适用于多种行业和应用场景，如金融、电商、物流、制造等。在金融领域，可以用于风险评估、智能投顾等；在物流领域，可以用于智能仓储管理、物流路径规划等。