一周热门｜李飞飞：过于武断的AI政策将损害学术界和开源社区；纽约大学教授：我们可能都被奥特曼耍了

在这里插入图片描述

大模型周报将从【企业动态】【技术前瞻】【政策法规】【专家观点】四部分，带你快速跟进大模型行业热门动态。

01 企业动态

CogVideoX 2B：首个开源商用级视频生成模型

作为首个开源商用级视频生成模型，CogVideoX 2B 与智谱AI「清影」同源，视频长度为 6 秒，帧率为 8 帧/秒，视频分辨率为 720*480，提示词上限为 226 个 token，在 FP-16 精度下的推理仅需 18GB 显存，微调则只需 40GB 显存，这意味着单张 4090 显卡即可进行推理，单张 A6000 显卡即可完成微调。

OpenAI 推出更便宜的 GPT-4o 版本

日前，OpenAI 推出了新版 GPT-4o，相比于上一代模型，输入 token 价格便宜 50%，输出 token 价格便宜 33%，且支持结构化输出，可确保模型输出与 JSON Schemas 完全匹配。

OpenAI：API 支持结构化输出，JSON 准确率 100%

近日，OpenAI 宣布，他们的 API 现在可以严格执行工具模式了。简单来说，就是模型生成的参数将完全匹配你提供的工具模式，再也不会出现乱七八糟的结果了。以前，我们使用工具调用时最头疼的就是模型经常生成不符合工具模式的参数。现在，OpenAI允许你明确要求生成的参数必须严格匹配提供的工具模式。这一功能将大大提高了开发效率，让我们可以更专注于应用本身的逻辑，而不是被各种参数处理绊住脚步。

OpenAI 联合创始人离职加入 Anthropic

当地时间 8 月 5 日，OpenAI 联合创始人之一 John Schulman 在社交媒体上宣布离职，将跳槽至 Anthropic，后者是由前 OpenAI 研究人员创立的公司，被认为是 OpenAI 强有力的竞争对手，Anthropic 一直标榜自己比 OpenAI 更有安全意识。

AI 芯片初创公司 Groq 获 6.4 亿美元新融资，估值 28 亿美元

为生成式 AI 开发专用芯片的初创公司 Groq 在贝莱德领投的新一轮融资中获得 6.4 亿美元融资，估值为 28 亿美元。这家总部位于加州山景城的公司旨在通过其语言处理单元（lpu）加速 AI 工作负载。Groq 称，这些芯片运行生成式 AI 模型的速度比传统处理器快 10 倍，但能耗只有传统处理器的十分之一。

中国移动：正推进万卡智算集群、万亿级 token 数据、万亿参数大模型

据财联社报道，中国移动董事长杨杰近日表示，在“AI+”行动计划方面，为充分发挥 AI 技术能力的规模效应，公司正在推进“三个万”：一是万卡智算集群，目前已经投产运行；二是万亿级 token 数据，目前已投入训练 5 万亿，后续还将逐步投入十几万亿；三是万亿参数大模型。

分析师：苹果或对部分 Apple Intelligence 功能收取高至 20 美元的费用

据《科创板日报》报道，Counterpoint Research 合伙人 Neil Shah 表示，由于对 AI 投资成本高昂，苹果可能会对 Apple Intelligence 收取 10 至 20 美元的费用，以提供更多高级 AI 功能。Shah 指出，AI 让苹果有机会进一步锁定其忠实客户群，因为 Apple Intelligence 将从用户行为中学习从而变得更加个性化。

消息称：近三个月，Humane 首款可穿戴 AI 设备退货量超销量

据 The Verge 获得的内部销售数据显示，从今年 5 月到 8 月，AI Pin 的退货量比购买量还多。数据显示，AI Pin 和配件总销售额刚刚超过 900 万美元，但约有 1000 笔订单在发货前被取消，价值超过 100 万美元的产品被退回。总共售出的 AI Pin 数量约为 1 万台，这仅仅是 Humane 计划到 2025 年 4 月出货 10 万台目标的 10%。

02 技术前瞻

苹果新研究：利用有限内存进行高效大模型推理

尽管大语言模型（LLM）在各种任务中展现出了卓越的性能，但它们对计算和内存的大量需求带来了挑战，尤其是对 DRAM 容量有限的设备而言。在这项工作中，苹果团队通过将模型参数存储在闪存中，并根据需要将其导入 DRAM，解决了高效运行超过 DRAM 可用容量的大语言模型（LLM）的难题。与 CPU 和 GPU 中的本地加载方法相比，这些方法共同使运行模型的大小达到可用 DRAM 的两倍，推理速度分别提高了 4-5 倍和 20-25 倍。

MiniCPM-V：手机上的 GPT-4V 级 MLLM

在这项工作中，开源社区 OpenBMB 提出了一系列可部署在终端设备上的高效 MLLM——MiniCPM-V。最新的 MiniCPM-Llama3-V 2.5 具有以下几个显著特点：1）性能强劲，在 OpenCompass 上的表现优于 GPT-4V-1106、Gemini Pro 和 Claude 3；2）具有强大的 OCR 能力和 180 万像素高分辨率图像感知能力，可感知任何长宽比的图像；3）行为可信，幻觉率低；4）支持 30 多种语言；5）可在手机上高效部署。

Meta FAIR 推出“自教学评估器”：无需人工标注，好过 GPT-4

在这项工作中，来自 Meta FAIR 的研究团队提出自教学评估器（Self-Taught Evaluator），旨在仅使用合成训练数据，在没有人工标注的情况下改进评估器。在没有任何标注偏好数据的情况下，该方法可以将一个强 LLM（Llama3-70B-Instruct）在 RewardBench 上的得分从 75.4 提高到 88.3（多数票为 88.7）。这优于 GPT-4 等常用的 LLM 评估器，并与使用标注示例训练的奖励模型的性能不相上下。

牛津团队推出医学分割模型 MedSAM-2

牛津大学团队推出了医学版 SAM 2（MedSAM-2），其利用 SAM 2 框架解决二维和三维医学图像分割任务。通过采用将医学影像作为视频的理念，MedSAM-2 不仅适用于三维医学影像，还具有新的一次提示（One-prompt）分割能力。用户只需要提供一张或某张针对某个物体的特定图像的提示，模型就能在随后的所有图像中自动分割出相同类型的物体，而无需考虑图像之间的时间关系。

DeepMind推出首个媲美人类中级选手的乒乓球机器人

近日，Google DeepMind 研究团队推出了首个能打乒乓球赛的机器人，在 29 场机器人与人类的比赛中，赢得了 45%（13/29）的比赛。值得注意的是，所有人类选手都是该机器人未见过的。虽然机器人输掉了所有与最顶尖选手的比赛，但它却战胜了 100% 的初学者和 55% 的中级选手。

清华太极-Ⅱ 光芯片登上 Nature，突破智能光计算训练难题

训练和推理是 AI 大模型核心能力的两大基石，缺一不可。相较于模型推理而言，模型训练更需要大规模算力。然而，现有的光神经网络训练严重依赖电计算进行离线建模并且要求物理系统精准对齐。正因如此，光学训练的规模受到了极大的限制。由清华大学电子工程系教授方璐、自动化系戴琼海院士及其科研团队提出的全前向智能光计算训练架构太极-II，摆脱了原有光计算系统对电计算离线建模的依赖，实现了大规模神经网络的在线训练，并有潜力支撑未来 AI 大模型的高速、低功耗训练。

03 政策法规

亚马逊对 Anthropic 的 40 亿美元投资将面临英国合并调查

近日，英国反垄断监管机构宣布对亚马逊投资 AI 初创公司 Anthropic 一事展开调查。据悉，截至今年 3 月底，亚马逊已向 Anthropic 注资约 40 亿美元，获得该公司少数股权。英国竞争与市场管理局（CMA）表示，此次调查旨在评估亚马逊与 Anthropic 的关系是否构成实质性合并，以及是否可能损害英国市场的公平竞争。初步结果预计将于 10 月 4 日前公布。

英国央行：可以在完成工作过程中使用 AI

英国央行在周一晚间的会议上批准了新的 AI 政策。根据新通过的政策，工作人员将能够在完成自己工作过程中使用 AI，“这可能包括但不限于起草通信、笔记、图像，为教学或行政目的开发内容，以及分析数据和信息。”在教师允许的情况下，学生可以使用经批准的 AI 程序进行教学。

04 专家观点

李飞飞：过于武断的 AI 政策将损害学术界和开源社区

8 月 7 日，“AI教母”、斯坦福大学首位红杉讲席教授李飞飞（Feifei Li）在 Fortune 撰文指出，加州 AI 限制法案将损害学术界、小型科技公司和开源社区，限制创新，且该法案并未解决 AI 的潜在危害，包括偏见和深度伪造（deepfake）等等。她表示，AI 政策必须鼓励创新，设定适当的限制，并减轻这些限制的影响。

纽约大学教授：我们可能都被 Sam Altman 耍了

近日，纽约大学教授 Gary Marcus 在《卫报》上发文称，OpenAI 首席执行官 Sam Altman 很可能一开始的意图是好的，也许他真的想从 AI 的威胁中拯救世界，并引导 AI 向善，但后来贪婪占据了上风。Marcus 表示，他根本不会相信私营的大型 AI 初创公司会以道德和透明的方式管理自己，“我们可能都被 Sam Altman 耍了”。

Mistral AI 首席执行官：当今最安全的技术是开源技术

日前，Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在《时代》杂志专访中，详细探讨了 Mistral AI 如何吸引稀缺人工智能（AI）人才、如何实现盈利以及欧洲 AI 生态系统的缺失等话题。他表示，开源模型没有任何风险，他只看到了好处；用于构建这些应用程序的技术并不是唯一可以被监管的东西，控制投放市场的应用程序的质量非常重要。

05 其他

Sam Altman 被指对 OpenAI 的安全工作不诚实

在给 OpenAI 的一封信中，爱荷华州共和党参议员 Chuck Grassley 要求 OpenAI 提供证据，证明 OpenAI 不再要求可能“压制”其员工向政府监管机构进行“受保护的披露”的协议。

具体来说，Grassley 要求 OpenAI 提供当前的雇佣、离职、不得贬低和保密协议，以向国会保证合同不会阻碍披露。他表示，这一点至关重要，以便能够依靠举报人揭露新威胁，帮助形成有效的 AI 政策，以防范随着技术进步而出现的存在性 AI 风险。

Grassley 在信中提到，他显然已经两次要求这些记录，但 OpenAI 没有回应。到目前为止，OpenAI 还没有回应最新发送文件的请求。

马斯克重启对 OpenAI 和 Sam Altman 的诉讼

近日，马斯克再次对 OpenAI 和 Sam Altman 提起诉讼，指控 OpenAI 将利润和商业利益置于公共利益之上，背离了创立公司时造福全人类的初衷。此次新起诉状的篇幅几乎是原诉状的两倍，同时还新增了对 OpenAI 涉嫌敲诈勒索的指控。马斯克认为，自己向 OpenAI 投入了名誉、大量时间和数千万美元的种子基金，却遭到 Altman 及其同伙的背叛。