一周热门|李飞飞:过于武断的AI政策将损害学术界和开源社区;纽约大学教授:我们可能都被奥特曼耍了

在这里插入图片描述

大模型周报将从【企业动态】【技术前瞻】【政策法规】【专家观点】四部分,带你快速跟进大模型行业热门动态。

01 企业动态

CogVideoX 2B:首个开源商用级视频生成模型

作为首个开源商用级视频生成模型,CogVideoX 2B 与智谱AI「清影」同源,视频长度为 6 秒,帧率为 8 帧/秒,视频分辨率为 720*480,提示词上限为 226 个 token,在 FP-16 精度下的推理仅需 18GB 显存,微调则只需 40GB 显存,这意味着单张 4090 显卡即可进行推理,单张 A6000 显卡即可完成微调。

OpenAI 推出更便宜的 GPT-4o 版本

日前,OpenAI 推出了新版 GPT-4o,相比于上一代模型,输入 token 价格便宜 50%,输出 token 价格便宜 33%,且支持结构化输出,可确保模型输出与 JSON Schemas 完全匹配。

OpenAI:API 支持结构化输出,JSON 准确率 100%

近日,OpenAI 宣布,他们的 API 现在可以严格执行工具模式了。简单来说,就是模型生成的参数将完全匹配你提供的工具模式,再也不会出现乱七八糟的结果了。以前,我们使用工具调用时最头疼的就是模型经常生成不符合工具模式的参数。现在,OpenAI允许你明确要求生成的参数必须严格匹配提供的工具模式。这一功能将大大提高了开发效率,让我们可以更专注于应用本身的逻辑,而不是被各种参数处理绊住脚步。

OpenAI 联合创始人离职加入 Anthropic

当地时间 8 月 5 日,OpenAI 联合创始人之一 John Schulman 在社交媒体上宣布离职,将跳槽至 Anthropic,后者是由前 OpenAI 研究人员创立的公司,被认为是 OpenAI 强有力的竞争对手,Anthropic 一直标榜自己比 OpenAI 更有安全意识。

AI 芯片初创公司 Groq 获 6.4 亿美元新融资,估值 28 亿美元

为生成式 AI 开发专用芯片的初创公司 Groq 在贝莱德领投的新一轮融资中获得 6.4 亿美元融资,估值为 28 亿美元。这家总部位于加州山景城的公司旨在通过其语言处理单元(lpu)加速 AI 工作负载。Groq 称,这些芯片运行生成式 AI 模型的速度比传统处理器快 10 倍,但能耗只有传统处理器的十分之一。

中国移动:正推进万卡智算集群、万亿级 token 数据、万亿参数大模型

据财联社报道,中国移动董事长杨杰近日表示,在“AI+”行动计划方面,为充分发挥 AI 技术能力的规模效应,公司正在推进“三个万”:一是万卡智算集群,目前已经投产运行;二是万亿级 token 数据,目前已投入训练 5 万亿,后续还将逐步投入十几万亿;三是万亿参数大模型。

分析师:苹果或对部分 Apple Intelligence 功能收取高至 20 美元的费用

据《科创板日报》报道,Counterpoint Research 合伙人 Neil Shah 表示,由于对 AI 投资成本高昂,苹果可能会对 Apple Intelligence 收取 10 至 20 美元的费用,以提供更多高级 AI 功能。Shah 指出,AI 让苹果有机会进一步锁定其忠实客户群,因为 Apple Intelligence 将从用户行为中学习从而变得更加个性化。

消息称:近三个月,Humane 首款可穿戴 AI 设备退货量超销量

据 The Verge 获得的内部销售数据显示,从今年 5 月到 8 月,AI Pin 的退货量比购买量还多。数据显示,AI Pin 和配件总销售额刚刚超过 900 万美元,但约有 1000 笔订单在发货前被取消,价值超过 100 万美元的产品被退回。总共售出的 AI Pin 数量约为 1 万台,这仅仅是 Humane 计划到 2025 年 4 月出货 10 万台目标的 10%。

02 技术前瞻

苹果新研究:利用有限内存进行高效大模型推理

尽管大语言模型(LLM)在各种任务中展现出了卓越的性能,但它们对计算和内存的大量需求带来了挑战,尤其是对 DRAM 容量有限的设备而言。在这项工作中,苹果团队通过将模型参数存储在闪存中,并根据需要将其导入 DRAM,解决了高效运行超过 DRAM 可用容量的大语言模型(LLM)的难题。与 CPU 和 GPU 中的本地加载方法相比,这些方法共同使运行模型的大小达到可用 DRAM 的两倍,推理速度分别提高了 4-5 倍和 20-25 倍。

MiniCPM-V:手机上的 GPT-4V 级 MLLM

在这项工作中,开源社区 OpenBMB 提出了一系列可部署在终端设备上的高效 MLLM——MiniCPM-V。最新的 MiniCPM-Llama3-V 2.5 具有以下几个显著特点:1)性能强劲,在 OpenCompass 上的表现优于 GPT-4V-1106、Gemini Pro 和 Claude 3;2)具有强大的 OCR 能力和 180 万像素高分辨率图像感知能力,可感知任何长宽比的图像;3)行为可信,幻觉率低;4)支持 30 多种语言;5)可在手机上高效部署。

Meta FAIR 推出“自教学评估器”:无需人工标注,好过 GPT-4

在这项工作中,来自 Meta FAIR 的研究团队提出自教学评估器(Self-Taught Evaluator),旨在仅使用合成训练数据,在没有人工标注的情况下改进评估器。在没有任何标注偏好数据的情况下,该方法可以将一个强 LLM(Llama3-70B-Instruct)在 RewardBench 上的得分从 75.4 提高到 88.3(多数票为 88.7)。这优于 GPT-4 等常用的 LLM 评估器,并与使用标注示例训练的奖励模型的性能不相上下。

牛津团队推出医学分割模型 MedSAM-2

牛津大学团队推出了医学版 SAM 2(MedSAM-2),其利用 SAM 2 框架解决二维和三维医学图像分割任务。通过采用将医学影像作为视频的理念,MedSAM-2 不仅适用于三维医学影像,还具有新的一次提示(One-prompt)分割能力。用户只需要提供一张或某张针对某个物体的特定图像的提示,模型就能在随后的所有图像中自动分割出相同类型的物体,而无需考虑图像之间的时间关系。

DeepMind推出首个媲美人类中级选手的乒乓球机器人

近日,Google DeepMind 研究团队推出了首个能打乒乓球赛的机器人,在 29 场机器人与人类的比赛中,赢得了 45%(13/29)的比赛。值得注意的是,所有人类选手都是该机器人未见过的。虽然机器人输掉了所有与最顶尖选手的比赛,但它却战胜了 100% 的初学者和 55% 的中级选手。

清华太极-Ⅱ 光芯片登上 Nature,突破智能光计算训练难题

训练和推理是 AI 大模型核心能力的两大基石,缺一不可。相较于模型推理而言,模型训练更需要大规模算力。然而,现有的光神经网络训练严重依赖电计算进行离线建模并且要求物理系统精准对齐。正因如此,光学训练的规模受到了极大的限制。由清华大学电子工程系教授方璐、自动化系戴琼海院士及其科研团队提出的全前向智能光计算训练架构太极-II,摆脱了原有光计算系统对电计算离线建模的依赖,实现了大规模神经网络的在线训练,并有潜力支撑未来 AI 大模型的高速、低功耗训练。

03 政策法规

亚马逊对 Anthropic 的 40 亿美元投资将面临英国合并调查

近日,英国反垄断监管机构宣布对亚马逊投资 AI 初创公司 Anthropic 一事展开调查。据悉,截至今年 3 月底,亚马逊已向 Anthropic 注资约 40 亿美元,获得该公司少数股权。英国竞争与市场管理局(CMA)表示,此次调查旨在评估亚马逊与 Anthropic 的关系是否构成实质性合并,以及是否可能损害英国市场的公平竞争。初步结果预计将于 10 月 4 日前公布。

英国央行:可以在完成工作过程中使用 AI

英国央行在周一晚间的会议上批准了新的 AI 政策。根据新通过的政策,工作人员将能够在完成自己工作过程中使用 AI,“这可能包括但不限于起草通信、笔记、图像,为教学或行政目的开发内容,以及分析数据和信息。”在教师允许的情况下,学生可以使用经批准的 AI 程序进行教学。

04 专家观点

李飞飞:过于武断的 AI 政策将损害学术界和开源社区

8 月 7 日,“AI教母”、斯坦福大学首位红杉讲席教授李飞飞(Feifei Li)在 Fortune 撰文指出,加州 AI 限制法案将损害学术界、小型科技公司和开源社区,限制创新,且该法案并未解决 AI 的潜在危害,包括偏见和深度伪造(deepfake)等等。她表示,AI 政策必须鼓励创新,设定适当的限制,并减轻这些限制的影响。

纽约大学教授:我们可能都被 Sam Altman 耍了

近日,纽约大学教授 Gary Marcus 在《卫报》上发文称,OpenAI 首席执行官 Sam Altman 很可能一开始的意图是好的,也许他真的想从 AI 的威胁中拯救世界,并引导 AI 向善,但后来贪婪占据了上风。Marcus 表示,他根本不会相信私营的大型 AI 初创公司会以道德和透明的方式管理自己,“我们可能都被 Sam Altman 耍了”。

Mistral AI 首席执行官:当今最安全的技术是开源技术

日前,Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在《时代》杂志专访中,详细探讨了 Mistral AI 如何吸引稀缺人工智能(AI)人才、如何实现盈利以及欧洲 AI 生态系统的缺失等话题。他表示,开源模型没有任何风险,他只看到了好处;用于构建这些应用程序的技术并不是唯一可以被监管的东西,控制投放市场的应用程序的质量非常重要。

05 其他

Sam Altman 被指对 OpenAI 的安全工作不诚实

在给 OpenAI 的一封信中,爱荷华州共和党参议员 Chuck Grassley 要求 OpenAI 提供证据,证明 OpenAI 不再要求可能“压制”其员工向政府监管机构进行“受保护的披露”的协议。

具体来说,Grassley 要求 OpenAI 提供当前的雇佣、离职、不得贬低和保密协议,以向国会保证合同不会阻碍披露。他表示,这一点至关重要,以便能够依靠举报人揭露新威胁,帮助形成有效的 AI 政策,以防范随着技术进步而出现的存在性 AI 风险。

Grassley 在信中提到,他显然已经两次要求这些记录,但 OpenAI 没有回应。到目前为止,OpenAI 还没有回应最新发送文件的请求。

马斯克重启对 OpenAI 和 Sam Altman 的诉讼

近日,马斯克再次对 OpenAI 和 Sam Altman 提起诉讼,指控 OpenAI 将利润和商业利益置于公共利益之上,背离了创立公司时造福全人类的初衷。此次新起诉状的篇幅几乎是原诉状的两倍,同时还新增了对 OpenAI 涉嫌敲诈勒索的指控。马斯克认为,自己向 OpenAI 投入了名誉、大量时间和数千万美元的种子基金,却遭到 Altman 及其同伙的背叛。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1541251.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

java项目编译UTF-8编译问题

代码没有报错信息,但是一启动就各种符号什么的报错,看代码也没有问题 然后就搜各种解决方案 我试了好几种,这种是生效的,直接在IDEA修改 没修改之前的配置 修改后的

一对一视频通话软件Call-Me

什么是 Call-Me ? Call-Me 使你能够直接通过网页浏览器使用 WebRTC 技术轻松进行一对一的视频通话。 Call-Me 的主要功能: 使用用户名登录。通过输入接收者的用户名进行视频通话。切换视频源的可见性。通话结束时挂断电话。提供 REST API 获取所有连接…

【d46】【Java】【力扣】234.回文链表

思路 判断是否是回文,需要:一个指针指向头,一个指针指向尾,两个指针一边向中间靠拢,一边判断数值是否相同 对于单链表,不方便获得pre,如果将节点放进 数组/list ,数组/list可以直接…

[Unity Demo]从零开始制作空洞骑士Hollow Knight第七集:制作小骑士完整的冲刺Dash行为

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、制作一个完整的小骑士冲刺Dash行为 1.制作动画以及使用UNITY编辑器编辑2.使用代码实现完整的冲刺行为控制总结 前言 大家又好久不见(虽然就过了…

论文速递!基于PINN的知识+数据融合方法!实现可再生能源电力系统中的TTC高效评估

本期推文将介绍一种结合知识驱动和数据驱动的混合算法在电力系统总传输能力(TTC)评估中的应用,这项研究发表于《IEEE Transactions on Power Systems》期刊,主要解决高比例可再生能源渗透下电力系统中的TTC快速评估问题。 荐读的论…

day21JS-npm中的部分插件使用方法

1. 静态资源目录 静态资源目录就是访问服务器的某些路劲时候,服务器可以吐出一个写好的指定页面。 实现思路: 1、先判断要找的路径是否是文件,如果是文件,就加载发给对方。 2、如果是文件夹,找到这个文件夹所在路径中…

linux----进程地址空间

前言 提示:以下是本篇文章正文内容,下面案例可供参考 一、空间分布 二、栈和堆的特点 (1)栈堆相对而生,堆是向上增长的,栈是向下增长的。 验证:堆是向上增长的 这里我们看到申请的堆&#xff…

springMvc的初始配置

基础文件结构(toWeb插件) 1.导入对应依赖 <?xml version"1.0" encoding"UTF-8"?><project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"ht…

【软考】循环冗余校验码

目录 1. 说明2. CRC 的代码格式3. 例题3.1 例题1 1. 说明 1.循环冗余校验码(Cyclic Redundancy Check&#xff0c;CRC)广泛应用于数据通信领域和磁介质存储系统中。2.它利用生成多项式为k个数据位产生&#xff0c;r个校验位来进行编码&#xff0c;其编码长度为 kr。3.循环几余…

如何成为信息安全等级测评师?具体有哪些要求?

给大家的福利&#xff0c;点击下方蓝色字 即可免费领取↓↓↓ &#x1f91f; 基于入门网络安全/黑客打造的&#xff1a;&#x1f449;黑客&网络安全入门&进阶学习资源包 文章目录 前言 信息安全等级测评师 定义与作用&#xff1a;证书颁发&#xff1a;能力要求&#x…

【React】(推荐项目)一个用 React 构建的 CRUD 应用程序

推荐项目&#xff1a;CRUD 应用示例 在本篇文章中&#xff0c;我想向大家推荐一个非常实用的项目&#xff1a;CRUD 应用示例。这个项目展示了如何使用现代技术栈创建一个基础的增删改查&#xff08;CRUD&#xff09;应用&#xff0c;非常适合用于学习和实践后端开发技能。 适…

【2024华为杯数学建模研赛赛题已出(A-F题)】

华为杯2024年中国研究生数学建模竞赛A-F题已公布 A题 B题 C题 D题 E题 F题

骨传导耳机怎么选?深扒2024五款热门骨传导耳机!

耳机在我们的日常生活中渐渐变得不可或缺&#xff0c;早晨出门、通勤、工作&#xff0c;甚至睡觉时&#xff0c;它们总是陪伴在侧。尽管我们都知道长期使用耳机会对听力造成一定影响&#xff0c;但骨传导耳机的出现为我们提供了更为安全和卫生的选择。这种耳机的设计使耳朵保持…

其他比较条件

使用BETWEEN条件 可以用BETWEEN范围条件显示基于一个值范围的行。指定的范围包含一个下限和一个上限。 示例&#xff1a;查询employees表&#xff0c;薪水在3000-8000之间的雇员ID、名字与薪水。 select employee_id,last_name,salary from employees where salary between 3…

泛微E9开发 创建自定义浏览框,关联物品管理表【1】

创建自定义浏览框&#xff0c;关联物品管理表【1】 1、自定义浏览框1.1 概念1.2 前端样式 2、创建物品管理表2.1 新建建模表单操作方法2.2 物品管理表 3、创建浏览按钮 1、自定义浏览框 1.1 概念 自定义浏览框可以理解为是建模引擎中的表与表关联的一个桥梁。比如利用建模引擎…

菜鸟也能轻松上手的Java环境配置方法

初学者学习Java这么编程语言&#xff0c;第一个难题往往是Java环境的配置&#xff0c;今天与大家详细地聊一聊&#xff0c;以便大家能独立完成配置方法和过程。 首先&#xff0c;找到“JDK”&#xff0c;点击“archive”&#xff1a; 向下滑&#xff0c;在“previous java rel…

小白src挖掘 | 记某证书站的虚拟仿真实验平台

&#x1f36c; 博主介绍 &#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【应急响应】 【edusrc漏洞挖掘】 【VulnHub靶场复现】【面试分析】 &#x1f389;欢迎关注…

017_FEA_CSG_in_Matlab新的统一有限元分析工作流之2D几何

Matlab新的统一有限元分析工作流 从2023a开始&#xff0c;Matlab提供了一个统一有限元分析工作流&#xff08;UFEAW&#xff0c;unified finite element analysis workflow&#xff09;。 这个新的工作留提供一个统一的接口来求解三类问题&#xff0c;并且可以用同一套数据随…

并查集(上)

并查集简要介绍&#xff1a; 我们先讲并查集的一般使用场景&#xff0c;之后再讲并查集的具体细节以及原理。 并查集的使用一般是如下的场景&#xff1a; 一开始每个元素都拥有自己的集合&#xff0c;在自己的集合里只有这个元素自己。 f i n d ( i ) find(i) find(i)&#…

数据结构之算法复杂度

目录 前言 一、复杂度的概念 二、时间复杂度 三、大O的渐进表示法 四、空间复杂度 五、常见复杂度对比 总结 前言 本文主要讲述数据结构中的算法复杂度 一、复杂度的概念 算法在编写成可执行程序后&#xff0c;运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏…