阿里 Qwen2.5 开源发布;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 开发者日报

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、阿里史上最大规模开源发布,超 GPT-4o 、Llama-3.1!
在这里插入图片描述

今日凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型 Qwen2.5、专用于编码 Qwen2.5-Coder 和数学的 Qwen2.5-Math。这三大类模型一共有 10 多个版本,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B,适用于个人、企业以及移动端、PC 等不同人群不同业务场景的模型。

如果不想进行繁琐的部署,阿里还开放了旗舰模型 Qwen-Plus 和 Qwen-Turbo 的 API,帮助你快速开发或集成生成式 AI 功能。

虽然 Qwen2.5 只有 720 亿参数,但在多个基准测试中击败了 Meta 拥有 4050 亿参数的最新开源 Llama-3.1 指令微调模型;全面超过了 Mistral 最新开源的 Large-V2 指令微调模型,成为目前最强大参数的开源模型之一。

Qwen2.5 系列支持中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文等超过 29 种主流语言。与 Qwen2 类似,Qwen2.5 语言模型支持高达 128K tokens,并能生成最多 8K tokens 的内容。

与 Qwen-2 相比,Qwen2.5 系列的预训练数据大幅度增长达到了惊人的 18 万亿 tokens,超过了 Meta 最新开源 Llama-3.1 的 15 万亿,成为目前训练数据最多的开源模型。(@AIGC 社区)

2、文生视频模型 Runway、Luma 同时开放 API

著名文生视频模型 Runway 宣布开放最新文生视频模型 Gen-3AlphaTurbo 的 API,帮助开发者将该功能集成在应用中。

Runway 的 API 提供了两个套餐:「Build」主要面向希望将文生视频集成在应用的个人和团队;「Enterprise」则面向更大型的组织和企业。目前,Runway 的 API 需要申请候补名单。

几乎在同一时间,Runway 的主要竞争对手 Luma 也宣布开放了生成视频 API,同样可以将文生视频功能集成在应用中。

Luma 的 API 提供的是最新模型 Dream Machine v1.6,在生成效率和质量方面同样非常出色。(@AIGC 社区)

3、YouTubeVeo 引入 Google DeepMind 的 Veo 模型,创作者可使用 Veo 创作视频

YouTube Shorts 将引入 Google DeepMind 的 Veo 模型,它允许创作者制作 6 秒的独立视频片段,并将 AI 生成的背景与现有视频结合,扩展视觉创意。

这些 AI 技术将集成到 YouTube Shorts 的 Dream Screen 功能中。

Dream Screen 首先使用 Imagen 3 生成四个不同的图像,创作者可以从这些选项中选择符合他们偏好风格、构图或美学的图像。选择图像后,然后 Veo 模型将基于所选图像生成 6 秒长的高质量背景视频,以实现用户的创意愿景。

不过 AI 生成的内容将通过 SynthID 打上水印,清晰标识为 AI 生成。(@小互 AI)

4、字节跳动:与台积电合作 AI 芯片一事不实

此前,The Information 报道,有知情人士透露,字节跳动正在计划与台积电合作,在 2026 年前量产自主设计的 AI 芯片,预计字节将预定数十万枚芯片的产量。

报道称,生产自主设计的芯片将有利于字节减少对价格高昂英伟达芯片的依赖,从而减少开发和运行 AI 模型的成本,在中国 AI 聊天机器人市场领先对手。

昨日,字节方面就此事回应《科创板日报》表示,报道不实,字节跳动在芯片领域确实有一些探索,但还处于初期阶段,主要是围绕推荐、广告等业务的成本优化,所有项目也完全符合相关的贸易管制规定。

几个月前也有消息称字节跳动与博通公司合作开发 AI 芯片,由台积电制造,不过字节跳动否认了「与博通合作开发 AI 芯片」的传闻。(@APPSO)

5、iPhone 15 Pro/Max 升级苹果 iOS 18.1 Beta 4 后支持拍摄空间照片

科技媒体 9to5Mac 9 月 17 日发布博文报道称,苹果 iPhone 15 Pro 和 iPhone 15 Pro Max 两款机型在升级 iOS 18.1 Beta 4 更新之后,可以支持空间照片(Spatial Photos)。

iPhone 15 Pro 和 iPhone 15 Pro Max 两款机型升级 iOS 18.1 Beta 4 之后,支持拍摄空间照片,意味着用户可以拍摄沉浸式 3D 图像,后续可以在 Vision Pro 头显上观看,让其重温他们喜爱的时刻。

要在 iPhone 15 Pro 上拍摄空间照片,用户需打开相机应用,选择空间模式,并将 iPhone 旋转至横屏模式。随后,根据苹果官网的指示,用户将看到录制空间视频和拍摄空间照片的选项。用户升级 iOS 18.1 Beta 4 更新之后,可以不再仅依赖第三方应用程序,就能拍摄空间照片。

值得注意的是,Spatialify 等第三方产品在某些领域仍提供了额外的功能。例如,Spatialify 应用允许用户以 4K 分辨率录制空间视频,而苹果内置的相机应用仅支持录制 1080p 的空间视频。(@VRAR 星球)

02 有态度的观点

1、阿里 CEO 吴泳铭:AI 算力需求渗透率超 50%,最大的想象力不在手机屏幕

2024 云栖大会开幕式上,阿里巴巴集团董事兼 CEO、阿里云智能集团董事长兼 CEO 吴泳铭表示,「在新增的算力市场和算力需求中,超过 50% 以上的需求现在都由 AI 驱动产生,AI 算力的需求渗透已经超过 50%,已经占据主导地位,未来这一趋势还会持续地扩大。」

「AI 计算正在加速演进,成为整个计算体系的主导,无论是端侧的计算还是云端的计算,这都是一个非常明显的趋势,生成式 AI 对数字世界和物理世界的重构,将带来计算架构的根本性变化。」吴泳铭表示,「过去几十年 CPU 主导的计算体系,正在加速向 GPU 为主导的 AI 计算体系牵引,未来几乎所有的软硬件都会具备推理能力,他们的计算内核将会变成 GPU AI 算力为主,CPU 算力为辅助的计算模式。」

「在汽车、生物医药、工业仿真、气象预测、教育企业软件、移动 Anh、游戏等行业,AI 计算正在加速渗透,在各行各业看不见的新兴产业革命正在悄然演进,所有行业都需要性能更强,规模更大,更适应 AI 需求的算力基础设施。」吴泳铭表示。

吴泳铭表示,「阿里云正在以前所未有的强度投入 AI 技术研发和基础设施的建设,我们的单网络集群拓展已扩展到 10 万卡的级别,正在从芯片、服务器、网络存储、供电数据中心等方方面面,重新打造面向未来的 AI 先进基础设施」。

吴泳铭认为 AI 最大的想象力不在手机屏幕,而是改变物理世界。「过去 22 个月,AI 发展速度超过任何历史时期,但依然处于 AGI 变革的早期。生成式 AI 最大的想象力,绝不是在手机屏幕上做一两个新的超级 App,而是接管数字世界,改变物理世界。」(@IT 之家)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/143584.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

4路同步AD模拟量采集卡800K采样频率—PCIe9757

阿尔泰科技 概述: 信息社会的发展,在很大程度上取决于信息与信号处理技术的先进性。数字信号处理技术的出现改变了信息与信号处理技术的整个面貌,而数据采集作为数字信号处理的必不可少的前期工作在整个数字系统中起到关键性、乃至决定性的…

平替WordPress/Zendesk,3分钟零代码用HelpLook建立一个企业网站

您是否正寻找一个能同时接入网站、小程序、App的内容管理系统?是否希望无需后端技能也能轻松接入,且无需搭建服务器?尤其是有出海需求的企业,希望搭建一个国内外访问速度都快而稳定的在线帮助中心? 企业对于在线内容管…

【neo4j】neo4j和Cypher 查询语言相关知识点

【neo4j】neo4j和Cypher 查询语言相关知识点 1.什么是neo4j Neo4j 是一个广泛使用的图形数据库管理系统(Graph Database Management System)。它是一种NoSQL数据库,专为存储和查询图形数据而设计。Neo4j 支持图形数据模型,允许用…

[论文笔记]MRRNET

这是一篇河大的论文 感觉跟SANET很像 摘要 摘要:随着物联网(IoT)的大规模部署,道路场景中实时感知和环境理解的需求变得越来越迫切。 同时,语义分割作为像素级场景解析得到了广泛的研究。 然而,资源有限…

异常中的常见方法

成员方法 getMessage package trycatch;public class TrycatchDemo {public static void main(String[] args) {int[] arr {1,2,3,4,5,6,7};try {System.out.println(arr[10]);} catch (ArrayIndexOutOfBoundsException e) {String message e.getMessage();System.out.print…

9.19工作笔记

怎么做多空对冲 脚本2怎么实现多空对冲的 首先读取factors和periods中的文件,然后read_coin得到结果strategy里面的cal_factor的作用是将所有的因子排名加权得到一个新的因子,这个就是多因子的做法。其中因子权重为factor_list里面的因子的最后一个元素…

数据处理与统计分析篇-day05-Pandas详解

创建DaraFrame对象 概述 DataFrame是一个表格型的结构化数据结构,它含有一组或多组有序的列(Series),每列可以是不同的值类型(数值、字符串、布尔值等)。 DataFrame是Pandas中的最基本的数据结构对象&…

CRM客户管理系统如何帮你做好客户分类

CRM客户管理系统通过一系列功能和策略帮助企业有效地进行客户分类,从而优化资源配置,提升客户满意度和忠诚度,进而推动业务增长。 以下是CRM系统如何帮助企业做好客户分类的详细阐述: 一、全面数据收集与整合 CRM系统能够全面收…

通过知识图谱自动生成和丰富加速医学知识发现 - 哈佛大学等

KGGPT Accelerating Medical Knowledge Discovery through Automated Knowledge Graph Generation and Enrichment 摘要 知识图谱(KGs)作为组织和表示结构化知识的强大工具,广受认可。尽管它们的实用性广泛被认可,但在自动化和完…

“码”上中秋 · 与 豆包 MarsCode 共赏家乡月

《水调歌头》(宋苏轼) (丙辰中秋,欢饮达旦。大醉,作此篇,兼怀子由) 明月几时有? 把酒问青天。 不知天上宫阙,今夕是何年。 我欲乘风归去,又恐琼楼玉宇,高处不胜寒。 起舞弄清影,何似在人间? 转…

VR全景摄影制作中的常见问题及解决方案

随着VR全景摄影技术的普及,越来越多的摄影师和企业开始尝试使用这种方式来展示产品、场景或服务。虽然VR全景摄影有着强大的视觉表现力和沉浸式体验,但在制作过程中也会遇到各种挑战。为了帮助大家更好地掌握VR全景摄影的制作技巧,今天给分享…

Hi3559A/C V100 集成了双核 A73 和双核 A53,支持 8K30/4K120 视频录制

1.1 概述 Hi3559AV100 是专业的 8K Ultra HD Mobile Camera SOC ,它提供了 8K30/4K120 广播级图像质量的数字视频录制,支持多路 Sensor 输入,支持 H.265 编码输出或影视 级的 RAW 数据输出,并集成高性能 ISP 处理&…

上架谷歌安卓APP完整图文流程

本节包含以下内容: 第一步:登录Google play开发者后台第二步:创建应用第三步:设置应用第四步:开启通知第五步:发布应用第六步:查看审核结果第七步:配置app支付参数第八步&#xff1…

windows环境安装Elasticsearch和图形化界面head插件

废话少说ES相关的用法可以参考文档:https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html 注意:elasticsearch是使用java开发的,且本版本的ES需要的jdk版本要是1.8以上,所以安装elasticsearch之前保证jdk1.8以…

换个手机IP地址是不是不一样?

在当今这个信息爆炸的时代,手机已经成为我们生活中不可或缺的一部分。而IP地址,作为手机连接网络的桥梁,也时常引起我们的关注。你是否曾经好奇,换个手机,IP地址会不会也跟着变呢?本文将深入探讨这个问题&a…

关于实时数仓的几点技术分享

一、实时数仓建设背景 业务需求的变化:随着互联网和移动互联网的快速发展,企业的业务需求变得越来越复杂和多样化,对数据处理的速度和质量要求也越来越高。传统的T1数据处理模式已经无法满足企业的需求,实时数据处理成为了一种必…

【Python爬虫】学习Python必学爬虫,这篇文章带您了解Python爬虫,Python爬虫详解!!!

Python爬虫详解 Python爬虫是一种用于从网站获取数据的自动化脚本。它使用Python编程语言编写,并利用各种库和模块来实现其功能。以下是Python爬虫的详细讲解,包括基本概念、常用库、基本流程和示例代码。 基本概念 HTTP请求:爬虫通过向目…

9-----MTK专用工具 MTKpro解锁 读取分区 备份nv 檫除nv 工具预览与步骤解析

以上工具包含原版与汉化版工具。根据上面图示 可以看到此工具可以刷写mtk机型,包含有刷机的各个加载选项以及刷写方式。其中动画界面演示了无需加载任何引导。联机就可以读取到当前机型分区的演示。 工具功能选项 ★★★★★不需要任何引导直接读取mtk分区 备份 檫除 写入分…

【深度学习】(3)--损失函数

文章目录 损失函数一、L1Loss损失函数1. 定义2. 优缺点3. 应用 二、NLLLoss损失函数1. 定义与原理2. 优点与注意3. 应用 三、MSELoss损失函数1. 定义与原理2. 优点与注意3. 应用 四、BCELoss损失函数1. 定义与原理2. 优点与注意3. 应用 五、CrossEntropyLoss损失函数1. 定义与原…

在Python中快速获取HTML中<span>标签的内容

在Python中&#xff0c;要获取HTML中<span>标签的内容&#xff0c;通常我们会使用像BeautifulSoup这样的库&#xff0c;它提供了方便的方法来解析HTML和XML文件&#xff0c;并从中提取数据。下面是一个使用BeautifulSoup来获取<span>标签内容的简单示例。 首先&am…