腾讯为什么支持开源?

今天看到一条新闻,感觉腾讯在 AI 大模型方面确实挺厉害的,符合它低调务实的风格,在不知不觉中一天竟然开源了两个核心的,重要的 AI 大模型。

据新闻报道,11月 5 日,腾讯混元宣布最新的 MoE 模型“混元 Large” 以及混元 3D 生成大模型正式开源。同时,腾讯云TI平台和高性能应用服务 HAI 也于宣布开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。

简单介绍一下这两个大模型。

cbdad4f2cf9a2eebb3e8c7552758d8a0.png

腾讯混元 Large 模型是基于 MoE 模型结构的,熟悉 AI 技术的同学应该知道,MoE(Mixture of Experts),即混合专家模型,是目前国内外主流的大模型结构,MoE 模型的每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型。

这次腾讯混元 Large 模型总参数量 389B,激活参数量 52B ,上下文长度达 256 k,是当前业界参数规模最大、效果最好的开源 MoE模型,同时通过技术的优化,也更适配开源框架的精调和部署,具有较强的实用性。

公开的测评结果显示,腾讯混元Large在CMMLU、MMLU、CEval、AGIEval等多学科综合评测集、中英文NLP任务、代码和数学等9大维度全面领先,超过Llama3.1、Mixtral等国外一流的开源大模型。

2ef6c25a10cd4672738502968ee44e1d.png

而混元 3D 生成大模型是首个同时支持文字、图像生成 3D 的开源大模型。据说,这个模型具有强大泛化能力和可控性,可重建各类尺度物体,大到建筑,小到工具花草。

经过定性、定量多个维度的评估,腾讯混元3D生成大模型在生成质量上全面超过了 SOTA 开源模型。并在保证高质量、多样化生成的条件下,推理性能也达到了业界领先水平,显著减少了 3D 资产生产的耗时。

120ee3b2c178915a43342faf457cbaf2.png

说白了,有了这个开源大模型,以后大家做 3D 模型会非常的方便。

看到腾讯拥抱开源,一天开放 2 大核心模型,让我又想起了 AI 开源与闭源之争,今年上半年,关于 AI 大模型开源好,还是闭源好,在网上激烈的讨论。

其实,我是坚定的开源拥护者,原因很简单,我感觉有 3 点。

1、 降低了开发门槛

对于 AI 大模型来讲,门槛挺高的,一般的企业是没有能力开发的,如果使用闭源的就必须交钱,而且闭源的大模型无法自由修改和扩展,限制了创新的可能性。同时因为闭源,也缺乏透明度。

如果有像腾讯这样的大企业在开源大模型上下力,许多小型企业和初创公司可以利用腾讯提供的开源资源,快速构建自己的 AI 应用,而无需从零开始开发。比如,在教育领域,可以让许多教育机构利用腾讯的开源模型,开发出智能教育工具,提供个性化的学习体验。再比如,腾讯混元开源的文生 3D 大模型,也可以让很多中小型企业针对自己的业务去开发 3D 模型。

所以,开源大模型降低了企业和开发者进入 AI 领域的门槛。

2、 降低了开发和运行成本

开源技术通常是免费的,企业可以减少在模型开发上的资金投入。而且开发一个大规模的 AI 模型需要大量的计算资源、数据集和技术积累,这些对于大多数企业来说都是巨大的成本开支。就以腾讯的混元 Large 和混元 3D 生成模型,已经在这些方面进行了大量的投入和优化。企业可以直接使用这些开源模型,而不需要从头开始研发。

另外,我们也知道通用大模型因为其通用性,所以,涉及的东西太多,在算力和电力上,耗费也巨大,开源模型,我们可以针对自己的业务进行裁剪和修改,对于运行成本来讲也很节省。

3、 有助于生态的繁荣与创新

就以这次腾讯的开源为例,腾讯的开源大模型混元 Large 和混元 3D 生成模型,通过提供先进的技术和架构,可以推动了整个行业的技术进步。开源使得其他研究人员和开发者可以基于腾讯的模型进行二次开发,探索新的应用场景。比如,混元 Large 模型在自然语言处理中的卓越表现,促使各类企业和研究机构能够更好地解决实际问题,如自动化客服和智能写作等。

而且,腾讯的开源大模型不仅限于某一领域,其多模态能力使其在多个行业中得以应用。比如,混元文生 3D 模型可用于游戏开发、建筑设计、虚拟现实等领域。在游戏开发中,开发者可以快速生成高质量的 3D 资产,当大家都在上面使用的时候,可以玩出更多花样。目前,腾讯地图利用混元 3D 模型推出了自定义 3D 导航车标功能,支持用户创作个性化的 3D 导航车标。腾讯元宝 APP 上线了“3D 角色梦工厂”,支持个性化的 UGC 3D 人物生成。

e43087c74569a275d099bf47088997f7.png

开源有利于生态的繁荣与创新。

再来说说我认为腾讯为什么坚持走开源路线。腾讯是一家以产品起家的数字企业,用户为本、构建生态是腾讯一贯坚持并且擅长做的事情。我们看微信生态,腾讯擅长的是搭建“基础设施”、降低使用门槛,小程序、公众号和视频号都是很好的例子,里面活跃着一大批中小开发者和内容创作者。

很显然,对于大企业来说,闭源可以保护企业核心的商业机密,开源对于企业早期的商业化并不有利。不过相比这些,腾讯更看重的是开放,把生态做好、把蛋糕做大。通过开源,腾讯也希望促进知识共享,吸引更多的用户和合作伙伴。

现在的AI虽然很火热,但还并没有真正实现技术普惠,那腾讯这样的大企业通过开源模型去帮助中小企业和开发者就是一个很好的实践。

另外,开源模型我认为反倒是企业技术创新自信的表现。正因为相信自己的技术能够持续改进并保持领先,所以愿意将其开源供他人使用和学习。我一直认为,开源不仅仅是技术上的选择,更是一种开放创新文化的体现,腾讯是很好践行开放创新的一家企业。

所以,真希望,国内大厂能够像腾讯一样,多为开源做贡献,在支持自身发展的同时,也多为 AI 行业的生态做贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/7332.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

学习了,踩到一个坑!

前言 踩坑了啊,最近踩了一个 lombok 的坑,有点意思,给你分享一波。 我之前写过一个公共的服务接口,这个接口已经有好几个系统对接并稳定运行了很长一段时间了,长到这个接口都已经交接给别的同事一年多了。 因为是基…

『Django』APIView基于类的用法

点赞 关注 收藏 学会了 本文简介 上一篇文章介绍了如何使用APIView创建各种请求方法,介绍的是通过函数的方式写接口。 本文要介绍 Django 提供的基于类(Class)来实现的 APIView 用法,代码写起来更简单。 APIView基于类的基…

CentOS系统查看CPU、内存、操作系统等信息

Linux系统提供了一系列命令可以用来查看系统硬件信息,如CPU的物理个数、核数、逻辑CPU数量、内存信息和操作系统版本。 查看物理CPU、核数和逻辑CPU 在多核、多线程的系统中,了解物理CPU个数、每个物理CPU的核数和逻辑CPU个数至关重要。超线程技术进一步…

DNS配置

1.搭建dns服务器能够对自定义的正向或者反向域完成数据解析查询。 2.配置从DNS服务器,对主dns服务器进行数据备份。 options {listen-on port 53 { 192.168.111.130; };directory "/var/named";allow-query { any;};zone "openlab.com&qu…

【WebRTC】WebRTC的简单使用

目录 1.下载2.官网上的使用3.本地的使用 参考: 【webRTC】一、windows编译webrtc Windows下WebRTC编译 1.下载 下载时需要注意更新python的版本和网络连接,可以先试试ping google。比较关键的步骤是 cd webrtc-checkout set https_proxy127.0.0.1:123…

使用axois自定义基础路径,自动拼接前端服务器地址怎么办

请求路径: http://localhost:5173/http://pcapi-xiaotuxian-front-devtest.itheima.net/home/category/head 很明显多拼接了路径地址 查看基础路径文件发现: //axios基础封装 import axios from axiosconst httpInstance axios.create({baseURL: /h…

第J5周:DenseNet+SE-Net实战

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 任务: ●1. 在DenseNet系列算法中插入SE-Net通道注意力机制,并完成猴痘病识别 ●2. 改进思路是否可以迁移到其他地方呢 ●3. 测试集acc…

力扣最热一百题——杨辉三角

目录 题目链接:118. 杨辉三角 - 力扣(LeetCode) 题目描述 示例 提示: 解法一:利用特性构建杨辉三角 1. 结果存储结构: 2. 初始化和循环遍历每一层: 3. 构建每一层: 4. 填充中间的元素&…

道品科技智慧农业中的自动气象检测站

随着科技的进步,智慧农业已经成为现代农业发展的重要方向。农业自动气象检测站作为智慧农业的一个关键组成部分,发挥着不可或缺的作用。本文将从工作原理、功能特点、应用场景以及主要作用等方面对农业自动气象检测站进行深入探讨。 ## 一、工作原理 农…

Android——多线程、线程通信、handler机制

Android——多线程、线程通信、handler机制 模拟网络请求&#xff0c;会阻塞主线程 private String getStringForNet() {StringBuilder stringBuilder new StringBuilder();for (int i 0; i < 100; i) {stringBuilder.append("字符串" i);}try {Thread.sleep(…

练习LabVIEW第三十三题

学习目标&#xff1a; 刚学了LabVIEW&#xff0c;在网上找了些题&#xff0c;练习一下LabVIEW&#xff0c;有不对不好不足的地方欢迎指正&#xff01; 第三十三题&#xff1a; 用labview编写一个判断素数的程序 开始编写&#xff1a; LabVIEW判断素数&#xff0c;首先要搞…

我要精通前端-布局方式理解总结

一、浮动 1、传统网页布局的三种方式 ​CSS 提供了三种传统布局方式(简单说,就是盒子如何进行排列顺序)&#xff1a; 1.普通流&#xff08;标准流&#xff09; 2.浮动 3.定位 这三种布局方式都是用来摆放盒子的&#xff0c;盒子摆放到合适位置&#xff0c;布局自然就完成了…

C-DTL698电表 转 IEC61850 协议项目案例

目录 1 案例说明 2 VFBOX网关工作原理 3 准备工作 4 配置VFBOX网关 5 用IEC61850协议转发数据 6 网关使用多个逻辑设备和逻辑节点的方法 7 其他说明 8 案例总结 1 案例说明 设置网关采集DLT698电表数据数据把采集的数据转成IEC61850协议转发给其他系统。 2 VFBOX网关…

斗破QT编程入门系列之二:GUI应用程序设计基础:UI文件(四星斗师)

斗破Qt目录&#xff1a; 斗破Qt编程入门系列之前言&#xff1a;认识Qt&#xff1a;Qt的获取与安装&#xff08;四星斗师&#xff09; 斗破QT编程入门系列之一&#xff1a;认识Qt&#xff1a;初步使用&#xff08;四星斗师&#xff09; 斗破QT编程入门系列之二&#xff1a;认识…

机器学习4_支持向量机_核函数——MOOC

核函数的定义 引入了映射 后 最小化&#xff1a; 或 限制条件&#xff1a; &#xff08;1&#xff09; &#xff08;2&#xff09; 具体研究 引入 核函数&#xff08;Kernel Function&#xff09; Vladimir Naumovich Vapnik 指出&#xff0c;可以不用知道 的具体…

论文《基于卷积神经网络的手术机器人控制系统设计》文献阅读分析报告

论文报告&#xff1a;基于卷积神经网络的手术机器人控制系统设计 摘要 本研究针对传统手术机器人控制系统精准度不足的问题&#xff0c;提出了一种基于卷积神经网络的手术机器人控制系统设计。研究设计了控制系统的总体结构&#xff0c;并选用PCI插槽上直接内插CAN适配卡作为上…

房地产行业知识库管理系统的应用与未来展望

在日新月异的房地房地产行业知识库管理系统的应用与未来展望产房地产行业知识库管理系统的应用与未来展望市场中&#xff0c;企业正面临着前所未有的竞争压力&#xff0c;而客户需求的变化更是日新月异。为了在这场激烈的竞争中脱颖而出&#xff0c;房地产企业必须高效地管理、…

MySQL核心业务大表归档过程

记录一下2年前的MySQL大表的归档&#xff0c;当时刚到公司&#xff0c;发现MySQL的业务核心库&#xff0c;超过亿条的有7张表&#xff0c;最大的表有9亿多条&#xff0c;有37张表超过5百万条&#xff0c;部分表行数如下&#xff1a; 在测试的MySQL环境 &#xff1a; pt-archiv…

每日OJ题_牛客_春游_贪心+数学_C++_Java

目录 牛客_春游_贪心数学 题目解析 C代码 Java代码 牛客_春游_贪心数学 春游 描述&#xff1a; 盼望着&#xff0c;盼望着&#xff0c;东风来了&#xff0c;春天脚步近了。 值此大好春光&#xff0c;老师组织了同学们出去划船&#xff0c;划船项目收费如下&#xff1a;…

黔院长:传承中医智慧,开启慢病快调新时代

在当今社会&#xff0c;慢性病如影随形地困扰着许多人&#xff0c;成为影响人们生活质量的重要因素。然而&#xff0c;有着悠久历史传承的黔院长&#xff0c;作为中医世家&#xff0c;源于 1760 年&#xff0c;正以其独特的魅力和非遗项目&#xff0c;为慢病快调带来新的希望。…