AI大模型日报#0923:李飞飞创业之后首个专访、华为云+腾讯音乐发布昇腾适配方案

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:近日,AI大模型领域迎来多项重要进展。华为云与腾讯音乐天琴实验室达成深度合作,共同推出基于昇腾AI的视觉大模型推理加速方案,显著提升了推理速度与性价比,为大模型部署提供了高效经济的解决方案。美图公司则宣布其美图奇想大模型视频生成能力全面升级,生成效率与模型性能均实现进阶,优化了多领域风格泛化力。同时,李飞飞教授的空间智能创业公司World Labs正式亮相,她强调了空间智能在AI领域的重要性,并探讨了AI的终极目标。 此外,上海AI Lab推出新一代视频生成大模型“书生・筑梦2.0”,支持长视频多格式生成及2K分辨率增强,并开源了训练框架LiteGen。在AI大模型的数学推理能力评测方面,北大与阿里巴巴联合打造的Omni-MATH评测基准显示,o1-mini模型表现最佳,验证了关注少部分能力、放弃广泛世界知识路线的优势。 随着基础模型时代的来临,移动机器人的智能化也取得突破。研究者们期待将基础模型应用于移动机器人,提升其场景感知和任务执行能力,有望在未来展现更强的自主性和灵活性。这些进展共同推动了AI大模型领域的发展,为各行业数智化升级提供了有力支持。

标题: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI


摘要: 9月19-21日,华为全联接大会在上海举办。腾讯音乐娱乐集团天琴实验室与华为云昇腾AI云服务合作,发布了视觉大模型推理加速方案lyraSD的昇腾适配方案。该方案采用多项优化策略,相比传统方案推理速度提升166%,性价比提升35%,降低了大模型部署门槛,提供了高效、经济的AI算力应用解决方案。此外,天琴实验室MUSELight将在昇腾AI算力的加速下,展开歌单封面生成业务试点,推进音乐制作产业数智化升级。双方还将推出更多大模型推理加速解决方案,全面赋能各项业务形态。
网址: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI | 机器之心
 
标题: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶


摘要: 9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力全面升级,结合多项自研技术优势,显著提升视频生成时长、画质等。该模型支持长视频生成,并在艺术风格、细节把控上达到高度平衡,优化多领域风格泛化力。升级后的模型采用新技术路线,解决了视频生成核心问题,已应用于美图旗下部分产品,将提升用户体验与效率,并深化在多个领域的应用实践。
网址: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶 | 机器之心
 
标题: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本


摘要: 李飞飞教授的空间智能创业公司World Labs及其全明星团队正式亮相,随后她与联合创始人Justin Johnson接受了a16z的专访。在访谈中,李飞飞重点介绍了AI领域的新研究前沿——空间智能,认为其与语言一样根本。她回顾了自己在AI领域20多年的经历,以及ImageNet对计算机视觉发展的贡献,强调了计算和数据在AI发展中的重要作用。同时,她定义了AI的终极目标,并探讨了空间智能在其中所扮演的角色。最后,她介绍了World Labs团队及度量空间智能发展进展的方式。访谈还涉及了AI的发展历程、生成式AI与预测建模的区别等话题。
网址: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本 | 机器之心
 
标题: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
摘要: 机器之心AIxiv专栏促进了全球学术交流,现推出上海人工智能实验室的新一代视频生成大模型“书生・筑梦2.0”,支持长视频、多格式生成和2K分辨率增强。该模型采用扩散式Transformer架构,并开源训练框架LiteGen,优化显存和序列长度,提升视频生成效率。团队由上海人工智能实验室和新加坡南洋理工大学S-Lab成员组成,致力于视频生成技术的前沿研究,包括VBench、VideoBooth等多个项目进展。
网址: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了 | 机器之心
 
标题: 北大AI奥数评测,o1-mini比o1-preview分数还高
 


摘要: 北大与阿里巴巴的研究团队联合打造了一个数学奥林匹克评测基准——Omni-MATH,用于评估大型语言模型在奥林匹克水平的数学推理能力。该评测集包含4428道竞赛级别的问题,涵盖33个子领域和10个难度级别。在最新排行榜中,o1-mini表现最佳,平均分比o1-preview高8%,验证了关注少部分能力、放弃广泛世界知识路线的优势。此外,Omni-MATH具有人工验证答案的可靠性、清晰合理的难度分类和广泛的题目类型等特点。研究团队对国内外奥林匹克数学竞赛进行了调研,构建了树状分类体系,并利用GPT-4o给每道题目分类。同时,还开发了一个开源的答案验证器Omni-Judge,用于验证模型的输出是否和标准答案一致,评测一致率高达95%。
网址: 北大AI奥数评测,o1-mini比o1-preview分数还高 | 量子位
 
标题: 秋分 | 基础模型时代下的移动机器人
摘要: 1966年,斯坦福大学SRI研究所开发的Shakey是第一个具备感知、规划和执行能力的自主移动机器人,但受限于当时的技术和计算能力,其应用有限。随着硬件、计算和算法的发展,移动机器人已走向实际应用。研究者期待将基础模型应用于移动机器人,提升场景感知和任务执行能力。一种稳健的研究思路是扩展基于地图的技术路线,利用先进传感器和SLAM算法构建高质量地图,结合基础模型进行场景理解和任务执行。同时,探索将信息与大语言模型结合,处理更复杂指令任务。另一种新颖做法是端到端移动机器人算法,直接通过大模型处理传感器数据并执行动作,避免繁琐规则设计,但面临数据挑战。尽管存在诸多问题,基础模型的结合仍为移动机器人带来智能化突破,有望在未来展现更强自主性和灵活性。
网址: 秋分 | 基础模型时代下的移动机器人 - 智源社区
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1543635.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

计算机毕业设计 | SSM 凌云招聘平台 求职问答审批系统(附源码)

1,绪论 人力资源是企业产生效益、创造利润的必不可少的、最重要的资源。人作为人力资源的个体可看作是一个承载着有效知识、能力的信息单元。这样的信息单元可看作是一个为企业产生价值和利润的个体。从而使得这样的信息单元所具有的信息就是一个有价值的信息。 校…

【Java】JVM基本组成

一、JDK、JRE、JVM JDK:全称 “Java Development Kit” Java 开发工具包,提供 javac编译器、jheap、jconsole 等监控工具; JRE:全称 “Java Runtime Environment” Java 运行环境,提供 class Library 核心类库JVM; …

java项目之基于springboot的医院资源管理系统源码

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的医院资源管理系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 💕💕作者:风…

JavaEE: 深入探索TCP网络编程的奇妙世界(六)

文章目录 TCP核心机制TCP核心机制九: 面向字节流TCP核心机制十: 异常处理 小小的补充(URG 和 PSH)~TCP小结TCP/UDP 对比用UDP实现可靠传输(经典面试题) 结尾 TCP核心机制 上一篇文章JavaEE: 深入探索TCP网络编程的奇妙世界(五) 书接上文~ TCP核心机制九: 面向字节流 TCP是面…

GUI编程之MATLAB入门详解(01)

⛄前言 图形用户界面的设计是MATLAB的核心应用之一。当用户与计算机之间或用户与计算机程序之间进行交互操作时,舒服高效的用户接口功能则会对用户产生极大的吸引力。图形用户界面(GUI)则通过窗口、图标、按钮、菜单、文本等图形对象构成用户…

瑞璟湾居安居房附近的工地免费停车位探寻

从前海卓越骑行30分钟就可以达到瑞璟湾居安居房,顺着前海的繁华沿途过来就越发觉得瑞璟湾居的地段真的是王炸哈。虽然安居房均价45745.43元/平方米,但是对比附近商品房和宝安现代化的城市规划,感觉这个楼盘应该可以快速去化。虽然我也是安居房…

如何使用cmd命令查看本机电脑的主机名?

1、按键盘win R 键,输入cmd,然后按一下【回车】 2、输入ping -a localhost , 然后按下【回车】 3、如下Ping 后面的DESKTOP-ALB9JF7即是本机电脑的【主机名】

面向对象程序设计——mapの简析

1.map的定义 Key就是map底层关键字的类型,T是map底层value的类型,set默认要求Key⽀持⼩于⽐较,如果不⽀持或者需要的话可以⾃⾏实现仿函数传给第⼆个模版参数,map底层存储数据的 内存是从空间配置器申请的。⼀般情况下&#xff0c…

OpenBayes 教程上新|让虚拟偶像活起来!LivePortrait 实现超逼真表情迁移

过去,使用单一图像生成动态视频效果需要复杂的动画技术和大量的手工操作。特别是在控制眼睛和嘴唇等细节上,耗时且难以实现逼真的同步效果。 LivePortrait 在最新版本中通过精确的画像编辑和视频编辑等功能,极大地简化了这一过程。创作者可以…

调度_命令行_环境变量

linux的进程调度算法 饥饿问题 新建进程/时间片结束进程,若放回active,很可能该进程优先级太高,下一个还是执行该进程,导致不断执行同一进程,各进程调度不均衡。 饥饿问题解决 新建进程不能到active,要到…

论文大杀器!分享4款ai论文写作工具软件

在当今学术研究和论文写作领域,AI技术的应用已经变得越来越普遍。这些工具不仅能够提高写作效率,还能帮助研究人员生成高质量的论文内容。本文将重点介绍四款优秀的AI论文写作工具,并特别推荐千笔-AIPassPaper。 一、千笔-AIPassPaper 传送门…

RTR_Chapter_6 上

第六章 纹理 表面纹理(texture)是指其外观和给人的视觉感受,就像是一幅油画的图案一样。而在计算机图形学中,纹理化则指的是一个过程,即通过使用一些图像、函数或者其他数据,来对每个表面位置的外观表现进行…

看Threejs好玩示例,学习创新与技术(React-three-fiber)

什么,竟有人把ThreeJS和React绑定在一起,混着用? 1、VUE劫持问题 暂先把今天的问题先放一边,先简单回顾下vue劫持的情况。vue会把data里面的数据自动转换为属性,方便界面与数据交互。这本身是没有任何问题&#xff0…

内网穿透(当使用支付宝沙箱的时候需要内网穿透进行回调)

内网穿透 一、为什么要使用内网穿透: 内网穿透也称内网映射,简单来说就是让外网可以访问你的内网:把自己的内网(主机)当做服务器,让外网访问 二、安装路由侠 路由侠-局域网变公网 (luyouxia.com) 安装成功如下: 三…

全栈开发(一):springBoot3+mysql初始化

1.开发环境准备 1.开发工具 2.jdk下载 官网下载java17 3.java环境变量配置 用户变量: ①.JAVA_HOME ②.path 4.mysql下载 b站随便搜 5.新建项目 6.maven配置 可以下载zip放到目录里 这里是配置好的 repository文件夹:为maven提供下载的文件存放…

Face++API调用

人脸检测API调用 import requests import json #将自己的KEY和Secret进行替换 API_KEYyour_API_KET API_SECRETyour_API_Secret# 人脸识别的URL URL https://api-cn.faceplusplus.com/facepp/v3/detect# 请求参数,需要什么参数传入什么参数 data {"api_key":API…

【LVIO-SLAM】SVD分解,最小二乘与EKF

【LVIO-SLAM】SVD分解与应用推导 1.1 线性最小而二乘1.2 SVD分解算法流程问题描述算法流程算法复杂度总结 1.3 非线性最小二乘1.4 EKF融合 KF/ EKF推导过程 1.1 线性最小而二乘 针对A是任意矩阵的话使用SVD分解求解,其中U是AA转置的特征值,V是AA转置A的特…

Python3 爬虫教程 - Web 网页基础

Web网页基础 1,网页的组成HTMLcssJavaScript2,网页的结构 3,节点树及节点间的关系4,选择器开头代表选择 id,其后紧跟 id 的名称。如:div 节点的 id 为 container,那么就可以表示为 #container 1…

828华为云征文 | 云服务器Flexus X实例,Docker集成搭建Jenkins CI/CD平台

828华为云征文 | 云服务器Flexus X实例,Docker集成搭建Jenkins CI/CD平台 Jenkins 是一个开源的自动化服务器,用于持续集成(CI)和持续交付(CD)软件项目。它允许开发人员在软件开发过程中自动化各种任务&…

进阶SpringBoot之集合 Redis

&#xff08;在跑 Redis 测试之前&#xff0c;需要先安装 Redis&#xff0c;并开启 Redis 服务&#xff09; Spring Boot 项目添加依赖 NoSQL -> Spring Data Redis pom.xml 文件如下 <dependencies><dependency><groupId>org.springframework.boot<…