在这里游玩和创造,见证实时互动和 AI 的融合爆发丨年末场 RTE Open Day@RTE2024 回顾

在这里插入图片描述

RTE2024 第十届实时互联网大会上周末在北京圆满结束了,不知道大家体验交流得如何?可能是因为本来入秋的北京悄然升温,又或者是那两天的观众都很热情,25-26 号的活动现场特别像是一场夏天的聚会。

RTE Open Day 马不停蹄来到了第五期,今年已经有三四十个“实时互动+”的项目依次亮相,在 Open Day 展区被更多感兴趣的朋友所了解。这次依然为大家提供了众多好玩的体验,以及围绕“实时互动+AI”的观点讨论。

而每次活动结束我们都会迎来一批新的 RTE builders 加入社区,队伍越来越活跃壮大!这一次还要额外欢迎一批毛孩子们!
在这里插入图片描述

👓 在 RTE Open Day 玩起来

让观众能够身临其境地触摸、聆听、交互实时互动前沿技术,与产品背后风采各异的开发者和创业者一对一交流,是 RTE Open Day 的唯一宗旨。
在这里插入图片描述

这次 Open Day 开发者市集,除了社区自己的展位,还有 17 家 RTE 开发者社区成员和超音速计划项目参与,在酒店 L 型的回廊里一直延伸到尽头。门楣围绕着一圈酷炫的灯牌。

在这里插入图片描述

以及,虽然活动日期刚好错开了“1024”程序员节,但是终点有一枚特制的闪闪发光程序猿灯牌为开发者亮起。

在这里插入图片描述

从社区成长起来的 TEN Framework 开源框架已经不是第一次在 Open Day 亮相了。过去短短的一个月时间内, 这个实时多模态 AI Agent 框架快速接入了 OpenAI Realtime API,并且做了几个新的 use case 供开发者体验:语音剧本杀“西部世界”,电脑系统级 AI 语音助手“除你武器”,主播与 AI 直播共唱“Swan&frog”。

在这里插入图片描述

超次元旗下的**超梦 AI,**是一个集真人拍摄、AIGC 拟真、AIGC 二次元等多型态自定义角色和多模态场景交互建立起来的 AI 陪伴社区,以满足用户多样化情感陪伴。现场观众可以在小程序端体验,而他们对超梦 AI 的商业化也非常感兴趣。

在这里插入图片描述

开物量子开发者社区 是一个开放技术社区,聚焦量子计算交流与学习、量子 AI 算法探索与开发、量子计算真机研究与使用。在现场可以体验到“N 皇后闯关”之类可代表量子 AI 算法探索的经典案例。开物量子社区也欢迎更多的算法工程师关注、参与~

在这里插入图片描述

作为超音速计划的一员,Gotin 一直在结合 RTE 的领域探索新应用落地的方向。他们专注于虚拟空间及体验综合服务平台,打造未来虚拟交互的新方式,比如车企的线上车主俱乐部,银行的线上营业厅等等。这次在展位也可以体验到 Gotin 为保时捷定制的“旅行猪猪”交互,可以给粉红猪猪投喂食物,让它环游世界并带着明信片回来。

在这里插入图片描述

XSwitch 是社区主理人之一杜金房老师的项目。XSwitch 致力于连接一切音视频、AI设备和服务,可以实现话机外呼、视频会议、AI助手交互等等功能。在现场,你真的可以给 OpenAI 打电话。

在这里插入图片描述

《言灵计划:中二嘴炮大作战》 是一款由 AI 驱动的演出派对游戏。玩家可以通过 AI 生成自己的言灵,而在对战环节玩家输入的文本或者语音指令会转化为相应的动作。

在这里插入图片描述

为品牌打造互动体验的壹墨互动 Emerge 每次都会展开一个三折屏,通过 iPad 面板与之互动响应,为观众展示不同的客户案例,非常吸引目光。Emerge 也经常带来一些 geek 的小玩意儿。这次是一个拥有屏幕和传感器的赛博骰子“EM-DICE”。在生活中面临多种抉择时,“摇一摇”让它来决定。玩过之后好想拥有。

在这里插入图片描述

**萤火空间,**专注于混合现实(MR)企业级软硬件产品的研发以及开发。用社区朋友费费的话来说就是,“100度 FOV 的 OST 自研一体机方案,20 个人做的软硬件,太太太硬核了!!!”

在这里插入图片描述

ViiTor AI 提供视频翻译、音色克隆、AI虚拟形象视频、语音合成、音色库等产品服务,以及 19 种语言的实时翻译功能。用 ViiTor AI 和 ViiTor 实时翻译这两款 App 就可以实际体验。观众在现场也详细询问了关于产品支持 API 的功能及实现程度、效果准确度、产品的技术架构或底层逻辑等细节问题。

在这里插入图片描述

《PixelHack》 是一款 XR 射击游戏,通过 RTE 实现多人实时在线作战,玩家们可以在同一地方实时看到其他玩家的位置动作,通过语音互相沟通。很多现场观众试玩之后都非常喜欢游戏里复古像素和 3D 的结合效果,确实想起了小时候玩游戏的回忆。

在这里插入图片描述

Fish Speech 是 Fish Audio 团队自主研发的语音合成大模型。这也是一个开源项目,允许用户通过 15 秒的参考音频快速克隆出音色、语调、韵律、情感。有助于开发一些视频创作、有声书、AI 教育等场景下的应用。现场演示了不同的 TTS 音色,而观众对于开源项目总是更关心开源进展和后续计划。

在这里插入图片描述

实时编程工具 MicroBlocks 带来了 XGO 的桌面机器人,让大家感受积木编程即刻实时驱动机器人。现场是蓝牙传输,接上 RTC 就能远程控制,想象空间就更大了。这个在现场激发了一些感兴趣的观众,也想要自己买个桌面机器人来做一些好玩的应用场景。

在这里插入图片描述

尽管 Open Day 有时候会邀请老朋友,但我们绝对保证每一次的体验都是不一样的。上一次亮相 Open Day 的 蚁触科技 这次装备了全新升级的触感沙发,在赛车、演唱会、电影等一系列场景中的体验会更细腻丰富。还有新增的冥想场景,是以触觉作为特别的导师,引导现场体验者进入心流状态,即使在会场的环境里,也容易心静下来(甚至差点睡着了)。

在这里插入图片描述

专注于混合现实(MR)技术开发的 扶光工作室 这次带来了《气与魔法》多人对战游戏。玩家需要手持一根魔法棒对轰,击中对面对手的盾牌,被路过的现场观众强势围观。扶光的朋友们还贴心地为玩家保留了在这条走廊闪转腾挪的影像。

在这里插入图片描述

作为本次 Open Day 展区的唯一一家大模型厂商,面壁小钢炮 这次主要展示了 2 款轻量端侧模型。现场观众可以通过已本地部署模型的 iPad 与它们进行对话交互,尤其是借助摄像头感受实时视频理解能力。

在这里插入图片描述

声湃 x 罗德麦克风 联合展位既摆出了罗德的专业音频设备,也给大家带来了声湃的语音克隆 demo。现场直接售出了几台罗德展品,好的输入设备也能帮助提升这些围绕音视频交互的产品体验,尤其是在较为嘈杂的环境中。

在这里插入图片描述

inSpaze 是一款专为 Apple Vision Pro 设计的社交应用,戴上 Apple Vision Pro 除了能与其他线上朋友社交互动,还可以在自己的“房间”听歌、玩游戏、360 度欣赏模型等等。只要你不是近视眼,相信你的感觉一定很棒。社区小伙伴体验完之后也大呼心动,甚至开始憧憬社区将来的 Meetup 也能在 inSpaze 上举办。

在这里插入图片描述

本次 RTE 年度场景 Showcase 的重点生态合作与社区伙伴伯克利天台基金、五源资本、Rokid、inSpaze、真成投资、大创智、AWS 云创、 Founder Park、HuggingFace、LlamaIndex 等等也专程在 showcase 路演前后,在 RTE Open Day 展区打卡体验。

在这里插入图片描述

为了让不在现场的朋友也能感受一下氛围,这次 Open Day 特别安排了展区 live tour 直播,并且随机对一些展商进行了采访。

在这里插入图片描述

而超音速吉祥物、社区大明星 小音符獭獭 这次装备升级,戴上了专属的 RTE 口水巾。我们的獭獭周边越来越多,以后 RTE 开发者社区,还请认准獭獭帽子!

图片

线下游园环节,夸夸贴纸上次备受好评,以后也会成为我们的保留项目。喜欢哪个项目,就要把自己的夸赞传达出去!

在这里插入图片描述

同时这次 RTE Open Day 还推出线上线下联动,进行网站评论抽奖,希望将展商项目跟现场观众的连接延续到线上。

在这里插入图片描述

“这也太酷了”“体验非常丝滑”“产品快点正式上线”,现场观众留下这样的反馈,进入产品的用户社群,或者是与展商沟通业务合作。2 天 Open Day 展商市集结束,虽然大家身体很疲惫,但是收获颇丰!

最终结合我们的线下夸夸贴纸数量,和线上网站的留言与点赞数,PixelHack 获得了我们本次最受欢迎的展商大奖,“你就是 RTE 行业的未来!”

🎙️ 围观《编码人声》的线下开放麦

面向开发者,聊聊技术和人生,由 RTE 开发者社区出品的《编码人声》已经走到第四年,屡次获得苹果播客首页推荐和年度科技播客提名,单期收听量 10 万+。

这一次我们把录制现场放到了 RTE 大会线下。四场嘉宾和话题的轮番上阵,听众或专程或意外的加入,这一切都组成了一场技术思辨的流动的盛宴。

四场录制覆盖话题:AI 写作和 AI 播客、Computer Use 和 Action Agent、空间计算和物理计算和 RTE 场景年度大盘点。也欢迎关注《编码人声》播客订阅接下去的更新。

在这里插入图片描述

🤝 来 Dev Party 认识新朋友

Dev Party@RTE Open Day 是我们为社区开发者准备的固定的环节,在第一天的灵感和技术交流后,总需要换一个轻松氛围认识新朋友、分享新想法。

在这里插入图片描述

开场的是社区发起人 Cynthia 和主理人杜金房、Richard林旅强,而近期加入 RTE 开发者社区的主理人卢恒老师最后也赶到现场,第一次全部线下集合啦!

在这里插入图片描述

Dev Party 通常没有什么特定的主题,吃饱喝足之后最重要的就是 lightning demo 环节,鼓励开发者 即兴、快闪式地聊聊 自己最近的项目或者想法,只有 3 分钟,不需要 PPT。阶跃星辰、弥知科技 AR 平台、WasmEdge、TEN Framework、言灵计划&Paw Party、姬械机和声网的伙伴们依次上前分享。

💻 Workshop 动手实操多模态

这次 Open Day 为 T08 展位的 TEN Framework 专门安排了一场线下工作坊,希望现场开发者在体验完展区的实时互动项目之后,也可以尝试使用实时多模态开源框架来构建自己的 AI Agent。

在这里插入图片描述

三场开场分享,先为开发者启发一些灵感。普列斯作为 TEN Framework 共同发起者 & RTE 开发者社区布道师,介绍了 TEN 开源框架为构建实时多模态 AI Agent 时所提供的一些解决方案,以及最佳实践案例。

在这里插入图片描述

第二位讲师吕翔,是来自阿里巴巴通义实验室的语音算法专家,分享了 CosyVoice 语音生成大模型原理和实践。CosyVoice 是 TEN Framework 的插件生态中的一个代表。这次工作坊的升级挑战中,我们也给大家准备了 CosyVoice 和 FishAudio 的 key,让大家现场体验不同的 TTS 效果。

在这里插入图片描述

Rokid 全球开发者生态负责人赵维奇,最后介绍了 Rokid 空间计算,以及如何利用 TEN Framework 结合 Rokid 穿戴硬件开发实时多模态 Agent 应用。

在这里插入图片描述

动手实践环节,其实 3 个小时并不久。这次工作坊为大家准备了三个挑战,从跑通基础 Agent demo,体验 OpenAI realtime API 到自行修改 Agent 相关配置,循序渐进尝试 TEN 接入的不同能力。现场有超过一半的朋友拿走了我们的挑战成功礼品,还在结束后成为了 TEN 社群的新晋成员。也特别感谢社群伙伴喵喵在现场协助 TEN 主创团队为大家提供技术支援。

在这里插入图片描述

💥 在技术论坛碰撞观点

本次大会的 5 场技术论坛,信息量满满,无法在这篇 recap 内一一展现,请关注 RTE 开发者公号后续的单篇分享回顾!

🎉 见证 RTE 年度最具代表性场景三强出炉

10 月 25 日下午,RTE 年度场景 Showcase 暨第四届 RTE 创新大赛在 RTE 生态与社区伙伴们的见证下圆满完成,2024 年春季超音速计划四强与 RTE 开发者社区及各国际赛区的优胜项目共同角逐年度最具代表性场景三强,通过激烈的角逐最终评选出三强团队:Infiniflow、聊会小天和 Traini。由观众现场投票选出的最受观众欢迎奖 PixelHack 获得了 AIRTE 版的小音符獭獭。

在这里插入图片描述
https://mp.weixin.qq.com/s/2ieRuPMT492UUZvbYEvc9Q

当一群人聚在 RTE Open Day 现场,就会有新的灵感和机会出现!

那么,今年的 Open Day 就到此全部结束!明年还会有什么新鲜的项目和玩法呢?跟大家一起期待着!

点击👇图片下方链接查看过往 RTE Open Day

在这里插入图片描述
https://mp.weixin.qq.com/s/RoA0k5jvb4b3zlVYsoDcBA

点击👇图片下方链接查看过往 RTE Open Day

在这里插入图片描述

https://mp.weixin.qq.com/s/WOtQV1EI9I8akXCY53nR_g

RTE 开发者社区介绍

RTE 开发者社区由声网及多位资深实时互动社区专家联合发起,是聚焦实时互动领域的中立开发者社区。希望通过社区链接领域内的生态伙伴,激活开发者力量,萌芽更多新技术、新场景,探索实时互动领域的更多可能。

RTE 开发者社区有一系列的线上线下活动平台,包括平均单期播放 10 万人次的播客《编码人声》、每月举办的RTE Meetup 以及周期性的 RTE Open Day,为各类 RTE 开发者提供了交流、展示 demo、合作握手的平台,可以关注我们的公众号“RTE 开发者社区”了解最新动态与活动信息哦!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/2475.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

智能体联手微信,打造24小时在线的全能AI机器人,除了聊天,还能接商单

最近在我们的智能体学习群里,微信AI机器人成了小明星,它功能丰富,机智幽默,成为了大家的心头好😗 比如,它会非常热情的欢迎新入群的小伙伴,并且能够很机智的将小伙伴的名字巧妙地融入到欢迎词中…

采购退料单集成方案:从旺店通到金蝶云的API实现

14-采购退料单集成方案:旺店通旗舰奇门数据集成到金蝶云星空 在企业的供应链管理中,采购退料单的高效处理至关重要。为了实现这一目标,我们采用了轻易云数据集成平台,将旺店通旗舰奇门的数据无缝对接到金蝶云星空。本次分享的案例…

MyBatis的高级映射及延迟加载

多对一: 多种方式,常见的包括三种: 第一种方式:一条SQL语句,级联属性映射。 第二种方式:一条SQL语句,association。 第三种方式:两条SQL语句,分步查询。(这…

bugku中web题-source

Web安全解题基础三件套思路 信息收集与目录扫描 御剑扫描:探测网站目录结构,找潜在可访问路径,如管理员后台等目录。dirsearch扫描后台目录:配置参数后扫描,分析返回有意义状态码的目录,可能包含后台管理界…

Java中String的length与Oracle数据库中VARCHAR2实际存储长度不一致的问题

目录 一、根本原因 二、解决方案 一、根本原因 Oracle数据库新增数据的时候报如下错误: 先给大家看个小案例,这样更好去理解,下面是一段测试代码: 这里面我分别列举了三种字符串,中文,英文和数字以及两种…

shodan6-7---清风

shodan6-7 1.shodan网页版 以cve-2019-0708漏洞指纹特征为例 "\x03\x00\x00\x0b\x06\xd0\x00\x00\x124\x00"在这里插入图片描述 搜索命令参考 https://www.shodan.io/search/filters这个网页中有搜索关键词 对指定网址进行监控,这里可以对ip进行扫描&…

Spring5学习记录(四)声明式事务管理

Spring5学习记录(四)声明式事务管理 一、事务管理1、事务四个特性ACID2、事务的两种方式 二、基于注解实现声明式事务管理1、配置xml文件2、添加事务注解 Transactional 三、声明式事务管理的参数配置1、propagation:事务传播行为2、isolat…

Linux上python离线安装教程

一. 安装Python 1. 下载python离线包 安装包下载地址:https://www.python.org/downloads/source/ 我下载的是Python 3.10.14 下面是linux服务器上的部署过程 2. 系统更新 sudo yum update -y 3. 安装必要的依赖项 sudo yum groupinstall “Development Tools” -y…

快速入门CSS

欢迎关注个人主页:逸狼 创造不易,可以点点赞吗 如有错误,欢迎指出~ 目录 CSS css的三种引入方式 css书写规范 选择器分类 标签选择器 class选择器 id选择器 复合选择器 通配符选择器 color颜色设置 border边框设置 width/heigth 内/外边距 C…

ssm基于vue搭建的新闻网站+vue

系统包含:源码论文 所用技术:SpringBootVueSSMMybatisMysql 免费提供给大家参考或者学习,获取源码请私聊我 需要定制请私聊 目 录 目 录 I 摘 要 III ABSTRACT IV 1 绪论 1 1.1 课题背景 1 1.2 研究现状 1 1.3 研究内容 2 [2 系统…

MATLAB计算朗格朗日函数

1. 朗格朗日函数介绍 朗格朗日函数(Lagrange function)通常用于优化问题,尤其是带有约束的优化问题。其一般形式为: 其中: f(x) 是目标函数。 是约束条件。 是拉格朗日乘子。 为了编写一个MATLAB代码来计算和绘制…

商场应急响应:SpringBoot技术优化

3系统分析 3.1可行性分析 通过对本大型商场应急预案管理系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本大型商场应急预案管理系统采用SSM框架&#xff0…

WebSocket的理解与应用

WebSocket的理解与应用 一、是什么二、特点1、全双工2、二进制帧3、协议名4、握手5、优点 三、应用场景 一、是什么 WebSocket,是一种网络传输协议,位于OSI模型的应用层。可在单个TCP连接上进行全双工通信,能更好的节省服务器资源和带宽并达…

【C++ 算法进阶】算法提升八

复杂计算 (括号问题相关递归套路 重要) 题目 给定一个字符串str str表示一个公式 公式里面可能有整数 - * / 符号以及左右括号 返回最终计算的结果 题目分析 本题的难点主要在于可能会有很多的括号 而我们直接模拟现实中的算法的话code会难写 要考虑…

Node学习记录-until实用工具

来源:Nodejs 第十八章(util) util 是Node.js内部提供的很多实用或者工具类型的API util.promisify 用于将遵循Node回调风格(即最后一个参数为回调函数)的函数转换成返回Promise的函数,这样可以使得异步代…

Vue生命周期

Vue生命周期:Vue实例从创建到销毁的过程,即指从创建、初始化数据、编译模板、挂载DOM到渲染、更新到渲染、销毁等一系列过程。主要分为创建前后、载入前后、更新前后、销毁前后以及一些特殊场景的生命周期。 …

注意力机制的目的:理解语义;编码器嵌入高纬空间计算;注意力得分“得到S*V”;解码器掩码和交叉注意力层用于训练;最终的编码器和输出实现大模型

目录 注意力机制的目的:理解语义中的它是小白兔 词编码器嵌入高纬空间 计算注意力得分“得到S*V” 权重QKV:连接权重 训练阶段使用解码器:翻译后的语句 解码器掩码和交叉注意力层用于训练 最终的编码器和输出实现大模型 Transformer模型中,QKV QKV的作用 举例说明…

鸿蒙5.0时代:原生鸿蒙应用市场引领开发者服务新篇章

前言 10月22日原生鸿蒙之夜发布会宣布HarmonyOS NEXT正式发布,首个版本号:鸿蒙5.0。这次“纯血鸿蒙”脱离了底层安卓架构成为纯国产的独立系统,仅凭这一点就有很多想象空间。 目前鸿蒙生态设备已超10亿,原生鸿蒙操作系统在中国市…

联动香港、成都、武汉三所高校!“2024 深圳国际金融科技大赛”校园行圆满结束

在金融科技蓬勃发展的当下,人才培养成为推动行业前行的关键。为推进深圳市金融科技人才高地建设,向高校学子提供一个展示自身知识、能力和创意的平台,2024 FinTechathon 深圳国际金融科技大赛——西丽湖金融科技大学生挑战赛重磅开启&#xf…

【真题笔记】16年系统架构设计师要点总结

【真题笔记】16年系统架构设计师要点总结 存储部件接口嵌入式处理器产品配置配置管理用户文档系统文档CMM(能力成熟度模型)螺旋模型敏捷软件开发的方法学软件工具面向对象的分析模型设计模型COP(面向构件的编程)构件原子构件模块S…