RWKV 社区 10 月动态速览!

欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2024 年 10 月的最新动态。

10 月动态省流版(TL;DR)

  1. RWKV 社区活动
    • 10 月 13 日,RWKV 团队在北京大学做了《RWKV 技术产品化与生态及模型架构》主题分享
  2. RWKV 学术研究动态
    • 新论文:VisualRWKV-HD and UHD,VisualRWKV 项目的高分辨率版本
    • MATCC:基于 RWKV 架构的股价预测框架
    • Bone:由 RWKV 社区发布的参数高效微调新方法
  3. RWKV 社区项目动态
    • OccRWKV:基于 RWKV 的 3D 语义占用预测项目,可用于自动驾驶、具身智能等领域
    • Sudoku-RWKV:一个用于解决数独谜题的专用 RWKV 模型,仅 29M 参数
  4. RWKV 社区活动预告
    • 11 月 2 日(本周六),RWKV 团队会在浙江大学开展《RWKV 技术产品化与生态及模型架构》主题讲座

RWKV 社区活动

此版块包含 RWKV 官方动态,以及 RWKV 社区举办或参加的各类活动

RWKV 进高校第一站:北京大学

应北京大学创新学社的邀请,RWKV 团队于 10 月 13 日在北京大学做了一次《RWKV 技术产品化与生态及模型架构》主题分享。

此次分享吸引了线上线下共 200 多人参与,RWKV 团队与嘉宾们进行了深入的沟通交流。

RWKV 在北京大学

欢迎更多高校来交流、了解 RWKV 这种新型大模型架构。同时也欢迎科研工作者和创业者使用 RWKV,我们可以提供技术支持。

  • 联系微信:jadexlaw
  • 邮箱:luoxuan@rwkvos.com

RWKV 学术研究动态

RWKV 学术研究包括基于 RWKV 架构的新论文RWKV 社区参加的学术研究

VisualRWKV-HD and UHD

  • 论文名称:VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models
  • 论文链接:https://arxiv.org/abs/2410.11665

VisualRWKV-HD and UHD 是 VisualRWKV 的高分辨率版本,VisualRWKV-HD 支持 1024×1024 的图片,VisualRWKV-UHD 支持 4096×4096 的图片。

这两个新模型更加适合图片-文档理解和 text-rich 的任务。

VisualRWKV-HD-UHD 的架构设计

MATCC(股价预测模型)

  • 论文名称:MATCC: A Novel Approach for Robust Stock Price Prediction Incorporating Market Trends and Cross-time Correlations
  • 论文链接:https://dl.acm.org/doi/abs/10.1145/3627673.3679715

论文提出了基于 RWKV 架构的 “MATCC” 框架,可用于解决股价预测中的市场趋势和跨时间关联问题。

实验表明,MATCC 在预测准确性和投资组合表现方面显著优于其他模型,验证了股价趋势和跨时间关联在股票分析中的重要性。

MATCC 架构

免责声明:MATCC 框架仅用于研究目的,不保证其在股价预测方面的准确性。投资决策需自行谨慎判断,我们不对任何基于该框架预测结果的投资承担责任。

Bone(RWKV 高效微调方法)

  • 论文名称:Bone: Block Affine Transformation as Parameter Efficient Fine-tuning Methods for Large Language Models
  • 论文链接:https://arxiv.org/abs/2409.15371
  • GitHub 仓库地址:https://github.com/JL-er/Bone

Bone 微调(Block Affine)是一种全新的参数高效微调方法(PEFT,Parameter-Efficient Fine-Tuning)。

相对 LoRA 微调,Bone 微调通过增强原始权重信息的利用率和强调权重间的内部联系,实现更快的收敛和更好的数据拟合。

Bone 微调方法及论文由 RWKV 社区成员 @J.L(Jiale Kang) 独立完成并发布。

在这里插入图片描述

RWKV 社区项目动态

此版块主要包括“RWKV 社区的新项目” 和 “RWKV 社区项目的重要更新”等内容。

OccRWKV(RWKV3D 语义占用预测项目)

OccRWKV 是一个基于 RWKV 的 3D 语义占用预测项目,可用于自动驾驶、具身智能等领域。

OccRWKV 使用 BEV 空间和稀疏特征投影显著地降低了计算需求,非常适合增强机器人系统中的实时自主导航。

occrwkv-overview

GitHub 仓库地址:https://github.com/jmwang0117/OccRWKV

🌟 OccRWKV 的 GitHub 仓库包含详细的训练环境配置训练数据集的收集模型训练文档。

Sudoku-RWKV(RWKV 数独模型)

Sudoku-RWKV 是一个用于解决数独谜题的专用 RWKV 模型。作为一个仅 29M 参数的小模型,Sudoku-RWKV 对最高 50 个空单元格的数独实现了近 100% 的准确率:

Sudoku-RWKV 准确率

Sudoku-RWKV 的训练代码和数据制作脚本均已开源。

GitHub 仓库:https://github.com/Jellyfish042/Sudoku-RWKV

有关 Sudoku-RWKV 的详细介绍,请阅读:RWKV 通过几万 token 的 CoT 解决几乎 100% 的数独问题

关于《RWKV 社区动态》栏目

《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。

《RWKV 社区最新动态》不定期更新,所以请保持关注我们的微信公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开平台,以获取最新的消息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/11891.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C++:模板之全

目录 前言: 一、函数模板 1.函数模板的原理: 2.函数模板的实例化 2.1.隐式实例化 2.2.显示实例化 2.3.模板参数匹配原则 二、类模板 1.类模板的实例化 三、非类型模板参数 四、模板的特化 五、模板的分离编译 前言: 在C语言中是…

嵌入式linux系统中I2C控制实现AP3216C传感器方法

大家好,今天主要给大家分享一下,如何使用linux系统里面的I2C进行控制实现。 第一:Linux系统中I2C简介 Linux 内核开发者为了让驱动开发工程师在内核中方便的添加自己的 I2C 设备驱动程序,更容易的在 linux 下驱动自己的 I2C 接口硬件,进而引入了 I2C 总线框架。与 Linux 下…

PyQt5超详细教程终篇

PyQt5超详细教程 前言 接: [【Python篇】PyQt5 超详细教程——由入门到精通(序篇)](【Python篇】PyQt5 超详细教程——由入门到精通(序篇)-CSDN博客) 建议把代码复制到pycahrm等IDE上面看实际效果,方便理…

YOLOv11(Ultralytics)可视化界面ui设计,基于pyqt5,单文件即插即用,支持文件夹检测及云摄像头检测并保存

本文的可视化界面对于YOLOv11/Ultralytics/YOLOv8的检测、分割、分类、姿势估算(detection, segmentation, obb, classification, and pose estimation)等均可正常显示。本次新增了图片及视频的保存,可以选择传入文件夹进行检测并显示&#x…

colmap软件用法

文档地址:Tutorial — COLMAP 3.11.0.dev0 documentation background: Structure-from-Motion 分为三个阶段(colmao软件也是按这个阶段进行划分解耦的): Feature detection and extraction Feature matching and geometric verification …

uniapp使用里image标签图片无法撑满全屏问题,uniapp image填充不满父容器解决方案

问题效果 底部有一个白条,查看元素之后也没有padding也没有margin 解决方案 vertical-align: bottom;解决后效果图

嵌入式开发系列----入门保姆级必看博客

嵌入式开发是指为特定的硬件平台编写软件的过程,通常涉及硬件资源有限、实时性要求高的应用。嵌入式系统广泛应用于消费电子、工业自动化、汽车、医疗设备等领域。本文将介绍嵌入式开发的基础内容,包括硬件和软件的构成、开发工具链、常用的编程语言以及…

计算机网络(4)

同轴电缆 由一根空心的外圆柱导体和一根位于中心轴线的内导线组成,内导线和圆柱 导体及外界之间用绝缘材料隔开,按直径的不同,同轴电缆分为粗缆和细缆 两种 与双绞线相比,同轴电缆的抗干扰能力强,屏蔽性好,…

Cesium基础-(Entity)-(label )

里边包含Vue、React框架代码详细步骤、以及代码详细解释 Label 在 Cesium 中表示一个可以在三维地球上显示的文本标签。它通常用于在特定位置显示信息,比如地名、地标名称或其他注释。Label 可以自定义样式、颜色、大小,并能根据距离视角动态调整显示效果。 以下是 Label 的…

云计算虚拟化-自用服务器购买指南

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 首先强调:这个不是必需品,请各位根据自己的情况来。技术的进步这些只能算锦上添花,重要的…

基于gewe制作第一个微信聊天机器人

现在我们制作一个微信智能聊天机器人。发送文字它可以回复一段话,或一张图片,是不是有点小酷! 当然,这种智能回复的算法和数据库我们自己肯定是没有的,所以我们借助于gewe框架的开放API接口来完成我们的功能。 请求参…

C++模板进阶

C教学总目录 C模板进阶 1、模板初阶的补充2、非类型模板参数3、模板的特化3.1、函数模板特化3.2、类模板特化3.2.1、全特化3.2.2、偏特化3.2.3、类模板特化的应用 4、模板的分离编译 1、模板初阶的补充 现在假设我们有一个vector对象,我们要遍历输出vector对象中的…

Rocky、Almalinux、CentOS、Ubuntu和Debian系统初始化脚本v9版

Rocky、Almalinux、CentOS、Ubuntu和Debian系统初始化脚本 Shell脚本源码地址: Gitee:https://gitee.com/raymond9/shell Github:https://github.com/raymond999999/shell脚本可以去上面的Gitee或Github代码仓库拉取。 支持的功能和系统&am…

Iotop使用

文章目录 Iotop依赖及编译1:内核配置2: 环境配置3.依赖库ncurses3.1 Ncurses的编译配置 4. Iotop的编译及修改5.测试效果如下: Iotop依赖及编译 源码路径:https://github.com/Tomas-M/iotop#how-to-build-from-source (GitHub - Tomas-M/iotop: A top u…

CVPR力推!预训练+医学图像这么玩,审稿人都得为你让条路!

最近发现Nature、CVPR、NeurIPS等顶会顶刊上,涌现了不少预训练医学图像的文章,不仅效果拔群,思路也很有启发性。 像是Nature上的REFERS,便颠覆了传统方法,使标注数据量直降90%!此外还有CVPR24上…

Spark 共享变量:广播变量与累加器解析

Spark 的介绍与搭建:从理论到实践_spark环境搭建-CSDN博客 Spark 的Standalone集群环境安装与测试-CSDN博客 PySpark 本地开发环境搭建与实践-CSDN博客 Spark 程序开发与提交:本地与集群模式全解析-CSDN博客 Spark on YARN:Spark集群模式…

基于Matlab 疲劳驾驶检测

Matlab 疲劳驾驶检测 课题介绍 该课题为基于眼部和嘴部的疲劳驾驶检测。带有一个人机交互界面GUI,通过输入视频,分帧,定位眼睛和嘴巴,通过眼睛和嘴巴的张合度,来判别是否疲劳。 二、操作步骤 第一步:最…

强化学习不愧“顶会收割机”!2大创新思路带你上大分,毕业不用愁!

强化学习之父Richard Sutton悄悄搞了个大的,提出了一个简单思路:奖励聚中。这思路简单效果却不简单,等于是给几乎所有的强化学习算法上了一个增强buff,所以这篇论文已经入选了首届强化学习会议(RLC 2024)&a…

个人记录。改错huggingface,离线使用

huggingface_hub.utils._errors.LocalEntryNotFoundError: Connection error, and we cannot find the requested files in the disk cache. Please try again or make sure your Internet connection is on. 下载 true改false