计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-10

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-10

1. Characterizing and Efficiently Accelerating Multimodal Generation Model Inference

Y Lee, A Sun, B Hosmer, B Acun, C Balioglu, C Wang… - arXiv preprint arXiv …, 2024
https://arxiv.org/pdf/2410.00215?

在这里插入图片描述
在这里插入图片描述
特征化与高效加速多模态生成模型推理

摘要

本文针对多模态生成模型在实际系统上的推理性能进行了深入分析,识别了系统设计和优化的关键机会。多模态生成模型在理解并响应多种模态方面具有革命性的能力,但这些高级功能通常需要显著的系统资源。为了在全球范围内将生成性AI能力扩展到数十亿用户,推理过程必须快速且高效。文章通过特征化一系列新兴的多模态生成模型,指出了关键的系统设计和优化机会,并展示了从应用到系统软件和硬件的最新优化方法,可将推理性能提高3.88倍。

创新点

  1. 系统性能特征化:对多模态生成模型进行了深入的系统性能分析,包括计算需求、内存带宽需求和输入分布的变化。
  2. 优化方法:展示了包括torch.compile、CUDA Graph、Scaled Dot Product Attention (SDPA) / Flash Attention和量化技术在内的最新优化方法,这些方法可以显著提高推理性能。
  3. 算法优化:通过LayerSkip等算法优化进一步提高推理性能效率。

算法模型

  • 多模态生成模型:涵盖了语言模型(如Code Llama)、语音翻译(如Seamless)、文本和图像生成(如Chameleon)以及生成式深度学习推荐系统(如gDLRM)。
  • 优化技术
    • SDPA/Flash Attention:用于加速Transformer模型中的关键性能瓶颈。
    • torch.compile和CUDA Graph:用于优化内存效率和提高GPU利用率。
    • 量化:提高计算密度和内存带宽利用率。
    • LayerSkip:一种自推测解码方法,用于加速生成过程。

实验效果

  • 性能提升:通过启用最新的优化技术,跨关键生成AI任务的推理性能平均提高了3.88倍。
  • 数据与结论
    • 不同模型的性能差异:例如,Chameleon的文本到图像任务比HSTU需要更多的计算资源。
    • 优化技术的影响:SDPA和torch.compile结合使用可以显著提高性能,尤其是在小批量设置中。
    • 实时应用潜力:对于Seamless模型,优化后的端到端推理速度提高了2.7倍,这对于实时语音翻译任务至关重要。

推荐阅读指数

★★★★☆

推荐理由

  • 全面性:文章全面地分析了多模态生成模型的系统性能,并提出了多种优化策略。
  • 实用性:提出的优化方法可以直接应用于实际的AI系统,具有很高的实用价值。
  • 前瞻性:随着多模态AI模型的快速发展,这些优化技术对于未来的AI系统设计具有指导意义。

2. Generative AI Application for Building Industry

H Wan, J Zhang, Y Chen, W Xu, F Feng - arXiv preprint arXiv:2410.01098, 2024
https://arxiv.org/pdf/2410.01098
在这里插入图片描述
生成式人工智能在建筑行业的应用

摘要

本文探讨了生成式人工智能技术,特别是大型语言模型(LLMs),在建筑行业的变革潜力。通过利用这些先进的AI工具,研究了它们在能源规范合规性、建筑设计优化和劳动力培训等关键领域的应用。研究强调了LLMs如何自动化劳动密集型流程,显著提高建筑实践中的效率、准确性和安全性。文章还解决了在建筑计划和法规规范中解释复杂视觉和文本数据的挑战,提出了创新的解决方案,以增强AI驱动的合规性检查和设计流程。此外,研究还考虑了AI集成的更广泛影响,包括开发AI驱动的工具,以实现跨不同监管领域的全面规范合规,以及AI通过现实模拟彻底改革劳动力培训的潜力。

创新点

  1. 综合应用分析:提供了生成式AI在建筑行业多个领域应用的全面分析。
  2. AI驱动的合规性检查:提出了使用LLMs自动化建筑规范合规性检查的创新方法。
  3. 设计优化:探索了利用AI优化设计流程,提高建筑实践的效率和准确性。
  4. 劳动力培训:考虑了AI在通过现实模拟彻底改革劳动力培训方面的潜力。

算法模型

  • Transformer模型:用于处理包括文本生成、语言理解和分类在内的各种自然语言处理(NLP)任务。
  • Diffusion模型:通过模拟从噪声到有意义内容的逐步转换过程,生成图像或文本。
  • 检索增强生成(RAG):一种通过整合外部知识源来增强语言模型功能的技术。

实验效果

  • 代码合规性检查:展示了LLMs在自动化翻译建筑规范为明确规则方面的潜力。
  • HVAC系统控制:使用ChatGPT和深度Q网络(DQN)模型优化HVAC系统的控制,以减少能源消耗。
  • 数据挖掘:结合最大频繁项集挖掘和生成预训练变压器(GPT)来识别建筑运营数据中的能源浪费模式。
  • 建筑模拟输入文件支持:研究了LLMs在建筑能源建模(BEM)软件中的集成,特别是EnergyPlus。

结论

生成式AI在建筑行业的集成为设计、合规性和培训的各个方面的变革提供了重要的潜力。通过利用LLMs在能源规范合规性检查、建筑设计优化和劳动力培训等方面的能力,建筑行业可以实现显著的效率、准确性和安全性改进。

推荐阅读指数

★★★★☆

推荐理由

  • 全面性:文章全面地分析了生成式AI在建筑行业的应用,提供了深入的见解。
  • 创新性:提出了AI在建筑行业中的新用途,尤其是在合规性检查和设计优化方面。
  • 实用性:探讨了AI技术如何帮助解决建筑行业中的实际问题。

3. Application of RAG Model Based on Retrieval Enhanced Generation Technique in Complex Query Processing

X Li

基于检索增强生成技术的RAG模型在复杂查询处理中的应用

摘要

本文探讨了检索增强生成(RAG)模型在处理复杂查询中的应用。RAG模型通过结合检索和生成两个过程,展示了在处理复杂查询时的独特优势。文章深入讨论了RAG模型的工作原理,并将其应用于复杂查询处理场景。通过分析真实案例和验证实验结果,展示了RAG模型在增强查询处理结果方面的显著优势。尽管RAG模型在处理复杂查询方面表现出良好的性能,但其应用仍面临一些挑战和限制。文章最后对RAG模型的未来发展进行了展望,探索了可能的优化方向和应用前景。

创新点

  1. 检索增强生成技术:RAG模型结合了检索和生成过程,以处理复杂查询。
  2. 深度集成:RAG模型通过检索文档片段并将其作为上下文信息输入生成模型,提高了生成响应的相关性和准确性。
  3. 端到端训练:RAG模型采用端到端训练方法,优化检索器和生成器的协同工作。

算法模型

  • RAG模型:结合信息检索与生成模型,通过检索与生成的结合来提供更准确的答案。
  • 检索步骤:使用向量表示的检索模型(如DPR)从大规模数据集中筛选与查询最相关的文档片段。
  • 生成步骤:基于检索到的内容和初始处理的查询信息,生成与用户需求一致的自然语言响应。

实验效果

  • 实验结果:RAG模型在处理复杂查询时,能够更有效地利用外部知识,生成内容的相关性更高。
  • 重要数据与结论:RAG模型在知识广度和答案准确性方面显著优于传统生成模型。

推荐阅读指数

★★★★☆

推荐理由

  • 对于自然语言处理(NLP)领域的研究人员和实践者来说,这篇文章提供了RAG模型在复杂查询处理中的深入分析和应用案例。
  • 文章不仅讨论了RAG模型的优势,还指出了其面临的挑战和未来的发展方向,对于理解当前NLP技术的前沿进展非常有帮助。
  • 适合对检索增强生成技术感兴趣的研究人员和希望在复杂查询处理中应用RAG模型的工程师。

4. How Can Generative Artificial Intelligence Techniques Facilitate Intelligent Research into Ancient Books?

J Liu, X Ma, L Wang, L Pei - ACM Journal on Computing and Cultural Heritage, 2024

在这里插入图片描述
在这里插入图片描述
生成式人工智能技术如何促进古籍研究智能化?

摘要

本文探讨了生成式人工智能(AI)技术在古籍研究领域的应用,包括数字化、智能化处理古籍文本和古籍活化的智能应用。研究重点在于多模态大型模型在古籍图像处理和光学字符识别(OCR)中的作用,以及如何利用大型语言模型(LLM)进行古籍文本的智能信息处理。文章还讨论了结合提示工程、检索增强生成(RAG)、监督式微调、LangChain 等技术来提高古籍文本挖掘和应用的性能。尽管大型语言模型在推进古籍研究领域向智能分析发展方面展现出变革潜力,但仍存在知识补全、理解情感和文化细微差别以及伦理和责任问题的局限性。

创新点

  1. 多模态大型模型:在古籍图像处理和OCR中的应用,提高布局分析的准确性。
  2. 智能信息处理:使用LLM进行古籍文本的深入分析,包括结构化分析、信息提取和深度语义分析。
  3. LangChain 技术:构建基于链式推理模型的智能知识库问答系统,提高问答系统的深度和准确性。
  4. 智能代理技术:将需求和答案转化为可由其他IoT设备执行的命令,实现文化产业的智能化。

算法模型

  • 多模态大型模型(Multimodal LLMs):结合图像和文本信息,提高古籍页面的布局分析和文字识别。
  • 大型语言模型(LLMs):用于理解和生成复杂的古籍文本,进行结构化分析和深度语义分析。
  • 检索增强生成(RAG):结合信息检索和自然语言生成,提高LLM的回答准确性和知识丰富度。
  • LangChain:基于LLM的智能信息处理框架,提供标准化接口,简化应用开发难度。

实验效果

  • 古籍修复:使用AI模型对敦煌遗书等古籍进行数字化修复,恢复了文档的完整性。
  • 智能古籍注释:使用“WYD: WIDEN YOUR DATA”平台进行古籍文本的自动注释,提高了研究效率。
  • 数据和结论:AI技术在古籍研究中的应用不仅提高了对传统文化的理解和传播,还为古籍的数字化保护和智能化使用开辟了新的途径。

推荐阅读指数

★★★★☆

推荐理由

  • 创新性:文章探讨了AI在古籍研究中的新颖应用,展示了AI技术在文化遗产保护中的潜力。
  • 实践价值:提供了实际案例,如AI古籍修复和智能注释,证明了AI技术在实际应用中的有效性。
  • 跨学科:结合了计算机科学和人文学科,为数字人文学科的发展提供了新的视角。

扣分理由

  • 技术深度:对于非专业读者来说,某些技术细节可能过于复杂,难以完全理解。
  • 局限性:文章指出了AI在理解古籍文本的深层含义和情感方面存在局限,表明了技术发展的当前边界。

5. Retrieval-Augmented Generation for Large Language Models: A Survey

Yunfan Gao, Yun Xiong, et.
https://arxiv.org/pdf/2312.10997
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用于大型语言模型的检索增强生成:一项综述

摘要

大型语言模型(LLMs)展现出了令人印象深刻的能力,但同时也面临诸如幻觉、知识过时以及推理过程不透明和不可追溯等挑战。检索增强生成(RAG)通过整合外部数据库的知识,作为一种有希望的解决方案出现。这增强了生成内容的准确性和可信度,特别是对于知识密集型任务,并允许持续的知识更新和整合特定领域的信息。RAG将LLMs的内在知识与外部数据库的庞大、动态的知识库相结合。这篇综述论文详细检查了RAG范式的进展,包括朴素RAG、高级RAG和模块化RAG。它细致地审查了RAG框架的三个部分基础,包括检索、生成和增强技术。本文强调了这些关键部分中嵌入的最新技术,提供了对RAG系统进展的深刻理解。此外,本文介绍了最新的评估框架和基准。最后,本文概述了目前面临的挑战,并指出了研究和开发的潜在途径。

创新点

  1. 系统性综述:提供了RAG方法的全面和系统性的回顾,包括其在大型语言模型中的应用。
  2. 技术范式总结:总结了三种主要的RAG研究范式,包括朴素RAG、高级RAG和模块化RAG。
  3. 关键技术分析:深入分析了RAG过程中的关键技术,特别是检索、生成和增强方面。
  4. 最新评估框架:介绍了适用于RAG的最新评估框架和基准。

算法模型

  • 朴素RAG:遵循传统的检索和生成流程,包括索引、检索和生成。
  • 高级RAG:引入了优化策略,包括预检索和后检索策略,以及改进的索引技术。
  • 模块化RAG:提供了更高的适应性和灵活性,引入了多个特定功能模块,并支持端到端训练。

推荐阅读指数

★★★★☆

推荐理由

  • 对于对大型语言模型和信息检索领域感兴趣的研究人员和实践者来说,这篇文章提供了RAG领域的全面概述。
  • 文章详细介绍了RAG的关键技术和评估方法,对于想要了解这一领域最新进展的读者非常有帮助。

后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习,计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1559533.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用Colly库进行大规模数据抓取?

在互联网时代,数据的价值日益凸显,大规模数据抓取成为获取信息的重要手段。Go语言因其高效的并发处理能力,成为编写大规模爬虫的首选语言。Colly库作为Go语言中一个轻量级且功能强大的爬虫框架,能够满足大规模数据抓取的需求。本文…

C语言 | Leetcode C语言题解之第467题环绕字符串中唯一的子字符串

题目&#xff1a; 题解&#xff1a; #define MAX(a, b) ((a) > (b) ? (a) : (b))int findSubstringInWraproundString(char * p) {int dp[26];int len strlen(p);memset(dp, 0, sizeof(dp));int k 0;for (int i 0; i < len; i) {if (i && (p[i] - p[i - 1] …

动态线程池设计与实现

为什么要有动态线程池 ThreadPoolExecutor 核心线程参数对某些业务不知到设置多少合适调整参数需要重新启动服务没有告警功能 设计思路 流程设计 库表抽象 更新操作流程图 代码实现 GitCode - 全球开发者的开源社区,开源代码托管平台

太阳诱电电感选型方法及产品介绍

功率电感在电子电路中被广泛应用&#xff0c;太阳诱电的功率电感从原材料开始进行研发&#xff0c;生产和销售。 本次研讨会将带领大家更加了解功率电感的选型方法&#xff0c;以及各种功率电感的种类和特征。 此外&#xff0c;也将介绍太阳诱电的最新产品阵容。本次研讨会预计…

python之详解集合

一种无序且不重复的数据容器&#xff0c;集合用大括号{}表示。 1、集合的查找访问 集合是不能通过 集合名[index] 这种方式访问的&#xff0c;其作用在于快速读取&#xff0c;而不是针对某个元素。 但&#xff0c;可将集合转为列表&#xff0c;再由列表访问元素。不过&#…

Spring Boot 进阶-实战Spring Boot整合Swagger3.0

说到Swagger有人会问Swagger到底是什么?作为一个后端开发人员来讲,为什么要使用Swagger呢?因为我们现在完成的项目大多数情况下都是前后端分离的项目,而对于前端开发人员来讲,他们需要调用接口,才能获取到对应的数据。那么这个接口如何获取,总不能是后端开发人员弄好之后…

xianshan分支预测单元基础与top层介绍

xianshan分支预测单元基础与top层接口介绍 2 xianshan BPU分支预测器总体架构2.1 分支预测器块思想2.2 多预测器2.3 多流水线2.4 取值目标队列--FTQ2.4.1 BPU预测结果内部重定向2.4.2 FTQ2BPU 重定向请求2.4.4 BPU的update请求 2.5 总结 在这里重点介绍xianshan分支预测单元BPU…

数学建模算法与应用 第8章 时间序列分析

目录 8.1 确定性时间序列分析方法 Matlab代码示例&#xff1a;移动平均法提取趋势 8.2 平稳时间序列模型 Matlab代码示例&#xff1a;差分法与ADF检验 8.3 时间序列的Matlab相关工具箱及命令 Matlab代码示例&#xff1a;ARIMA模型的建立 8.4 ARIMA序列与季节性序列 Matl…

开发环境搭建之NVM管理NODE安装

由于项目繁多前端node环境代码不统一、所以安装切换不同版本node、所以在此记录一下安装过程&#xff1a; 下载NVM工具 nvm zip github下载安装包 简单粗暴一看就会、直接从官网下载zip安装包、然后执行命令安装所需node版本即可 下载之后直接安装&#xff1a; 安装完成之…

linux执行脚本的时候为什么要写成 ./脚本名 而不是用脚本名直接执行

原因&#xff1a; 一定要写成 ./test.sh&#xff0c;而不是 test.sh&#xff0c;运行其它二进制的程序也一样&#xff0c;直接写 test.sh&#xff0c;linux 系统会去 PATH 里寻找有没有叫 test.sh 的&#xff0c;而只有 /bin, /sbin, /usr/bin&#xff0c;/usr/sbin 等在 PATH…

查询v$asm_disk等待enq: DD - contention

1.两个节点查询v$asm_disk均卡住&#xff0c;等待enq: DD - contention&#xff0c;阻塞源头为rbal进程&#xff0c;rbal进程未发生阻塞&#xff0c;未在异常等待事件上。 2.阻塞源头RBAL&#xff0c;在CPU上运行。没有在做rebalance磁盘平衡。 3.diag诊断日志中&#xff0c;阻…

python实现3D立柱图demo

import matplotlib.pyplot as plt import numpy as np plt.rcParams["font.sans-serif"] ["SimHei"] # 设置字体 plt.rcParams["axes.unicode_minus"] False # 该语句解决图像中的“-”负号的乱码问题# 数据 regions [东北, 中南, 华东, 华…

飞腾CPU技术发展分析

飞腾CPU剖析 CPU&#xff1a;信创根基&#xff0c;国之重器 国产CPU市场呈现三大领军阵营&#xff1a;x86、ARM以及其他创新架构。鲲鹏与飞腾在ARM阵营中引领风潮&#xff0c;依托ARM技术授权研发高性能处理器&#xff1b;海光与兆芯则以x86架构为基石&#xff0c;深入挖掘其潜…

数学建模算法与应用 第7章 数理统计与方法

目录 7.1 参数估计与假设检验 Matlab代码示例&#xff1a;均值的假设检验 7.2 Bootstrap方法 Matlab代码示例&#xff1a;Bootstrap估计均值的置信区间 7.3 方差分析 Matlab代码示例&#xff1a;单因素方差分析 7.4 回归分析 Matlab代码示例&#xff1a;线性回归 7.5 基…

Registry私有仓库可视化

Docker Registry 是一个用于存储和分发 Docker 镜像的服务&#xff0c;它支持构建私有仓库来管理组织内部的应用程序和镜像。然而&#xff0c;默认的 Docker Registry 并没有提供图形界面&#xff0c;这使得管理镜像变得不太直观。为了方便管理和查看私有仓库中的镜像&#xff…

显卡 3090 vs v100

1.3090 Date: 2020 AmperePielines/ Cuda cores: 10496 2.V100 Date: 2018 VoltaPielines/ Cuda cores: 5129 3.结构 & Core比较: v100优点: v100功耗小v100较快的双精度(fp64)和混合精度(fp16fp32)pcie版的NVLink与2080ti完全一致 v100缺点: 不支持整数格式计算&…

机器学习笔记-2

文章目录 一、Linear model二、How to represent this function三、Function with unknown parameter四、ReLU总结、A fancy name 一、Linear model 线性模型过于简单&#xff0c;有很大限制&#xff0c;我们需要更多复杂模式 蓝色是线性模型&#xff0c;线性模型无法去表示…

水下图像增强(论文复现)

本文所涉及所有资源均在 传知代码平台 可获取。 目录 概述 一、论文思路 二、模型介绍&#xff1a; 三、实现方法 四、复现过程(重要) 部署方式 概述 2021年11月&#xff0c;提出一种用于水下图像增强的U型Transformer模型&#xff0c;这是首次在水下图像增强任务中使用Transfo…

MySQL 对其他服务器授权

MySQL 对其他服务器授权 MySQL默认情况下,只允许本地连接,即 localhost ,如果其他服务器需要连接到 MySQL,需要MySQL 对这个服务器授权语法格式: grant 权限 on 数据库对象 to ⽤户 1. 使用下面 SQL,创建用户,并授权 -- 创建⽤户yulin, 并设置密码, 此步可省略 CREATE USER…

SpringBoot 整合 阿里云 OSS图片上传

一、OOS 简介 ‌阿里云OSS&#xff08;Object Storage Service&#xff09;是一种基于云存储的产品&#xff0c;适用于存储和管理各种类型的文件&#xff0c;包括图片、视频、文档等。‌ 阿里云OSS具有高可靠性、高可用性和低成本等优点&#xff0c;因此被广泛应用于各种场景&…