AI大模型:(二)1.4 Qwen2.5-Omni全模态大模型部署
目录
1.部署要求
2.全模态模型介绍
3.环境准备
4.模型下载
5.推理
6.web多模态聊天推理
6.1.安装依赖
6.2.使用量化加载
6.3.运行推理
3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天了!
1.部署要求
最小GPU显存要求:
Precision | 15(s) Video | 30(s) Video | 60(s) Video |
---|---|---|---|
FP32 | 93.56 GB | Not Recommend | Not Recommend |
BF16 | 31.11 GB | 41.85 GB | 60.19 GB |
4bit量化版:
Model Size |
---|