Llama 3.2-Vision 多模态大语言模型

1. 引言

Llama 3.2-Vision多模态大型语言模型(文本 + 图像)是一个图像推理生成模型,按照官方的说法,在常见行业基准测试上,其性能优于许多可用的开源和闭源多模态模型。Llama 3.2-Vision有两个版本,一个是11B (7.9G),另一个是90B (55G)。在之前的文章中【能够识别中文的视觉模型比较;视觉模型在岩石工程中的应用 (识别GSI图): Llama 3.2 vs ChatGPT-4o】,我们测试了在线的llama-3.2-vision-90b-instruct模型,结果显示Llama 3.2 90B不太适合岩石工程的图表解释,它更适合于目标检测的应用。

现在,我们在本地可以使用这两个版本的模型:llama3.2-vision:90b和llama3.2-vision:latest,不过,尽管90b模型也能够生成结果,但运行速度极慢,相比之下,11b模型的运行很流畅。

2. 多线程运行

为了在一个代码中,同时运行多个模型,我们之前采用的方法是循环,例如:

models=[qwen2.5:32b, llama3.2:latest, deepseek-v2:latest]

然后

for each_model in models:....

在这个试验中,使用了多线程同时运行两个模型,因此产生的结果不像循环方法顺序生成的,而是随机出现的:

models = ['minicpm-v', 'llama3.2-vision']
image_path = 'image.jpg'
# 创建线程
threads = []
for model in models:thread = threading.Thread(target=chat_with_model, args=(model, image_path))threads.append(thread)thread.start()
# 等待所有线程完成
for thread in threads:thread.join()

使用了两个本地视觉模型minicpm-v和llama3.2-vision。《计算岩土力学》之前讨论的多线程主要是与Itasca软件相关:

3. 测试

下图所示的是Cariboo Gold Project地下矿的一个斜坡道入口。现在采用上述两个模型对这个图像进行解释。

(1) 图片显示的是隧道入口建成后不久的景象,很可能是Cariboo黄金项目区域内矿山基础设施项目的一部分,森林丘陵和梯田土壤的存在表明了在施工活动中的环境管理努力,这可能表明采矿作业中的可持续发展做法。

(2) 图片描述的是一个矿井的入口,入口由混凝土块建成,呈拱形,为周围的土提供结构支撑和稳定性。主要特点如下:

(a) 入口:入口是工人、设备和材料进入矿井的主要入口。

(b) 结构支撑:拱形设计的入口有助于在整个结构上均匀分布重量,防止土压造成的坍塌或损坏。

© 出入口:出入口为进入地下区域提供了一个安全可靠的途径,可确保人员安全并将潜在危险降至最低。

图片是在Cariboo黄金项目拍摄的,表明该入口是正在进行的采矿作业的一部分。背景中树木表明该项目位于农村或偏远地区,可能道路或基础设施有限。

(3) 图片显示的是矿井的入口,这是Cariboo黄金项目基础设施的重要组成部分。入口是人员、设备和材料进出隧道或矿井的出入口。在这张图片中,入口似乎正在施工,周围有明显的挖掘和准备工作的痕迹,周围地区看起来荒芜而多岩石,表明该项目是在偏远或崎岖的地方进行的。入口本身是用混凝土块建成的,可提供结构支撑和保护,在隧道入口处可以看到一个闸门,很可能是用来控制进出和确保矿井内安全的。总之,这张图片为我们了解Cariboo黄金项目入口的施工阶段提供了宝贵的资料,突出了精心规划和执行对于建造一个安全高效的地下作业入口的重要性。

(4) 图片描述的是一个地下通道的入口,很可能是Cariboo黄金项目矿区采矿作业相关基础设施开发的一部分。该结构由混凝土和砖砌成,并有台阶通往地下通道,表明其功能是供车辆或行人通过高架地形。在背景中有大量的推土活动,表明在这个被森林环绕的偏远地区正在进行施工。

如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/11827.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

OpenObserve云原生平台指南:在Ubuntu上快速部署与远程观测

文章目录 前言1. 安装Docker2. Docker镜像源添加方法3. 创建并启动OpenObserve容器4. 本地访问测试5. 公网访问本地部署的OpenObserve5.1 内网穿透工具安装5.2 创建公网地址 6. 配置固定公网地址 前言 本文主要介绍如何在Linux系统使用Docker快速本地化部署OpenObserve云原生可…

隧道论文阅读2-采用无人融合扫描数据的基于深度学习的垂直型隧道三维数字损伤图

目前存在的问题: 需要开发新的无人测量系统测量垂直隧道图像数据量巨大,基于深度学习完成损伤评估跟踪获取图像位置的困难,对大型基础设施感兴趣区域(roi)的2d和3d地图建立进行了研究,对整个目标结构的损伤定位仍然具有挑战性。为…

【从VAE到LDM】Variational Auto Encoder原理以及关于Latent Diffusion的思考

论文链接:High-Resolution Image Synthesis with Latent Diffusion Models 官方实现:CompVis/latent-diffusion、CompVis/stable-diffusion 视频讲解:一个视频看懂VAE的原理以及关于latent diffusion的思考 前言 目前的扩散模型范式基本上都…

1111fxh,MYSQL加锁规则

怎么查看一个事务中对索引的加锁情况 -- 这条语句可以看到事务执行过程中加了哪些锁 select * from performance_schema.data_locks X是next-key lock 混合锁 X,REC_NOT_GAP就是行锁 X,GAP是间隙锁 可重复读下的加锁规则 2原则2优化 1.加锁的基本单位是next-key lock,即行…

mysql中数据不存在却查询到记录?

前言 首先看下面的查询语种 select * from AudioKnowledgeChatInfo where AudioId297795550566600706; 查询结果如下 看到上面的查询结果,是不是一脸懵?这audioId明显不对啊,怎么查询到了? 原因剖析 首先我们来看看数据库表…

拿不下总统之位,那就用热加载拿下验证码识别与爆破好了!

大家好,这里是在总统选举中惜败的超级牛 虽然没能拿下阿美利卡总统之位 但是牛牛的热加载功能,却能轻松拿下验证码的识别与爆破 验证码一般会在注册、登录等功能,用来防止自动化工具的攻击。一般的验证码生成过程如下图所示: …

闯关leetcode——202. Happy Number

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/happy-number/description/ 内容 Write an algorithm to determine if a number n is happy. A happy number is a number defined by the following process: Starting with any positive inte…

如何使用 Web Scraper API 高效采集 Facebook 用户帖子信息

目录 前言一、什么是Web Scraper API二、Web Scraper API 的优势:三、Web Scraper API 适用场景四、实践案例目标需求视频讲解1、选择Web Scraper API2、登录注册3、进入用户控制面板4、选择API5、触发数据收集 API6、获取爬虫结果7、分析爬虫结果(1&…

json转excel,读取json文件写入到excel中【rust语言】

一、rust代码 将json文件写入到 excel中。(保持json :key原始顺序) use indexmap::IndexMap; use serde::Deserialize; use serde_json::{Value, from_str}; use std::error::Error; use std::io::{self, Write}; use std::path::{Path}; u…

2024年下半年系统规划与管理师论文真题

试题一、论IT服务规划设计 IT服务规划设计处于整个IT服务生命周期中的前端,可以帮助IT服务供方了解客户的需求并对其进行全面的需求分析,规划设计的范围不仅包括新的服务,还包括服务连续性保障服务水平的满足和对标准、规则的遵从&#xff0…

无人机动力测试台如何快速外接第三方传感器

前言 动力测试台对于测试动力系统的拉力、扭矩、RPM 和效率至关重要。将传感器集成到您的测试中增加了另一层优化,可以将您的性能提升到一个新的水平。 在无人驾驶行业中,有充分的证据表明,从外部传感器收集数据可能具有挑战性。为了解决这…

金蝶云星空与旺店通数据集成解决方案实例

金蝶云星空与旺店通旗舰奇门的数据集成案例分享 在企业日常运营中,数据的高效流转和准确对接是确保业务顺畅运行的关键。本文将聚焦于一个具体的系统对接集成案例:如何将金蝶云星空中的直接调拨单数据无缝集成到旺店通旗舰奇门平台。 本次集成方案命名…

gorm使用注意事项

1. 使用updates更新字段为0或""时 在updates更新时,会默认将数值为0、字符串为""等忽略掉,不会更新;比如 db.Model(&user).Updates(User{Name: "hello", Age: 18, Active: false, Games: 0, Friend: &qu…

docker compose - 设置名字

只使用 docker compose up 启动容器,默认名字为当前文件夹的名字 设置 project-name,docker 客户端会显示设置的名字,方便区分 docker compose --project-name webtest up错误: docker compose up --project-name webtest 效果…

破解反向代购复杂挑战,一站式简化逆向海淘购物

在全球化日益加深的今天,反向代购行业迎来了前所未有的发展机遇,同时也伴随着一系列挑战。这些企业不仅需要穿梭于世界各地的商场与网店,搜罗各式各样的商品,还要应对商品众多、客户下单繁杂以及客户细分需求多样化的现实问题。想…

户型超赞!招商“超级大城”再腾飞!三期新品全面升级!即将首开!

2024年9月底,美联储降息带来整体政策方向全面转变楼市组合大招密集落地,力度非同寻常。先是降息、降准、降存量房贷利率等货币宽松政策,到国家首提“止跌回稳”再到上海、深圳等一线城市连夜出台限购优化政策。在利好扶持重磅加码&#xff0c…

Web3 游戏周报(11.03 - 11.09)

回顾上周的区块链游戏概况,查看 Footprint Analytics 与 ABGA 最新发布的数据报告。 【11.03 - 11.09】Web3 游戏行业动态: Ton Accelerator 推出名为「Synergy」的 500 万美元计划,旨在推动跨链创新,创造 TON 用户与 EVM 网络适应…

Kafka面试题解答(一)

1.kafka消息发送的流程? 生产者: 在消息发送的过程中涉及到了两个线程:main线程和sender线程。在main线程中创建了一个双端队列RecordAccumulator(默认32m)。main线程将消息发送到RecordAccumulator,sender线程不断地…

从规划到执行:高效项目进度管理流程与技巧

项目进度管理是项目管理的一个重要组成部分,包括规划、组织和管理活动和资源,确保项目按时完成。 该流程首先明确定义实现项目目标所需的所有任务和活动,并将它们细分为更小、更易管理的项目模块,以便于全面规划和执行。项目进度…

【故障分析】屏幕显示系统无法找到根文件系统 (/dev/mapper/rhel-root)

此屏幕显示系统无法找到根文件系统 (/dev/mapper/rhel-root)。这通常是由于逻辑卷管理器(LVM)配置出现问题,或是 /etc/fstab 文件中的问题引起的。 以下是一些排查此问题的步骤: 检查 LVM 分区: 运行命令 ls /dev/mapper/ 查看是否存在 LVM 卷。 如果不存在,可能是 LVM …