1. 引言
Llama 3.2-Vision多模态大型语言模型(文本 + 图像)是一个图像推理生成模型,按照官方的说法,在常见行业基准测试上,其性能优于许多可用的开源和闭源多模态模型。Llama 3.2-Vision有两个版本,一个是11B (7.9G),另一个是90B (55G)。在之前的文章中【能够识别中文的视觉模型比较;视觉模型在岩石工程中的应用 (识别GSI图): Llama 3.2 vs ChatGPT-4o】,我们测试了在线的llama-3.2-vision-90b-instruct模型,结果显示Llama 3.2 90B不太适合岩石工程的图表解释,它更适合于目标检测的应用。
现在,我们在本地可以使用这两个版本的模型:llama3.2-vision:90b和llama3.2-vision:latest,不过,尽管90b模型也能够生成结果,但运行速度极慢,相比之下,11b模型的运行很流畅。
2. 多线程运行
为了在一个代码中,同时运行多个模型,我们之前采用的方法是循环,例如:
models=[qwen2.5:32b, llama3.2:latest, deepseek-v2:latest]
然后
for each_model in models:....
在这个试验中,使用了多线程同时运行两个模型,因此产生的结果不像循环方法顺序生成的,而是随机出现的:
models = ['minicpm-v', 'llama3.2-vision']
image_path = 'image.jpg'
# 创建线程
threads = []
for model in models:thread = threading.Thread(target=chat_with_model, args=(model, image_path))threads.append(thread)thread.start()
# 等待所有线程完成
for thread in threads:thread.join()
使用了两个本地视觉模型minicpm-v和llama3.2-vision。《计算岩土力学》之前讨论的多线程主要是与Itasca软件相关:
3. 测试
下图所示的是Cariboo Gold Project地下矿的一个斜坡道入口。现在采用上述两个模型对这个图像进行解释。
(1) 图片显示的是隧道入口建成后不久的景象,很可能是Cariboo黄金项目区域内矿山基础设施项目的一部分,森林丘陵和梯田土壤的存在表明了在施工活动中的环境管理努力,这可能表明采矿作业中的可持续发展做法。
(2) 图片描述的是一个矿井的入口,入口由混凝土块建成,呈拱形,为周围的土提供结构支撑和稳定性。主要特点如下:
(a) 入口:入口是工人、设备和材料进入矿井的主要入口。
(b) 结构支撑:拱形设计的入口有助于在整个结构上均匀分布重量,防止土压造成的坍塌或损坏。
© 出入口:出入口为进入地下区域提供了一个安全可靠的途径,可确保人员安全并将潜在危险降至最低。
图片是在Cariboo黄金项目拍摄的,表明该入口是正在进行的采矿作业的一部分。背景中树木表明该项目位于农村或偏远地区,可能道路或基础设施有限。
(3) 图片显示的是矿井的入口,这是Cariboo黄金项目基础设施的重要组成部分。入口是人员、设备和材料进出隧道或矿井的出入口。在这张图片中,入口似乎正在施工,周围有明显的挖掘和准备工作的痕迹,周围地区看起来荒芜而多岩石,表明该项目是在偏远或崎岖的地方进行的。入口本身是用混凝土块建成的,可提供结构支撑和保护,在隧道入口处可以看到一个闸门,很可能是用来控制进出和确保矿井内安全的。总之,这张图片为我们了解Cariboo黄金项目入口的施工阶段提供了宝贵的资料,突出了精心规划和执行对于建造一个安全高效的地下作业入口的重要性。
(4) 图片描述的是一个地下通道的入口,很可能是Cariboo黄金项目矿区采矿作业相关基础设施开发的一部分。该结构由混凝土和砖砌成,并有台阶通往地下通道,表明其功能是供车辆或行人通过高架地形。在背景中有大量的推土活动,表明在这个被森林环绕的偏远地区正在进行施工。
如何学习AI大模型?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业
?”“谁的饭碗又将不保了?
”等问题热议不断。
不如成为「掌握AI工具的技术人
」,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高
那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料
分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈
学习路线
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓