TripoSR模型构建指南

一、介绍

TripoSR 是由 Tripo AI 和 Stability AI 合作开发的最先进的开源模型,用于从单个图像进行快速前馈 3D 重建。利用大型重建模型(LRM)的原理,TripoSR 带来了关键的进步,大大提高了 3D 重建的速度和质量。该模型的特点是能够快速处理输入,在 NVIDIA A100 GPU 上在不到 0.5 秒的时间内生成高质量的 3D 模型。

二、构建流程

1. 基础环境

  • 系统:Ubuntu系统,显卡:3090,显存:24G
  • 权重文件:config.yaml model.ckpt config.json u2net.onnx
  • 查看系统是否有Miniconda3的虚拟环境
    conda -V
    如果输入命令没有显示Conda版本号,则需要安装。

安装教程可查看*~~(gitee.com)https://e.gitee.com/gz_donkey/docs/2504450/file/5797611?sub_id=11485950&scope=root~~*

屏幕截图

2. 更新系统命令

输入下列命令将系统更新及系统缺失命令下载

apt-get update apt-get upgrade apt-get install -y vim wget unzip lsof net-tools openssh-server git git-lfs gcc cmake build-essential

3. 下载模型

输入下列命令对TripoSR模型进行下载

git clone https://gitclone.com/github.com/VAST-AI-Research/TripoSR.git

4. 创建虚拟Python环境

  • 创建一个名为"tsr"的虚拟镜像,python版本为3.10
conda create -n tsr python=3.10
  • 进入"tsr"虚拟环境
conda activate tsr

屏幕截图

5. 安装pytorch

  • 换国内源提升下载速度,出现“Writing to /root/.config/pip/pip.conf”则换源成功
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.douban.com

屏幕截图

  • 输入下列命令对pytorch进行安装
pip3 install torch torchvision torchaudio

屏幕截图

系统下载过程中,切勿有任何操作,直到出现“Successfully installed......”开头则表示安装结束并且成功。

屏幕截图

6. 下载模型依赖包

  • 使用Pip升级pip本身和setuptools
pip install --upgrade setuptools

微信截图_20240729110233.png

  • 找到模型TripoSR模型文件进入requirements.txt文档中,将第四个“git+https://github.com/tatsy/torchmcubes.git”

改为:“git+https://gitclone.com/github.com/tatsy/torchmcubes.git”

git+https://gitclone.com/github.com/tatsy/torchmcubes.git
  • 进入模型文件并下载模型依赖包
cd TripoSR
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

系统下载过程中,切勿有任何操作,直到出现“Successfully installed......”开头则表示安装结束并且成功。

微信截图_20240729111327.png

7. 添加权重文件

  • 首先进入gradio_app.py文件中将最后几行代码删掉

微信截图_20240729114218.png

第一次运行项目时需要下载config.yaml和model.ckpt权重文件

export HF_ENDPOINT=https://hf-mirror.comexport GRADIO_SERVER_NAME=0.0.0.0export GRADIO_SERVER_PORT=8080python3 gradio_app.py

微信截图_20240729112202.png

此时已下载config.yaml权重文件,仍需要model.ckpt权重

其查看路径如下:/root/.cache/huggingface/hub/models--stabilityai--TripoSR/snapshots/2ba2f5591f8eb0821784764ab9ab99a12e1abb08/

屏幕截图

第二次运行项目时需要下载config.json权重文件

export HF_ENDPOINT=https://hf-mirror.comexport GRADIO_SERVER_NAME=0.0.0.0export GRADIO_SERVER_PORT=8080python3 gradio_app.py

屏幕截图

其查看路径如下:/root/.cache/huggingface/hub/models--facebook--dino-vitb16/snapshots/f205d5d8e640a89a2b8ef0369670dfc37cc07fc2/

屏幕截图

第三次运行项目时需要下载u2net.onnx权重文件

export HF_ENDPOINT=https://hf-mirror.comexport GRADIO_SERVER_NAME=0.0.0.0export GRADIO_SERVER_PORT=8080python3 gradio_app.py

屏幕截图

三、网页演示

使用下列命令运行项目呈现模型的成功界面

export GRADIO_SERVER_NAME=0.0.0.0 export GRADIO_SERVER_PORT=8080 python3 gradio_app.py

屏幕截图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1523700.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【ISSCC】论文详解-34.6 28nm 72.12TFLOPS/W混合存内计算架构

本文介绍ISSCC34.6文章,题目是《A 28nm 72.12TFLOPS/W Hybrid-Domain Outer-Product Based Floating-Point SRAM Computing-in-Memory Macro with Logarithm Bit-Width Residual ADC》(一种28nm 72.12TFLOPS/W混合域外积浮点SRAM存内计算宏单元&#xff…

AI Dify + 大模型+ Agent 详细教程 从0-1教你构建小助手

前言 Dify 是一个易于使用的 LLMOps 平台,提供了多种应用程序类型和模板,包括 AI 聊天机器人、代码转换器、SQL 生成器、新闻内容编写、创意脚本等。团队使用 Dify,可以基于 GPT-4 等模型快速「开发部署」 AI 应用程序并进行可视化操作&…

python学习13:对excel格式文件进行读写操作

读取excel的话需要下载第三方库: 常用的库:xlrd(读),xlwt(写),xlutils,openpyxl[-----pip install xxx-------] 这里推荐openpyxl pip install openpyxl excel读取的基本操作 # 2)基本操作: # 2.1)打开文件,获取工作簿 filename rD:\stdutyZiLiao\pythoneProje…

面试总结1

1.数据库查询语句,找重复名字。有三列(名字、班级、姓名) 2.问3范式,字段类型,前两个是project_id:项目编号(可以包含字母和数字)project_name:项目名称(可以…

【C++】vector(下)--上篇

个人主页~ vector(上)~ vector 二、vector的模拟实现1、了解组成2、vector.h(1)为什么有了size_t参数的vector构造函数还要再写一个int参数的重载vector构造函数(2)为什么reserve不用memcpy(3&…

【C语言】零碎知识点(易忘 / 易错)总结回顾

一、数据类型 1、%p —— 以地址的形式打印 2、整型在内存中的存储 (1)原码、反码、补码 计算机中的有符号数有三种表示方法:原码、反码和补码。 三种表示方法均有符号位和数值位两部分,数值位三种表示方法各不相同。 原码&a…

Redis数据结构与连接

1 基本的数据结构 1.1 string string的实现有多种 int:字符串长度小于等于20且能转成整数raw:字符串长度大于44embstr:字符串长度小于等于44 字符串长度小于1M 时,加倍扩容;超过 1M 每次只多扩1M;字符串…

MySQL:表创建指南

前言 随着信息技术的飞速进步,数据库设计的优劣对系统性能产生了决定性影响。 一个精心设计的数据库不仅能显著提升应用效率,还能确保数据的安全和一致性。 本文将以一张具体的实体-关系图(E-R图)为基础,详细阐述如…

HarmonyOS NEXT开发:UI导航栏组件-NavigationBarView

NavigationBarView 是什么? NavigationBarView是ArkTS上的UI自定义导航栏组件,内置了导航栏的返回按钮、标题、搜索入口、右侧按钮等常用微功能。NavigationBarView结构展示 NavigationBarView ├── back │ ├── back_icon │ …

全倒装COB超微小间距LED显示屏比正装COB小间距的优势在哪些方面

在全倒装COB超微小间距LED显示屏与正装COB小间距显示屏的激烈对比中,我们不得不深入探讨其各自在技术创新、显示效果、以及应用领域的独特优势。 全倒装技术作为LED显示领域的一项重大突破,其核心在于将LED芯片直接倒装焊接在基板上,这一创新…

RFID光触发标签与端口自检功能新型光交箱哑资源管理方案

在通信行业的快速发展进程中,光交箱作为关键的网络节点,其哑资源的有效管理对于保障通信服务的质量和稳定性至关重要,传统的管理方式在面对日益庞大和复杂的光交箱哑资源时,逐渐显露出诸多弊端,如资源信息不准确、故障…

PDF转PPT,四款神器助你一臂之力!

亲爱的朋友们,你们在日常的工作和生活中有没有遇到过需要将PDF文件转换成PPT格式的情况呢?今天,我就来给大家推荐四款非常好用的工具,让你轻松应对PDF转PPT的难题! 一、福昕转换器 直通车(粘贴到浏览器打…

最新版php进销存系统源码 ERP进销存专业化管理 永久免费升级更新+完整图文搭建教程

在当今信息化时代,企业管理的高效性与精确性是企业竞争力的关键。分享一款最新版的PHP进销存系统源码,一款专为企业设计的ERP进销存管理工具,其丰富的功能、灵活的子账号设置、强大的权限控制、以及独家升级的合同管理和报价单打印功能&#…

数据仓库系列11:ETL的主要步骤是什么,它们分别有什么作用?

你是否曾经感觉被海量数据淹没?是否在寻找一种方法来有效地整合、转换和加载这些数据?如果是,那么你来对地方了。今天,我们将深入探讨ETL(Extract, Transform, Load)过程的三个关键步骤,这是每个大数据开发者都应该掌握的核心技能。准备好踏上成为数据整合大师的旅程了吗?让…

[B站大学]Zotero7教程

参考资料: https://www.bilibili.com/video/BV1PSvUetEQX 2. 账号注册与同步 本节内容参考zotero中文社区文档:https://zotero-chinese.com/user-guide/sync 2.1 数据同步 首先注册一个Zotero官方账户。登录账号密码。 2.2 文件同步 按照文档,推荐…

Kafka3.x 使用 KRaft 模式部署 不依赖 ZooKeeper

前言 Kafka 从 2.8.0 版本开始引入了 Kafka Raft Metadata Mode(KRaft 模式),这个模式允许 Kafka 在不依赖 ZooKeeper 的情况下进行元数据管理。KRaft 模式在 Kafka 3.0.0 中进入了稳定版本,本文部署的 Kafka_2.12-3.6.0 单机模式 环境 Ce…

从Deepfake事件透视:人工智能如何重塑安防监控的未来

近年来,随着人工智能技术的飞速发展,特别是深度伪造(Deepfake)技术的出现,引发了社会各界的广泛关注与讨论。Deepfake技术通过深度学习算法,将个人的声音、面部表情及身体动作拼接合成虚假内容,…

什么是基于云的 SIEM

随着企业不断将业务迁移到数字世界,网络威胁的领域也在不断扩大,随着时间流逝,新的威胁不断出现,手段也变得更加巧妙。一个关键问题出现了:组织如何保护其敏感数据、资产和声誉免受网络威胁?这就是基于云的…

10.5 传输层协议(TCP和UDP)

传输层协议 TCP 关键特性 传输层协议 TCP 头部 传输层协议 TCP 三次握手 传输层协议 UDP 真题 1

raksmart香港大带宽服务器地址

RAKsmart香港大带宽服务器的地址是由RAKsmart公司提供的香港机房所在地,具体地址未在公开资料中披露,但其主要特点是提供高带宽且不限制流量的服务。 RAKsmart是一家成立于2012年的美国公司,其香港机房以提供大带宽、直连内地的优化线路和丰富…