在ar、vr、3d打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3d模型非常重要。
传统方法创建模型需大量时间,专业设备和技术人员才可完成。

相反,在日常生活中,我们通常使用手机相机或在网页上找到的人像照片。
因此,一种能从单张图像准确重建3D人体模型的方法可以显著降低成本,并简化独立创作的过程。
以往方法(左)与本文方法技术路线比较(右)
以往的深度学习模型用于3D人体重建,往往需要经过三个步骤:从图像中提取2D特征,将2D特征转到3D空间,以及3D特征用于人体重建。
然而这些方法在2D特征转换到3D空间的阶段,往往忽略了人体先验的引入,导致特征的提取不够充分,最终重建结果上会出现各种缺陷。
SIFU与其他SOTA模型重建效果比较
此外,在对纹理预测的阶段,以往模型仅仅依靠训练集中学得的知识,缺少真实世界的先验知识,也往往导致不可见区域的纹理预测较差。

SIFU在纹理预测阶段引入先验知识,增强不可见区域(背部等)的纹理效果。
对此,来自浙江大学ReLER实验室的研究人员提出SIFU模型,依靠侧视图条件隐函数从单张图片重建3D人体模型。
图片
论文地址:https://arxiv.org/abs/2312.06704
项目地址:https://github.com/River-Zhang/SIFU
该模型通过在2D特征转换到3D空间引入人体侧视图作为先验条件,增强几何重建效果。并在纹理优化阶段引入预训练的扩散模型,来解决不可见区域纹理较差的问题。
模型pipeline如下:
图片
该模型运行可分为两个阶段,第一阶段借助侧隐式函数重建人体的几何(mesh)与粗糙的纹理(coarse texture),第二阶段则借助预训练的扩散模型对纹理进行精细化。
在第一阶段中,作者设计了一种独特的Side-view Decoupling Transformer,通过global encoder提取2D特征后,在decoder中引入了人体先验模型SMPL-X的侧视图作为query,从而在图像2D特征中解耦出人体不同方向的3D特征(前后左右),最后用于重建。
该方法成功的在2D特征转换到3D空间时结合人体先验知识,从而使得模型有更好的重建效果。
SCISPACE
AI论文研究助手,探索和解释论文的平台
65
查看详情
在第二阶段,作者提出一种3D一致性纹理优化流程(3D Consistent Texture Refinement),首先将人体不可见的区域(侧面、背面)可微渲染成视角连续的图片集,再借助在海量数据中学习到先验知识的扩散模型,对粗糙纹理图片进行一致性编辑,得到更精细的结果。最后通过精细化前后的图片计算损失来优化3D模型的纹理贴图。
更高的重建精度
在实验部分,作者
使用全面多样化的测试集对他们的模型进行测试,包括CAPE-NFP、CAPE-FP和THuman2.0,并与以往发表在各大顶会的单张图片人体重建SOTA模型进行比较。经定量测试,SIFU模型在几何重建与纹理重建中均表现出了最好的效果。
定量评估几何重建精度
定量评估纹理重建效果
使用互联网中公开图片作为输入进行定性效果展示
以往的模型应用训练集以外的数据时,由于估计的人体先验模型SMPL/SMPL-X不够准确,往往导致重建结果与输入图片相差甚远,难以投入实际应用。
对此,作者专门对模型的鲁棒性进行了测试,通过在ground truth先验模型参数中加入扰动使其位姿发生偏移,模拟真实场景中SMPL-X估计不准确的情况,来评估模型重建的精度。结果表明SIFU模型在该情况下,依然具有最好的重建精度。
评估模型面对有误差的人体先验模型时的鲁棒性
使用真实世界中的图片,在先验人体模型估计不准确的情况下,SIFU依然有较好的重建效果
SIFU模型的高精度高质量重建效果,使得其具有丰富的应用场景,包括3D打印、场景搭建、纹理编辑等。
3D打印SIFU重建的人体模型
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

SIFU用于3D场景搭建

借助公开动作序列数据,可对SIFU重建的模型进行驱动
本文提出侧视图条件隐式函数和3D一致性纹理编辑方法,弥补了以往工作在2D特征转换到3D空间、纹理预测时对先验知识引入的不足,极大的提高了单张图片人体重建的精度和效果,使模型在真实世界应用中具有显著的优势,也为该领域未来的研究提供了新的思路。
参考资料:
https://arxiv.org/abs/2312.06704
以上就是浙大提出新SOTA技术SIFU:仅需一张图片即可重建高质量3D人体模型的详细内容,更多请关注其它相关文章!
# 开源
# 网站建设 大兴区
# 外贸建设网站的公司
# 企业网站的建设方案
# 鼓楼网站建设价位
# 严查广西建设系统网站
# 电信推广营销策略有哪些
# seo网站优化工程师
# 英文网站优化ppt照片
# 河池网站优化找哪家
# 谢家集区关键词seo排名优化
# 不准确
# 3D
# 仅需
# 好用
# 十大
# 最好的
# 前十
# 以往
# 建新
# 高质量
# SOTA
# 方法
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
优化推广96088 】
【
技术知识133117 】
【
IDC资讯59369 】
【
网络运营7196 】
【
IT资讯61894 】
相关推荐:
上海发布大模型政策 打造AI“模”都
清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳
衡水市冀州中学机器人社团在世界机器人大赛中斩获佳绩
英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言
全新小艺搭载AI大模型,有效提升学生和职场人士的工作效率
Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙
人工智能如何帮助制造业?
曝光HarmonyOS 4的重要新能力:全面升级AI大模型,小艺实现全面进化
自己动手使用AI技术实现数字内容生产
挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判
走进首家“元宇宙”未来工厂,卡奥斯探知工业之旅出发!
对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型
周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资
小岛秀夫不反对使用AI 但认为人类应该凌驾于AI
石头扫拖机器人 G20 618 福利来袭:4999 元,超值配件领到手软
中国电信AI能力通过国家级金融领域权威认证并荣膺AI国际头部竞赛冠军
“痴迷”元宇宙,魔珐科技想做什么?
字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉
严打“黑飞”,无人机检测反制设备护航大运会净空安全
【机智云物联网低功耗转接板】远程环境数据采集探索
6月14日《星空下的对话》 张朝阳陆川将畅聊人生、电影、心理学与AI
边喷火边跳踢踏舞,机器狗最新技能爆火全网!网友直呼真·热狗
高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案
零数科技CTO兰春嘉:区块链与人工智能的结合点在数据
改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键
谷歌推出RT-2视觉语言动作模型,使机器人能够掌握垃圾丢弃技能
视觉中国推出AI灵感绘图功能,付费后可在“合法合规前提下使用”
2025 年开发者必须知道的六个 AI 工具
能走、能飞、能游泳,科学家打造全能 M4 机器人
《爱康未来之夜嘉宾官宣,携手共赴AI未来》
数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念
数字文明尼山对话 | 在东方圣城与AI潮流梦幻联动,看“智慧大脑”让数字山东更美好
PS AI修图免费平替来了!Stability AI又放大招,核弹级更新一键扩图
上新7款产品,美图继续“蹭”AI
国家发改委组织工业机器人产业高质量发展现场会
社区里,孩子们体验“机器人竞技”
联通发布鸿湖图文AI大模型1.0,可实现以文生图
尼康尼克尔Z 180-600mm f/5.6-6.3 VR镜头发布:12499元 拍鸟神器
谷歌推出 SAIF 框架,倡导安全环境下探索和发展人工智能
昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布
从谷歌到亚马逊,科技巨头们的AI痴迷
AI大模型,将为智慧城市带来哪些新变化?
华为余承东表示:鸿蒙可能拥有强大的人工智能大模型能力
美图发布国内首个“懂美学的”AI视觉大模型MiracleVision
这款在《自然通讯》发表的机器人,为变形金刚来到现实创造可能性
Meta 推出 Quest 超级分辨率技术,让 VR 画面更清晰
人工智能如何与智能家居集成
Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月
你大脑中的画面,现在可以高清还原了
2024-01-18
运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。