当前位置: 首页 > news >正文

三维重建技术的最新进展

随着深度学习技术席卷计算机视觉领域,传统的基于图像几何关系的sfm和SLAM技术面临新的挑战,一方面基于深度学习的技术提供了新的视角影响计算机视觉的发展,另一方面深度学习的方法通常需要巨大的计算量限制了它的实用化,不管怎么样这些新技术都有很高的研究价值,虽然现在还不大可能在工程项目中直接使用这些技术,但随着手机,车载系统,ROS硬件水平的提高,这些新技术也许能找到用武之地。下面分类介绍一些这样的新技术。

NeRF:Representing Scenes as Neural Radiance Fields for View Synthesis
简介:深度学习与三维重建技术结合的开山之作,诞生了无数基于此技术的研究创新论文,随便在网上搜索一下就能搜出一大堆来,该方法通过使用multilayer perceptron (MLP),把三维场景用一个体函数表示,渲染的时候,根据视角位置和方向,生成体像素,最后用体渲染的方式显示出新位置的视觉效果。
代码:https://github.com/bmild/nerf

3D Gaussian Splatting for Real-Time Radiance Field Rendering
简介:短时间内迅速火爆三维重建领域,用3D高斯球点云描述三维场景,然后用分块光栅化进行渲染,论文的突破点在于实现快速的训练和渲染效果。话说在一块价格几万块的A6000GPU上跑100fps有点夸张。
代码:https://github.com/graphdeco-inria/gaussian-splatting

3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting
简介:Nvidia对于3DGS的扩展,使用raytracing进行渲染。总之都是效果奇好,速度奇慢,给显卡做广告到是不错。
代码:https://github.com/nv-tlabs/3dgrut

MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors
简介:先由两张图片生成pointmap,然后再与当前关键帧做匹配,跟踪估计位姿并做pointmap融合,如果有新的关键帧则做回环检测和优化。应该算是比较完整的稠密SLAM方案。不依赖相机的类型约束也是一大亮点,相机可以做镜头缩放而不影响跟踪效果。
代码:https://github.com/rmurai0610/MASt3R-SLAM

LODGE:Level-of-Detail Large-Scale Gaussian Splatting with Efficient Rendering
简介:Google对3DGS的扩展,对场景使用LOD减少内存占用和加快渲染速度。在iphone 13 mini上能跑41fps,感觉性能还可以,推荐看一下。
代码:https://lodge-gs.github.io

MVSAnywhere: Zero-Shot Multi-View Stereo
简介:基于transformer架构的多视角深度估计算法。看论文介绍,该技术可以同时对室内外场景进行深度估计,看网站视频,对于室外大场景的深度估计还是很震撼的,推荐一下。
代码:https://nianticlabs.github.io/mvsanywhere/

MapAnything: Universal Feed-Forward Metric 3D Reconstruction
简介:基于transformer的架构把许多不同输入的图片和相机配置,一步直接生成三维场景,相当神奇。
代码:https://github.com/facebookresearch/map-anything

http://www.zskr.cn/news/171492.html

相关文章:

  • 基于Python的个性化电影推荐可视化系统的设计与实现爬虫可视化
  • 镜像容器相关命令,docker export/import/save/load/commit,导出容器给别人使用
  • 基于Python的摄影师婚纱租赁 预约与交易系统vue
  • 2025.11.8上机实验二:逻辑回归算法实现与测试
  • 中信银行信用卡中心Android高级研发工程师岗位深度解析与技术面试指南
  • 清华大学开源镜像站配置PyTorch源的方法详解
  • 2025.10.30非遗声景漫游馆(项目架构文档)
  • 文法定义了一个典型的表达式文法,支持加法和乘法,具有左递归以实现左结合
  • 2025.11.3社区智慧共享资源管理系统(项目概述文档)
  • 蜕茧成蝶:当代码遇见了工程
  • 从文法的开始符号出发,尝试通过一系列最左推导,构造出与输入串完全匹配的语法树
  • 2025.11.4社区智慧共享资源管理系统(技术架构文档)
  • 2025.11.5社区智慧共享资源管理系统(部署和运行文档)
  • 编译原理中**语法制导翻译**(Syntax-Directed Translation, SDT)在中间代码生成阶段的核心机制
  • Springmvc的底层原理流程描述
  • 布尔表达式的文法与代码结构在编译原理中属于**中间代码生成**阶段的重要内容
  • FIRST/FOLLOW 集是编译原理中语法分析阶段的重要工具,主要用于自顶向下语法分析(如 LL(1) 分析)
  • 江湖四门:邪术门派的绝密智慧
  • 自动驾驶,AutoWareAuto框架全框架梳理思维导图及代码注释。 授人以鱼不如授人以渔,涵...
  • 昆仑 MCGS 与台达 B2 伺服通过 Modbus RTU 通讯控制教程
  • 三菱通过485BD板CRC指令通讯示例(不含详细校验程序)
  • 西门子S7 - 200与两台变频器Modbus RTU通信实战
  • 西门子博图电机控制块实战指南
  • 目标是对输入串 `abbcde#` 进行**自底向上的规范归约**,即使用 LR 分析技术中的“移进-归约”方式
  • 线程池配置-七大关键参数
  • 西门子S7-1500 PLC程序案例:制药厂洁净空调BMS系统(含冷水机组及洁净室空调机组控制
  • 计算机Java毕设实战-基基于SpringBoot+Vue的高校学习讲座预约管理系统设计于SpringBoot的高校学习讲座预约系统的设计与实现【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 2025.10.24AI儿童故事生成系统
  • 西门子1200博途程序与威纶触摸屏画面实例:V15及以上博图版 - 上位机通讯、modbus4...
  • 推荐阅读:阿里通义千问 Qwen-3-Max-Preview:大模型技术演进的新里程碑