3D Gaussian Splatting 真实场景的光场图像渲染

2024-08-022025-04-03 projects 7 minutes read (About 988 words) 0 visits

一、基本原理实现

3DGS 将稀疏的点云变成 3D 空间中的椭球体，每个椭球体拥有位置、颜色、不透明度、协方差（大小），当混合在一起时，可以产生从任何角度渲染的完整模型的可视化效果；

整体框架

通过 SfM 获取初始化稀疏点云（采样点）；
基于初始化点云生成 3D 高斯椭球集；
利用投影矩阵将 3D 高斯椭球投影的 2D 平面；
进行场景渲染（分 tile 16*16）；
计算 Loss 以及梯度回传；
基于梯度自适应改变点云的分布方式；

二、构建场景数据

针对实际场景重建需要获取场景各个角度的图片，并且每张照片尽量保持一致的曝光。由于也可以录制视频提取单帧来获取图片，因此构建场景数据集主要通过以下两种方式：

获取重建场景各个角度图片，尽量保持一致曝光，推荐100-1000张；
利用 FFMPEG工具构建真实场景数据集

使用的基本命令如下，video_addr 指的是实际视频文件地址，FPS 主要影响每秒采多少帧的图像：

1	ffmpeg -i {video_addr} -qscale:v 1 -qmin 1 -vf fps={FPS} %04d.jpg

构建的场景数据集
数据集目录结构

<dataset_name>
|---input
|   |---<image 0>
|   |---<image 1>
|   |---...

三、获取相机位姿

3DGS 需要利用稀疏点云作为输入进行建模，因此我们需要针对场景数据集建立点云。本项目中我们可以利用 COLMAP 获取相机位姿建立点云，安装完成后在终端执行以下命令，完成相机位姿和点云的建立：

1	python convert.py -s data/dataset_name

可视化相机位姿与点云

借助 COLMAP 工具我们可以对真实场景建立稀疏点云以及对应的相机位姿。

<dataset_name>
|---input
|---distorted
|---images
|---sparse
|   |---0
|   |   |---cameras.bin
|   |   |---images.bin
|   |   |---points3D.bin
|---stereo
|---...

四、3DGS训练模型

针对构建好的真实场景数据以及 COLMAP 估计出的相机位姿，利用 3DGS 训练场景数据集对应的模型：

1	python train.py -s data/playroom

模型训练损失

场景渲染对比

训练完成后，会得到如下目录结构，其中 point_cloud.ply 就是训练好的点云模型文件。

output
|---<Env_ID>
|   |---point_cloud
|   |   |---iteration_7000
|   |   |   |---point_cloud.ply
|   |   |---iteration_30000
|   |   |   |---point_cloud.ply
|   |---cameras.json
|   |---cfg_args
|   |---events.out...
|   |---input.ply