计算相机运动
对极几何(Epipolar Geometry)
下图表示在两帧图像$I_1,I_2$中,点$P$投影到两张图像中为$p_1,p_2$。两个相机中心分别$O_1,O_2$,假设第一帧到第二帧的运动为$[R,t]$.
- 极平面(Epipolar plane): $O_1O_2P$三点组成的平面
- 极点(Epipolar): $e_1,e_2$
- 基线: $O_1O_2$连线
- 极线: $l_1,l_2$
设点$P$在世界坐标系下表示为:
$P=[X,Y,Z]^T$
为方便计算,以$O_1$为世界坐标系,$O_2$在$O_1$坐标系下的运动为$[R,t]$,则$P$在$O_1$和$O_2$坐标系下分别表示为:
$P_1=[X_1,Y_1,Z_1]^T=P\ P_2=[X_2,Y_2,Z_2]=RP_1+t=RP+t$
跟拒相机模型:
通过转换可以推导出:
这被称为对极约束.事实上这个公式的几何意义是$O_1,P, O_2$三点共面。
令$E=[T_\times]R, F=K^{-T}[T_\times]RK^{-1}$,分别记为本质矩阵(Essential Matrix) $E$和基础矩阵(Fundamental Matrix) $F$.
根据对极约束求解相机姿态:
- 根据匹配点求出基础矩阵或本质矩阵
- 根据基础矩阵或本质矩阵求解旋转矩阵和平移向量
本质矩阵
- 由于对极约束是等市为0的约束,乘以任意常量等市一人成立,这被称为$E$在不同尺度的等价性。
- 根据$E=[T_\times]R$,本质矩阵奇异值必定是$[\sigma,\sigma,0]^T$的形式,这被称为本质矩阵的内在性质。
- 平移和旋转各有三个自由度,加起来为6个。又由于尺度等价性,本质矩阵的实际自由度为5个
本质矩阵常用经典的八点法(Eight-point-algorithm)进行求解。
令$x_1=K^{-1}p_1, x_2=K^{-1}p_2$, 则$x_2^TEx_1=0$.
根据$x_1, x_2$的归一化坐标和对极约束:
$$\left(u_{2}, v_{2}, 1\right)\left(\right)\left(\right)=0 \ \text{(这里$x_1,x_2$的坐标并不是指真实的像素坐标$p_1,p_2$,而是经过相机外参矩阵变换过后的归一化坐标)}$$
写成向量形式:
这就转化为一个齐次线性方程求解的问题。
一般采用SVD和最小二乘法进行求解。解空间为A矩阵的零空间。而零空间即是V矩阵的列向量。为了约束e的二范数最小,一般取最小特征值对应的列向量作为解。
本质矩阵分解相机运动
- 解的判断。任取一点对四个解进行验证,只有在两个相机下都具有正的深度的是合理的解。
- 根据SVD分解出的特征值可能不是$[\sigma,\sigma,0]^T$的形式。若$\Sigma=[\sigma_1,\sigma_2,\sigma_3]^T, (\sigma1\geq\sigma_2\geq\sigma_3)$,则可以取$\Sigma=[\frac{\sigma_1+\sigma_2}{2},\frac{\sigma_1+\sigma_2}{2},0]^T$或直接取$\Sigma=[1,1,0]^T$。由于尺度不变性,这样取也是合理的。
单应矩阵
H: homography.
单应矩阵通常描述处于共同平面的一些点在两张图像之间的变换关系。所以单应矩阵多适用于平面场景中的姿态估计。