CHMOP planner
CHMOP: Covariant Hamiltonian Optimization for Motion Planning
introduction
轨迹优化在最优控制问题上已能得出最优的结果,而受限于计算资源和局部极值,这一方法很少在运动规划上有类似的成果。而本方法致力于在综合考虑动力学,平滑性和避障的基础上产生最优的运动规划结果。
基于以下两个原则:
- Gradient information is often available and can be computed inexpensively.
- Trajectory optimization should be invariant to parametrization
突破限制:
- 使用蒙特卡罗(Hamiltonian Monte Carlo, HMC) 进行采样,同时产生扰动避免局部极值
- 运动学约束可以被加入到约束流形中,加速迭代
自身局限:
- 不适于高维运动规划
objective functional
- smooth gradient
- obstacle gradient
- update trajectory
障碍物梯度信息:
- integrate across time: moving more quickly through regions of high cost will be penalized less(在时间上积分并不理想,因为如果该点处移动很快,则时间就会很小)
- integrate with respect to an arc-length parameterization: (因此选择根据参数曲线的弧长进行积分,计算代价时考虑的是路径本身的长度,而不是机器人在路径上的速度或花费的时间。使用弧长参数化后,目标函数就不会受速度变化的影响,只和路径的形状有关。通过这种方式,无论机器人沿路径移动的快慢如何改变,都不会影响到总的路径长度和因而产生的总代价?根据这个直观的理解,(functional gradient)的表现形式是将工作空间梯度投影到与运动方向垂直的二维平面上。 这里所说的“投影”意味着我们只考虑那些直接指向提高路径效率(减少代价)的方向的梯度成分。)
- $\xi$: 运动轨迹,机器人构形相对时间的函数。$\xi(0)=q_0, \xi(1)=q_1$
- $\mathcal{F}_{\text {obs }}[\xi]$: 环境障碍物惩罚函数
- $\mathcal{F}_{\text {smooth }}[\xi]$: 动力学平滑惩罚函数
- $x(\xi(t), u)$: 由轨迹点和机器人局部任一位置(body point)定义的全局位置点(workspace position)
- $x'$: 全局位置点的速度
- $\nabla c(x)$: collision cost 的梯度
障碍物惩罚函数定义为对机器人上每一个点的colliison cost在空间和时间上的积分。
为简化计算,在每一时刻只计算最大cost的点。
平滑性以加速度衡量。
functional gradient: 泛函梯度
梯度下降:
pseudocode
smooth_cost_i = (p[i+1] - p[i] + p[i-1] ) / (dt * dt)
// cost 是一个数值
// grad 表明了方向
if d < 0:
obs_grad = -gradient
obs_cost = -d + thres_/2.0
else if d < thres_:
obs_cost = (d - thres_)^2 / (2*thres_)
obs_grad = (d - thres_)/thres_ * gradient
x_dt: (p[i+1] - p[i-1]) / (2 * dt) // velocity
x_dt_dt: (p[i+1] - 2 * p[i] + p[i-1]) / (dt * dt) // acceleration
x_dt_normalized = x_dt / norm(x_dt)
x_dt_prj = I - xd_normalized * x_dt_normalized.T
k = x_dt_prj * x_dt_dt / (norm(x_dt) * norm(x_dt)) // a_perp = k v^2
obs_cost_f = norm(x_dt) * ((x_dt_prj*obs_grad) - obs_cost * k)
Moveit Implementation
ChompPlanner::solve(planning_scene, req, params, res)
// initialize trajectory
ChompTrajectory trajectory(planning_scene->getRobotModel(), 3.0, .03, req.group_name);
// fill in start point
robotStateToArray(start_state, req.group_name, trajectory.getTrajectoryPoint(0));
// fill in goal point
robotStateToArray(goal_state, req.group_name, trajectory.getTrajectoryPoint(goal_index));
// fill in whole trajectory
// 1. 根据已知轨迹填充
trajectory.fillInFromTrajectory(*res.trajectory_[0])
// 2. 曲线拟合方式填充
trajectory.fillInMinJerk(); // default
trajectory.fillInLinearInterpolation();
trajectory.fillInCubicInterpolation();
// optimization
optimizer =ChompOptimizer(&trajectory, planning_scene,req.group_name, ¶ms_nonconst, start_state);
optimizer->optimize();\
ChompOptimizer::
optimize():
for i in iterations:
calculateSmoothnessIncrements()
calculateCollisionIncrements()
calculateTotalIncrements()
addIncrementsToTrajectory() // 更新轨迹
getSmoothnessCost():
getCollisionCost()
performForwardKinematics()
chomp 中依赖planningscene中的检测器。planningscene默认检测器为CollisionDetectorAllocatorFCL
,chomp要求为CollisionDetectorAllocatorHybrid
.
ref: CollisionDetectorAllocator
// planning_scene
// 默认情况会自定义一个
setActiveCollisionDetector(collision_detection::CollisionDetectorAllocatorFCL::create());
// 该函数也可以手动调用,设置完之后,该collision会作为最新的检测器
setActiveCollisionDetector()
// 手动设置
planning_scene::PlanningScenePtr ps = planning_scene_->diff();
ps->setActiveCollisionDetector(collision_detection::CollisionDetectorAllocatorHybrid::create(), true);
Trychomp
qs = np.array([-5.0, -5.0]) # 起始点
qe = np.array([7.0, 7.0]) # 结束点
# 初始化轨迹 xi
xi = np.tile(qs, (nq, 1)).flatten()
# 初始化 A, b 和 A_inv
AA = np.zeros((xidim, xidim))
for ii in range(nq):
AA[ii*cdim:(ii+1)*cdim, ii*cdim:(ii+1)*cdim] = 2.0 * np.eye(cdim)
if ii > 0:
AA[ii*cdim:(ii+1)*cdim, (ii-1)*cdim:ii*cdim] = -1.0 * np.eye(cdim)
AA[(ii-1)*cdim:ii*cdim, ii*cdim:(ii+1)*cdim] = -1.0 * np.eye(cdim)
AA /= dt * dt * (nq + 1)
bb = np.zeros(xidim)
bb[:cdim] = qs
bb[-cdim:] = qe
bb /= - dt * dt * (nq + 1)
Ainv = np.linalg.inv(AA)
在这段代码中,AA
和bb
都是与轨迹优化相关的矩阵和向量,用于定义一个二次规划问题以生成平滑的轨迹。下面是这两个变量的大小和含义:
AA (矩阵的大小)
AA
是一个大小为xidim
x xidim
的矩阵,其中xidim
表示轨迹的总维度,计算方式是轨迹中的点数(nq
)乘以配置空间的维度(cdim
)。如果按照给定的参数:
- 轨迹中的点数 (
nq
) = 20 - 配置空间的维度 (
cdim
) = 2
那么,轨迹的总维度 (xidim
) = 20 * 2 = 40。所以,AA
是一个40 x 40的矩阵。
AA (矩阵的含义)
AA
矩阵代表了轨迹优化问题的二次项系数矩阵,它被用来确保轨迹的平滑性。此矩阵构建了一个离散化的时间加速度代价函数,该函数通过最小化每个时间步长内的加速度变化来生成平滑轨迹。这是通过惩罚相邻轨迹点之间的差异来实现的。
在这段代码中,AA
矩阵通过以下操作构建:
- 每个轨迹点对应的二维子矩阵设置为2倍单位矩阵(2.0 * np.eye(cdim))
- 相邻轨迹点的二维子矩阵之间设置为-1倍单位矩阵(-1.0 * np.eye(cdim))
这样可以模拟出一种离散的二阶导数(加速度),即每个点处的加速度值由当前点、前一个点和后一个点共同决定。
bb (向量的大小)
bb
是一个长度为xidim
的向量。同样地,在给定的参数下:
- 轨迹的总维度 (
xidim
) = 40
因此,bb
是一个长度为40的向量。
bb (向量的含义)
bb
向量代表了线性项的系数,定义了轨迹优化问题的目标函数中与变量线性相关的部分。在这段代码中,bb
向量的前两个元素和最后两个元素分别设置为起始点qs
和结束点qe
的坐标,其余元素均为0。
这意味着优化问题会考虑到轨迹的起始和结束位置,使得生成的轨迹能够从起始点开始并在结束点结束。
结合AA和bb
结合AA
和bb
,你可以定义一个二次优化问题,目标是找到一个使得以下代价函数取最小值的轨迹xi
:
xi^T * AA * xi + bb^T * xi
其中,xi
是代表整条轨迹的向量(包含所有轨迹点的坐标),AA
是二次项的系数矩阵,bb
是线性项的系数向量。该代价函数旨在使得轨迹尽可能平滑并且能够从指定的起点移动到终点。
bicycle model
方向盘转角
曲率
ref
- blog
- mainpage
- relative library
- paper