畸变矫正、投影与重映射（图像拼接系列 · 第 3 篇）

本文介绍了如何利用相机标定得到的参数K和D对畸变图像进行矫正，生成无畸变图像。主要内容包括：1）详细解析了矫正流程，即从畸变像素到归一化坐标、去畸变、再投影到理想像素的完整步骤；2）对比了前向映射和反向映射两种方法，说明工程实践中多采用反向映射结合插值的原因；3）介绍了预计算查找表（LUT）的优化方法，通过提前存储映射关系大幅提升处理速度；4）提供了OpenCV中undistort和remap函数

朝风工作室

370人浏览 · 2026-03-11 10:21:15

朝风工作室 · 2026-03-11 10:21:15 发布

上篇讲了畸变模型 $k_1,k_2,k_3$ 、 $p_1,p_2$ ，以及棋盘标定如何得到 $K$ 和 $D$ 。本篇承接这条链条，回答：有了 $K$ 和 $D$ ，如何得到「无畸变」图像？ 同时说明典型拼接实现的柱面/透视投影与经典 undistort 的差异。

本篇会回答：

矫正流程是什么？像素 → 归一化 → 去畸变 → 再投影
前向 vs 反向映射，为何工程多用反向 + 插值？
LUT 的动机：逐像素算太慢，预计算查找表
OpenCV undistort / remap 怎么用？
典型拼接实现的柱面投影、透视校正与经典 undistort 有何不同？

0 动机：标定得到 K/D 后，如何得到「无畸变」图像？

上篇的畸变模型定义在 归一化平面 上： $(xn,yn)⇒(xd,yd)(x_n,y_n) \Rightarrow (x_d,y_d)$ 。标定完成后，我们得到 $K$ 和 $D$ ，但原始图像上的像素仍是畸变的。要用于拼接、SLAM、三维重建等，需要把畸变像素映射到 理想针孔模型 下的像素。

两类需求：

需求	说明
畸变矫正（undistort）	输入畸变图像，输出无畸变图像，仍为平面透视投影
投影变换（warp）	把平面图像投影到柱面、球面等目标坐标系，用于全景拼接

本篇先讲 畸变矫正 的通用流程（像素 → 归一化 → 去畸变 → 再投影），再讲 投影变换 与典型拼接实现的实现。

1 矫正流程：像素 → 归一化 → 去畸变 → 再投影

矫正的完整流程可以拆成四步。

1.0 流程概览

  畸变图像像素 (u,v)        归一化坐标        去畸变后          理想像素 (u',v')
  ┌─────────────┐         ┌─────────────┐   ┌─────────────┐   ┌─────────────┐
  │  (u,v)      │   K⁻¹   │  (x_d,y_d)   │   │  (x_n,y_n)  │   │  (u',v')    │
  │  畸变像素   │ ──────>  │  畸变归一化  │ ─>│  理想归一化  │ ─>│  理想像素   │
  └─────────────┘         └─────────────┘   └─────────────┘   └─────────────┘
                               ↑                   ↑
                               │  畸变公式         │   K
                               │  (前向)           │
                               └──────────────────┘
                              矫正时需反向：x_d,y_d → x_n,y_n

1.1 第一步：像素 → 归一化（去内参）

给定畸变图像上的像素 $(u, v)$ ，先去掉内参 $K$ ，得到归一化平面上的坐标：

$\begin{bmatrix} x_d \\ y_d \\ 1 \end{bmatrix} = K^{-1} \begin{bmatrix} u \\ v \\ 1 \end{bmatrix}$

即 $x_d = (u - c_x)/f_x$ ， $y_d = (v - c_y)/f_y$ 。这里的 $x_d, y_d)$ 是 畸变后 的归一化坐标（上篇符号）。

1.2 第二步：去畸变（反向）

上篇的畸变公式是前向： $(xn,yn)→(xd,yd)(x_n,y_n) \to (x_d,y_d)$ 。矫正需要反向：给定 $x_d,y_d)$ ，求 $x_n,y_n)$ 。

径向畸变： $x_d,y_d) = L(r)(x_n,y_n)$ ，其中 $r^2 = x_n^2 + y_n^2$ ， $L(r) = 1 + k_1 r^2 + k_2 r^4 + k_3 r^6$ 。反向即求 $rd=xd2+yd2r_d = \sqrt{x_d^2 + y_d^2}$ ，再求 $r_n$ 使得 $r_d = r_n L(r_n)$ ，最后 $x_n,y_n) = (x_d,y_d) / L(r_n)$ 。该方程无闭式解，需迭代或 多项式近似。

迭代法（OpenCV 常用）：初值 $r_n^{(0)} = r_d$ ，迭代 $r_n^{(k+1)} = r_d / L(r_n^{(k)})$ ，收敛后得到 $x_n,y_n)$ 。

1.3 第三步：再投影到理想像素

得到理想归一化坐标 $x_n,y_n)$ 后，乘以内参 $K$ 得到理想像素：

$\begin{bmatrix} u' \\ v' \\ 1 \end{bmatrix} \sim K \begin{bmatrix} x_n \\ y_n \\ 1 \end{bmatrix}$

即 $u' = f_x x_n + c_x$ ， $v' = f_y y_n + c_y$ 。

1.4 小结：矫正的数学链

步骤	变换	公式
1	像素 → 归一化	$(xd,yd,1)⊤=K−1(u,v,1)⊤(x_d,y_d,1)^\top = K^{-1}(u,v,1)^\top$
2	去畸变（反向）	$(xd,yd)→(xn,yn)(x_d,y_d) \to (x_n,y_n)$ ，迭代或 LUT
3	再投影	$(u′,v′,1)⊤∼K(xn,yn,1)⊤(u',v',1)^\top \sim K(x_n,y_n,1)^\top$

符号： $(u, v)$ 畸变像素； $x_d,y_d)$ 畸变归一化坐标； $x_n,y_n)$ 理想归一化坐标； $(u^{'}, v^{'})$ 理想像素。

2 前向 vs 反向映射：为何工程多用“反查原图”

生成无畸变图像时，有两种思路：前向映射 和 反向映射。

2.1 前向映射

对畸变图像的每个像素 $(u, v)$ ，计算它对应的理想像素 $(u^{'}, v^{'})$ ，把颜色写到输出图的 $(u^{'}, v^{'})$ 。

问题： $(u^{'}, v^{'})$ 往往不是整数，且多个 $(u, v)$ 可能映射到同一 $(u^{'}, v^{'})$ 附近，产生空洞或重叠，需要额外处理。

2.2 反向映射（常用）

对输出图的每个像素 $(u^{'}, v^{'})$ ，反推它在畸变图像上该采样的位置 $(u, v)$ ，用插值得到颜色，写入 $(u^{'}, v^{'})$ 。

优点：

输出图每个像素有且仅有一个来源，无空洞
插值在源图上做，实现简单（双线性、双三次等）
OpenCV remap 就是反向映射 + 插值

流程：对每个 $(u^{'}, v^{'})$ → $x_n,y_n)$ → $x_d,y_d)$ （畸变公式前向）→ $K(x_d,y_d,1)^\top$ ，在 $(u, v)$ 处插值采样。

2.3 反向映射为何只需前向畸变？

反向映射时，对每个输出像素 $(u^{'}, v^{'})$ ，要找源图上的采样位置 $(u, v)$ 。输出为无畸变图，故 $(u^{'}, v^{'})$ 对应理想归一化坐标 $(xn,yn)=K−1(u′,v′,1)⊤(x_n,y_n) = K^{-1}(u',v',1)^\top$ 。源图有畸变，其像素 $(u, v)$ 是由理想点 $x_n,y_n)$ 经 前向畸变 得到的： $(xd,yd)=distort(xn,yn)(x_d,y_d) = \text{distort}(x_n,y_n)$ ， $K(x_d,y_d,1)^\top$ 。

因此反向映射的完整链为：

$\xrightarrow{K^{-1}} (x_n,y_n) \xrightarrow{\text{前向畸变}} (x_d,y_d) \xrightarrow{K} (u,v)$

只需前向畸变公式，无需迭代求逆。这就是工程上偏爱反向映射的原因之一：计算简单、无迭代。

2.4 小结：这两种“反向”各管哪摊事

到这里可以先做一个小结，把“第 1 节的去畸变逆”和“本节的反向映射”放在一起看：

场景	出发点	终点	是否要解畸变逆？
第 1 节：理论上的去畸变链	畸变像素 $(u, v)$	理想像素 $(u^{'}, v^{'})$	是，要在归一化平面上做 $(xd,yd)→(xn,yn)(x_d,y_d)\to(x_n,y_n)$
本节：工程里的反向映射	输出像素 $(u^{'}, v^{'})$	原图像素 $(u, v)$	否，只需用前向畸变 $(xn,yn)→(xd,yd)(x_n,y_n)\to(x_d,y_d)$

后面讲 LUT 和 remap 时，默认采用的是“第 2 行”这种做法：
把输出图看成理想图，从理想那一端出发，反查回原图的采样位置。

3 LUT 的动机：逐像素算太慢，预计算查找表

即使用反向映射 + 前向畸变，每个输出像素仍要算一次 $K^{-1}$ 、畸变、 $K$ 。若输出 1920×1080，就要 200 多万次。预计算查找表（LUT） 可大幅加速。

3.1 思路

对输出图每个像素 $(i, j)$ ，预计算对应的源图采样坐标 $map_x(i,j), map_y(i,j))$ ，存成两个与输出同尺寸的浮点图。运行时只需一次 remap(img, map_x, map_y, ...)，按 LUT 做插值采样，无需再算畸变。

从坐标系角度看，LUT 里存的是整条几何链的结果：

(i,j)  →  (u',v')   →   (x_n,y_n)   →   (x_d,y_d)   →   (u,v)
          输出像素        理想归一化       畸变归一化        原图像素

当输出图是柱面 / 球面坐标时，只需要把链条中间那一段换成对应的投影公式即可。

3.2 典型用法

cv::Mat map1, map2;
cv::initUndistortRectifyMap(cameraMatrix, distCoeffs, cv::Mat(), cameraMatrix,
                            imageSize, CV_32FC1, map1, map2);
cv::remap(src, dst, map1, map2, cv::INTER_LINEAR);

initUndistortRectifyMap 预计算 LUT，remap 按 LUT 重采样。同一相机、同一分辨率，LUT 只需算一次，可复用。

3.3 分辨率与精度

LUT 分辨率通常等于输出分辨率。若输出图会缩放，可对 LUT 插值，或按输出尺寸重新计算。LUT 存的是源图坐标，用 CV_32FC1 足够；双通道时 map1 存 $u$ ，map2 存 $v$ 。

4 OpenCV `undistort` / `remap` 的典型用法

4.1 一站式 `undistort`

cv::undistort(src, dst, cameraMatrix, distCoeffs);

内部等价于：initUndistortRectifyMap + remap，且默认用 cameraMatrix 作为新相机矩阵（即去畸变后内参不变）。若要去畸变的同时做去畸变 + 裁剪，可用 undistort 的 P 参数或 initUndistortRectifyMap 自定义新 $K$ 。

4.2 分步 `remap`（需自定义映射时）

cv::Mat map1, map2;
cv::initUndistortRectifyMap(K, D, R, P, size, CV_32FC1, map1, map2);
cv::remap(src, dst, map1, map2, cv::INTER_LINEAR, cv::BORDER_CONSTANT);

R 为可选的旋转（立体校正时用），P 为新相机矩阵。单目去畸变时 R 为单位阵，P 常取 K。

4.3 输出边界

去畸变后，图像四角可能映射到源图外，产生黑边。可设置 BORDER_CONSTANT 填常数，或用 BORDER_REPLICATE 等。若想裁剪掉黑边，可计算有效区域，用 getOptimalNewCameraMatrix 的 alpha 参数调节。

5 典型拼接实现的投影：柱面与透视校正

典型拼接实现没有传统意义上的畸变矫正（无 $D$ 、无 undistort）。它的「变换」主要是 柱面投影 和 透视校正，用于把多张平面图统一到柱面/平面坐标系，便于拼接。

如果和前两节对比，可以这样理解它在整条流程中的位置：

（本节）   选择一个更适合拼接的“公共投影面”（平面 / 柱面 / 球面）
        ↓
前两节   在这个公共投影面上，用反向映射 + 插值生成输出图
        ↓
后续篇   在公共投影面上做特征匹配、MST 初始化、BA 和融合

5.1 柱面投影的几何

柱面投影把图像平面上的点投影到「以相机为轴、半径为 $r$ 的圆柱」上。设图像中心为 $c_x, c_y)$ ，点 $(x, y)$ 在图像上，则：

前向（图像 → 柱面）：

$\theta = \arctan\frac{x - c_x}{r}, \quad y' = \frac{(y - c_y) \cdot r}{\sqrt{(x-c_x)^2 + r^2}}$

反向（柱面 → 图像，用于重采样）：

$\tan\theta + c_x, \quad y = \frac{y' \cdot r}{\cos\theta} + c_y$

符号： $r$ 圆柱半径，与焦距相关； $c_x, c_y)$ 投影中心； $(θ,y′)(\theta, y')$ 柱面坐标。

5.2 柱面投影的伪代码

前向（图像 → 柱面）：

proj(x, y):
    θ ← atan((x - cx) / r)
    y' ← (y - cy) / sqrt((x - cx)² + r²)
    return (θ, y')

反向（柱面 → 图像，用于重采样）：

proj_r(θ, y'):
    x ← r * tan(θ) + cx
    y ← y' * r / cos(θ) + cy
    return (x, y)

圆柱半径 $r$ 由 35mm 等效焦距换算： $\approx \text{hypot}(w, h) \cdot f_{35} / 43.266$ 。对整张图做柱面投影时，用 反向映射：对输出每个像素，用 proj_r 反推源图坐标，再双线性插值采样。

5.3 透视校正

柱面拼接后，全景图是「弯曲」的（柱面展开）。透视校正用透视变换把四角拉成矩形，使输出更接近「平铺」的宽幅图。流程：

取首尾图像的四个角点，经单应 $H$ 变换到参考帧，再投影到柱面坐标
计算从当前四角到标准矩形的单应（4 点法）
按该单应重采样，得到矩形输出

5.4 投影类型：flat、cylindrical、spherical

类型	说明
flat	平面透视， $p = [x / z, y / z]$
cylindrical	柱面， $θ=atan2(x,z)\theta = \text{atan2}(x,z)$ ， $\sqrt{x^2+z^2}$
spherical	球面（equirectangular）， $θ=atan2(x,z)\theta = \text{atan2}(x,z)$ ， $ϕ=atan2(y,x2+z2)\phi = \text{atan2}(y, \sqrt{x^2+z^2})$

柱面拼接模式下，单张图先做柱面投影，再在 flat 投影下做范围估计与融合。

5.5 柱面模式下的 Affine 与 half-shifted 坐标

柱面投影后，相邻图的变换近似仿射（缩放、旋转、剪切），用 Affine 而非 Homography 更稳定、参数更少。

half-shifted 坐标：单应 $H$ 将图 $j$ 变换到图 $i$ 时，坐标在 $[- w /2, w /2]$ 下，即原点在图像中心，而非左上角。渲染前需将 homo 从 half-shifted 转为图像坐标。

6 与第 1 篇的衔接：投影后仍满足针孔模型

第 1 篇的 $H = K R K^{-1}$ 假设 理想针孔、无畸变。典型拼接实现的柱面投影是在 图像平面到柱面 的映射，相当于在针孔投影之后又做了一层「平面 → 柱面」的几何变换。柱面投影后的图像，可视为在「柱面坐标系」下的针孔投影；后续匹配、单应估计仍可沿用 $H$ 、 $R$ 等概念，只是坐标系从平面换成了柱面。

总结：畸变矫正是「归一化平面上去畸变」，使图像满足理想针孔；柱面/球面投影是「换一个目标坐标系」，投影后在该坐标系下仍可视为针孔成像的某种展开。

7 常见坑：LUT 分辨率、边界、GPU 加速

坑点	说明	建议
LUT 分辨率	LUT 与输出尺寸绑定，缩放输出需重算或插值 LUT	按实际输出尺寸生成 LUT
边界黑边	去畸变后四角可能越界，产生黑边	用 `getOptimalNewCameraMatrix` 的 `alpha` 或手动裁剪
插值方式	`INTER_NEAREST` 快但锯齿，`INTER_LINEAR` 常用，`INTER_CUBIC` 更平滑	按质量/速度权衡选择
GPU 加速	OpenCV `cuda::remap` 可加速，需 GPU 模块	大图、实时场景可考虑
柱面半径 $r$	$r$ 与焦距相关，焦距不准会导致柱面「过弯」或「过平」	用估计或标定获取焦距
half-shifted	homo 在 $[- w /2, w /2]$ 下，与像素坐标混用会错	渲染前需做坐标转换

8 下一篇预告

矫正/投影后，图像满足（近似）针孔模型，可以建立图间对应关系。

《特征匹配与单应估计（RANSAC）》

将讲：

特征点与描述子
匹配与比率检验
单应 $H$ 的线性估计（4 点法、DLT）
RANSAC 与从 $H$ 求 $R$

本篇总结

矫正流程：像素 → 归一化 → 去畸变（反向需迭代）→ 再投影；反向映射时用前向畸变公式，无需迭代
LUT：预计算 map_x、map_y，remap 时按 LUT 插值，避免每像素重复计算
OpenCV：undistort 一站式，initUndistortRectifyMap + remap 可自定义
典型拼接实现：无传统 undistort，用柱面投影统一坐标系；柱面模式下用 Affine；homo 在 half-shifted 坐标 $[- w /2, w /2]$ 下

自测

反向映射时，对输出像素 $(u^{'}, v^{'})$ ，如何得到源图采样坐标 $(u, v)$ ？（答： $x_n,y_n) = K^{-1}(u',v')$ ， $(xd,yd)=distort(xn,yn)(x_d,y_d) = \text{distort}(x_n,y_n)$ ， $u,v) = K(x_d,y_d)$ ）
柱面投影的反向映射 proj_r 输入输出分别是什么坐标系？（答：输入柱面坐标 $(θ,y′)(\theta, y')$ ，输出图像平面坐标 $(x, y)$ ）

符号速查（本篇新增）

符号	含义
$(u, v)$	畸变图像像素
$(u^{'}, v^{'})$	理想/输出图像像素
$x_d,y_d)$	畸变后归一化坐标
$x_n,y_n)$	理想归一化坐标
$r$	柱面投影的圆柱半径
$(θ,y′)(\theta, y')$	柱面坐标
LUT	查找表，存 `map_x`、`map_y`

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git