视觉图像坐标转换

创业
2025-09-16 04:27:02

1. 透镜成像

相机的镜头系统将三维场景中的光线聚焦到一个平面（即传感器）。这个过程可以用小孔成像模型来近似描述，尽管实际相机使用复杂的透镜系统来减少畸变和提高成像质量。

小孔成像模型：假设有一个理想的小孔，光线通过小孔后在对面形成倒立的实像。在小孔成像模型中，物体到小孔的距离 Z Z Z、焦距 f f f（小孔到成像平面的距离）、物体的实际尺寸 Y Y Y 和 X X X 以及物体在成像平面上的投影尺寸 y y y 和 x x x 之间的关系如下：

Z f = Y y = X x \frac{Z}{f} = \frac{Y}{y} = \frac{X}{x} fZ=yY=xX 其中，

Z Z Z 是物体到小孔的距离。 f f f 是焦距（小孔到成像平面的距离）。 Y Y Y 和 X X X 是物体的实际尺寸。 y y y 和 x x x 是物体在成像平面上的投影尺寸

这个模型假设有一个理想的小孔，光线通过小孔后在对面形成倒立的实像。虽然现实中没有完全理想的小孔，但这个模型有助于理解基本原理。

2. 相机内参数

内参数描述了相机的内部几何特性，包括焦距、主点位置、像素比例等。这些参数通常通过相机标定过程获得，并用于将三维空间中的点投影到二维图像平面上。

三种坐标系的变换

2.1 主要内参数

焦距（Focal Length）：

通常用 f x f_x fx 和 f y f_y fy 表示，分别对应X轴和Y轴方向上的焦距。焦距决定了相机的视角和放大倍数。

主点（Principal Point）：

通常用 c x c_x cx 和 c y c_y cy 表示，表示光轴与成像平面的交点，即图像中心的像素坐标。

畸变系数（Distortion Coefficients）：

包括径向畸变（Radial Distortion）和切向畸变（Tangential Distortion）系数。这些系数用于校正镜头引起的图像失真。 2.2 内参数矩阵

内参数通常以一个3x3的矩阵 K K K 表示：

K = [ f x 0 c x 0 f y c y 0 0 1 ] K = \begin{bmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1 \end{bmatrix} K= fx000fy0cxcy1

其中：

f x f_x fx 和 f y f_y fy 是焦距（以像素为单位）。 c x c_x cx 和 c y c_y cy 是主点坐标（通常是图像中心）。 2.3 作用投影变换：将三维空间中的点投影到二维图像平面上。校正畸变：利用畸变系数校正图像中的失真现象，提高图像质量。 3. 外参数

外参数（Extrinsic Parameters）描述了相机相对于某个固定的世界坐标系的位置和姿态，包括旋转矩阵 R R R 和平移向量 t t t。获取这些参数通常需要通过特定的方法或技术进行标定或估计。以下是几种常见的获取外参数的方法：

3.1 相机标定（Camera Calibration）

相机标定不仅用于获取内参数，还可以同时获得外参数。常用的方法之一是使用已知几何结构的标定板（如棋盘格），通过多个视角拍摄标定板图像，然后利用这些图像来计算相机的内外参数。

使用OpenCV进行相机标定

OpenCV 提供了一套完整的工具来进行相机标定，可以同时获取内参数和外参数。以下是一个简化的步骤说明：

准备标定板：使用一个已知尺寸的棋盘格作为标定板。采集图像：从不同角度拍摄多张包含标定板的图像。角点检测：在每张图像中找到棋盘格的角点位置。标定过程：使用这些角点信息来计算相机的内外参数。 import cv2 import numpy as np def calibrate_camera(images, pattern_size=(9, 6)): """ Calibrate the camera using a set of images with a known chessboard pattern. Parameters: - images: List of image paths containing the chessboard pattern. - pattern_size: Tuple (rows, cols) representing the number of inner corners per a chessboard row and column. Returns: - Intrinsic matrix K, distortion coefficients, rotation vectors, and translation vectors. """ # Prepare object points, like (0,0,0), (1,0,0), (2,0,0) ....,(6,5,0) objp = np.zeros((pattern_size[0]*pattern_size[1], 3), np.float32) objp[:,:2] = np.mgrid[0:pattern_size[0], 0:pattern_size[1]].T.reshape(-1,2) # Arrays to store object points and image points from all the images. objpoints = [] # 3d point in real world space imgpoints = [] # 2d points in image plane. for fname in images: img = cv2.imread(fname) gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # Find the chess board corners ret, corners = cv2.findChessboardCorners(gray, pattern_size, None) # If found, add object points, image points (after refining them) if ret == True: objpoints.append(objp) corners2 = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria) imgpoints.append(corners2) # Perform camera calibration ret, K, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None) return K, dist, rvecs, tvecs # Example usage if __name__ == "__main__": # Camera calibration using chessboard images images = ["image1.jpg", "image2.jpg", "image3.jpg"] # Replace with actual image paths criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001) K, dist, rvecs, tvecs = calibrate_camera(images) print("Intrinsic matrix K:\n", K) print("Distortion coefficients:", dist) print("Rotation vectors:", rvecs) print("Translation vectors:", tvecs) 3.2 主要外参数 3.2.1旋转矩阵（Rotation Matrix）旋转矩阵：通常用 $ R $ 表示，是一个3x3的正交矩阵，描述了相机相对于世界坐标系的旋转角度。 3.2.2平移向量（Translation Vector）平移向量：通常用 $ t $ 表示，是一个3x1的向量，描述了相机相对于世界坐标系的平移距离。 3.3 外参数矩阵

外参数通常以一个4x4的齐次变换矩阵 T T T 表示：

T = [ R t 0 T 1 ] T = \begin{bmatrix} R & t \\ 0^T & 1 \end{bmatrix} T=[R0Tt1]

其中：

R R R 是旋转矩阵。$t $ 是平移向量。 0 T 0^T 0T 是一个1x3的零向量。 3.3 作用坐标变换：将三维世界坐标系中的点转换到相机坐标系中。姿态估计：确定相机在世界坐标系中的位置和方向，常用于SLAM（同步定位与地图构建）、AR（增强现实）等应用。

标签：

视觉图像坐标转换由讯客互联创业栏目发布，感谢您对讯客互联的认可，以及对我们原创作品以及文章的青睐，非常欢迎各位朋友分享到个人网站或者朋友圈，但转载请说明文章出处“视觉图像坐标转换”

上一篇
基于Python深度学习的电影评论情感分析可视化系统（2.0

下一篇
大摩闭门会：250228学习总结报告