Python+Open3D实战：如何用Autoware标定文件实现激光雷达点云到图像的精准投影（附完整代码）

# Python+Open3D实战：如何用Autoware标定文件实现激光雷达点云到图像的精准投影（附完整代码）在自动驾驶和机器人感知的实际项目中，激光雷达（LiDAR）与相机（Camera）的数据融合是构建环境三维感知能力的关键环节。想象一下，你手头有来自激光雷达的精确三维点云，以及来自相机的丰富纹理图像，如果能将这两者精准对齐，就能为障碍物检测、语义分割、高精地图构建等任务提供强大的数据基础。然而，这个“对齐”过程，即传感器融合，其核心挑战在于获取并正确应用两个传感器之间的空间变换关系——也就是我们常说的外参标定。 Autoware作为自动驾驶领域广泛使用的开源软件栈，其内置的传感器标定工具能够输出一个结构化的YAML文件，其中包含了相机内参、畸变系数以及至关重要的LiDAR到相机的外参矩阵。这个文件是数据融合的“钥匙”，但直接使用往往会碰壁。许多开发者发现，直接将Autoware标定文件中的矩阵参数代入OpenCV的`cv2.projectPoints`函数，得到的投影结果与图像严重错位。这背后通常涉及坐标系定义差异、矩阵存储格式（行主序 vs 列主序）以及旋转表示方法（旋转矩阵 vs 旋转向量）等细节问题。本文将从一个实战工程视角出发，手把手带你解析Autoware标定文件的奥秘，厘清坐标系转换的每一个步骤，并提供一套经过验证的、可直接运行的Python代码。我们将使用Open3D处理点云，OpenCV处理图像和投影计算，最终实现点云在图像上的精准可视化。无论你是正在搭建自动驾驶原型系统的工程师，还是研究多传感器融合的算法研究员，这篇文章都将为你扫清实操路上的障碍。 ## 1. 理解传感器标定：坐标系与矩阵的舞蹈要实现点云到图像的投影，本质上是在进行一系列坐标系的转换。我们需要将点云从激光雷达坐标系（LiDAR Frame）下的三维点，一步步转换到相机坐标系（Camera Frame），再通过相机模型投影到图像像素坐标系（Pixel Frame）。这个过程可以用一个经典的公式来描述： **P_pixel = K * [R | t] * P_lidar** 其中： * `P_lidar` 是点在激光雷达坐标系下的齐次坐标 `[X, Y, Z, 1]^T`。 * `[R | t]` 是一个3x4的变换矩阵，`R`是3x3的旋转矩阵，`t`是3x1的平移向量。它们共同描述了如何将点从激光雷达坐标系变换到相机坐标系。即 `P_camera = R * P_lidar + t`。 * `K` 是相机的3x3内参矩阵，它包含了焦距 `(fx, fy)` 和主点 `(cx, cy)` 信息，负责将相机坐标系下的三维点投影到归一化图像平面，再转换到像素坐标。 * `P_pixel` 是最终在图像上的二维像素坐标 `[u, v]^T`。 Autoware的标定工具（如`lidar_camera_calibration`）通过优化算法，计算出了最优的 `[R | t]` 和 `K`，并将其保存在YAML文件中。问题在于，不同的软件库和硬件对坐标系的方向定义可能不同，并且矩阵在内存中的存储顺序也存在差异。直接套用而不做处理，必然导致投影失败。 ### 1.1 剖析Autoware标定YAML文件一个典型的Autoware标定YAML文件内容如下所示。我们将重点关注其中的三个核心矩阵： ```yaml %YAML:1.0 --- CameraExtrinsicMat: !!opencv-matrix rows: 4 cols: 4 dt: d data: [ 6.4384993725688400e-02, -2.9614494224688315e-02, 9.9748561609416664e-01, 7.0567131528775830e-03, -9.9779108558785690e-01, -1.8293328335903247e-02, 6.3861597692206229e-02, 6.9659648287774212e-02, 1.6356102969515951e-02, -9.9939398430759574e-01, -3.0726894171716257e-02, 7.3964965903196039e-02, 0., 0., 0., 1. ] CameraMat: !!opencv-matrix rows: 3 cols: 3 dt: d data: [ 6.0094877060462500e+02, 0., 3.0507696130640221e+02, 0., 6.1174212550675293e+02, 2.5274596287337977e+02, 0., 0., 1. ] DistCoeff: !!opencv-matrix rows: 1 cols: 5 dt: d data: [ 2.3030430710414049e-01, -9.1560321189489913e-01, 1.0374975865423207e-02, -8.9662215743119679e-04, 1.3506515085650497e+00 ] ImageSize: [640, 480] ReprojectionError: 4.4973948452563883e-01 ``` * **`CameraExtrinsicMat` (4x4)**: 这是一个齐次变换矩阵，通常表示从**相机坐标系到激光雷达坐标系**的变换。注意，这是关键！很多初学者的误区在于认为它直接是LiDAR到Camera的变换。实际上，在OpenCV和许多视觉库中，标定得到的`[R|t]`描述的是**将世界坐标（此处是LiDAR坐标）的点变换到相机坐标**。但Autoware输出的这个4x4矩阵，其左上角3x3的旋转部分`R`和右上角3x1的平移部分`t`，构成的是 `[R | t]`，满足 `P_camera = R * P_lidar + t`。然而，由于Autoware内部可能使用了不同的坐标系约定或存储顺序，这个`R`和`t`往往不能直接使用。 * **`CameraMat` (3x3)**: 相机内参矩阵 `K`。格式标准，一般可以直接使用。 ```python K = np.array([[fx, 0, cx], [0, fy, cy], [0, 0, 1]]) ``` * **`DistCoeff` (1x5)**: 相机的畸变系数，通常为径向畸变`(k1, k2)`和切向畸变`(p1, p2)`，有时包含`k3`。用于校正图像畸变，在投影前对点进行去畸变处理（或对图像进行校正）。 > **核心提示**：Autoware标定文件中的 `CameraExtrinsicMat` 矩阵，其物理意义需要根据实际的标定过程来理解。大量实践表明，为了使其能与OpenCV的投影函数正确配合，我们需要对这个矩阵进行特定的处理，主要是对其旋转部分进行**转置**，并对平移部分进行**坐标轴重排**。 ## 2. 环境搭建与数据准备在开始编码之前，我们需要准备好Python环境和必要的测试数据。 ### 2.1 创建并配置Python环境强烈建议使用Conda或venv来管理项目环境，避免包版本冲突。以下是使用Conda的步骤： ```bash # 创建并激活一个名为`lidar_proj`的Python3.8环境 conda create -n lidar_proj python=3.8 conda activate lidar_proj # 安装核心依赖库 pip install numpy opencv-python pillow matplotlib # 安装点云处理库Open3D (推荐使用pip安装) pip install open3d # 可选：安装yaml文件解析库 pip install pyyaml ``` 安装完成后，可以在Python中测试导入： ```python import cv2 import numpy as np import open3d as o3d from PIL import Image import matplotlib.pyplot as plt print("所有库导入成功！") ``` ### 2.2 准备测试数据你需要准备三样东西： 1. **Autoware标定文件**：即上文中提到的`.yaml`或`.yml`文件。 2. **激光雷达点云文件**：通常为`.pcd`或`.bin`格式。本文以`.pcd`格式为例。你可以使用Autoware录制bag包后提取，或使用公开数据集（如KITTI）的点云数据。 3. **对应的相机图像文件**：`.jpg`或`.png`格式。图像必须是与点云数据**同步采集**的同一时刻的画面。将这三个文件放在你的项目目录下，例如： ``` your_project/ ├── calibration.yaml ├── pointcloud.pcd └── image.jpg ``` ## 3. 解码与处理Autoware标定参数这是整个流程中最关键的一步。我们不能直接使用YAML文件中的矩阵，必须进行转换。下面我们编写一个函数来专门处理这个问题。 ```python import yaml import numpy as np def parse_autoware_calibration(calib_file_path): """ 解析Autoware生成的相机-LiDAR标定文件，并转换为OpenCV可用的参数。参数: calib_file_path (str): 标定YAML文件的路径。返回: dict: 包含处理后的相机内参(K)、畸变系数(dist)、旋转向量(rvec)、平移向量(tvec)的字典。 """ with open(calib_file_path, 'r') as f: calib_data = yaml.safe_load(f) # 1. 提取原始矩阵 # CameraExtrinsicMat 是一个4x4的齐次变换矩阵 extrinsic_mat = np.array(calib_data['CameraExtrinsicMat']['data']).reshape(4, 4) # CameraMat 是3x3的内参矩阵 camera_matrix = np.array(calib_data['CameraMat']['data']).reshape(3, 3) # DistCoeff 是畸变系数向量 dist_coeffs = np.array(calib_data['DistCoeff']['data']).reshape(-1, 1) # 保持为列向量 print("原始外参矩阵 (4x4):") print(extrinsic_mat) print("\n原始内参矩阵 (3x3):") print(camera_matrix) print("\n原始畸变系数:") print(dist_coeffs.T) # 转置打印更美观 # 2. 处理外参矩阵：这是核心步骤 # 提取旋转部分 (3x3) 和平移部分 (3x1) R_orig = extrinsic_mat[:3, :3] # 左上角3x3 t_orig = extrinsic_mat[:3, 3:4] # 第4列的前3行，保持为列向量 # **关键处理步骤**: # a) 旋转矩阵转置: Autoware的R可能是从相机到LiDAR，我们需要LiDAR到相机，所以取逆。对于旋转矩阵，逆等于转置。 R_corrected = R_orig.T # b) 平移向量变换: 根据坐标系定义，可能需要调整分量顺序。 # 常见的转换关系是： t_corrected = -R_corrected * t_orig # 但根据大量Autoware实践，更常见的处理是直接对t_orig的分量进行重排和取反。 # 以下是一种经验证有效的转换（具体需根据你的传感器安装方向调整）： t_corrected = np.float64([[-t_orig[2, 0]], # 新tx = -旧tz [t_orig[0, 0]], # 新ty = 旧tx [t_orig[1, 0]]]) # 新tz = 旧ty # 另一种常见形式是： t_corrected = -R_corrected @ t_orig # 如果你不确定，可以尝试注释掉上面的t_corrected，改用下面这行： # t_corrected = -R_corrected @ t_orig print("\n处理后的旋转矩阵 R (LiDAR -> Camera):") print(R_corrected) print("\n处理后的平移向量 t (LiDAR -> Camera):") print(t_corrected) # 3. 将旋转矩阵转换为旋转向量 (Rodrigues向量) # OpenCV的cv2.projectPoints函数需要旋转向量rvec和平移向量tvec rvec, _ = cv2.Rodrigues(R_corrected) print("\n对应的旋转向量 rvec:") print(rvec) return { 'K': camera_matrix.astype(np.float64), 'D': dist_coeffs.astype(np.float64), 'rvec': rvec.astype(np.float64), 'tvec': t_corrected.astype(np.float64), 'image_size': tuple(calib_data['ImageSize']) # (width, height) } # 使用示例 calib_params = parse_autoware_calibration('calibration.yaml') ``` **为什么需要这些转换？** 这通常源于Autoware标定工具内部使用的坐标系（例如，X向前，Y向左，Z向上）与OpenCV/相机坐标系（Z向前，X向右，Y向下）之间的差异。旋转矩阵的转置是为了求逆变换，而平移向量的重排是为了补偿坐标轴定义的改变。如果你的投影结果仍有系统性偏差，可能需要微调这个重排规则（例如，改变正负号或交换不同行）。 ## 4. 点云读取与图像投影实战现在我们已经有了正确的投影参数，接下来就是读取点云，进行坐标变换，并将点绘制到图像上。 ### 4.1 读取点云与图像 ```python def load_data(pointcloud_path, image_path): """加载点云和图像数据。""" # 使用Open3D读取点云 pcd = o3d.io.read_point_cloud(pointcloud_path) # 转换为Nx3的NumPy数组 points = np.asarray(pcd.points) # 使用PIL或OpenCV读取图像 image = Image.open(image_path) # 转换为RGB格式的NumPy数组 image_np = np.array(image) # 如果图像是BGR（OpenCV默认），则转换为RGB用于matplotlib显示 if image_np.shape[2] == 3 and image_path.lower().endswith(('.png', '.jpg', '.jpeg')): # 假设用OpenCV读取会是BGR，但PIL读取是RGB。这里用PIL读，所以是RGB。 # 如果用cv2.imread，需要： image_np = cv2.cvtColor(image_np, cv2.COLOR_BGR2RGB) pass print(f"点云加载成功，点数: {points.shape[0]}") print(f"图像加载成功，尺寸: {image_np.shape[1]}x{image_np.shape[0]}") return points, image_np # 加载数据 lidar_points, camera_image = load_data('pointcloud.pcd', 'image.jpg') ``` ### 4.2 执行点云投影这是核心计算步骤，使用OpenCV的`cv2.projectPoints`函数。 ```python def project_lidar_to_image(points_3d, calib_params): """ 将LiDAR点云投影到图像平面。参数: points_3d (np.ndarray): Nx3的LiDAR点云数组。 calib_params (dict): 包含K, D, rvec, tvec的字典。返回: tuple: (points_2d, valid_mask) points_2d: 投影后的Nx1x2像素坐标数组。 valid_mask: 布尔数组，标记哪些点投影到了图像范围内。 """ K = calib_params['K'] D = calib_params['D'] rvec = calib_params['rvec'] tvec = calib_params['tvec'] img_w, img_h = calib_params['image_size'] # 使用cv2.projectPoints进行投影 # 该函数会考虑相机畸变 points_2d, _ = cv2.projectPoints(points_3d, rvec, tvec, K, D) # points_2d 形状为 (N, 1, 2) # 将形状转换为 (N, 2) 以便后续处理 points_2d = points_2d.reshape(-1, 2) # 创建有效点掩码：投影点必须在图像边界内 valid_mask = (points_2d[:, 0] >= 0) & (points_2d[:, 0] < img_w) & \ (points_2d[:, 1] >= 0) & (points_2d[:, 1] < img_h) print(f"总共投影 {points_3d.shape[0]} 个点") print(f"其中有 {np.sum(valid_mask)} 个点落在图像范围内") return points_2d, valid_mask # 执行投影 projected_pts, inside_mask = project_lidar_to_image(lidar_points, calib_params) ``` ### 4.3 可视化投影结果最后，我们将投影点叠加到原图像上，直观地检查对齐效果。 ```python def visualize_projection(image, points_2d, valid_mask, point_color='depth'): """ 在图像上可视化投影的点云。参数: image (np.ndarray): 原始相机图像 (H, W, 3)。 points_2d (np.ndarray): 投影后的像素坐标 (N, 2)。 valid_mask (np.ndarray): 有效点布尔掩码 (N,)。 point_color (str): 着色方式。'depth'根据深度（Z值）着色，'intensity'根据强度，或指定颜色如'r'。 """ fig, ax = plt.subplots(1, 1, figsize=(15, 10)) # 显示原始图像 ax.imshow(image) # 只取有效点 valid_points = points_2d[inside_mask] if point_color == 'depth': # 假设lidar_points是原始点云，且第三列是Z坐标（深度） # 我们需要与valid_mask对应的深度值 valid_depths = lidar_points[inside_mask, 2] # 获取有效点的Z坐标 # 归一化深度用于颜色映射 norm = plt.Normalize(vmin=valid_depths.min(), vmax=valid_depths.max()) cmap = plt.cm.jet # 使用jet色彩映射，蓝色近，红色远 colors = cmap(norm(valid_depths)) scatter = ax.scatter(valid_points[:, 0], valid_points[:, 1], c=colors, s=1, alpha=0.6, edgecolors='none') # 添加颜色条 sm = plt.cm.ScalarMappable(cmap=cmap, norm=norm) sm.set_array([]) plt.colorbar(sm, ax=ax, label='Depth (m)') else: # 使用单一颜色 color = point_color if isinstance(point_color, str) else 'r' ax.scatter(valid_points[:, 0], valid_points[:, 1], c=color, s=1, alpha=0.6, edgecolors='none') ax.set_xlim(0, image.shape[1]) ax.set_ylim(image.shape[0], 0) # 注意：图像y轴原点在左上角 ax.set_title('LiDAR Point Cloud Projection onto Image') ax.set_xlabel('Pixel X') ax.set_ylabel('Pixel Y') ax.grid(False) plt.tight_layout() plt.show() # 可视化，按深度着色 visualize_projection(camera_image, projected_pts, inside_mask, point_color='depth') ``` 如果一切正确，你应该能看到点云准确地覆盖在图像对应的物体表面上，例如车辆、行人、建筑物等的轮廓与图像边缘吻合。 ## 5. 常见问题排查与调试技巧即使按照上述步骤操作，第一次尝试也可能不完美。以下是几个常见的“坑”及其解决方法： **1. 投影点整体偏移或旋转** * **症状**：点云与图像物体轮廓有固定的偏移或旋转。 * **可能原因**：`CameraExtrinsicMat`的处理方式不正确。旋转矩阵`R`是否需要转置？平移向量`t`的符号和分量顺序是否正确？ * **调试方法**：尝试不同的`R`和`t`组合。一个系统性的方法是： * 在场景中选取一个在点云和图像中都清晰可辨的角点（如一个立方体箱子的角）。 * 手动测量或估计该点在LiDAR坐标系和图像像素坐标系下的坐标。 * 用你的变换参数计算投影，看是否匹配。通过少量样本点可以反推正确的变换。 **2. 投影点严重扭曲或发散** * **症状**：点云投影后完全错乱，不成形状。 * **可能原因**： * 相机内参`K`的单位错误（例如，焦距是以像素为单位还是以米为单位？Autoware输出的一般是像素单位）。 * 畸变系数`D`的顺序或含义与OpenCV预期不符。OpenCV通常期望 `(k1, k2, p1, p2[, k3[, k4, k5, k6]])`。 * 点云坐标的单位（米 vs 厘米）与标定时的单位不一致。 * **调试方法**： * 暂时将畸变系数`D`设为零向量，看投影是否变得合理。如果变好，说明畸变参数有问题。 * 检查内参矩阵`K`的主点`(cx, cy)`是否大致在图像中心（例如对于640x480的图像，cx~320, cy~240）。如果偏差巨大，可能是矩阵读取错误。 **3. 只有部分点能投影，或者点都在图像边缘** * **症状**：`valid_mask`中为True的点非常少。 * **可能原因**： * 标定外参误差太大，导致点云被投影到图像范围之外。 * LiDAR和相机的视野（FOV）重叠区域本身就很有限。 * 点云数据可能包含了大量地面点或天空点，这些点本身就不在相机视野内。 * **调试方法**： * 在投影前，先过滤掉距离过远或过近的点，以及明显在地平面以下或天空中的点。 * 可视化所有点（包括无效点）的投影位置，看看它们落在图像平面外的哪个方向，这有助于判断是平移问题还是旋转问题。 **4. 使用`cv2.projectPoints`时遇到`Assertion failed`错误** * **症状**：程序崩溃，报错与数组维度或类型有关。 * **可能原因**：输入数据的`dtype`不是`np.float32`或`np.float64`。 * **解决方法**：确保传入`cv2.projectPoints`的所有NumPy数组都是`np.float64`类型。在函数调用前使用`.astype(np.float64)`进行强制转换。为了帮助你系统化地验证，下面提供一个简单的验证表格，你可以根据实际现象勾选： | 现象 | 可能原因 | 建议检查项 | | :--- | :--- | :--- | | 点云整体平移错位 | 平移向量`t`错误 | 检查`t`的符号和分量顺序 | | 点云整体旋转错位 | 旋转矩阵`R`错误 | 检查`R`是否需要转置或求逆 | | 点云扭曲，不成比例 | 内参矩阵`K`错误 | 检查`fx, fy, cx, cy`的值是否合理 | | 点云发散成放射状 | 畸变系数`D`错误 | 尝试将`D`设为0，或检查系数顺序 | | 几乎没有点落在图像内 | 外参误差大或FOV不匹配 | 检查标定质量，过滤无关点云 | ## 6. 进阶应用：为点云着色与生成深度图成功实现基础投影后，我们可以做更多有趣的事情。 ### 6.1 根据投影为点云着色我们可以将图像对应像素的颜色“赋予”点云，生成彩色的点云，这对于可视化非常有用。 ```python def colorize_point_cloud(points_3d, points_2d, valid_mask, image): """ 使用图像颜色为点云着色。参数: points_3d (np.ndarray): 原始3D点云 (N, 3)。 points_2d (np.ndarray): 投影的2D像素坐标 (N, 2)。 valid_mask (np.ndarray): 有效点布尔掩码。 image (np.ndarray): RGB图像 (H, W, 3)，值范围0-255。返回: o3d.geometry.PointCloud: 带有颜色的Open3D点云对象。 """ # 创建新的点云对象 colored_pcd = o3d.geometry.PointCloud() colored_pcd.points = o3d.utility.Vector3dVector(points_3d) # 初始化颜色数组为黑色 (0,0,0) colors = np.zeros((points_3d.shape[0], 3)) # 只对有效投影点进行着色 valid_indices = np.where(valid_mask)[0] valid_pixels = points_2d[valid_mask].astype(int) # 取整得到像素坐标 # 确保像素坐标不越界 (虽然valid_mask已保证，但取整后可能为img_w或img_h) h, w = image.shape[:2] valid_pixels[:, 0] = np.clip(valid_pixels[:, 0], 0, w-1) valid_pixels[:, 1] = np.clip(valid_pixels[:, 1], 0, h-1) # 从图像中提取颜色 (注意Open3D需要0-1范围的float) # 图像是[H, W, 3]，索引是[y, x] colors[valid_indices] = image[valid_pixels[:, 1], valid_pixels[:, 0]] / 255.0 colored_pcd.colors = o3d.utility.Vector3dVector(colors) return colored_pcd # 生成彩色点云 colored_pcd = colorize_point_cloud(lidar_points, projected_pts, inside_mask, camera_image) # 使用Open3D可视化彩色点云 o3d.visualization.draw_geometries([colored_pcd], window_name="Colorized LiDAR Point Cloud", width=1024, height=768) ``` ### 6.2 生成稀疏深度图投影后的点云可以用于生成与图像对齐的深度图。由于LiDAR点云是稀疏的，生成的深度图也是稀疏的。 ```python def create_sparse_depth_map(image_size, points_2d, points_3d, valid_mask): """ 创建一个稀疏深度图。参数: image_size (tuple): (width, height)。 points_2d (np.ndarray): 投影的2D像素坐标 (N, 2)。 points_3d (np.ndarray): 原始3D点云 (N, 3)，用于获取深度（通常是Z坐标）。 valid_mask (np.ndarray): 有效点布尔掩码。返回: np.ndarray: 深度图 (H, W)，无效位置为0或NaN。 """ w, h = image_size depth_map = np.zeros((h, w), dtype=np.float32) # 或者用NaN表示无效值: depth_map = np.full((h, w), np.nan, dtype=np.float32) valid_points_2d = points_2d[valid_mask].astype(int) # 这里假设points_3d的第三列是相机坐标系下的Z值（深度）。 # 注意：我们的tvec是将点转到相机坐标系，但projectPoints内部做了这个变换。 # 更准确的深度是变换后的点在相机坐标系下的Z值。 # 我们可以直接使用原始点云在相机坐标系下的Z值，需要计算 P_cam = R @ P_lidar + t R = calib_params['rvec'] # 注意，我们之前把R转成了rvec，这里需要变回矩阵 R_mat, _ = cv2.Rodrigues(calib_params['rvec']) t_vec = calib_params['tvec'] # 计算所有点在相机坐标系下的坐标 # 更高效的做法：只计算有效点 valid_points_3d = points_3d[valid_mask] # 转换为齐次坐标 (N, 4) ones = np.ones((valid_points_3d.shape[0], 1)) points_homo = np.hstack([valid_points_3d, ones]) # 构建变换矩阵 (3x4) transform_mat = np.hstack([R_mat, t_vec]) # 变换到相机坐标系 points_cam = (transform_mat @ points_homo.T).T # 结果形状 (N, 3) # 深度就是相机坐标系下的Z值 depths = points_cam[:, 2] # 将深度值填入深度图对应像素位置 for (x, y), d in zip(valid_points_2d, depths): if 0 <= x < w and 0 <= y < h: # 如果同一个像素有多个点，可以取最近的点（深度最小） if depth_map[y, x] == 0 or d < depth_map[y, x]: depth_map[y, x] = d return depth_map # 生成深度图 depth_img = create_sparse_depth_map(calib_params['image_size'], projected_pts, lidar_points, inside_mask) # 可视化深度图 plt.figure(figsize=(12, 5)) plt.subplot(1, 2, 1) plt.imshow(camera_image) plt.title('Original Image') plt.axis('off') plt.subplot(1, 2, 2) # 将深度为0的区域显示为黑色 depth_display = depth_map.copy() depth_display[depth_map == 0] = np.nan plt.imshow(depth_display, cmap='jet') plt.colorbar(label='Depth (m)') plt.title('Sparse Depth Map from LiDAR') plt.axis('off') plt.tight_layout() plt.show() ``` ## 7. 完整代码整合与工程化建议将以上所有步骤整合到一个脚本中，并添加一些工程化的改进，如参数解析、错误处理和日志记录。 ```python #!/usr/bin/env python3 """ LiDAR点云到图像投影工具 (基于Autoware标定文件) 作者: [你的名字] 日期: 2023-10-27 描述: 该脚本读取Autoware生成的传感器标定文件、LiDAR点云和相机图像，实现点云到图像的精准投影与可视化。 """ import argparse import yaml import numpy as np import cv2 import open3d as o3d from PIL import Image import matplotlib.pyplot as plt from pathlib import Path import logging # 配置日志 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') logger = logging.getLogger(__name__) class LidarCameraProjector: def __init__(self, calib_file): """ 初始化投影器，加载并处理标定参数。 """ self.calib_params = self._parse_calibration_file(calib_file) logger.info("标定参数加载并处理完成。") def _parse_calibration_file(self, calib_file_path): """解析标定文件，内部方法。""" # ... (与之前 parse_autoware_calibration 函数内容相同) ... # 为节省篇幅，这里省略具体实现，请使用前面章节的代码 pass def load_point_cloud(self, pcd_path): """加载点云文件。""" if not Path(pcd_path).exists(): raise FileNotFoundError(f"点云文件不存在: {pcd_path}") pcd = o3d.io.read_point_cloud(pcd_path) points = np.asarray(pcd.points) # 可选：检查是否有强度信息 if pcd.has_colors(): logger.warning("点云包含颜色信息，但本脚本暂未使用。") if pcd.has_normals(): logger.warning("点云包含法线信息，但本脚本暂未使用。") logger.info(f"从 {pcd_path} 加载了 {points.shape[0]} 个点。") return points def load_image(self, img_path): """加载图像文件。""" if not Path(img_path).exists(): raise FileNotFoundError(f"图像文件不存在: {img_path}") # 使用PIL读取，确保为RGB image = Image.open(img_path) # 转换为RGB模式（处理可能的RGBA或L模式） if image.mode != 'RGB': image = image.convert('RGB') image_np = np.array(image) logger.info(f"从 {img_path} 加载了图像，尺寸: {image_np.shape[1]}x{image_np.shape[0]}") return image_np def project_points(self, points_3d): """投影点云到图像平面。""" # ... (与之前 project_lidar_to_image 函数内容相同) ... pass def visualize(self, image, points_2d, valid_mask, output_path=None): """可视化投影结果。""" # ... (与之前 visualize_projection 函数内容类似，增加保存功能) ... if output_path: plt.savefig(output_path, dpi=150, bbox_inches='tight') logger.info(f"可视化结果已保存至: {output_path}") plt.show() def run(self, pcd_path, img_path, output_dir='./output'): """主运行流程。""" Path(output_dir).mkdir(parents=True, exist_ok=True) # 1. 加载数据 points = self.load_point_cloud(pcd_path) image = self.load_image(img_path) # 2. 投影 projected_pts, valid_mask = self.project_points(points) # 3. 可视化 vis_path = Path(output_dir) / 'projection_result.png' self.visualize(image, projected_pts, valid_mask, output_path=str(vis_path)) # 4. 可选：保存彩色点云 colored_pcd = self.colorize_point_cloud(points, projected_pts, valid_mask, image) pcd_output_path = Path(output_dir) / 'colored_pointcloud.ply' o3d.io.write_point_cloud(str(pcd_output_path), colored_pcd) logger.info(f"彩色点云已保存至: {pcd_output_path}") # 5. 可选：保存深度图 depth_map = self.create_sparse_depth_map(points, projected_pts, valid_mask) depth_map_path = Path(output_dir) / 'depth_map.npy' np.save(str(depth_map_path), depth_map) logger.info(f"深度图已保存至: {depth_map_path}") return { 'points_2d': projected_pts, 'valid_mask': valid_mask, 'colored_pcd': colored_pcd, 'depth_map': depth_map } def main(): parser = argparse.ArgumentParser(description='将LiDAR点云投影到图像上。') parser.add_argument('--calib', required=True, help='Autoware标定YAML文件路径') parser.add_argument('--pcd', required=True, help='LiDAR点云文件路径 (.pcd)') parser.add_argument('--img', required=True, help='相机图像文件路径') parser.add_argument('--output', default='./output', help='输出目录') args = parser.parse_args() try: projector = LidarCameraProjector(args.calib) results = projector.run(args.pcd, args.img, args.output) logger.info("处理完成！") except Exception as e: logger.error(f"处理过程中发生错误: {e}", exc_info=True) return 1 return 0 if __name__ == '__main__': exit(main()) ``` 将这个脚本保存为 `lidar_projection.py`，你就可以通过命令行方便地使用了： ```bash python lidar_projection.py --calib ./calibration.yaml --pcd ./pointcloud.pcd --img ./image.jpg --output ./my_result ``` **工程化建议：** * **参数化**：将外参处理中的平移向量变换规则（如 `[-tz, tx, ty]`）作为可配置参数，以适应不同的传感器安装方案。 * **批处理**：扩展脚本以支持处理整个数据序列（多个点云和图像对）。 * **性能优化**：对于大规模点云，可以考虑使用体素下采样（Open3D的`voxel_down_sample`）来减少点数，提高投影和可视化速度。 * **验证工具**：编写一个辅助脚本，通过手动选取若干对应点（点在点云和图像中的位置）来定量评估投影误差，并自动计算重投影误差。 * **集成到管道**：将投影模块封装成函数或类，方便集成到更大的感知系统中，例如为图像上的2D检测框提供对应的3D点云簇。通过以上步骤，你应该已经掌握了使用Autoware标定文件实现激光雷达点云到图像精准投影的完整流程。记住，传感器标定是感知系统的基石，耐心调试和理解每个参数背后的物理意义至关重要。当看到稀疏的激光点完美地贴合在图像的物体轮廓上时，那种成就感正是推动我们解决一个个技术难题的动力。在实际项目中，你可能还会遇到时间同步、运动畸变校正等问题，但这篇文章为你打下了坚实的第一步。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Banana Pi BPI-Centi-S3 利用MicroPython实现JPG图片轮播功能