基于单视图几何摄像机内参的投影成像原理-程序员充电站

理论基础：

焦距 f 就是胶片到小孔的距离

摄像机焦距和fov存在一一对应的关系，fov其实就是摄像机焦距的另一种更直观的表达方式

摄像机坐标系的原点就是针孔位置：

摄像机焦距就是原点到像平面的距离

通过将：（点的物理坐标/点的深度z ）* f-[相机以像素为单位的焦距] 就可以得到点的物理坐标到像平面坐标的转换

计算方式：

根据图像长宽和fov得到图像的相机内参，从而得到3D点到图像平面的映射关系

代码实现：

从图像通过假设fov的方式得到相机内参的代码：

def generate_camera_params(image_path, fx=None, fy=None, cx=None, cy=None, fov=60): """ Generate camera parameters for 3D visualization. Args: image_path: Path to the image fx, fy: Focal lengths in pixels (if None, will be calculated from fov) cx, cy: Principal point coordinates in pixels (if None, will be set to image center) fov: Field of view in degrees (default: 60°) Returns: dict: Camera parameters with keys 'fx', 'fy', 'cx', 'cy' """ image = Image.open(image_path) w, h = image.size # Generate pseudo camera params if not provided if fx is None or fy is None: fx = round(w / (2 * np.tan(np.deg2rad(fov) / 2)), 2) fy = round(h / (2 * np.tan(np.deg2rad(fov) / 2)), 2) if cx is None or cy is None: cx = round(w / 2, 2) cy = round(h / 2, 2) cam_params = {'fx': fx, 'fy': fy, 'cx': cx, 'cy': cy} return cam_params

由摄像机坐标系下的物理3D点，根据对应摄像机内参来得到对应像平面上2D像素坐标的代码：

def convert_3dbbox(point, cam_params): """ Convert 3D bounding box to 2D image coordinates We represent 3D bounding boxes as: `[x_center, y_center, z_center, x_size, y_size, z_size, roll, pitch, yaw]` - **x_center, y_center, z_center**: Object center in camera coordinates (meters) - **x_size, y_size, z_size**: Object dimensions (meters) - **roll, pitch, yaw**: Rotation angles (radians) """ x, y, z, x_size, y_size, z_size, pitch, yaw, roll = point hx, hy, hz = x_size / 2, y_size / 2, z_size / 2 local_corners = [ [ hx, hy, hz], [ hx, hy, -hz], [ hx, -hy, hz], [ hx, -hy, -hz], [-hx, hy, hz], [-hx, hy, -hz], [-hx, -hy, hz], [-hx, -hy, -hz] ] def rotate_xyz(_point, _pitch, _yaw, _roll): # 这是一个 XYZ 顺序的欧拉角旋转 x0, y0, z0 = _point x1 = x0 y1 = y0 * math.cos(_pitch) - z0 * math.sin(_pitch) z1 = y0 * math.sin(_pitch) + z0 * math.cos(_pitch) x2 = x1 * math.cos(_yaw) + z1 * math.sin(_yaw) y2 = y1 z2 = -x1 * math.sin(_yaw) + z1 * math.cos(_yaw) x3 = x2 * math.cos(_roll) - y2 * math.sin(_roll) y3 = x2 * math.sin(_roll) + y2 * math.cos(_roll) z3 = z2 return [x3, y3, z3] img_corners = [] for corner in local_corners: # 8个顶点 rotated = rotate_xyz(corner, np.deg2rad(pitch), np.deg2rad(yaw), np.deg2rad(roll)) X, Y, Z = rotated[0] + x, rotated[1] + y, rotated[2] + z if Z > 0: x_2d = cam_params['fx'] * (X / Z) + cam_params['cx'] y_2d = cam_params['fy'] * (Y / Z) + cam_params['cy'] img_corners.append([x_2d, y_2d]) return img_corners

多视图情况：

多视图中的物体表示方法：

1，所有帧都以第一帧的相机坐标系为世界坐标系，直接预测物体在世界坐标系中的3D位置

2，每一帧都：预测目标物体在当前帧的相机坐标系下的3d坐标，这样z_center就是对应的相对于当前帧的相机的深度

代码随想录算法训练营第三十七天：最长递增子序列，最长连续递增数列，最长重复子序列

300.最长递增子序列文章讲解/视频讲解题目描述： 给你一个整数数组 nums ，找到其中最长严格递增子序列的长度。子序列是由数组派生而来的序列，删除（或不删除）数组中的元素而不改变其余元素的顺序。例如&#xff…

李华

40、GCC对C语言的扩展

GCC对C语言的扩展 1. 引言 GNU编译器集合（GCC）为C语言提供了许多扩展，其中一些对系统程序员特别有价值。大部分扩展能让程序员向编译器提供代码行为和预期用途的额外信息，帮助编译器生成更高效的机器代码，还有些扩展填补了C语言底层的空白。 GCC提供的部分扩展已被纳入…

李华

【昇腾CANN训练营·优化篇】刀尖上的舞蹈：深入理解 Atomic Add 原子操作与性能代价

训练营简介 2025年昇腾CANN训练营第二季，基于CANN开源开放全场景，推出0基础入门系列、码力全开特辑、开发者案例等专题课程，助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证，即可领取精美证书，完成…

李华

17、构建前端面板界面全解析

构建前端面板界面全解析 1. 常见架构与LCD显示在许多应用场景中，存在一种常见的架构，即Linux处理器通过连接到串行、并行或USB端口的控制器芯片来处理LCD显示。这种架构适用于小批量生产以及基于个人计算机主板的设备。这类架构下的LCD通常有1 - 4行文本，每行包含10 - …

李华

毕业设计实战：Spring Boot付费问答系统，从“知识变现”到“支付安全”避坑指南！

毕业设计实战：Spring Boot付费问答系统，从“知识变现”到“支付安全”避坑指南！ 家人们谁懂啊！当初做付费问答系统时，光“付费解锁逻辑”就纠结了整整一周——一开始直接用数据库字段控制查看权限，结果用户…

李华

基于UWB定位的安全帽人员定位系统：技术架构和核心功能详解

hello~这里是维构lbs智能定位，如果有项目需求和技术交流欢迎来私信我们~点击文章最下方可获取免费获取技术文档。安全帽是多种定位终端的设备之一，而安全帽人员定位系统是融合定位终端、无线通信技术与后台管理平台的智能化系统，将定位模块集…

李华