透视变换
当人眼看近处的东西时,它们看起来比远处的东西大。这通常称为透视。而变换是将对象等从一种状态转移到另一种状态。
因此,总的来说,透视变换涉及将 3d 世界转换为 2d 图像。人类视觉的工作原理与相机的工作原理相同。
我们将详细了解为什么会发生这种情况,即那些离您近的物体看起来更大,而那些离您远的物体看起来更小,即使您靠近它们时它们看起来更大。
我们将从参考系的概念开始讨论:
参考系:
参考系基本上是一组我们测量某物时所参考的值。

5 个参考系
为了分析 3d 世界/图像/场景,需要 5 个不同的参考系。
- 对象
- 世界
- 相机
- 图像
- 像素
对象坐标系
对象坐标系用于对对象进行建模。例如,检查某个对象相对于另一个对象是否处于适当的位置。它是一个 3d 坐标系。
世界坐标系
世界坐标系用于在 3 维世界中关联对象。它是一个 3d 坐标系。
相机坐标系
相机坐标系用于将对象与相机关联起来。它是一个 3d 坐标系。
图像坐标系
它不是 3d 坐标系,而是 2d 系统。它用于描述 3d 点如何映射到 2d 图像平面中。
像素坐标框架
它也是一个 2d 坐标系。每个像素都有一个像素坐标值。
这 5 个框架之间的转换

这就是 3d 场景如何转换为 2d,带有像素图像。
现在我们将从数学上解释这个概念。

其中
Y = 3d 物体
y = 2d 图像
f = 相机焦距
Z = 物体与相机之间的距离
现在,此变换中形成了两个不同的角度,用 Q 表示。
第一个角度是

其中减号表示图像是反转的。形成的第二个角度是:

比较这两个方程,我们得到

从这个方程中,我们可以看到,当光线从物体上反射回来,从相机传出时,会形成一个倒像。
通过这个例子,我们可以更好地理解这一点。
例如
计算形成的图像的大小
假设拍摄了一个身高 5 米、站在距离相机 50 米远的人的图像,我们必须知道这个人的图像大小,相机的焦距为 50 毫米。
解决方案:
由于焦距长度以毫米为单位,因此我们必须将每件事都转换为毫米才能计算出来。
因此,
Y = 5000 毫米。
f = 50 毫米。
Z = 50000 毫米。
将值代入公式,我们得到

= -5 毫米。
同样,减号表示图像是倒置的。