透视变换

当人眼看近处的东西时,它们看起来比远处的东西大。这通常称为透视。而变换是将对象等从一种状态转移到另一种状态。

因此,总的来说,透视变换涉及将 3d 世界转换为 2d 图像。人类视觉的工作原理与相机的工作原理相同。

我们将详细了解为什么会发生这种情况,即那些离您近的物体看起来更大,而那些离您远的物体看起来更小,即使您靠近它们时它们看起来更大。

我们将从参考系的概念开始讨论:

参考系:

参考系基本上是一组我们测量某物时所参考的值。

perspective

5 个参考系

为了分析 3d 世界/图像/场景,需要 5 个不同的参考系。

  • 对象
  • 世界
  • 相机
  • 图像
  • 像素

对象坐标系

对象坐标系用于对对象进行建模。例如,检查某个对象相对于另一个对象是否处于适当的位置。它是一个 3d 坐标系。

世界坐标系

世界坐标系用于在 3 维世界中关联对象。它是一个 3d 坐标系。

相机坐标系

相机坐标系用于将对象与相机关联起来。它是一个 3d 坐标系。

图像坐标系

它不是 3d 坐标系,而是 2d 系统。它用于描述 3d 点如何映射到 2d 图像平面中。

像素坐标框架

它也是一个 2d 坐标系。每个像素都有一个像素坐标值。

这 5 个框架之间的转换

transformation

这就是 3d 场景如何转换为 2d,带有像素图像。

现在我们将从数学上解释这个概念。

maths perspective

其中

Y = 3d 物体

y = 2d 图像

f = 相机焦距

Z = 物体与相机之间的距离

现在,此变换中形成了两个不同的角度,用 Q 表示。

第一个角度是

tan

其中减号表示图像是反转的。形成的第二个角度是:

tan1

比较这两个方程,我们得到

result

从这个方程中,我们可以看到,当光线从物体上反射回来,从相机传出时,会形成一个倒像。

通过这个例子,我们可以更好地理解这一点。

例如

计算形成的图像的大小

假设拍摄了一个身高 5 米、站在距离相机 50 米远的人的图像,我们必须知道这个人的图像大小,相机的焦距为 50 毫米。

解决方案:

由于焦距长度以毫米为单位,因此我们必须将每件事都转换为毫米才能计算出来。

因此,

Y = 5000 毫米。

f = 50 毫米。

Z = 50000 毫米。

将值代入公式,我们得到

formula

= -5 毫米。

同样,减号表示图像是倒置的。