计算机视觉和计算机图形学

计算机视觉

计算机视觉涉及使用计算机软件和硬件对人类视觉进行建模和复制。如果我们正式定义计算机视觉，那么它的定义将是计算机视觉是一门学科，它研究如何根据场景中存在的结构属性，从二维图像中重建、中断和理解三维场景。

它需要以下领域的知识来理解和模拟人类视觉系统的运作。

计算机科学
电气工程
数学
生理学
生物学
认知科学

计算机视觉层次结构

计算机视觉分为以下三个基本类别：

低级视觉：包括用于特征提取的过程图像。

中级视觉：包括物体识别和三维场景解释

高级视觉：包括场景的概念描述，如活动、意图和行为。

计算机视觉与图像处理

图像处理研究图像到图像的转换。图像处理的输入和输出都是图像。

计算机视觉是从图像中构建物理对象的明确、有意义的描述。计算机视觉的输出是对 3D 场景中结构的描述或解释。

示例应用

机器人技术
医学
安全
运输
工业自动化

机器人应用

定位 - 自动确定机器人位置
导航
避障
装配（钻孔、焊接、喷漆）
操作（例如 PUMA 机器人操作器）
人机交互 (HRI)：智能机器人与人互动并为人服务

医学应用

分类和检测（例如病变或细胞分类和肿瘤检测）
2D/3D分割
3D人体器官重建（MRI或超声波）
视觉引导机器人手术

工业自动化应用

工业检测（缺陷检测）
装配
条形码和包装标签读取
对象分类
文档理解（例如OCR）

安全应用

生物识别（虹膜、指纹、人脸识别）
监视 - 检测某些可疑活动或行为

运输应用

自动驾驶汽车
安全，例如驾驶员警觉监控

计算机图形学

计算机图形学是使用计算机创建的图形，并由计算机在专门的图形硬件和软件的帮助下表示图像数据。正式地说，计算机图形学是几何对象（建模）及其图像（渲染）的创建、操作和存储。

计算机图形学领域随着计算机图形硬件的出现而发展起来。如今，计算机图形学几乎应用于每个领域。已经开发了许多强大的工具来可视化数据。当公司开始在视频游戏中使用计算机图形学时，计算机图形学领域变得更加流行。今天，它是一个价值数十亿美元的产业，也是计算机图形学发展的主要驱动力。一些常见的应用领域如下：

计算机辅助设计 (CAD)
演示图形
3D 动画
教育和培训
图形用户界面

计算机辅助设计

用于建筑、汽车、飞机和许多其他产品的设计
用于制作虚拟现实系统。

演示图形

常用于汇总财务、统计数据
用于生成幻灯片

3D 动画

在电影行业中被 Pixar、DresmsWorks 等公司广泛使用
在游戏和电影中添加特效。

教育和培训

计算机生成的物理系统模型
医学可视化
3D MRI
牙科和骨扫描
用于飞行员训练的刺激器等。

图形用户界面

它用于制作图形用户界面对象，如按钮、图标和其他组件

数字图像处理

计算机视觉和计算机图形学