计算机视觉和计算机图形学
计算机视觉
计算机视觉涉及使用计算机软件和硬件对人类视觉进行建模和复制。如果我们正式定义计算机视觉,那么它的定义将是计算机视觉是一门学科,它研究如何根据场景中存在的结构属性,从二维图像中重建、中断和理解三维场景。
它需要以下领域的知识来理解和模拟人类视觉系统的运作。
- 计算机科学
- 电气工程
- 数学
- 生理学
- 生物学
- 认知科学
计算机视觉层次结构
计算机视觉分为以下三个基本类别:
低级视觉:包括用于特征提取的过程图像。
中级视觉:包括物体识别和三维场景解释
高级视觉:包括场景的概念描述,如活动、意图和行为。
相关领域
计算机视觉与以下领域有很大的重叠:
图像处理:它专注于图像处理。
模式识别:它研究对模式进行分类的各种技术。
摄影测量:它涉及从图像中获取精确的测量值。
计算机视觉与图像处理
图像处理研究图像到图像的转换。图像处理的输入和输出都是图像。
计算机视觉是从图像中构建物理对象的明确、有意义的描述。计算机视觉的输出是对 3D 场景中结构的描述或解释。
示例应用
- 机器人技术
- 医学
- 安全
- 运输
- 工业自动化
机器人应用
- 定位 - 自动确定机器人位置
- 导航
- 避障
- 装配(钻孔、焊接、喷漆)
- 操作(例如 PUMA 机器人操作器)
- 人机交互 (HRI):智能机器人与人互动并为人服务
医学应用
- 分类和检测(例如病变或细胞分类和肿瘤检测)
- 2D/3D分割
- 3D人体器官重建(MRI或超声波)
- 视觉引导机器人手术
工业自动化应用
- 工业检测(缺陷检测)
- 装配
- 条形码和包装标签读取
- 对象分类
- 文档理解(例如OCR)
安全应用
- 生物识别(虹膜、指纹、人脸识别)
- 监视 - 检测某些可疑活动或行为
运输应用
- 自动驾驶汽车
- 安全,例如驾驶员警觉监控
计算机图形学
计算机图形学是使用计算机创建的图形,并由计算机在专门的图形硬件和软件的帮助下表示图像数据。正式地说,计算机图形学是几何对象(建模)及其图像(渲染)的创建、操作和存储。
计算机图形学领域随着计算机图形硬件的出现而发展起来。如今,计算机图形学几乎应用于每个领域。已经开发了许多强大的工具来可视化数据。当公司开始在视频游戏中使用计算机图形学时,计算机图形学领域变得更加流行。今天,它是一个价值数十亿美元的产业,也是计算机图形学发展的主要驱动力。一些常见的应用领域如下:
- 计算机辅助设计 (CAD)
- 演示图形
- 3D 动画
- 教育和培训
- 图形用户界面
计算机辅助设计
- 用于建筑、汽车、飞机和许多其他产品的设计
- 用于制作虚拟现实系统。
演示图形
- 常用于汇总财务、统计数据
- 用于生成幻灯片
3D 动画
- 在电影行业中被 Pixar、DresmsWorks 等公司广泛使用
- 在游戏和电影中添加特效。
教育和培训
- 计算机生成的物理系统模型
- 医学可视化
- 3D MRI
- 牙科和骨扫描
- 用于飞行员训练的刺激器等。
图形用户界面
- 它用于制作图形用户界面对象,如按钮、图标和其他组件