AI - 代理和环境

AI 系统由代理及其环境组成。代理在其环境中行动。环境可能包含其他代理。

什么是代理和环境?

代理是任何能够通过传感器感知其环境并通过效应器对该环境采取行动的东西。

  • 人类代理具有与传感器平行的感觉器官,例如眼睛、耳朵、鼻子、舌头和皮肤,以及用于效应器的其他器官,例如手、腿、嘴巴。

  • 机器人代理用摄像头和红外测距仪代替传感器,用各种电机和执行器代替效应器。

  • 软件代理已编码位串作为其程序和操作。

代理和环境

代理术语

  • 代理的性能衡量标准 − 它是决定代理成功程度的标准。

  • 代理的行为 − 它是代理在任何给定的感知序列之后执行的操作。

  • 感知 − 它是代理在给定实例中的感知输入。

  • 感知序列 − 它是代理迄今为止所感知到的所有事物的历史记录。

  • 代理功能 −它是从戒律序列到动作的映射。

理性

理性不过是合理、明智和具有良好判断力的状态。

理性与预期动作和结果有关,具体取决于代理所感知的内容。以获取有用信息为目的执行操作是理性的重要组成部分。

什么是理想的理性代理?

理想的理性代理是能够根据以下条件执行预期动作以最大化其绩效指标的代理 −

  • 其感知序列
  • 其内置知识库

代理的理性取决于以下 −

  • 绩效衡量标准,决定成功程度。

  • 代理到目前为止的感知序列

  • 代理关于环境的先验知识

  • 代理可以执行的操作

理性的代理总是执行正确的操作,其中正确的操作意味着导致代理在给定的感知序列中最成功的操作。代理解决的问题以性能测量、环境、执行器和传感器 (PEAS) 为特征。

智能代理的结构

代理的结构可以视为 −

  • 代理 = 架构 + 代理程序
  • 架构 = 代理执行的机器。
  • 代理程序 = 代理功能的实现。

简单反射代理

  • 它们仅根据当前感知选择操作。
  • 只有根据当前感知做出正确决策时,它们才是理性的。
  • 它们的环境是完全可观察的。

条件-动作规则 −它是将状态(条件)映射到动作的规则。

Simple Reflex Agent

基于模型的反射代理

它们使用世界模型来选择自己的行为。它们保持内部状态。

模型 − 关于"世界上的事情如何发生"的知识。

内部状态 − 它表示当前状态中未观察到的方面,具体取决于感知历史。

更新状态需要有关 − 的信息

  • 世界如何演变。
  • 代理的行为如何影响世界。
基于模型的反射代理

基于目标的代理

它们选择自己的行为以实现目标。基于目标的方法比反射代理更灵活,因为支持决策的知识是明确建模的,从而允许进行修改。

目标 −这是对理想情况的描述。

基于目标的反射代理

基于效用的代理

它们根据每个状态的偏好(效用)选择操作。

当 − 时,目标是不充分的

  • 存在相互冲突的目标,其中只有少数可以实现。

  • 目标实现存在一定的不确定性,您需要权衡成功的可能性与目标的重要性。

基于效用的代理

环境的性质

一些程序在完全人工环境中运行,仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。

相比之下,一些软件代理(软件机器人或软机器人)存在于丰富、无限的软机器人领域中。模拟器具有非常详细、复杂的环境。软件代理需要实时从一系列操作中进行选择。旨在扫描客户在线偏好并向客户展示有趣项目的软机器人既可以在真实环境中工作,也可以在人工环境中工作。

最著名的人工环境图灵测试环境,其中一个真实代理和其他人工代理在平等的基础上进行测试。这是一个非常具有挑战性的环境,因为软件代理很难像人类一样表现良好。

图灵测试

可以使用图灵测试来衡量系统智能行为的成功。

两个人和一台要评估的机器参与测试。在两个人中,一个人扮演测试员的角色。他们每个人都坐在不同的房间里。测试员不知道谁是机器,谁是人。他通过键入问题并将其发送给两个智能来询问问题,然后他会收到键入的答案。

此测试旨在愚弄测试人员。如果测试人员无法从人类响应中确定机器的响应,则该机器被称为智能。

环境属性

环境具有多种属性 −

  • 离散/连续 − 如果环境状态的数量有限,且这些状态具有明确的定义,则该环境是离散的(例如,国际象棋);否则,该环境是连续的(例如,驾驶)。

  • 可观察/部分可观察 − 如果可以根据感知确定每个时间点环境的完整状态,则该环境是可观察的;否则,该环境仅是部分可观察的。

  • 静态/动态 − 如果代理在执行操作时环境没有变化,则该环境是静态的;否则,该环境是动态的。

  • 单个代理/多个代理 − 环境可能包含其他代理,这些代理可能与代理属于相同或不同的类型。

  • 可访问/不可访问 −如果代理的感官器官可以访问环境的完整状态,则该代理可以访问环境。

  • 确定性/非确定性 − 如果环境的下一个状态完全由当前状态和代理的操作决定,则环境是确定性的;否则是非确定性的。

  • 情景/非情景 − 在情景环境中,每个情景都由代理感知然后采取行动组成。其行动的质量仅取决于情景本身。后续情景不依赖于前几集中的动作。情景环境要简单得多,因为代理不需要提前思考。