语音识别

语音识别生物特征识别模式是生理和行为模式的结合。语音识别就是声音识别。它依赖于受−影响的特征。

  • 生理成分 − 人的声带、嘴唇、牙齿、舌头和口腔的物理形状、大小和健康状况。

  • 行为成分 − 说话时的情绪状态、口音、语调、音调、说话速度、喃喃自语等。

语音识别系统

语音识别也称为说话人识别。在注册时,用户需要对着麦克风说出一个单词或短语。这对于获取候选人的语音样本是必要的。

来自麦克风的电信号通过模拟数字 (ADC) 转换器转换为数字信号。它作为数字化样本记录到计算机内存中。然后,计算机将候选人的输入语音与存储的数字化语音样本进行比较并尝试匹配,并识别候选人。

语音识别

语音识别模式

语音识别有两种变体 − 说话人相关说话人独立

说话人相关语音识别依赖于对候选人特定语音特征的了解。该系统通过语音训练(或注册)学习这些特征。

  • 系统需要对用户进行训练,使其适应特定的口音和语调,然后才能用于识别所说的内容。

  • 如果只有一个用户使用该系统,这是一个不错的选择。

说话人独立系统能够通过限制语音上下文(例如单词和短语)来识别来自不同用户的语音。这些系统用于自动电话接口。

  • 它们不需要对每个单独的用户进行系统训练。

  • 它们是供不同个人使用的好选择,不需要识别每个候选人的语音特征。

语音和语音识别之间的区别

说话人识别和语音识别被错误地视为相同;但它们是不同的技术。让我们看看 −

说话人识别(语音识别) 语音识别
语音识别的目的是识别谁在说话。 语音识别旨在理解和领会所说的内容。
它用于通过分析其音调、音高和口音来识别人。 它用于免提计算、地图或菜单导航。

语音识别的优点

  • 它很容易实现。

语音的缺点识别

  • 容易受到麦克风质量和噪音的影响。
  • 无法控制影响输入系统的因素会显著降低性能。

  • 一些说话人验证系统也容易受到通过录音进行的欺骗攻击。

语音识别的应用

  • 执行电话和互联网交易。
  • 与基于交互式语音应答 (IRV) 的银行和医疗系统合作。

  • 将音频签名应用于数字文档。
  • 在娱乐和紧急服务中。
  • 在在线教育系统中。