第5课语音识别技术

语音识别四大步骤

声音数字化

按照一定频率对连续变化的声音物理信号进行采样，转换成计算机能处理的数值。采样频率和量化精度越高，声音质量越好。

特征提取

每隔一定时间，把声音的音调、音高、音长等特征提取出来，为后续识别做准备。

模式匹配

将提取出的特征在声学模型中进行对比，得到一组音素序列。音素是根据语音自然规律划分的最小语音单位。

语言处理

借助语言模型，将音素序列转换为有意义的文字或指令，完成语音识别过程。

声音波形数字化过程示意图

🎯 知识检测 - 语音识别技术

1. 语音识别技术的第一步是什么？

A. 特征提取

B. 声音数字化

C. 模式匹配

D. 语言处理

✅ 正确！声音数字化是语音识别的第一步，将模拟声音信号转换为数字信号。

❌ 不正确。语音识别的第一步是声音数字化，需要先将声音转换为计算机能处理的数字信号。

2. 在特征提取阶段，主要提取声音的哪些特征？

A. 音调、音高、音长

B. 颜色、形状、大小

C. 温度、湿度、压力

D. 速度、方向、距离

✅ 正确！特征提取主要提取音调、音高、音长等声音特征。

❌ 不正确。特征提取阶段主要提取的是音调、音高、音长等声音相关的特征。

3. 什么是音素？

A. 声音的频率单位

B. 根据语音自然规律划分的最小语音单位

C. 声音的强度单位

D. 语音识别的错误率

✅ 正确！音素是根据语音自然规律划分出的最小语音单位。

❌ 不正确。音素是根据语音自然规律划分出的最小语音单位，不是频率或强度单位。

4. 为什么用方言对智能设备说话可能导致识别失败？

A. 方言音量太小

B. 方言与声学模型中的标准发音不匹配

C. 方言说话速度太快

D. 方言包含太多词汇

✅ 正确！方言的发音特征与声学模型中的标准发音不匹配，导致模式匹配失败。

❌ 不正确。方言识别失败的主要原因是发音特征与声学模型不匹配，而不是音量或速度问题。

5. 语音识别技术的最后一步"语言处理"需要借助什么？

A. 声学模型

B. 语言模型

C. 数学模型

D. 物理模型

✅ 正确！语言处理需要借助语言模型来理解语义和上下文。

❌ 不正确。语言处理阶段需要借助语言模型，而不是声学模型或其他模型。

得分: 0/5

第5课 语音识别技术

语音识别四大步骤

🎯 知识检测 - 语音识别技术