第5课 语音识别技术

探索让计算机理解人类语言的神奇技术

语音识别四大步骤

1
声音数字化
按照一定频率对连续变化的声音物理信号进行采样,转换成计算机能处理的数值。采样频率和量化精度越高,声音质量越好。
2
特征提取
每隔一定时间,把声音的音调、音高、音长等特征提取出来,为后续识别做准备。
3
模式匹配
将提取出的特征在声学模型中进行对比,得到一组音素序列。音素是根据语音自然规律划分的最小语音单位。
4
语言处理
借助语言模型,将音素序列转换为有意义的文字或指令,完成语音识别过程。
声音数字化过程
声音波形数字化过程示意图

🎯 知识检测 - 语音识别技术

1. 语音识别技术的第一步是什么?
A. 特征提取
B. 声音数字化
C. 模式匹配
D. 语言处理
2. 在特征提取阶段,主要提取声音的哪些特征?
A. 音调、音高、音长
B. 颜色、形状、大小
C. 温度、湿度、压力
D. 速度、方向、距离
3. 什么是音素?
A. 声音的频率单位
B. 根据语音自然规律划分的最小语音单位
C. 声音的强度单位
D. 语音识别的错误率
4. 为什么用方言对智能设备说话可能导致识别失败?
A. 方言音量太小
B. 方言与声学模型中的标准发音不匹配
C. 方言说话速度太快
D. 方言包含太多词汇
5. 语音识别技术的最后一步"语言处理"需要借助什么?
A. 声学模型
B. 语言模型
C. 数学模型
D. 物理模型
得分: 0/5