第5课 语音识别技术
探索让计算机理解人类语言的神奇技术
🎵 播放课程介绍
语音识别四大步骤
1
声音数字化
按照一定频率对连续变化的声音物理信号进行采样,转换成计算机能处理的数值。采样频率和量化精度越高,声音质量越好。
2
特征提取
每隔一定时间,把声音的音调、音高、音长等特征提取出来,为后续识别做准备。
3
模式匹配
将提取出的特征在声学模型中进行对比,得到一组音素序列。音素是根据语音自然规律划分的最小语音单位。
4
语言处理
借助语言模型,将音素序列转换为有意义的文字或指令,完成语音识别过程。
声音波形数字化过程示意图
🎯 知识检测 - 语音识别技术
1. 语音识别技术的第一步是什么?
A. 特征提取
B. 声音数字化
C. 模式匹配
D. 语言处理
✅ 正确!声音数字化是语音识别的第一步,将模拟声音信号转换为数字信号。
❌ 不正确。语音识别的第一步是声音数字化,需要先将声音转换为计算机能处理的数字信号。
2. 在特征提取阶段,主要提取声音的哪些特征?
A. 音调、音高、音长
B. 颜色、形状、大小
C. 温度、湿度、压力
D. 速度、方向、距离
✅ 正确!特征提取主要提取音调、音高、音长等声音特征。
❌ 不正确。特征提取阶段主要提取的是音调、音高、音长等声音相关的特征。
3. 什么是音素?
A. 声音的频率单位
B. 根据语音自然规律划分的最小语音单位
C. 声音的强度单位
D. 语音识别的错误率
✅ 正确!音素是根据语音自然规律划分出的最小语音单位。
❌ 不正确。音素是根据语音自然规律划分出的最小语音单位,不是频率或强度单位。
4. 为什么用方言对智能设备说话可能导致识别失败?
A. 方言音量太小
B. 方言与声学模型中的标准发音不匹配
C. 方言说话速度太快
D. 方言包含太多词汇
✅ 正确!方言的发音特征与声学模型中的标准发音不匹配,导致模式匹配失败。
❌ 不正确。方言识别失败的主要原因是发音特征与声学模型不匹配,而不是音量或速度问题。
5. 语音识别技术的最后一步"语言处理"需要借助什么?
A. 声学模型
B. 语言模型
C. 数学模型
D. 物理模型
✅ 正确!语言处理需要借助语言模型来理解语义和上下文。
❌ 不正确。语言处理阶段需要借助语言模型,而不是声学模型或其他模型。
上一题
得分: 0/5
下一题