语音识别真实互动实验工具

使用真实麦克风输入,体验完整的语音识别流程 🎤

麦克风

实验1:真实麦克风语音输入

使用你的麦克风,实时观察声音的波形变化

🎤 麦克风控制

📊 实时数据

采样率: -- Hz
声道数: --
录音时长: 0秒

💡 使用提示

  • • 点击"开启麦克风"后需要授权浏览器访问麦克风
  • • 对着麦克风说话,观察波形和音量变化
  • • 尝试不同音量和音调,看波形如何变化
  • • 点击"停止录音"结束实验

🌊 实时波形图

点击"开启麦克风"开始录音

🔍 观察要点

  • 波形振幅:说话越大声,波形越高
  • 波形频率:音调越高,波形越密集
  • 波形连续性:持续说话会形成连续的波形
  • 静音状态:不说话时波形接近直线
对比

实验2:真实场景还原对比

通过音频处理技术,真实还原三种不同的识别场景

标准普通话

清晰标准的发音

识别状态:未开始

"今天天气真好"

0%

准确率:98%

技术说明:原音播放,无任何处理,模拟理想识别环境
⚠️

四川方言

真实还原方言特征

识别状态:未开始

"今天天真好"

0%

准确率:75%

技术说明:语速降低15%,低频增强+6dB(400Hz),鼻音共振+4dB(1200Hz),高频衰减-5dB(3000Hz),轻微失真处理,五重滤波器链模拟真实四川方言

街道噪音

真实还原噪音干扰

识别状态:未开始

"今......好"

0%

准确率:45%

技术说明:原音降至60%音量,叠加15%白噪音,添加2000Hz低通滤波器,模拟真实街道环境

🔬 真实还原技术

✅ 标准普通话

采用原始音频,无任何处理

• 清晰的音素
• 标准的音调
• 无背景干扰

⚠️ 四川方言

通过Web Audio API实时处理

• 语速降低15%
• 低频增强(音调偏低)
• 鼻音共振增强
• 高频衰减(卷舌弱化)
• 轻微失真(发音不标准)

❌ 街道噪音

实时生成白噪音并混合

• 原音衰减40%
• 白噪音叠加
• 低通滤波模拟

游戏

实验3:同音异义词识别挑战

测试语言模型如何根据语境选择正确的词

得分:0 / 0

📝 题目 1/5

请根据下面的句子,选择正确的词:

森林里有很多___。

读音:shù mù

🎯 游戏规则

  • • 共5道题,每题4个选项
  • • 根据句子语境选择正确的词
  • • 答对得1分,答错不扣分
  • • 选择后会显示正确答案

💡 为什么会出错?

同音异义词的发音完全相同,语音识别系统需要依靠语言模型分析上下文,才能选出符合语义的正确词汇。这也是语音识别的难点之一!