在小爱音箱上获得与豆包近乎一致的端侧实时语音对话体验
2.23.1.mov
| 型号 | 设备代号 |
|---|---|
| Xiaomi 智能音箱 Pro | OH2P |
- 实时对话体验:与移动端豆包一致,支持实时互动、音色定义、连续对话与随时打断。
- 双助手共存:小爱同学与豆包同学可同时运行,拥有独立的唤醒词。
- 纯本地运行:程序完全在音箱本机执行,无需搭建外部中转服务器。
- 自定义唤醒:支持根据需求自定义关键词进行语音唤醒。
- 远场优化:集成 AEC(回声消除)、NS(降噪)、AGC(增益),大幅提升远场唤醒与对话的准确率。
-
刷机更新小爱音箱补丁固件,开启并 SSH 连接到小爱音箱 👉 教程
-
开通「豆包端到端实时语音大模型」👉 火山引擎
现在该模型是免费的,登陆后点“豆包端到端实时语音大模型” 下面有配置信息
-
执行安装脚本(会自动下载并安装最新 release 到
/data/xiaoai-plus)curl -sSfL https://fastly.jsdelivr.net/gh/kslr/xiaoai-plus@main/install.sh | sh -
更新 config.ini 里的配置
[realtime] app_id = your_app_id access_token = your_access_token secret_key = your_secret_key model = 1.2.1.0 bot_name = 豆包 system_role = 你是豆包同学,是小爱音箱上的语音助手。 speaking_style = 语气自然、友好、简洁。 [wakeup] say_hello = 在
-
(可选) 设置自定义关键词(在项目根目录执行,参考 sherpa 文档:https://k2-fsa.github.io/sherpa/onnx/kws/pretrained_models/index.html#)
# 安装 sherpa-onnx-cli(在开发机执行,不在小爱音箱上执行) python3 -m pip install -U sherpa-onnx click sentencepiece pypinyin cat <<'EOF' >assets/keywords_raw.txt 豆包同学 @豆包同学 小爱同学 @小爱同学 LIGHT UP @LIGHT_UP EOF sherpa-onnx-cli text2token \ --tokens assets/tokens.txt \ --tokens-type phone+ppinyin \ --lexicon assets/en.phone \ assets/keywords_raw.txt assets/keywords.txt
-
启动程序
/data/xiaoai-plus/xiaoai_plus_speaker -c /data/xiaoai-plus/config.ini
-
设置开机自启动(下载
boot.sh到/data/init.sh)curl -L -o /data/init.sh https://fastly.jsdelivr.net/gh/kslr/xiaoai-plus@main/boot.sh chmod +x /data/init.sh # 重启小爱音箱 reboot
- 本项目仅供学习与研究,请确保在合法合规前提下使用。
- 项目与小米、火山引擎/字节跳动无从属关系,品牌与商标归属其各自权利人。
MIT
本项目大量参考 https://github.com/idootop/open-xiaoai 研究和开发。