跳到主要内容

5.2.1 语音活动检测

功能介绍

本节介绍如何使用语音活动检测(Voice Activity Detection, VAD)模型,实现对人声的自动检测并控制录音行为。系统将在检测到语音时启动录音,在检测到静音时自动停止。

项目代码仓库:⭐ Bianbu AI Demo Zoo | NLP

准备工作

下载模型文件

wget -O ~/.cache/sensevoice.tar.gz https://archive.spacemit.com/spacemit-ai/openwebui/sensevoice.tar.gz 
tar -xzf ~/.cache/sensevoice.tar.gz -C ~/.cache
rm ~/.cache/sensevoice.tar.gz

克隆仓库代码

git clone https://gitee.com/bianbu/spacemit-demo.git

安装依赖环境

sudo apt update
sudo apt install onnxruntime python3-spacemit-ort
sudo apt install python3-numpy
sudo apt install python3-pyaudio

检测系统录音设备

方法1:使用 arecord

运行以下命令查看系统的录音设备列表:

arecord -l

记录下需要使用的设备索引编号。

方法2:运行脚本自动搜索

执行以下脚本以枚举系统中的录音设备:

python3 01_search_device.py