长音频离线流式识别 · 生成字幕

长音频离线流式识别 · 生成字幕
FireRedASR 大模型 manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav" # FunASR 轻量模型 manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav"

2. 麦克风离线流式识别 · 生成字幕

manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i mic manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i mic

3. 麦克风实时流式识别 · 实时生成字幕

manyspeech asr -t online --model paraformer-large-zh-en-int8-onnx-online -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic

4. VAD 语音端点检测 · 剔除音频或录音的静音噪声等部分

# 麦克风在线检测 manyspeech vad -t online -i mic # 音频文件离线检测(剔除静音) manyspeech vad -t offline -f meeting.wav # 指定输出格式 manyspeech vad -t offline --format wav -f noisy_speech.wav

5. 标点符号恢复 · 为文本自动标点或重新标点(支持中英文)

# 直接输入文本 manyspeech punc --text "今天天气不错一起去郊游吧" # 从文件读取 manyspeech punc -f transcript.txt # 指定输出JSON格式 manyspeech punc --text "hello world" --format json # 交互输入 manyspeech punc