安装步骤
-
新建 Python 环境(推荐)
conda create -n qwen3-asr python=3.12 -y
conda activate qwen3-asr
-
安装 Qwen3-ASR 包
-
(可选)加速推理安装 FlashAttention 2
pip install -U flash-attn --no-build-isolation
快速推理示例
import torch
from qwen_asr import Qwen3ASRModel
# 加载模型(可选:dtype="bfloat16"、device_map="cuda:0")
model = Qwen3ASRModel.from_pretrained("Qwen/Qwen3-ASR-1.7B")
# 推理音频(支持本地文件路径、URL等)
results = model.transcribe(audio="https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3-ASR-Repo/asr_en.wav")
print(results[0].language)
print(results[0].text)
注意:
- 更多高级推理选项与批量、流式推理、时间戳功能见官方文档。
- 若下载模型遇到网络限制,参考前述 ModelScope/Hugging Face 离线下载方案。