简体中文 繁體中文 English Deutsch 한국 사람 بالعربية TÜRKÇE português คนไทย Français Japanese

站内搜索

搜索
AI 风月

活动公告

03-01 22:34
通知:本站资源由网友上传分享,如有违规等问题请到版务模块进行投诉,资源失效请在帖子内回复要求补档,会尽快处理!
10-23 09:31

[经验分享] 开源语音识别模型Qwen3-ASR安装及使用步骤

6

主题

298

科技点

50

积分

太初窥星

积分
50
发表于 2026-3-4 20:28:49 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x

安装步骤

  1. 新建 Python 环境(推荐)

    conda create -n qwen3-asr python=3.12 -y
    conda activate qwen3-asr
  2. 安装 Qwen3-ASR 包

    • 只需 transformers 后端:

      pip install -U qwen-asr
    • 需要 vLLM 后端(推荐高性能/流式):

      pip install -U qwen-asr[vllm]
  3. (可选)加速推理安装 FlashAttention 2

    pip install -U flash-attn --no-build-isolation

快速推理示例

import torch
from qwen_asr import Qwen3ASRModel

# 加载模型(可选:dtype="bfloat16"、device_map="cuda:0")
model = Qwen3ASRModel.from_pretrained("Qwen/Qwen3-ASR-1.7B")

# 推理音频(支持本地文件路径、URL等)
results = model.transcribe(audio="https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3-ASR-Repo/asr_en.wav")

print(results[0].language)
print(results[0].text)

注意:

  • 更多高级推理选项与批量、流式推理、时间戳功能见官方文档
  • 若下载模型遇到网络限制,参考前述 ModelScope/Hugging Face 离线下载方案。
温馨提示:看帖回帖是一种美德,您的每一次发帖、回帖都是对论坛最大的支持,谢谢! [这是默认签名,点我更换签名]
回复

使用道具 举报

0

主题

1131

科技点

599

积分

候风辨气

积分
599
发表于 2026-3-5 00:06:49 | 显示全部楼层
感謝分享
温馨提示:看帖回帖是一种美德,您的每一次发帖、回帖都是对论坛最大的支持,谢谢! [这是默认签名,点我更换签名]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

手机版|联系我们|小黑屋|TG频道|RSS |网站地图

Powered by Pixtech

© 2025-2026 Pixtech Team.

>