音频分轨器(本地 AI)是什么?
云端人声分离工具适合快速试用,但并不适合私密歌曲、未发布 demo、客户素材或你不希望上传到外部服务器的长音频。它们还会把流程拖慢,因为你需要先上传,再等待处理,最后重新下载结果。
Audio Stem Splitter 把本地 AI 音源分离带进浏览器。你可以直接打开设备中的歌曲,在本地完成处理,然后预听和下载 vocals、instrumental、drums、bass 和 other,而不必把原始音频交给第三方服务。
依赖远程服务的 stem 分离会带来隐私和带宽成本
很多在线 vocal remover 都要求先把整首歌上传到服务器。
这对未发布音乐、客户录音、私密排练和带授权风险的内容并不友好。
大体积音频还会额外增加上传时间、处理排队和再次下载结果的等待。
很多创作者只是想快速拿到伴奏或人声,并不想每次都打开完整桌面工作流。
用本地 Demucs 模型在浏览器中直接导出 stem
这个工具使用本地 Demucs ONNX 模型,在浏览器里完成音频分离。
你可以导出 vocals、instrumental、drums、bass 和 other 的 WAV 文件,也可以一次下载完整 ZIP。
如果设备支持,工具会优先走 WebGPU 加速,同时保留 WASM 兼容路径。
如何使用音频分轨器(本地 AI)
- 1加载源音频 - 从本地设备选择 MP3、WAV、M4A、OGG、FLAC、Opus 等音频文件。
- 2选择处理模式 - 可让工具自动优先 WebGPU,也可以手动切换到 WASM 兼容模式。
- 3开始分离 - 让浏览器在本地下载模型、解码音频并执行 stem 分离。
- 4预听并导出 - 在页面里试听 vocals 或伴奏,然后下载单独 WAV 或完整 ZIP 包。
主要功能
- 本地 AI 分离,不上传音频
- 支持输出 vocals、instrumental、drums、bass、other
- 优先使用 WebGPU,并提供 WASM 回退
- 支持在线预听和 WAV、ZIP 导出
优势
- 无需把歌曲交给第三方也能制作卡拉 OK 和清唱素材
- 未发布作品、客户音频和敏感内容都能保留在本机
- 无需切换到重量级桌面流程即可完成常见 stem 分离任务
使用场景
制作卡拉 OK 伴奏
从本地歌曲中提取 instrumental,用作卡拉 OK 或排练背景音。
提取清唱
导出 vocal stem,用于 mashup、remix 草稿、歌词校对或节奏检查。
私密创作流程
对 demo、hook 或短片段做 stem 分离,而不把音频上传到外部平台。
练习与扒谱
单独听 bass、drums 或 vocal,方便分析节奏、走向和演唱细节。
技巧与常见错误
技巧
- 先用较短片段测试质量,再决定是否处理整首长音频。
- 在支持的设备上优先使用 WebGPU,可以获得更快的本地推理速度。
- 如果想后续在别的音频编辑器里比较,直接下载完整 ZIP 更方便。
- 保留原始音频,便于在结果不理想时重新从干净源文件开始。
常见错误
- 期待所有歌曲都能达到录音室原始多轨那样的完全干净分离。
- 忽略首次运行需要下载较大模型这一点。
- 在模型下载或推理过程中关闭页面,却期待任务继续运行。
- 把浏览器分离工具当成完整混音或母带工作站。
知识要点
- Stem 分离质量取决于编曲密度、效果器、母带处理以及模型训练边界。
- WebGPU 能在部分设备上加速本地推理,但浏览器支持仍存在差异。
- 本地 AI 流程避免了媒体上传,但会把模型下载、内存占用和计算压力放在用户设备上。
- Instrumental 是从完整混音中分离出来的估计结果,并不等于原始多轨工程。
常见问题
音频会离开我的设备吗?
不会。整个处理期间音频都保留在你的设备上。
能导出哪些 stem?
可以导出 vocals、instrumental、drums、bass 和 other 的 WAV 文件。
能不能做卡拉 OK 伴奏?
可以,下载 instrumental 即可作为卡拉 OK 背景音。
为什么第一次更慢?
因为浏览器需要先下载并缓存 AI 模型。
必须要 WebGPU 吗?
不是。WebGPU 主要用于提速,WASM 路径仍可用于兼容模式。
这是不是完整 DAW?
不是。它是一个专注于本地 stem 分离的浏览器工具。
相关工具
探索更多 社交媒体工具
音频分轨器(本地 AI) 属于 社交媒体工具。探索更多免费在线工具,快速完成相关任务。
查看全部 社交媒体工具