すべてのツールに戻る
ソーシャルメディアツール

オーディオ Stem 分離(ローカル AI)

問題を報告する

ブラウザ内でボーカル、伴奏、ドラム、ベース、その他のステムをローカル分離

元の音声

ステム分離はブラウザ内でローカル実行されます。音声はサーバーにアップロードされません。

クリックして音声ファイルを選択

初回は大きなモデルをダウンロードするため、長い音声ほど時間がかかりますが、音声データは常に端末内に留まります。

出力ステム

初回実行時にAIモデルをダウンロードし、以後はブラウザにキャッシュされたモデルを再利用できます。

AIエンジンの状態

音声をアップロードしてローカルのステム分離を開始します。

モデルは約172MBです。初回はブラウザがモデルをキャッシュするため時間がかかることがあります。

モデルのダウンロード進捗0%
分離の進捗0%
音声をアップロードしてローカルのステム分離を開始します。

AIエンジンの状態

初回実行時にAIモデルをダウンロードし、以後はブラウザにキャッシュされたモデルを再利用できます。

使用したバックエンド

自動(WebGPU優先)

処理サンプルレート

44,100 Hz

音声の長さ

--

ファイルサイズ

--

出力ステム

ui.noAudioSelected

処理はまだ利用できません。エンジンは後日追加されます。

ブラウザ内処理
即時結果
データ保存なし

ローカルAI音声ステム分離とは?

クラウド型の vocal remover は手軽ですが、未公開曲、クライアント音源、私的な練習録音、外部に渡したくない長い音声には向いていません。しかも、アップロードと再ダウンロードが必要なため、確認までに時間がかかります。

Audio Stem Splitter は、ローカル AI による音源分離をブラウザへ持ち込みます。端末内の曲を開き、そのままローカルで処理し、vocals、instrumental、drums、bass、other を試聴・保存できます。

外部サービス前提の分離はプライバシーと待ち時間の負担が大きい

多くのオンライン分離ツールは、まず曲全体をサーバーへ送る必要があります。

それは未公開の音源、顧客データ、私的な録音、権利面に配慮が必要な素材には不向きです。

大きな音声ファイルでは、アップロード時間、処理待ち、再ダウンロードの手間も増えます。

多くの制作者は、DAW 全体を開かずに伴奏やボーカルだけを素早く取り出したいだけです。

Demucs を使ったローカル分離と実用的な書き出し

このツールは Demucs ONNX モデルを使って、ブラウザ内でローカル分離を行います。

vocals、instrumental、drums、bass、other を WAV として書き出し、まとめて ZIP でも保存できます。

対応環境では WebGPU を優先して高速化しつつ、互換性のために WASM 経路も用意しています。

ローカルAI音声ステム分離の使い方

  1. 1元音声を読み込む - 端末から MP3、WAV、M4A、OGG、FLAC、Opus などの音声ファイルを選びます。
  2. 2処理経路を選ぶ - 自動で WebGPU 優先にするか、安定性重視で WASM を選びます。
  3. 3分離を実行する - 必要ならモデルをダウンロードし、音声のデコードと stem 分離をローカルで行います。
  4. 4試聴して保存する - ボーカルや伴奏をページ内で確認し、個別 WAV または ZIP をダウンロードします。

主な機能

  • 音声をアップロードしないローカル AI 分離
  • vocals、instrumental、drums、bass、other を出力
  • WebGPU 優先処理と WASM フォールバック
  • ページ内試聴と WAV、ZIP ダウンロード

メリット

  • 曲を外部サービスに渡さずにカラオケやアカペラ素材を作れる
  • 未公開音源、クライアント素材、機密音声を端末内に保持できる
  • 重いデスクトップ環境を開かずに手早く stem 分離できる

利用シーン

カラオケ用伴奏の作成

ローカル曲から instrumental を取り出して、カラオケや練習用の伴奏を作れます。

アカペラ抽出

vocal stem を書き出して、マッシュアップ、リミックス下準備、歌詞確認に使えます。

非公開の制作フロー

デモ、フック、短いクリップを外部へ送らずに分離できます。

練習と耳コピ

bass や drums、vocal を個別に聴いて、フレーズやグルーヴを把握しやすくします。

コツとよくあるミス

コツ

  • 長い曲を処理する前に、短い区間で品質を確認すると失敗が減ります。
  • 対応端末では WebGPU 優先にするとローカル推論が速くなりやすいです。
  • 後で別ソフトで比較したいなら、最初から ZIP をまとめて保存すると便利です。
  • 再試行に備えて元ファイルはそのまま残しておきましょう。

よくあるミス

  • どの曲でも元のマルチトラック並みに完璧に分離できると期待すること。
  • 初回は大きなモデルをダウンロードする点を見落とすこと。
  • ダウンロードや推論の途中でタブを閉じても処理が続くと思い込むこと。
  • ブラウザ分離を完全なミキシングやマスタリング環境の代わりと考えること。

解説メモ

  • stem 分離の品質は、編曲の密度、エフェクト、マスタリング、モデルの学習範囲に左右されます。
  • WebGPU は対応環境でローカル推論を速くできる一方、ブラウザごとの対応差は残ります。
  • ローカル AI はアップロードを避けられますが、その代わりモデル取得、メモリ、計算負荷は端末側が担います。
  • instrumental は元のマルチトラックではなく、完成したミックスから推定された分離結果です。

よくある質問

音声は端末の外へ出ますか?

いいえ。処理中も音声は端末内に残ります。

どの stem を出力できますか?

vocals、instrumental、drums、bass、other を WAV で出力できます。

カラオケ音源は作れますか?

はい。instrumental を保存すればカラオケ用の伴奏として使えます。

初回が遅いのはなぜですか?

ブラウザが AI モデルをダウンロードしてキャッシュする必要があるためです。

WebGPU は必須ですか?

いいえ。WebGPU は高速化に役立ちますが、WASM 経路でも利用できます。

これは完全な DAW ですか?

いいえ。ブラウザ内で stem を作るための専用ツールです。

もっと見る ソーシャルメディアツール

ローカルAI音声ステム分離はソーシャルメディアツールのツールです。関連する無料オンラインツールもまとめて確認できます。

すべて見る ソーシャルメディアツール