絵描き配信者向けボイスチェンジャー

マイクを落ち着かせ、解説音声をクローンし、すべてOBSにルーティング – Twitch ArtとYouTubeで伝統的な絵描き配信者向けの完全音声セットアップガイド。

絵描き配信者向けボイスチェンジャー

ライブ絵描きはTwitch ArtとYouTube Liveの最も瞑想的なコーナーの1つです。カメラはキャンバスを指します。ホストは何時間も絵を描きます。チャットは色が何かになるのを見ています。聴衆は異なる品質です – 忍耐強く、好奇心旺盛で、しばしばアーティスト自身です。オーディオのバーは生産スペクタクルの意味では高くありませんが、非常に特殊です: 彼らは人工的なエネルギーを持つポッドキャストレベルの制作ではなく、静かな部屋で自然に聞こえる穏やかでクリアな声を聞きたいのです。

この静かな環境は、見た目よりもオーディオを難しくするものです。絵描き配信には、キーボードノイズ、ゲームオーディオ、隠れるための絶え間ない群衆音がありません。すべてのブラシスウィッシュ、すべての水差しチリン、すべてのパレットスクレイプはマイクに明確に到達します。ノイズの多いゲーミング配信では十分に聞こえる声は、絵描き配信ではアーティファクトに囲まれた薄く聞こえます。

このガイドは、伝統的な絵描き配信者 – 油彩、水彩、アクリル – がペルソナを制御し、スタジオノイズを沈黙させ、AIクローニングを使用して再利用可能なチュートリアル解説のライブラリを構築したいときのための完全なオーディオセットアップをカバーしています。


TL;DR

  • ノイズ抑制は音声周波数範囲に触れることなく、ブラシ、水、パレット音を削除します。
  • WASAPI入力は遅延を20ms未満に保つため、解説は画面上のブラシストロークと同期したままです。
  • 小さなフォルマントと温かみの調整は、処理されたように聞こえることなく、穏やかで一貫性のあるオンエア ペルソナを構築します。
  • AIボイスクローニングにより、チュートリアルVOセグメントを1度バッチレコーディングして無期限に再利用できます。
  • 仮想マイク出力は、キャンバスオーバーヘッドカメラの横にOBSにきれいにルーティングされます。
  • カーネルドライバーやオーディオインターフェイス購入は必要ありません – 任意のWindows 10/11システムで動作します。

なぜ絵描き配信にはユニークなオーディオの課題があるのか

ゲーミング配信には組み込みのノイズフロアがあります: ゲームオーディオ、通知音、定期的なアクションが沈黙を埋め、マイクアーティファクトをマスクします。絵描き配信は多くの場合、本当に静かです。ホストは穏やかに話します。部屋は静止しています。最も大きく繰り返されるサウンドはキャンバスに対するブラシです。

この沈黙は両刃の剣です。あなたの声がはっきり際立つようにします。これは視聴可能性に良いです。また、あなたのオーディオの各不完全性が同様に明確であることを意味します。ブラシをすすぐために入れた水差しは、軽い「s」または「sh」子音とほぼ同じ周波数に位置しています。パレットナイフが塗料を横切ることで生じるトランジェントは、安価なノイズゲートが音声開始と解釈して通す過渡的なものです。これらは編集が治す問題ではありません – リアルタイムに、文の途中で起こります。

もう1つの課題はペルソナです。絵描き配信パーソナリティは穏やかで内省的な傾向があります。視聴者は部分的に声のために戻ります – その速度、その調子、その温かさ。ある1つのセッションで病気の場合、または別の配信で過去2時間を叫んだ場合、声色が変わり、長期的な視聴者はそれに気づきます。一貫性のある音声処理は、その日の音声がどのように感じるかに関係なく、戻るための定義されたベースラインを与えます。


低遅延オーディオのためにWASAPIを理解する

WASAPI – Windows Audio Session API – はWindows組み込みのオーディオレイヤーで、ソフトウェアが最小限のバッファリングでマイクやオーディオデバイスにアクセスできるようにします。実際の項では、声がOBSに十分速く到達することを意味します。解説とブラシストロークがストリームで時間的に同期したままでいるのに十分です。

ほとんどのコンシューマーオーディオソフトウェアは共有モードWASAPIを使用します。Windowsは固定サンプルレートで複数のアプリケーションをミックスします。エクスクルーシブモードWASAPIは単一のアプリケーションにハードウェアへの直接アクセスを提供し、処理ホップを削減し、遅延をさらに低下させます。

絵描き配信者にとって、WASAPIが重要なのは、ストリームモニター遅延があなた独自の出力をどのように経験するかだからです。あなたの声が画面上の手の動きに対して80ms遅延している場合、無意識のうちに何かが間違っているような気がし始めます – それが何であるかを特定できない場合でも。WASAPI入力を使用してこの数値を20ms未満に保つと、不調和が削除されます。

ほとんどの音声処理ソフトウェアでWASAPIを有効にするには: オーディオ入力設定を開き、入力モードをDirectSoundまたはMMEからWASAPIに切り替え、バッファサイズを128または256サンプルに減らします。44.1kHz。わずかなCPUコストはタイミング精度の価値があります。


絵描きスタジオのノイズ抑制

従来の絵描きセットアップは、標準マイクが音声とともにキャプチャする複数の一貫したノイズソースを導入しています:

ブラシオンキャンバス: 粗いキャンバスの上の硬い毛ブラシは、2〜6kHzの範囲でほとんどのエネルギーを持つこするトランジェントを生成します – 人間の音声の存在領域内に正方形です。シンプルなノイズゲートは、これとシビラント子音で始まる単語を区別することはできません。

水差し: ブラシをすすぐことで、広い周波数スプレッドを持つホワイトノイズに隣接するスプラッシュが発生します。単純なノイズ削減を打ち負かすのに十分な不規則ですが、モデル化と削除に十分です。

パレットスクレイピング: パレットナイフは鋭く、狭い過渡状態を生成します。これらは特に困難です。なぜなら、それらは短く、高エネルギーであり、ほとんどのノイズプロセッサは音声開始としてフラグを立てるからです。

HVACと部屋の音: ホームスタジオでは、加熱および冷却システムは一定の低周波ブザーを作成します。これは削除するのが最も簡単です – 80〜100Hzのハイパスフィルターはそれを完全に除去しますが、声への聞こえる影響はありません。

絵描き配信のための効果的なノイズ抑制は、ゲートベースではなくスペクトルである必要があります。スペクトル抑制は部屋のノイズプロファイルをモデル化し、受信信号から動的に減算します。これにより、ブラシがサッビングしている音や水音が削除されます。ゲートが行うように文の間に声を切ることなく。

VoxBoosterのノイズ抑制はこのスペクトルアプローチを使用しています。処理チェーンの最初のステップとしてそれを有効にします – ボイスエフェクトの前 – ダウンストリームプロセッサがクリーンなソース信号で動作するようにします。各セッションの開始時にノイズプロファイルを更新して、部屋の変更に対応します(異なる天気、異なるHVAC状態、異なるキャンバス表面)。


ボイスエフェクトで穏やかな絵描きペルソナを構築する

ボブロス原型は、穏やかな絵描き配信オーディオの金本位です: 暖かく、計測され、やや丸まった低ミッド、いつも急ぐことのないペース。それがあなたの自然なスピーチボイスであるかどうか、あなたは音声処理を使用して一貫して移動できます。

温かみと低ミッドプレゼンス

絵描き解説は、200〜400Hzの範囲での優しい+1〜+2dBブーストでよく座ります。これはマフされた音声を作らずにボディを追加します。3〜4kHzで軽い-1dBとペアリングして、密集型配信のきつさを減らします。

一貫性のためのフォルマント調整

フォルマントシフトは、ピッチに影響を与えることなく、音声の色合い性を変更します。小さな下向きフォルマントシフト(-5〜-10%)は、穏やかな配信とペアがよく合う、わずかに満杯でより共鳴する品質を追加します。それはあなたがあなた自身にどのように聞こえるかを変えていません – ミックスでは自然に聞こえ、セッションから一貫しています。

ピッチアンカリング

あなたの音声ピッチが日から日に変動する場合(病気、疲労、時刻)、非常に広い許容範囲(-10〜+10セント)に設定されたピッチ補正は、オートチューンのように聞こえることなくアンカーとして機能します。複数時間ストリーム全体で声をしっかりしたままにする段階的なドリフトを防ぎます。

リバーブ: なし、またはほぼなし

絵描き配信はリバーブから利益を得ません。フォーマットの親密さは、視聴者と同じ部屋にいるように聞こえることから来ています。わずかな部屋シミュレーション量(1〜2%ウェット、非常に短いプリディレイ)は、特定のスタジオスペースの印象を追加できますが、これはオプションです。やり過ぎるのは簡単です。


バッチチュートリアルVOのためのAIボイスクローニング

AIボイスクローニングが絵描き配信者のワークフローを本当に変換する1つの領域は、チュートリアルナレーション制作です。

ウォーターカラーシリーズを検討してください。各動画は1つの技術をカバーしています: ウェットオンウェットのウォッシュ、リフティング、マスキング液、ブルーミング。コア実演は撮影されます。説明的な解説はあらかじめ書く可能性があります。クローニングなしで、各セグメントはライブ記録セッションが必要です – セットアップ、パフォーマンス、レビュー、エクスポート。トレーニング済みのAIクローンで、パイプラインは: スクリプトを作成し、クローン音声でオーディオを生成し、タイムラインに同期する。

これが実際に何を意味するか:

  • カメラで実演を記録します。ライブフッテージがプライマリコンテンツです。
  • アップクローズテクニックセグメントの場合、ブラシが何をしているか、どのような色素動作を期待するか、各決定を行う理由を説明する詳細なナレーションスクリプトを書きます。
  • AIクローンはそれらのスクリプトからあなたの声でVOを生成します。結果はあなたの声です。汎用のTTS音声ではありません。
  • レビュー、出力が正しく聞こえない場合のスクリプトに小さな編集を行い、それらのラインを再生し、エクスポート。

このパイプラインは、ライブナレーションの「1回取得またはやり直し」問題も解決します。ライブデモンストレーション中に湿ったペーパーが開花を引き起こす理由を説明するのを逃した場合、その後説明を書きます。VOとして生成します。クリップはエディタにクリーンにドロップされます。

AIクローンをトレーニングするには、音声サンプルが必要です。通常は、静かな空間で記録された5〜15分のクリーンで自然な音声。ストリーミングに使用するのと同じオーディオセットアップが機能します。クローンをトレーニングしたら、それは永続化し、無期限に新しいコンテンツを生成できます。


OBSにすべてをルーティングする

OBSの典型的な絵描き配信セットアップには、少なくとも3つのビデオソースが関与します: 頭上のキャンバスカメラ、あなたの顔を示すウェブカメラ、および潜在的にあなたのパレットまたはリファレンスの2番目のショット。オーディオはシンプルです – 1つの音声ソースとオプションの非常に低いボリュームでアンビエントミュージック。

仮想マイクのセットアップ

ボイスチェンジャーは、OBSのオーディオソースリストに実際のマイクの横に表示される仮想オーディオデバイスを作成します。OBSで:

  1. オーディオミキサーを開き、マイクソースの歯車をクリックします。
  2. デバイスをボイスプロセッサから仮想マイク出力に変更します。
  3. 明確にラベルを付けてください(「処理されたコメント」)、入力ボリュームを-3dBに設定してヘッドルームを残します。

あなたの実際のマイクはOBSに直接表示されなくなります – 仮想デバイスが処理されたシグナルを運びます。

デュアルトラック録音

OBS出力設定でデュアルトラックオーディオを有効にします(設定→出力→記録→オーディオトラック1および2)。処理された音声をトラック1に割り当て、2番目のOBSオーディオソースを使用してトラック2にローマイク入力をルーティングします。これは、処理設定が事後に気付く問題を引き起こす場合に備えて、エディット用の未処理バックアップを提供します。

同期補償

OBSは、オーディオソースとビデオソース間のドリフトを補正するためにグローバルオーディオ同期オフセットを適用します。WASAPIベースの音声処理の場合、+20〜+40msのオフセットがキャンバスカメラソースに適用されます。通常、ブラシストロークとスポーク解説をアライメントするのに十分です。フレーム正確な同期テストを使用してこれをテストします: 単語を話しながら1回手をたたき、編集タイムラインでオーディオトランジェントと手の動きが揃っているかどうかを確認します。


比較: 絵描き配信者のためのオーディオアプローチ

アプローチノイズハンドリングペルソナ一貫性チュートリアルVOセットアップ複雑性
ベアマイク、処理なし不良 – 部屋の音が通す毎日の声で変わるセグメントあたり新しい記録セッションが必要最小
ノイズゲートのみ中程度 – 文の間に切れる、トランジェントを逃すなしセグメントあたり新しい記録セッションが必要低い
スペクトルノイズ抑制強力 – ブラシ、水、HVACを継続的に処理なし – 音声は生セグメントあたり新しい記録セッションが必要低から中
ノイズ抑制+ボイスエフェクト強力高 – 一貫性のある温かみ/フォルマント プリセットセグメントあたり新しい記録セッションが必要
フルチェーン(抑制+エフェクト+AIクローン)強力あなたの声でスクリプトからバッチ生成

実践的なセッションチェックリスト

絵描き配信をライブで行う前に、このオーディオチェックを実行します:

  1. ノイズプロファイルを更新する – マイクを話す前に開いた状態で5〜10秒の部屋音を捕捉します。ノイズサプレッサーが部屋の現在の状態をモデル化するのを許可します。
  2. ブラシキャリブレーションを確認する – OBSのオーディオメーターを見ながら、最も大声で典型的なブラシストロークを作ります。ノイズ抑制がアクティブな状態で-50dBFS上記に登録しないでください。
  3. WASAPI入力を確認する – 音声処理ソフトウェアを開き、入力が正しいデバイスでWASAPIモードに設定されていることを確認します。
  4. OBSで仮想マイクをテストする – 文を話し、それがコメンタリートラックに表示され、未処理のタートラックに誤って表示されないことを確認します。
  5. 音楽を-18dBFSに設定する – アンビエント音楽を-18dBFSで、解説の下に座りながら競争しません。視聴者がチャットで低くするように要求できるように、別のOBSオーディオソースを使用します。
  6. デュアルトラック録音を有効にする – トラック1(処理)とトラック2(生)の両方がキャプチャしていることを確認します。

外部リソース


関連するVoxBoosterガイド


FAQ

絵描き配信でボイスチェンジャーを使うのに特別なハードウェアは必要ですか?

いいえ、特別なハードウェアは必要ありません。Windows 10または11に接続された標準のUSBまたはXLRマイクで十分です。ボイスチェンジャーは仮想オーディオデバイスを作成し、OBSはそれを実際のマイクとまったく同じように扱います – 追加のオーディオインターフェイスは必要ありませんし、すでに持っている場合を除いてミキサーも必要ありません。

ブラシの音、水差しの音、パレットのこする音が配信に入るのを止めるにはどうすればいいですか?

ボイスエフェクトの前に、音声処理チェーンのノイズ抑制を有効にします。ノイズ抑制は、ブラシストロークや水音が発生する不規則で低振幅のトランジェントを対象とし、音声の周波数範囲に影響を与えることなくそれらをシグナルから削除します。

WASAPIは何で、絵描き配信者にとってなぜ重要ですか?

WASAPIはWindows Audio Session APIで、ソフトウェアが非常に低遅延でオーディオデバイスと直接通信することを可能にするWindows組み込みオーディオスタックです。絵描き配信者にとって、これはマイク音声が20ミリ秒以下でOBSに到達することを意味します – 解説とブラシストロークがストリームモニターで同期したままでいるのに十分です。

AIボイスクローニングを使って毎回やり直さずにチュートリアルのナレーション音声をバッチレコーディングできますか?

はい。音声のAIクローンをトレーニングしたら、スクリプトを入力またはペーストしてオーディオをエクスポートできます。これは再利用可能なチュートリアルセグメント – 色混ぜの説明、ブラシの種類、キャンバス準備 – に役立ちます。1度録音して複数の動画で再利用できます。毎回マイクに座る必要がありません。

ボイスチェンジャーは穏やかなボブロス風の絵描き配信で私の声をより自然に聞こえなくしますか?

エフェクト設定を強くしすぎた場合のみです。小さなフォルマント調整と穏やかなウォーム プリセットは、処理されたように聞こえることなく、存在感を追加し、声の疲労を軽減します。目標は、同じ人のように聞こえるが、よりクリーンで、より暖かく、よりマイク対応の声です。

絵描き配信でボイスチェンジャーをOBSにどのようにルーティングしますか?

ボイスチェンジャーの仮想出力デバイスをOBS内のマイクソースとして選択します。オーディオミキサーで「解説」というラベルを付け、キャンバスオーバーヘッドカメラ用に個別のシーンコレクションを設定します。多くのアーティストはOBSに2番目のオーディオトラックも追加して、音声の乾燥(未処理)バックアップを記録します。

絵描きながら同時に話す際に遅延の違いに気付きますか?

300ms未満の処理パイプラインとWASAPI入力で、スピーチからストリームモニターで自分の声を聞くまでの遅延は、通常の絵描き解説中は知覚できません。スピーカーでなくヘッドフォンを使用して自分を監視している場合のみ問題が発生します。その場合、出力が部屋にフィードバックします。

VoxBoosterを試す — 3日間無料。

リアルタイム音声クローン、サウンドボード、エフェクト — 会話するすべての場所で。

  • カード不要
  • ~30msのレイテンシ
  • Discord · Teams · OBS
3日間無料で試す