概要
- ラジオボイスエフェクトは、バンドパスフィルタリング(300Hz~3kHz)、圧縮、ハーモニック歪み、オプションの静的ノイズを組み合わせて、AMラジオ、トランシーバー、またはCBラジオ伝送をシミュレートします。
- その狭い範囲外の周波数をカットすることが単一の最大の要因です。それ以外はすべてテクスチャーとリアリズムをその上に追加します。
- VoxBoosterは、Windows 10/11上でカーネルドライバーなしでリアルタイムで完全なチェーンを適用するため、アンチチートを備えたゲームでも安全です。
- AIボイスクローンの上にラジオフィルターを重ねて、最大限のキャラクターを実現できます。
- エフェクトはDiscord、OBS、ゲーム、Zoom、およびマイク入力を受け入れるすべてのアプリで機能します。
- セットアップは2分以下です:インストール、ラジオプリセットを選択、アプリでVoxBooster仮想マイクを選択します。
ラジオから聞こえる音声には、すぐに認識できる何かがあります。それは権威的で、緊急で、映画的に感じられるやや劣化した方法で聞こえます。ストリーマーは軍事ロールプレイに使用します。ポッドキャスターはサウンドバイトに落とします。ゲーマーはそのチームが没入感を壊さずにコムスに入っていることを示すために使用します。声優はそれを使用してキャラクターを構築します。
そのサウンドを正しく取得することは幸運の問題ではありません—それはラジオ伝送が実際にオーディオに何をするかを理解し、その後ソフトウェアでそれらのステップを再作成することについてです。このガイドは、ラジオボイスエフェクトチェーンのすべてのコンポーネントを分解し、各コンポーネントの背後にあるDSPを説明し、オーディオエンジニアリングの背景がなくてもリアルタイムでそれを適用する方法を示しています。
ラジオボイスエフェクトとは何ですか?
ラジオボイスエフェクトは、オーディオ処理ステップの連鎖です。バンドパスフィルタリング、ダイナミック圧縮、ハーモニック歪み、オプションのノイズ注入により、きれいな音声がAMラジオ、トランシーバー、またはCBラジオチャネルを介して伝送されているように聞こえます。
エフェクトは、ラジオハードウェアが音声を劣化させる特定の方法で、意図的に音声を劣化させることによって機能します。実際のトランシーバーは音声の周波数範囲全体を送信しておらず、無制限のダイナミックレンジを持たず、それらのサーキットはハーモニック着色を追加します。説得力のあるラジオボイスフィルターはこれらすべての制約をシミュレートします。シミュレーションが実際の劣化プロファイルに一致するほど、結果はより本物です。
コアDSP:バンドパスフィルタリング
ラジオボイスエフェクトのステップが1つだけ実装できる場合、バンドパスフィルターになります。この単一のプロセスは、ラジオボイスがどのように聞こえるかの大部分を担当しています。
バンドパスフィルターは定義された範囲内の周波数を通し、それ以外のすべてを減衰させます。トランシーバーエフェクトの場合、ターゲット範囲はほぼ300Hzから3,000Hz(3kHz)です。より劣化したCBラジオサウンドの場合、さらに狭くする可能性があります—400Hzから2.5kHz。
各カットオフが削除する内容と重要な理由は次のとおりです:
300Hzでハイパス: 300Hz以下の周波数をカットすると、音声の胸部共鳴と低い肉体が削除されます。これは、ラジオボイスが直接マイク入力と比較して薄くて少し鼻のように聞こえる理由です。音声を温かく存在させ、部屋に存在させる低周波数は単に伝送されません。ベース音声(約100~150Hz程度)の基本周波数を失い、ハーモニックのみがスルーする中空バージョンで置き換えます。
3kHzでローパス: 3kHz以上の周波数をカットすると、音声のエア、プレゼンス、シビランスが削除されます。コンソナントS、T、およびFは主に4~8kHz範囲に存在します。それらをカットすると、スピーチは区別しやすくなります。これはラジオオペレーターが音声言語を使用する正確な理由です。また、リスナーに音声が本当の音響空間にあることを示す空間的品質も失います。
結果のオーディオは狭い電話/ラジオバンドに位置します—スピーチを理解するのに十分な周波数コンテンツですが、自然に聞こえるのに十分ではありません。これはまさにポイントです。
フィルター勾配も重要です。穏やかな6dB/オクターブロールオフは、急しい24dB/オクターブレンガを別にスクープします。実際のラジオハードウェアは高周波でより急な勾配になる傾向があり(ハードウェアローパスフィルターは多くの場合かなり急です)、低周波でより柔らかい勾配があります。より急なフィルターはより明らかに処理されたサウンドを作成します。より穏やかな勾配はより有機的に感じます。
ダイナミック圧縮:トランジェントの圧縮
実際のラジオ送信機と受信機は重い圧縮を適用します。送信機は過度な変調を避けるためにシグナルを制限し、受信機の自動ゲインコントロール(AGC)はさらに着信オーディオを圧縮します。ネット効果は、比較的一定の音量で留まる音声です—静かな単語は上に押し上げられ、大声で単語が叩き落とされます。
これを複製するには、高い比率(8:1以上、無限:1への制限まで)、高速アタック(5ms未満)、および適度なリリース(50~100ms)のコンプレッサーが必要です。高速攻撃は即座にトランジェントをキャッチし、高比率はそれらを強く固定し、適度なリリースは言葉の間で戻ります。
達成する主要なアーティファクトは「ポンピング」です—ゲイン回復が開始されるたびに、各大声の音節の後にコンプレッサーが取る軽い呼吸。微妙なポンピングは本物に聞こえます。積極的なポンピングはハードウェア障害のように聞こえますが、スタイライズされた効果に対して機能することができます。
また、シグナルをコンプレッサーに十分にハード駆動して、ゲイン削減メーターが常に移動するようにしたいと思います。よく圧縮されたラジオボイスはほぼ動的変動がなく、スピーチ全体で一定のレベルで留まります。
ハーモニック歪み и飽和
クリーンなラジオ伝送は実際にはまったくクリーンではありません。チューブサーキット、トランジスター制限、および過剰なAGCステージはすべて、サーキットの非線形動作によって生成される追加周波数コンテンツである調和歪みを追加します。
この飽和は微妙ですが重要です。奇数ハーモニック(基本周波数の1番目、3番目、5番目の部分音)を追加し、ラジオボイスに少しうなる、粒状のテクスチャーを与えます。これがなければ、帯域パス製フィルター処理および圧縮された音声は電話通話のように聞こえます。それと一緒に、ラジオのように聞こえます。
ソフトウェアでは、波形シェイパーまたはソフトクリッパーで飽和を複製します。目標は少量の周波数コンテンツを追加することです—テクスチャーを聞くのに十分ですが、音声が明らかにゆがむほどではありません。名目値のレベルから約3~6dB上のピークをフラットに平坦化するソフトクリップは、良い出発点です。
CBラジオエフェクト(粗い、古いハードウェア)の場合、飽和をさらに難しく押し込むことができます。軍事戦術ラジオの場合、微妙に保ち、よく保たれた専門的なユニットをシミュレートするために重い圧縮と組み合わせてください。
スタティック、ノイズ、大気テクスチャー
ラジオチャネルは決して沈黙していません—常にバックグラウンドノイズがあります。ノイズのタイプと量は、異なる伝送環境を区別します:
ホワイトノイズ: 一定の低レベルで追加された広帯域ノイズは、ラジオチャネルの搬送波ノイズをシミュレートし、開いているが明確に送信されていません。スピーチに対して-30〜-40dBFSで保ち、音声の下に座ったままで競争しないようにします。
帯域制限ノイズ: 音声に適用したのと同じバンドパスフィルターを通してノイズをフィルタリングするということは、ノイズがスピーチと同じ周波数空間を占めることを意味します。これは、ラジオが伝送できない周波数に拡張される未フィルタリングのホワイトノイズよりも本物に聞こえます。
定期的なクラックル: 数ミリ秒ずつの短い振幅スパイクが不規則に散在してRF干渉または悪いアンテナ接触をシミュレートします。これらは、定期的なクラックルではなく、偶発的なイベント(1分あたりのカップル)として最適に機能します。
ドロップアウトシミュレーション: オーディオの一時的な減衰または完全なカットは、地形または距離を通してスランギングするシグナルをシミュレートします。ばかりに使用されると、10~20秒ごとに50~100msドロップアウトは長い伝送に魅力的なリアリズムを追加します。
ノイズレベルと音声レベルのバランスが最も重要な変数です。ノイズが少なすぎると、エフェクトは電話通話のように聞こえます。実在しすぎると、音声は聞くのに疲れるようになります。目標は、フォーカスしている場合に聞こえるが、自分自身に注意を引かない音です。
スクエルチ:トランスミッション間のゲート
スクエルチはゲートサーキットで、閾値音量以下のオーディオをミュートし、単語間の背景スタティックをカットします。実際のラジオはスクエルチを使用して、誰も送信していないときのキャリアノイズを抑制します。それをシミュレート—文の間に沈黙にカットされるブリーフスタティックバースト—ラジオボイスエフェクトに大きなリアリズムを追加します。
実際には、閾値がノイズフロアの直下に設定されたノイズゲートを実装します。言葉の間では、ゲートは閉じて、ノイズは消えます。話し始めるとき、ゲートが開いてノイズが短く現れるときにクリックまたはポップがあり、その後あなたの声が引き継ぎます。このオープン/クローズサイクルは、実際のラジオ伝送の最も認識可能なアーティファクトの1つです。
ゲートのタイミングはここで多くの問題があります。攻撃が速すぎるとクリックが鋭すぎます。遅すぎるとゲートが早く開き、不自然に聞こえます。5~10msアタックと100~200msホールドが通常説得力のある結果を生成します。
一部の実装では、ゲートオープでブリーフノイズバースト(スクエルチテール)を追加して、受信機のスクエルチサーキットが開く音をシミュレートします。これは小さな詳細ですが、実際にラジオハードウェアを使用したことがある誰もが効果を売ります。
ラジオエフェクトバリアント:比較
異なるラジオタイプには異なるサウンドシグネチャーがあります。同じ基礎DSPチェーンが適用されますが、パラメータ値とノイズ特性は大幅に異なります。
| ラジオタイプ | バンドパス範囲 | 圧縮 | 飽和 | ノイズキャラクター |
|---|---|---|---|---|
| トランシーバー(FRS/GMRS) | 300Hz~3kHz | ヘビー、ファスト | ライト~モデレート | ホワイトノイズ、微妙 |
| CBラジオ(27MHzAM) | 300Hz~2.5kHz | モデレート | モデレート~ヘビー | クラックル、フェーディング |
| 軍事戦術(VHF) | 300Hz~3.4kHz | 非常に重い | ライト | ホワイトノイズ、ドロップアウト |
| AMブロードキャストラジオ | 100Hz~4kHz | モデレート | ライト | ミニマル、クリーン |
| ヴィンテージハムラジオ(SSB) | 300Hz~2.8kHz | ライト | ライト~モデレート | ヒス、時々スタティック |
| ポリス/ディスパッチラジオ | 300Hz~3kHz | 非常に重い | モデレート | ホワイトノイズ、スクエルチポップ |
AMブロードキャストラジオバリアントは、より多くの低周波コンテンツ(100Hzまで)を保持するため、目立つようにより温かくより完全です。古い音楽ラジオ放送は、トランシーバーの荒いカットとは異なる特徴的な温かいが少し狭い音を持っていました。
軍事戦術バリアントは、実際の軍事ラジオがオートマチックゲインコントロールを持つため、最も圧縮を使用し、本質的にスピーカーの音量に関係なく一定の音量で音声を浮かせます。結果はコントロール可能で少し不自然に聞こえます。これはまさに正確です。
VoxBoosterでラジオボイスフィルターを適用します
VoxBoosterはWASAPIバーチャルオーディオデバイスを通じてリアルタイムで完全なエフェクトチェーンを処理します—カーネルドライバーなし、仮想マシンなし、アンチチートシステムのために必要な回避策なし。リバーブとエコーなどのリアルタイム音声エフェクトがソフトウェアレベルでどのように機能するか、より広いコンテキストが必要な場合は、詳しく読むことができます。
Windows上のセットアップパス:
- VoxBoosterをインストールして起動します。
- [エフェクト]タブで、ターゲット(トランシーバー、CBラジオ、ディスパッチなど)に一致するラジオボイスプリセットを選択します。
- スライダーを使用して、バンドパスカットオフ、圧縮ドライブ、飽和量、ノイズレベルを調整します。
- ターゲットアプリケーション(Discord、OBS、ゲーム)で、オーディオ設定を開き、入力デバイスとして** VoxBooster Virtual Mic **を選択します。
- 話し始める—エフェクトが低いレイテンシでリアルタイムで適用されます。
処理チェーンのレイテンシーは、最新のCPUで20msをはるかに下回ります。これにより、会話使用で知覚可能な遅延のしきい値の下に配置されます。ヘッドフォンを通して監視している場合、自分自身をエコーするのは聞こえません。
人々を驚かすことの1つ:ラジオボイスエフェクトは、Discordの自身の処理—ノイズサプレッション、エコーキャンセル—をDisable VoxBoosterの出力を無調整で通すことを必要とするため、Discord音声チェンジャーワークフローと例外的に組み合わせます。VoxBoosterシグナルは既に処理されているため、Discordの独自のアルゴリズムはエフェクトの一部を元に戻す可能性があります。修正は簡単です:DiscordのVoice & Videoセッティングで、外部音声プロセッサを使用する場合、ノイズサプレッションとエコーキャンセルを無効にしてください。
AIボイスクローンで積み重ねラジオエフェクト
ラジオボイスエフェクトのより興味深い応用の1つは、ニューラルボイスコンバージョンで積み重ねることです。VoxBoosterには、音声をターゲットトーンカラーにリアルタイムに変換するAI音声クローンが含まれています。その変換を実行してから、出力をラジオボイスフィルターチェーンを通して送信する場合、実際に送信されているように聞こえるキャラクター音声で終わります。
順序が重要です:音声の変換最初、次にラジオフィルタリング。最初にフィルタリングしてから変換する場合、帯域パス処理されたオーディオはニューラル変換がしなければならないより少ない周波数情報を提供し、品質を低下させます。正しい順序で処理すると、2つのエフェクトがきれいに組み合わさります。
これは、特定の原型のように聞こえたいロールプレイヤーに有用です—commsの摩耗したベテラン、ロボットディスパッチャー、どこか遠くから放送されている超自然的なエンティティ。ラジオフィルターは、AIボイスを特定の送信コンテキストに接地し、より配置可能で意図的に感じさせます。
エフェクトの積み重ねについてのより詳細は、非常に異なる美的ターゲットのための同様の積み重ねの原則をカバーする宇宙人音声エフェクトガイドで見つけることができます。
一般的な間違いとそれらを修正する方法
エフェクトはラジオではなく電話通話のように聞こえます。 最も一般的な原因は飽和不足です。電話線は狭いバンドを通るきれいなオーディオです。ラジオは回路の色付けとその上の調和歪みを持っています。飽和を追加して、音声で軽いバズまたは粒状を聞くまで、その後約20%バックオフします。
スタティックは気を散らすです。 ノイズレベルが音声と注意のために争っている場合、それは高すぎます。ラジオスタティックは休止時に聞こえるはずですが、スピーチ下では見えません。話すときに消えるまでノイズゲインを低減します。
単語は理解するのが難しいです。 過度に急なバンドパスフィルター、特に高い方向は、子音を曇らせて、可読性が苦しむことができます。ハイパス閾値をわずかに上げ(200~250Hzに向かって)いくつかの暖かさを回復するか、ローパスを非常にわずかに低下(3.5kHzに)して、より多くのシビランスを通すことができます。認証性に対していくつかの認証を交換しています—両方の極値は正当な使用例があります。
圧縮は不自然に聞こえます。 非常に高速のアタック時間により、コンプレッサーは、ラジオアーティファクトよりもグリッチのように見えるトランジェントをチョークしています。攻撃を8~12msに柔らかくして、結果がより有機的に感じるかどうかを確認してください。
ゲートが開く意味はありません。 スタティックノイズが恒常的で、スクエルチ行動がない場合、ノイズフロアの直下に設定された閾値でノイズ注入後にノイズゲートを追加します。ゲートは言葉の間に閉じるので、その特徴的なカットを作成します。
ロボット-ラジオクロスオーバー
ロボットボイスエフェクトとラジオボイスエフェクトの間に興味深いハイブリッド領域があります。両方は同様の周波数の形を使用しますが、ロボット音声は通常、その上にピッチ量子化またはボコーダー処理を追加します。「ロボットラジオディスパッチ」—HAL 9000がкоордин座標を呼び出していることを考えてください—ラジオフィルターチェーンを軽いピッチ平坦化とリング変調の暗示と組み合わせます。
これはニッチエフェクトですが、よく行われたときにすぐに認識されます。このアプローチは、ラジオフィルターチェーン前の光リング変調(100~150Hzキャリア)を適用することです。リング変調はロボティック倍音を追加し、バンドパスフィルターはそれらをラジオ伝送空間に形作ります。結果は、非人間を示すのに十分に異世界から異なり、充分に理解するのに十分に心地よいです。
よくある質問
ラジオボイスエフェクトとは何ですか?
ラジオボイスエフェクトは、オーディオ処理ステップの連鎖です。バンドパスフィルタリング、ダイナミック圧縮、ハーモニック歪み、オプションのノイズ注入により、きれいな音声がAMラジオ、トランシーバー、またはCBラジオチャネルを介して伝送されているように聞こえます。
トランシーバーの音声はどの周波数を使用しますか?
トランシーバーとCBラジオ音声は通常、300Hz~3kHzの間でバンドパスフィルタリングされ、低いベース部分と音声を自然で充実して聞こえさせるハイエア周波数をカットします。この狭い範囲は、エフェクトに特徴的な薄くて遠い品質を与えるものです。
VoxBoosterはDiscord、OBS、ゲームで機能しますか?
はい。VoxBoosterはWASAPIを介して仮想オーディオデバイスを作成し、Windows 10または11上のすべてのアプリケーションがマイクロフォンソースとして使用できます。DiscordのVoxBooster仮想マイク、OBS、またはゲームのオーディオ設定を選択すると、エフェクトがリアルタイムで適用されます。
VoxBoosterはアンチチートシステムで安全ですか?
VoxBoosterはWASAPIレベルで完全にオーディオを注入します。カーネルドライバーはインストールされていません。EACやBattlEyeなどのアンチチートシステムはカーネルレベルの変更を探しているため、VoxBoosterはそれらをトリガーしません。
ラジオボイスエフェクトをAI音声クローンと組み合わせることはできますか?
はい。VoxBoosterではエフェクトをスタックできます。ニューラルボイスコンバージョンを実行して、音声を異なるトーンカラーに変更してから、出力をラジオボイスフィルターチェーンを通して渡すことで、クローンされた音声に説得力のあるラジオ伝送品質を与えることができます。
スクエルチとは何で、リアリズムにはなぜ重要ですか?
スクエルチはゲートサーキットで、閾値音量以下のオーディオをミュートし、単語間の背景スタティックをカットします。実際のラジオはスクエルチを使用して、誰も送信していないときのキャリアノイズを抑制します。それをシミュレート—文の間に沈黙にカットされるブリーフスタティックバースト—ラジオボイスエフェクトに大きなリアリズムを追加します。
ラジオボイスエフェクトを使用するために特別なマイクロフォンが必要ですか?
いいえ。Windowsが認識する任意のマイクロフォンが機能します。VoxBoosterはシグナルをキャプチャし、ソフトウェアのエフェクトチェーンを通して処理し、仮想デバイスに出力します。標準的なUSBまたはヘッドセットマイクロフォンは説得力のある結果を生成します。
結論
ラジオボイスフィルターは、悪い版と説得力のある版の間のギャップが広すぎて、改善が直ちに明らかになるため、最も満足のいくエフェクトの1つです。バンドパスを正しく取得して、音声はすでに伝送に属しているように聞こえます。圧縮、飽和、ノイズ、スクエルチを追加すれば、本当にイマーシブになります。
重要な洞察は、エフェクトが意図的な劣化についてです—ラジオハードウェアがオーディオを制約する色付けする特定の方法の再作成です。チェーン内のすべてのパラメーターは、実際のラジオ機器の対応する物理的なアナログを持っています。これらの接続を理解することは、チューニングを任意ではなく直感的にします。
VoxBoosterは、Windowsのすべてをリアルタイムで処理し、ドライバーのインストールはなく、仮想マシンはなく、互換性の問題はありません。ラジオプリセットで試してパラメーターを実験し、AI音声クローンと組み合わせて、実際に別のどこかから送信されているように聞こえるキャラクターを取得します。