受刑者の家族との絆のための音声クローニング
受刑者家族の音声AIは、最初の親が牢房のドアで子どもから分離されて以来、存在する問題を解決しています。人が対面できないときに、子どもの人生で存在し続けるにはどうするか?200万人以上のアメリカ人が現在投獄されています。約半分は親です。彼らの子ども(米国だけで推定270万人)は親の音声、顔、物理的なプレゼンスに毎日アクセスすることなく子どもを育てます。心理的コストは十分に記録されています。新しいのは、部分的な答えを提供するテクノロジーです。
AI音声クローニング、特に投獄前の録音を使用して音声モデルをトレーニングするアプリケーションは、テクニカル以外の家族成員が自宅で使用するために十分に実用的です。このポストは、テクノロジーがどのように動作するか、既に存在するプログラム、児童開発研究が聴覚親接続について言うこと、実用的にこれにアプローチする方法(音声クローニングができることとできないことについての現実的な期待を含む)を説明します。
TL;DR
- 米国の270万人の子どもが受刑親を持っています。聴覚的分離は物理的分離と共にトラウマを悪化させます。
- AI音声クローニングは既存の録音(ボイスメール、ビデオ、保存された音声メッセージ)をトレーニングして、親の音声で新しい音声を生成できます。ライブ刑務所録音セッションは不要です。
- 刑務所”子どもに読んでください”プログラムは数年間記録音声を使用してきました。AI音声クローニングはこのコンセプトを無制限の新しいコンテンツに拡張します。
- テクノロジーは3~10分のきれいで多様なソースオーディオで最適に機能します。
- 修復的司法実務家および児童心理学者は、同意ベースの家族音声クローニングをますます正当なサポートツールとして見なしています。
- 倫理的および法的保護が重要です。同意、プライベート使用、第三者詐欺なし。
投獄親と子どもへの影響の規模
テクノロジーを議論する前に、コンテキストが重要です。Prison Policy Initiativeによると、米国の約190万人の子どもは特定日に州または連邦刑務所に親を持っています。ジェイル施設が含まれる場合、数字は270万人に拡大します。これらの子どもは、投獄された親なしの同族と比べて、うつ病、不安、学校での行動問題、および愛着の混乱を経験する可能性が統計的に高いです。
これらの子どもの間での回復力の最強の予測因子は、投獄された親との継続的な接続です。投獄にもかかわらず、その通りです。訪問、電話、手紙を通して。ミネソタ大学の犯罪、司法、および地域研究所(2022)の研究は、投獄された親との定期的な接触を維持した子どもが、切断された接触を持つ子どもと比べて12歳までの行動障害率が大幅に低かったことを示しました。犯罪タイプと刑期の長さを制御してさえも。
音声はこの接続の大きな部分です。乳児は出生前に親の音声を認識します。小さな子どもはケアラーの音声を安全と関連付けます。眠前のお話の時に馴染みの音声を聞く、たとえ録音を通してさえ、7歳未満の子どもに対して親の物理的プレゼンスと同じニューラル落ち着きパスを活性化させます。
「受刑所家族音声AI」が実際に意味すること
「受刑所家族音声AI」という用語は、特定のユースケースをカバーしています。投獄前または投獄中に作成された録音を使用して、親の音声で新しいオーディオコンテンツを生成すること。通常、子ども向けで、通常はお話読み、メッセージ、またはパーソナライズされた挨拶です。
これは以下の点で異なります。
- リアルタイム音声変更(ライブコールを他の人に聞こえるように修正する)
- 詐欺のための音声詐称(倫理的に間違い、法的に問題がある)
- 合成セレブリティ音声クローニング(同意なく公人を複製)
同意ベースの家族アプリケーションは、親が長い派遣前にベッドタイムのお話しカセットのスタックを記録することに近いです。ただし、AI音声クローニングはそのスタックを無限に長く、その夜に子どもが必要なものにパーソナライズされています。
テクノロジーの仕組み
最新のAI音声クローニングは一般的なパターンに従います。
- オーディオ抽出: 人の音声の既存録音を収集します。ボイスメール、ビデオ通話、誕生日ビデオ、ホーム録音、メッセージアプリから保存された音声メッセージ。
- データ準備: オーディオをクリーニング(背景ノイズを削除、音声を音楽から分離、沈黙を短縮)し、使用可能なデータセットにコンパイルします。品質は量より重要です。5分のクリーンな音声は20分のノイズの多いオーディオを上回ります。
- モデルトレーニング: AIはその特定の音声の音響特性(ピッチ、音色、抑揚、共鳴、発音パターン)を学習します。トレーニング時間はハードウェアとソフトウェアに応じて数分から数時間までの範囲です。
- 推論/生成: 新しいテキストを入力します。モデルは元のスピーカーがそれらの言葉を言っているように聞こえるオーディオを生成します。これは親が決してレコーディングしなかったベッドタイムのお話、親が欠落する年の誕生日メッセージ、または子どもの好きな本の朗読です。
テクノロジーは、生成の時点でスピーカーが存在または認識されることを必要としません。元のソースオーディオを提供し、批判的に倫理的に、その使用に同意したことのみが必要です。
お子さんに読んでください:既に存在するプログラム
複数のプログラムはAI音声クローニングが実用的になるはるか前に従来の録音オーディオを使用してこのスペースで動作しています。それらを理解することはAIがどこに適合するかを文脈化します。
| プログラム | モデル | 仕組み |
|---|---|---|
| Storybook Project(米国、複数州) | 記録されたセッション | 受刑親は本を読んでいる自分をレコーディングします。記録と本は子どもに郵送されます |
| Daddy Read to Me(ジョージア) | 記録されたセッション | 父はファシリティでベッドタイム読み上げを記録します。子どもはDVDと物理的な本を受け取ります |
| Family Literacy Project(英国) | 記録されたセッション | HM Prison Partnership; オーディオCDは子どもに郵送されます |
| Reading Between the Bars(カナダ) | ライブビデオ+レコーディング | 促進されたストーリータイムビデオ通話; いくつかのプログラムは再利用のための記録を保持します |
| Sesame Street’s Little Children, Big Challenges | サポートカリキュラム | 記録ベースではありませんが、投獄された親を持つ子どもを特に対象としています |
これらのプログラムは機能します。Storybook Projectの成果の2019年評価は、参加する子どもの保護者の87%が、その子どもが記録を繰り返し聞いてベッドタイム時にそれらを特に求めたことを報告しました。わずか18ヶ月の子どもは親の記録された音声への認識反応を示しました。
従来の記録プログラムの制限は、ライブラリが固定されていることです。親が30冊の本を記録したら、子どもは30個の記録があります。AI音声クローニングはこのキャップを削除します。親の訓練された音声は、元のセッション後に公開された本、子どもが書いた手紙、またはその週の子どもの特定の人生に関するパーソナライズされたお話を含む任意のテキストを読むことができます。
投獄前の録音から音声モデルをトレーニングする方法
このセクションは実用的です。受刑者の家族成員であり、既存の録音がある場合、VoxBoosterなどのWindows AI音声クローニングツールを使用したプロセスの外観は次のとおりです。
ステップ1——ソースオーディオを収集します
探す:
- ボイスメール: わずかなボイスメールでさえ増加します。3つの90秒のボイスメールは既に4.5分のソースオーディオを与えます。
- ビデオ録画: ホームビデオ、誕生日録画、休暇ビデオ。オーディオトラックを抽出します。
- 保存された音声メッセージ: WhatsApp、Telegram、Signal、iMessage、およびほとんどのメッセージングプラットフォームは音声メッセージの保存を許可します。
- 電話通話録音: 投獄前から電話通話記録が存在する場合、これらはしばしば高品質のソースマテリアルです。
- ビデオ通話: 記録されたZoom、FaceTime、またはSkypeセッション。
少なくとも3~5分のきれいな音声を目指してください。10分間でより良い結果が得られます。
ステップ2——オーディオをクリーニングします
背景ノイズは音声モデル品質を低下させます。Audacityなどの無料ツールを使用して。
- 大きな背景ノイズのセクションを削除
- 基本的なノイズ低減を適用
- オーディオレベルを正規化
- WAVまたは高品質MP3としてエクスポート
ビデオに音声が混在する場合、ターゲットスピーカーのセクションのみを分離します。
ステップ3——音声モデルをトレーニングします
準備されたオーディオをVoxBoosterの音声クローニングインターフェースにロードします。ソフトウェアはローカルモデルをトレーニングします。オーディオはマシンを離れません。トレーニング時間は、5~10分のソースマテリアル用に20~45分の中程度GPUを備えた標準WindowsペクのPC上で通常です。
ステップ4——コンテンツを生成します
モデルがトレーニングされたら、お話し、メッセージ、または手紙のテキストを入力またはペーストします。オーディオを生成します。聞き通し、必要に応じてスピーキング速度またはエンファシスに調整を行い、エクスポートします。
子どものベッドタイムルーチンのため、1週間分のお話し読み取りを生成するには、約1~2時間のテキスト入力とオーディオ生成が通常です。
ステップ5——配送
生成されたオーディオをMP3ファイルとしてエクスポートします。これらは以下のいずれかです。
- 子どもの携帯電話またはタブレットにロード
- スマートスピーカーを通じて再生
- CD上に書き込む(信頼できるストリーミングのない世帯に関連)
- プライベート家族Google Driveまたは同様のものを通じて共有
子どもの聴覚接続に関する研究が言うこと
子どもにおける音声認識の神経科学は十分に確立されています。親の音声はコンテンツを超えて小さな子どもに対して測定可能な生理学的効果があります。音響署名自体が意味を運びます。
2021年のスタンフォード研究(PNASで公開)では、7~12歳の子どもが母の音声を聞いたとき、未知の成人を聞く場合と比べて有意に異なる脳活性化パターンを示しました。特に感情、報酬、および顔処理に関連した地域で。音声だけで、親の物理的プレゼンスに通常関連する回路が活性化されました。
受刑親を持つ子どもにとって、これは重要です。なぜなら物理的な訪問はしばしば距離、費用、施設規則、ケアラー容量によって制限されているからです。音声録音。特にパーソナライズされ、現在で、相互作用的に見えるもの。慰めの賞だけではありません。それは親の不在の物理的プレゼンスを部分的に補正するニューラル結合の真のチャネルです。
愛着理論の専門家である心理学者は、安全な愛着にとって重要なのは継続的な物理的近接ではなく、親の接触の予測可能性と暖かさであることに注意します。親の音声でのナイトタイム・ストーリー。たとえ生成されたものでも。正確にその予測可能性を提供します。同じ音声、同じ暖かさ、同じ時間、毎晩。
修復的司法と人工知能支援接続の事例
修復的司法のフレームワークは、犯罪からの害の修復と関係の再構築に焦点を当てています。投獄された個人とその家族を含みます。家族接続のための音声クローニングは修復的原則に直接適合します。
- それは子どもの福祉を優先します。子どもは犯罪の当事者ではなく、切断された家族の結びによる不均衡な副作用的罰を負うべきではありません。
- それは再統合をサポートします。投獄中の親のアイデンティティと関係の維持は、親が戻るべき一貫した役割と責任を与えることで再犯率を低下させます。
- それは同意ベースです。監視技術または罰則的措置とは異なり、このツールは投獄された人の完全な知識と参加で動作します。
米国の複数の修復的司法実務家は、家族サポートパッケージの一部としてAI音声ツールについて議論し始めています。ペンシルバニア刑務所協会および同様の組織は、従来のプログラムへの訪問の補完としてデジタル家族接続ツールを探索しています。
距離と状況で分離した家族をサポートする音声クローニング技術の方法に関するさらに詳しい情報については、軍事派遣家族接続のための音声クローニングおよび国際採用アップデートのための音声クローニングに関するメッセージを参照してください。
倫理的枠組み:同意、明確性、および適切な使用
このアプリケーションの倫理は3つの柱に基づいています。
1. 同意
音声がクローン化される人は同意している必要があります。理想的には、これは以下を意味します。
- 人が使用に同意する投獄前または投獄中の会話
- 記録された同意(手紙またはされた口頭同意でも)特定の目的に注目
- 同意を取り消し続ける能力。親が後で彼らのクローン化された音声の使用に異議を唱えた場合、その願いが尊重されるべきです
対象者の知識なしに音声を複製するために記録を使用し、やさしい目的でさえ、重要な倫理的な線を横断します。
2. 目的の明確性
クローン化された音声は、指定された目的(家族接続、子ども向けコンテンツ)のみに使用し、以下は使用しないでください。
- 誰かをだまくらかすためのライブ通信として提示
- 本物の同時期の録音であるかのように法的処置で使用
- 人が同意していない方法で公開的に共有
子どもは年齢に適切な言語で理解できます。「これは父の声です。古い録音から学んだコンピュータなので、彼が遠くの場合でも彼はあなたに読むことができます。」子どもがこの枠組みが正直に提供されるとき驚くほど受け入れてくれます。
3. 法的認識
音声バイオメトリクスは複数の米国州(イリノイBIPA、テキサス、ワシントン)のプライバシー法と交差します。音声がクローン化される人が同意した場合(理想的には投獄前に書面で)、これはプライベート家族利用に通常許可されます。出力を公開的に配布したり、第三者を欺くために使用したりすることは異なる法的質問を生じます。疑問がある場合は、常に地元の弁護士に相談してください。
家族分離の間に親子接続を維持するため音声クローニングの使用に関する関連した議論については、離婚中の親子接続のための音声クローニングに関するメッセージを参照してください。
実用的な考慮事項:機能するもの、機能しないもの
| 要素 | 良好に機能 | 制限 |
|---|---|---|
| ソースオーディオ品質 | 異なる文で5分以上のきれいな音声 | 非常に短いか騒々しい記録はロボット出力を生成 |
| 音声モデル精度 | 独特の音声(ユニークなアクセント、抑揚、音色) | 同様の音色の音声は平均的な音声パターンとブレンド |
| コンテンツタイプ | お話し読み、メッセージ、シンプルなナレーション | 歌う、感情的な極端、非常に速い音声はより困難です |
| 子どもの年齢 | 10歳未満が最も反応性があります。幼児は音声パターンを認識 | より大きな子どもは出力を知的に検査する場合があります |
| 配信文脈 | 一貫したベッドタイムルーチン、使い慣れたデバイス | ランダムまたは不確定な暴露は結合利益を減らします |
| ケアラー関与 | ケアラーは記録をたいせつなものとして提示 | ケアラーフレーミングなしでは、子どもが関与しない場合があります |
重大な実用的なポイント。目標はテクニカル詐欺ではなく感情接続です。クリーンにしているように聞こえるが「パパがあなたのためにお話しを読んでいる」とクリアに表示される記録は、曖昧に提示された不気味な谷の完璧なレプリカより価値があります。子どもの脳は結びつきたいので音声に接続します。その欲求が重い仕事をします。テクノロジーは認識可能なほど十分に近い必要があるだけです。
これが悲しみとメモリアルオーディオに接続する方法
投獄に直面する家族は損失に直面する家族と特定の経験を共有します。不在の親、毎日の人生の空白、答えるのが難しい質問をする子ども。ツールも同じです。
メモリアル音声クローニング。家族が末期または亡くなった愛する人の音声を将来の世代のために保持することは成長する領域で独自の倫理的文献です。多くの同じ原則が適用されます。同意、明確な目的、子どもとの年齢適切な透明性。両方の状況にある家族のため、音声を聞くことは現実の否定ではなく、越え難く感じるギャップを越えた関係を維持しています。
家族の遺産のための音声保存に関するさらに詳しい情報については、悲しみおよびメモリアルオーディオのための音声クローニングおよび子ども向け本のためのAI音声クローニングの使用に関するメッセージを参照してください。
技術セットアップ:家族音声クローニングのためのVoxBooster
VoxBoosterはWindows 10および11で実行でき、個人的な音声録音からのカスタム音声モデルトレーニングをサポートしています。このユースケースに関連する数つの技術的メモ。
- ローカル処理: すべてのトレーニングと推論はマシン上で発生します。オーディオはアップロードされません。これは投獄された人と子どもの両方のプライバシーに重要です。
- カーネルドライバ不要: インストールはадmin-レベルドライバソフトウェアを必要としません。これは家族成員の古いPCにセットアップしている場合を重要にします。
- テキスト音声出力: 音声モデルがトレーニングされたら、テキストを入力またはペーストしてオーディオをエクスポートします。ライブコンポーネント不要。自分のペースでファイルを生成します。
- モデル永続性: トレーニング済み音声モデルはローカルに保存されて無期限に再利用可能です。一度トレーニング、必要なだけ多くのお話しを生成します。
3日間の無料試用版では、コミットする前にソース記録が十分であるかテストできます。
よくある質問
受刑親の音声をその子どもにクローン化できますか?
はい。投獄前のオーディオ録音が存在する場合(ボイスメール、ホームビデオ、電話録音)、AI音声クローニングソフトウェアはそのマテリアルからモデルをトレーニングできます。結果の音声モデルは、受刑親の音声で眠前のお話しの朗読などの新しい音声を生成できます。施設内でのライブ録音セッションは不要です。
受刑所の家族との絆のためにAI音声クローニングを使用することは倫理的ですか?
対象者の事前同意を得て、自分の子どもの利益のために使用される場合、この応用は児童心理学者および修復的司法実務家により広く倫理的と見なされます。クローン化された音声は他人を欺くために人を模倣していません。親の言葉を自分の家族に届けます。録音された手紙のようなものです。
音声をクローン化するための十分に良い録音とは?
ほとんどの最新AI音声クローニングツールは3~10分のきれいなオーディオで動作できます。ボイスメール、ビデオ通話録音、ホームビデオ、誕生日メッセージ、メッセージングアプリから保存された音声メッセージすべて該当します。オーディオがより清潔で多様(異なる文、単一の繰り返し文ではなく)であるほど、出力はより自然です。
子どもが親の音声のクローン化バージョンを聞くとどう反応しますか?
家族支援組織および修復的司法プログラムからの初期の質的報告は、子どもがコンテキストを理解するとき、肯定的に反応することを示唆しています。これは親の声が彼らに読んでいることです。心理学者は、不在の親への聴覚接続により分離不安および愛着混乱(特に10歳以下の子ども)を軽減できることに注目します。
受刑親のために既に録音された音声を使用するプログラムが存在しますか?
はい。「Storybook Project」および「Reading Is Fundamental」刑務所パートナーシップなどのプログラムは、受刑親による本の音声録音を数年間収集してきました。AI音声クローニングは、これらの録音が元のセッション以外の新規コンテンツ(新しい本、新しいメッセージ、パーソナライズされた就寝時のお話)を生成することを可能にします。
このため、VoxBoosterを使用できますか?
VoxBoosterはWindows 10/11で実行でき、個人的な音声録音からのカスタム音声モデルトレーニングをサポートしています。保存されたボイスメールまたはビデオオーディオを使用してモデルをトレーニングしてから、テキスト音声出力を使用してその音声で新しいナレーションを生成できます。ソフトウェアはすべてローカルで処理します。外部サーバーにはオーディオはアップロードされません。
受刑者の音声をクローン化する法的側面とは?
音声は複数の米国州(イリノイBIPA、テキサス、ワシントン)では生体認証データと見なされます。音声がクローン化される人が同意した場合、理想的には投獄前に書面で同意した場合、通常はプライベート家族利用に許可されます。出力を公開的に配布したり、第三者を欺くために使用したりすることは異なる法的問題を生じます。疑問がある場合は、常に地元の法律を参照してください。
結論
受刑者家族の音声AIは物理的なプレゼンス、訪問、または本当の再統合サポートの置き換えではありません。それはセッションが作成する距離の間に、ベッドタイムでの沈黙を解決します。同意、透明性、正しい技術セットアップを持つ投獄前の記録からのAI音声クローニングは、子どもに何かが本物を与えることができます。親のシミュレーションではなく、親自身の音声、読み取り、物語、分離を越えて存在し続けます。
投獄された音声クローンユースケースは末期病の音声保存、展開軍事親のための音声接続、およびグリーフファミリーのためのメモリアルオーディオと同じアプリケーション家族に属します。すべてに、テクノロジーは人間を行います。子どもの人生に音声を保つので、分離が終わるときに、認識と関係がゼロから開始する必要がありません。
既存の記録があり、これを実際に探索したい場合、VoxBoosterは3日間の無料トライアルを提供します。ローカル処理、カーネルドライバなし、フルカスタム音声モデルサポート。オーディオはマシンを離れません。
VoxBoosterをダウンロード。3日間の無料トライアル、クレジットカード不要。