การสร้างตัวแทนเสียงบน Anthropic’s Model Context Protocol นั้นตรงไปตรงมาจนกว่าคุณจะต้องทดสอบว่าพวกเขาทำงานอย่างไรภายใต้เงื่อนไขการพูดจริง การสรรหาผู้พูดสำหรับแต่ละแนวทางนั้นช้า; การพึ่งพาอินพุตข้อความเพียงอย่างเดียวทำให้ประเด็นทั้งหมดของอินเทอร์เฟซที่เป็นศูนย์กลางเสียง
คู่มือนี้เดินผ่านขั้นตอนการทำงานของนักพัฒนาที่ใช้งานได้จริง: ไมโครโฟนเสมือน WASAPI เป็นชั้นการฉีดเสียง การแปลงเสียง AI สำหรับการจำลองตัวละคร และการส่งผ่าน Whisper ภายในเครื่องสำหรับการควบคุมคุณภาพของการถ่ายเทียม — ทั้งหมดที่ไขเป็นการตั้งค่า Claude Desktop + เซิร์ฟเวอร์ MCP ที่คุณสามารถรันบนเครื่อง Windows 10/11 วันนี้
TL;DR
| ชั้น | เครื่องมือ | บทบาทในท่อระบาย |
|---|---|---|
| อินพุตเสียง | ไมโครโฟนเสมือน WASAPI | ฉีดเสียงที่สังเคราะห์หรือแปลงรูปแบบราวกับว่ามาจากไมโครโฟนจริง |
| ตัวละครเสียง | ตัวเปลี่ยนเสียง AI (ต่ำกว่า 300 md) | จำลองผู้พูดที่แตกต่างกันได้ |
| โฮสต์ MCP | Claude Desktop | กำหนดเส้นทางเรียกใช้เครื่องมือเสียงไปยังเซิร์ฟเวอร์ MCP |
| การตรวจสอบ QA | Whisper ในเครื่อง | ตรวจสอบการถ่ายเทียมก่อนและหลังเที่ยว MCP |
| เป้าหมาย OS | Windows 10 / 11 | ชั้น WASAPI — ไม่จำเป็นต้องมีไดรเวอร์เคอร์เนล |
Anthropic MCP ทำอะไรจริงๆสำหรับเสียง
Model Context Protocol เป็นข้อกำหนดอินเทอร์เฟซแบบเปิดที่ช่วยให้โมเดลภาษาเช่น Claude สามารถเข้าถึงเครื่องมือภายนอก — ฐานข้อมูล API อุปกรณ์เสียง — ผ่านสัญญารูปแบบ JSON-RPC ที่สอดคล้องกัน ตัวแทนเสียงที่สร้างใน MCP ไม่ใช่แค่เท่านั้น แค่ chatbot ที่มีสกินข้อความต่อเสียง เป็นกราฟการจัดเรียง: โมเดลได้รับการออกเสียงที่พูด (ที่ถ่ายเทียมอพสตรีม) ตัดสินใจว่าเครื่องมือใดที่จะเรียก เรียกใช้พวกเขา และสังเคราะห์การตอบสนองที่พูด
เอกสาร MCP ที่เป็นทางการที่ modelcontextprotocol.io อธิบายไตรภาค host/client/server ในบริบทของเสียง: โฮสต์ คือ Claude Desktop (หรือรันไทม์ที่ตระหนักถึง MCP ของคุณเอง) ไคลเอนต์ อาศัยอยู่ในโฮสต์นั้น และ เซิร์ฟเวอร์ คือเครื่องมือที่ตัวแทนเสียงของคุณสามารถเรียกได้ — การถ่ายเทียม การสังเคราะห์ การค้นหาบริบท การดำเนินการ
นี่หมายความว่าสำหรับการทดสอบ: อินพุตเสียงทุกช่วงเป็นจริง ลำดับของเรียกใช้เครื่องมือสี่ห้าช่วง หากคุณทดสอบเพียงแค่ข้อความที่พิมพ์ คุณจะข้ามขั้นตอนการถ่ายเทียม ขั้นตอนการประมวลผลล่วงหน้าเสียง และรูปแบบการเปลี่ยนแปลงคุณภาพสัญญาณที่มาจากการพูดจริง นี่คือสาเหตุที่ชั้นการฉีดเสียงที่สามารถสร้างซ้ำได้จึงมีความสำคัญ
ปัญหาของนักพัฒนา: อินพุตเสียงไม่ได้เป็นสิ่งที่กำหนดได้
เมื่อคุณทดสอบ UI ที่มองเห็นได้ คุณสามารถเล่นไฟล์ fixture ใหม่ได้ เมื่อคุณทดสอบตัวแทนเสียงด้วยไมโครโฟนจริง คุณจะได้รับการบันทึกที่แตกต่างกันทุกครั้ง — เสียงรบกวนพื้นหลังต่างกัน การหมดเวลาแตกต่างออกไปเล็กน้อย ความผันผวนเล็กน้อยในระดับเสียง ใด ๆ ของสิ่งเหล่านี้สามารถเปลี่ยนการถ่ายเทียม Whisper ได้โดยคำหนึ่งหรือสองคำ ซึ่งสามารถ cascade เข้าไปในการเลือกเครื่องมือ MCP ที่แตกต่างกัน
ความไม่กำหนดนี้มีประโยชน์ในการผลิต แต่เป็นหนี้สินในชุด regress ยังคุณต้องการแยกตัวแปร Voice changer ที่ป้อนไปยังไมโครโฟนเสมือน WASAPI ให้คุณ fixture เสียงที่สามารถสร้างซ้ำได้ในขณะเดียวกันยังคงทำงานทั้งหมด ห่วงโซ่การประมวลผลเสียง
ไมโครโฟนเสมือน WASAPI: ชั้นการฉีดเสียง
Windows Audio Session API (WASAPI) เป็นสแต็คเสียงระดับต่ำที่ใช้แอปพลิเคชัน Windows ทั้งหมดสมัยใหม่นั่งอยู่บน ไมโครโฟนเสมือน WASAPI ปรากฏไปยังระบบปฏิบัติการ — และด้วยเหตุนี้ไปยังแอปพลิเคชันใด ๆ รวมถึง Claude Desktop — เป็นอุปกรณ์ถ่ายภาพที่ถูกต้องตามกฎหมาย ไม่มีไดรเวอร์เคอร์เนล ไม่มี VB-Cable ไม่มีรูปแบบการบริหารจัดการที่จำเป็น
ขั้นตอนที่ใช้งานได้จริง:
- เริ่มเครื่องมือเสียงของคุณ (VoxBooster หรือที่เทียบเท่า) พร้อมกับแทร็กเสียงต้นทางหรือไมโครโฟนสด
- เลือกจุดสิ้นสุด WASAPI เสมือน เป็นเอาต์พุตที่ใช้งานอยู่ในการตั้งค่าการกำหนดเส้นทางของเครื่องมือเสียง
- ในการตั้งค่า Claude Desktop ให้ตั้งค่าอินพุตไมโครโฟนเป็นอุปกรณ์ WASAPI เสมือน
- ยืนยันด้วยการทดสอบการบันทึกสั้น ๆ ว่าการตั้งค่าเสียง Windows แสดงอุปกรณ์เสมือนเป็นอุปกรณ์ถ่ายภาพเริ่มต้น
จากจุดนี้เป็นต้นไป เสียงใด ๆ ที่ถูกกำหนดเส้นทางผ่านเครื่องมือเสียงของคุณ — รวมถึงเสียงที่แปลงรูปแบบ เสียงที่มีการเปลี่ยนระดับ หรือเสียงที่สร้างตัวละครแบบรูปแบบ — มาถึง Claude Desktop ราวกับว่าพูดตรงเข้าไปยังไมโครโฟนจริง
ตัวแปรที่สำคัญ: เมื่อตั้งค่าแล้ว เส้นทางเสียงจึง bit-identical ในทั่วการทดสอบการทำงานซ้ำสำหรับวัสดุต้นทางเดียวกัน นั่นคือสิ่งที่กำหนดได้ที่คุณต้องการสำหรับการทดสอบเสียง CI-friendly
การแปลงเสียงเพื่อการจำลองตัวละคร
ตัวแทนเสียง MCP มักจะให้บริการสถานการณ์บุคลิกลักษณ์หลาย ๆ: บอท บริการลูกค้าควรตอบสนองในลักษณะเดียวกันไม่ว่า ผู้พูดจะดูเหมือนอายุ 20 ปีหรือ 60 ปี ชายหญิง สำเร็จหรือไม่ การทดสอบสิ่งนี้ด้วยตนเองหมายถึงการสรรหาผู้พูดที่หลากหลาย การทดสอบด้วย voice changer หมายถึงการกำหนดโปรไฟล์เสียงห้าหรือหกครั้งและเรียกใช้พวกเขาต่อตัวแทนของคุณในทุก PR
คุณสมบัติของตัวละครทดสอบที่มีประโยชน์:
- Pitch shift — ครอบคลุมหนังสือเรียน ชาย/หญิง และอายุที่ผู้ใช้ของคุณจริง ๆ ช่วง
- Formant shift — อิสระจาก pitch จับลักษณะเสียงและความแตกต่างของท่อเสียง
- การฉีดเสียงรบกวน — จำลองการแปรปรวนคุณภาพไมโครโฟน (HVAC ในสำนักงาน เสียงรบกวนจากถนน อุปสรรค การบีบอัด earset)
- Cadence — ผู้ใช้บางคนพูดเร็ว บางคนหยุดบ่อย; แบบจำลองการถ่ายเทียมจัดการสิ่งเหล่านี้แตกต่างกัน
สำหรับการทดสอบความสอดคล้องของตัวละครโดยเฉพาะ ความหน่วงเวลาของการแปลงเสียงต้องต่ำพอที่คุณสามารถเรียกใช้ชุดทดสอบที่สมบูรณ์ได้ในเวลาผนัง ต่ำกว่า 300 md end-to-end เป็นเกณฑ์ที่ใช้งานได้จริง — ณ จุดนั้น ชุดอักษรของ 50 ตัวละคร × 20 การผสมผสานการพูด ใช้เวลาน้อยกว่าสามนาที
ไปป์ไลน์ WASAPI VoxBooster รันการแปลงเสียงเฉพาะที่บน Windows 10/11 โดยไม่มีการทำเที่ยวคลาวด์ นั่นคือสาเหตุที่มันมีประโยชน์ที่นี่: ความหน่วงเวลาการแปลงเป็นปกติและไม่เพิ่มความแปรปรวนของเครือข่ายให้กับการวัดการทดสอบของคุณ
เซิร์ฟเวอร์ MCP การเชื่อมต่อสำหรับเครื่องมือเสียง
เซิร์ฟเวอร์ MCP สำหรับเสียง เปิดเผยเครื่องมือที่โมเดลสามารถเรียกตามชื่อ เซิร์ฟเวอร์ MCP ขั้นต่ำที่มีความสามารถด้านเสียงอาจนำเสนอ:
{
"tools": [
{ "name": "transcribe_audio", "description": "ถ่ายเทียมเสียงจากอุปกรณ์ถ่ายภาพ WASAPI ปัจจุบัน" },
{ "name": "synthesise_speech", "description": "สังเคราะห์เสียงพูดจากข้อความและเล่นไปยังอุปกรณ์เอาต์พุตเริ่มต้น" },
{ "name": "set_voice_persona", "description": "ใช้โปรไฟล์การแปลงเสียงที่มีชื่อกับสตรีมถ่ายภาพ" }
]
}
Claude เห็นเครื่องมือเหล่านี้ สามารถเรียก set_voice_persona ก่อน transcribe_audio ในระหว่างเซสชัน multi-turn — มีผล อนุญาตให้โมเดลจัดการช่องทางเสียงด้วยตนเอง ไม่เพียงแค่จัดการแบบพasif
สำหรับนักพัฒนาที่ทดสอบการตั้งค่านี้: เรียกใช้เซิร์ฟเวอร์ MCP ของคุณด้วยการบันทึก --inspect เพื่อให้คุณสามารถเห็นได้ว่าเครื่องมือใดที่เรียกทำให้ไฟของการพูดแต่ละครั้ง การติดตามการเรียกใช้เครื่องมือในการรวมกับขั้นตอน QA Whisper ที่อธิบายไว้ด้านล่าง ให้บันทึกการตรวจสอบแบบเต็มรูปแบบเกี่ยวกับสิ่งที่ตัวแทนได้ยินและสิ่งที่ตัดสินใจทำ
ดู Anthropic Constitutional AI paper สำหรับการพิจารณาการจัดตำแหน่งที่ใช้เมื่อตัวแทนเสียงของคุณทำการตัดสินใจที่อิสระตามอินพุตผู้พูด — การจัดการที่ยุติธรรมของประเภทเสียงที่แตกต่างกันเป็นความกังวลเกี่ยวกับ Constitutional AI ไม่เพียงแค่ UX
Whisper ในเครื่องเป็นการตรวจสอบข้ามพยาธิของ QA
ขั้นตอน QA ที่มีประโยชน์ที่สุดที่คุณสามารถเพิ่มไปยังไปป์ไลน์ตัวแทนเสียงคือการส่งผ่าน Whisper ในเครื่องที่ทำงานอย่างอิสระจากการถ่ายเทียมที่เซิร์ฟเวอร์ MCP ของคุณใช้ นี่คือเหตุผล: หากเซิร์ฟเวอร์ MCP ของคุณใช้ API การถ่ายเทียมแบบคลาวด์ และ Whisper-local ผลิตการถ่ายเทียมที่แตกต่างกันอย่างมีนัยสำคัญสำหรับเสียงเดียวกัน คุณพบความคลุมเครือในเสียงของคุณที่อาจเรียกใช้การเลือกเครื่องมือที่ไม่สอดคล้องกัน
การตั้งค่าที่ใช้งานได้จริงบน Windows:
import whisper, numpy as np, soundfile as sf
model = whisper.load_model("small") # ~460 MB พอดีได้ง่ายใน RAM 8 GB
def qa_check(wav_path: str, expected: str, threshold: float = 0.05) -> bool:
result = model.transcribe(wav_path)
transcript = result["text"].strip().lower()
expected_norm = expected.strip().lower()
distance = edit_distance(transcript, expected_norm)
ratio = distance / max(len(expected_norm), 1)
return ratio < threshold
เรียกใช้นี้หลังจากแต่ละส่วนที่สังเคราะห์ออกจากเครื่องมือเสียงของคุณและก่อนที่เสียงจะไปถึงไมโครโฟนเสมือน WASAPI ส่วนใดที่มีอัตราส่วนสูงกว่าเกณฑ์จึงได้รับการทำเครื่องหมายเพื่อการตรวจสอบด้วยตนเอง ในทางปฏิบัติ คุณจะพบความล้มเหลวที่รวมกลุ่มรอบชื่อเฉพาะ ตัวย่อ และการพูดอย่างรวดเร็ว — ส่วนเดียวกันที่ยังส่งให้ผลโลกการเลือกเครื่องมือ MCP ส่วนใหญ่
การทดสอบความสอดคล้องของตัวละคร: วิธีการที่มีการจัดระเบียบ
เมื่อไปป์ไลน์ของคุณเชื่อมต่ออย่างแน่นหนา การทดสอบความสอดคล้องของตัวละครให้ตามเมทริกซ์ที่ตรงไปตรงมา:
| ตัวละคร | ชุดการพูด | เรียกใช้เครื่องมือที่คาดไว้ | เรียกใช้เครื่องมือจริง | ตรงกัน? |
|---|---|---|---|---|
| หญิงสาวชัดเจน | 20 prompt ทดสอบ | get_weather | get_weather | ✓ |
| ชายแก่ accented | 20 prompt ทดสอบ | get_weather | get_weather | ✓ |
| ผู้พูดที่ไม่ใช่เจ้าของภาษา | 20 prompt ทดสอบ | get_weather | search_general | ✗ |
ความไม่ตรงกันในแถวสุดท้ายคือข้อบกพร่องของคุณ พวกเขาบอกคุณว่าชั้นการถ่ายเทียมกำลังผลิตลำดับคำที่แตกต่างกันสำหรับเจตนาเชิงความหมายเดียวกัน และพวกเขาทำเช่นนั้นโดยไม่ต้องสรรหาผู้พูดที่ไม่ใช่เจ้าของภาษาสำหรับแต่ละการทำงานของการทดสอบ
วิธีการเมทริกซ์นี้เรียงกันกับ การวิจัยการจัดตำแหน่ง AI ของ Anthropic — การปฏิบัติอย่างยุติธรรมในประเภทเสียงต่าง ๆ ไม่ใช่เพียงแค่ตัวชี้วัดคุณภาพ มันเป็นข้อกำหนดความยุติธรรมสำหรับตัวแทนเสียงใด ๆ ที่ปรับใช้
ประมาณการหน่วงเวลาสำหรับการโต้ตอบเสียง MCP แบบเรียลไทม์
ความเข้าใจว่าเวลาไปอยู่ที่ไหนในการเดินทางแบบฟูลทริป ของเสียง MCP ช่วยให้คุณจัดสรรงบประมาณ 800 md ของคุณ:
| ขั้นตอน | ระยะเวลาปกติ | บันทึก |
|---|---|---|
| ถ่ายภาพเสียง + บัฟเฟอร์ WASAPI | 20-40 md | ตรึง ตามขนาดบัฟเฟอร์ OS |
| การแปลงเสียง | 80-250 md | ท้องถิ่น สามารถคาดการณ์ |
| การถ่ายเทียม (คลาวด์) | 150-400 md | ขึ้นอยู่กับเครือข่าย |
| การกระจายเครื่องมือ MCP | 50-200 md | ขึ้นอยู่กับการโหลดเซิร์ฟเวอร์ |
| การอนุมาน แบบจำลอง (Claude) | 200-600 md | สตรีมมิ่ง — โทเค็นแรกเร็วกว่า |
| การสังเคราะห์ TTS | 100-300 md | ท้องถิ่นหรือคลาวด์ |
| รวม | 600 md - 1.8 d | งบประมาณ: ต่ำกว่า 800 md |
ขั้นตอนการแปลงเสียงต้องอยู่ต่ำกว่า 300 md เพื่อปกป้องงบประมาณสำหรับขั้นตอนที่ไม่ใช่ท้องถิ่น นี่คือที่ที่การประมวลผลท้องถิ่นชนะ: เครื่องมือเปลี่ยนเสียงตามคลาวด์จะเพิ่มความหน่วงเวลาของเครือข่าย 200-400 md ให้กับการพูดทุกครั้ง ใช้เวลาครึ่งหนึ่งของงบประมาณที่รับรู้ได้ของผู้ใช้ก่อนที่แม้แต่โมเดลจะเห็นการถ่ายเทียม
ไปป์ไลน์ WASAPI ท้องถิ่น VoxBooster ยังคงการแปลงในช่วง 80-250 md บนฮาร์ดแวร์ Windows 10/11 มาตรฐาน ออกจากงบประมาณ 800 md สามารถบรรลุได้ด้วยเซิร์ฟเวอร์ MCP ที่รวดเร็วและระดับความหน่วงเวลาต่ำสำหรับจุดสิ้นสุดการอนุมาน
รายการตรวจสอบการตั้งค่าที่ใช้งานได้จริง
ก่อนที่คุณจะเรียกใช้เซสชันการทดสอบตัวแทนเสียงแรกของคุณ:
- ติดตั้ง VoxBooster (หรือเครื่องมือเสียง WASAPI ที่เทียบเท่า) บน Windows 10/11 — ไม่มีการติดตั้งไดรเวอร์เคอร์เนล
- ยืนยันว่าอุปกรณ์ WASAPI เสมือนปรากฏในการตั้งค่าเสียง Windows ภายใต้การบันทึก
- เลือกอุปกรณ์เสมือนเป็นอินพุตไมโครโฟน Claude Desktop
- ดาวน์โหลดและทดสอบ
whisper smallในเครื่อง — ยืนยันการถ่ายเทียมบน WAV ตัวอย่าง - กำหนดอย่างน้อยสามตัวละครเสียงที่มีชื่อบนประชากรผู้ใช้ของคุณ
- เขียนห้าการพูดพื้นฐานต่อตัวละครที่อาร์กผลต่อการเรียกใช้เครื่องมือ MCP ที่แตกต่างกัน
- เรียกใช้เมทริกซ์และแก้ไขความไม่ตรงกันก่อนเขียนการทดสอบการรวม
ข้อผิดพลาดทั่วไปและวิธีหลีกเลี่ยง
อุปกรณ์ WASAPI หายไปหลังจากการรีบูต. บางเครื่องมือเสียงลงทะเบียนอุปกรณ์เสมือนบนเริ่มต้นแต่ไม่เก็บไว้ กำหนดเป็นอุปกรณ์ถ่ายภาพเริ่มต้นในการตั้งค่าเสียง Windows หลังจากการเปิดตัวซอฟต์แวร์แต่ละครั้ง หรือเพิ่มการเปิดตัวไปยังลำดับการเริ่มต้น Windows ของคุณ
Whisper small vs base ความเห็นไม่ตรงกัน. หากการควบคุมคุณภาพ Whisper ของคุณ (ขนาดเล็ก) และการถ่ายเทียมเซิร์ฟเวอร์ MCP ของคุณสร้างผลลัพธ์ที่แตกต่างกันอย่างสม่ำเสมอ ปัญหาคือขนาดโมเดล ไม่ใช่คุณภาพเสียง ใช้ขนาด checkpoint Whisper เดียวกับที่เซิร์ฟเวอร์ผลิตของคุณใช้สำหรับการเปรียบเทียบ apple-to-apple
Persona drift ในระหว่างเซสชันยาว. การแปลงเสียง AI สามารถไปได้เล็กน้อยเมื่อแบบจำลองเสียงอุ่นขึ้นในระหว่างเซสชันยาว ปล่อยเครื่องมือเสียงให้เริ่มต้นใหม่ระหว่างชุดการทดสอบหลักเพื่อได้รับเบสลाইน์สะอาดสำหรับแต่ละตัวละคร
ความไม่ตรงกันเวอร์ชันเครื่องมือ MCP. เซิร์ฟเวอร์ MCP เปิดเผยสกีมาเครื่องมือที่สามารถเปลี่ยนแปลงไประหว่างเวอร์ชัน เสมอ ตรึงเวอร์ชันเซิร์ฟเวอร์ MCP ของคุณในอักษรสัตบรรพนาชุบของแพคเกจของสภาพแวดล้อมการทดสอบของคุณ — การเปลี่ยนแปลง schema ที่ตั้งชื่อพารามิเตอร์เครื่องมือใหม่จะเงียบ ๆ หักชุด fixture ของคุณ
เหตุใดการประมวลผลท้องถิ่นจึงมีความสำคัญสำหรับไปป์ไลน์ Dev
เครื่องมือเสียงบนคลาวด์ สะดวกสำหรับผู้ใช้ปลายทาง แต่ไปป์ไลน์การทดสอบนักพัฒนามีข้อกำหนดที่แตกต่างกัน: ผลลัพธ์ที่กำหนด ไม่มีค่าใช้จ่าย API ต่อการทดสอบการทำงาน ไม่มี rate limiting และความสามารถในการทำงานแบบออฟไลน์สำหรับสภาพแวดล้อมที่ไม่มีอากาศหรือ เพิ่มเติม
เครื่องมือการแปลงเสียงท้องถิ่นที่มีผลลัพธ์ WASAPI และไม่มีไดรเวอร์เคอร์เนลเป็นสถาปัตยกรรมที่ถูกต้องสำหรับกรณีการใช้งานนี้ มันวิ่งบนฮาร์ดแวร์ธุรกิจ Windows 10/11 มาตรฐาน ติดตั้งโดยไม่มีสิทธิ์การเพิ่มและไม่เพิ่มการพึ่งพาภายนอกไปยัง CI runner ของคุณ
VoxBooster พอดีกับรูปแบบนี้: การประมวลผลท้องถิ่น WASAPI-native ไม่มีไดรเวอร์เคอร์เนล เข้ากันได้กับ Windows 10 และ 11 พร้อมใช้งานจาก €5,99 สำหรับการใช้งาน dev ของแต่ละบุคคล
ขั้นตอนถัดไป
หากคุณกำลังสร้างตัวแทนเสียง MCP และต้องการไปลึกยิ่งขึ้นในด้านโครงสร้างพื้นฐาน:
- ข้อกำหนด MCP ที่ modelcontextprotocol.io ครอบคลุมรูปแบบสกีมาเครื่องมือที่สมบูรณ์และ lifecycle hooks
- เอกสารของ Anthropic เกี่ยวกับ การรวมเข้า MCP Claude Desktop กำหนดการตั้งค่า host/client/server end-to-end
- สำหรับไปป์ไลน์เสียงโดยเฉพาะ คู่มือเอฟเฟกต์เสียง VoxBooster ครอบคลุมการกำหนดเส้นทาง WASAPI ลึกขึ้น
- โพสต์ ตัวเปลี่ยนเสียง AI สำหรับนักพัฒนา ครอบคลุมกรณีการใช้งาน นอกเหนือการทดสอบ
การผสมผสานของชั้นการฉีดเสียง ที่สามารถสร้างซ้ำได้ QA Whisper ท้องถิ่น และเมทริกซ์ตัวละครที่มีการจัดระเบียบให้คุณ ขั้นตอนการทำงานการทดสอบตัวแทนเสียงที่มีขนาดกับ codebase ของคุณไม่ใช่กับงบประมาณสตูดิโอบันทึกเสียงของคุณ