Deep Voice Changer: ทําให้เสียงของคุณลึกกว่าและใหญ่ขึ้น

Voice changer ลึกทำได้มากกว่าการลากแถบเลื่อนลง - ทำได้ถูกต้อง มันจะเปลี่ยนทั้งระดับเสียงและลักษณะสั่นพ้องของเสียงของคุณ ดังนั้นผลลัพธ์จึงฟังเหมือนคนที่ใหญ่ขึ้นและมีอำนาจมากขึ้น ไม่ใช่เทปเล่นที่ความเร็วผิด ไม่ว่าคุณจะต้องการสร้างบุคลิกการสตรีมมิ่ง เพิ่มน้ำหนักให้กับการบรรยาย คงอยู่โดยไม่เปิดเผยตัวตนในแชทเสียง หรือเพียงแค่ทดลองกับเสียงของคุณ คู่มือนี้จะแนะนำกลไกการทำงาน DSP จริง การตั้งค่าที่สำคัญ และการตั้งค่าแบบสมบูรณ์ทีละขั้นตอนโดยใช้ VoxBooster

TL;DR

Pitch shift เพียงอย่างเดียว (ไม่มีการปรับเปลี่ยน formant) ฟังเพื่อและเหมือนหุ่นยนต์ - คุณต้องใช้ทั้งสอง
ทำให้ลึกตามธรรมชาติที่ดีที่สุด: -3 ถึง -4 semitones pitch, -15 ถึง -25% formant
สำหรับเสียงลึกสุดขั้วและเป็นแบบ: -5 ถึง -7 semitones + formant shift + low shelf EQ
VoxBooster กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน WASAPI - ทำงานบน Discord, OBS และทุกเกม
Latency ต่ำกว่า 10ms หมายความว่าเสียงของคุณจะอยู่ในการซิงค์ระหว่างการโทรสดและการสตรีมมิ่ง
ลองใช้งานฟรี 3 วัน ไม่ต้องใช้บัตรเครดิต

Deep Voice Changer ทำอะไรจริง ๆ?

ก่อนที่จะแตะปุ่มเลื่อน ก็ควรเข้าใจว่าซอฟต์แวร์จำเป็นต้องจัดการกับพารามิเตอร์ใด - เพราะสองพารามิเตอร์ที่สำคัญ (pitch และ formant) มักจะทำให้เกิดความสับสน และความสับสนนั้นนำไปสู่เสียงที่ขุ่นและเทียมซึ่งทำให้ voice changers มีชื่อเสียงไม่ดี

Pitch: ความถี่พื้นฐาน

เสียงที่มีเสียงทุกเสียงที่คุณออกมามี ความถี่พื้นฐาน - อัตราที่เสียงของคุณสั่น สำหรับเสียงพูดของชายผู้ใหญ่ปกติ มันจะอยู่ที่ประมาณ 85 ถึง 180 Hz สำหรับเสียงผู้หญิงผู้ใหญ่ปกติ มันจะอยู่ระหว่าง 165 ถึง 255 Hz เมื่อ voice changer ลึกเปลี่ยน pitch ลงมา มันจะลดความถี่พื้นฐานนี้ - ย้ายโน้ตดนตรีที่เสียงของคุณอยู่ลงบนตราด

การเปลี่ยน semitone หนึ่ง ตรงกับการคูณความถี่ด้วยประมาณ 0.944 ดังนั้นหากคุณพูดที่ 150 Hz และเปลี่ยนลง 4 semitones เสียงที่ประมวลผลจะลงจอดประมาณ 119 Hz - ลึกเข้าไปในอาณาเขตของเสียงการออกอากาศชายที่ลึก

Formants: ลักษณะช่องเสียง

Formants คือยอดสั่นพ้องที่สร้างขึ้นโดยรูปร่างและความยาวของช่องเสียงของคุณ - ปาก คออยห์ และเอกซ์นั่น พวกเขานั่งอยู่เหนือความถี่พื้นฐานและกำหนดเสียงสระที่คุณสร้างขึ้น รวมทั้ง ‘สี’ โดยรวมและขนาดที่รู้สึกของเสียงของคุณ ช่องเสียงที่ยาวกว่า (ตามที่พบในคนที่สูงกว่า) สร้าง formants ที่ต่ำกว่า และนั่นคือเหตุผลที่เสียงที่ลึกกว่ามักฟังเหมือนใหญ่ขึ้นจากกายภาพ

เมื่อคุณเปลี่ยน pitch ลงโดยไม่สัมผัส formants ระดับพื้นฐานลดลง แต่สิ่งสั่นพ้องของช่องเสียงก็คงอยู่ ไมของคุณได้ยินความไม่ตรงกันนี้ว่าไม่เป็นธรรมชาติ - pitch พูด ‘คน deep’ แต่ resonance พูด ‘คนเล็ก’ ผลลัพธ์ฟังเหมือน chipmunk กำลังวิ่งย้อนหลัง: เพื่อ, plasticky และไม่น่าเชื่อถือ

เลื่อน formants ลงพร้อมกับ pitch และสองเบาะแสจะจัดแนว เสียงของคุณฟังเหมือนว่ามันมาจากร่างกายที่ใหญ่ขึ้นจริง ๆ

ทำไม Pitch-Only ถึงฟังผิด (และ Formant Linking ซ่อมได้อย่างไร)

นี่คือความผิดพลาดที่เกือบทุกมือใหม่ทำ พวกเขาพบ preset เสียงลึก ปั่น pitch slider ถึง -6 หรือ -8 semitones และสงสัยว่าทำไมมันฟังเหมือนวิทยุเสีย มากกว่า movie villain

ปัญหาไม่ใช่จำนวน pitch - มันคือความไม่ตรงกัน formant การวิจัยเสียงเกี่ยวกับการรับรู้เสียงแสดงให้เห็นว่าผู้ฟังประเมินปลายทั้งสองพร้อมกัน เมื่อทั้งสองแตกต่างกัน เสียงจะอ่านเป็นประมวลผลแม้ว่าผู้ฟังไม่สามารถตั้งชื่อเหตุผล

Formant linking (บางครั้งเรียกว่า ‘formant tracking’ หรือ ‘vocal tract scaling’) แก้ไขสิ่งนี้โดยการเลื่อน formants ในสัดส่วนกับการเปลี่ยนแปลง pitch คุณภาพซอฟต์แวร์ voice changer มากมายนำเสนอสิ่งนี้เป็นลิงก์อัตโนมัติหรือเลื่อน formant แยกต่างหาก VoxBooster ให้คุณควบคุมอิสระของทั้งสอง ซึ่งเป็นวิธีการที่ถูกต้อง - ทำให้ลึกตามธรรมชาติต้องการการเลื่อน formant ที่เล็กกว่าเล็กน้อยกว่าการเปลี่ยน pitch และบางกรณีการใช้งาน (เช่นเสียง monster) ต้องการการลด formant ที่เกินจริงนอกเหนือจากสิ่ง pitch เรียก

จุดเริ่มต้นที่ใช้ได้จริง: สำหรับการเปลี่ยน pitch -1 semitone ลดฟอร์แมนต์ประมาณ 3 ถึง 5 เปอร์เซ็นต์ อัตราส่วนนั้นลอกเลียนแบบความสัมพันธ์เสียงเพลงระหว่างความยาวของเสียงและความยาวของช่องเสียงในการเปลี่ยนเสียงตามธรรมชาติ

การตั้งค่าที่เหมาะสมสำหรับเสียงลึกตามธรรมชาติ

ทำให้ลึกตามธรรมชาติ - สิ่งที่ฟังเหมือนคนจริงแตกต่างกันแทนการ์ตูน - ต้องมีการทดำเนิน การตั้งค่าด้านล่างเป็นจุดเริ่มต้น ปรับเปลี่ยนตามเสียงต้นฉบับของคุณ

การตั้งค่าอนุรักษ์นิยม: อำนาจเล็ก ๆ

นี่คืออุดมคติสำหรับการนำเสนอ บรรยาย และสถานการณ์ที่คุณต้องการน้ำหนักโดยไม่ดึงดูดความสนใจไปที่การประมวลผล

Pitch: -2 ถึง -3 semitones
Formant: -10 ถึง -18%
Low shelf EQ: +2 ถึง +3 dB ที่ 100 Hz, Q เท่ากับ 0.7
Reverb: ไม่มีหรือห้องสั้น ๆ (pre-delay 10ms, decay 0.3s)

ที่การตั้งค่าเหล่านี้ ผู้ฟังส่วนใหญ่จะไม่ระบุเสียงว่าเป็นประมวลผล - พวกเขาจะเพียงรับรู้เสียงที่ลึกกว่าปกติ

การตั้งค่าตรงกลาง: Gaming Persona / Streaming Character

นี่คือช่วงที่ใช้โดย streamers ส่วนใหญ่ที่สร้าง persona on-screen ที่แตกต่าง เสียงฟังแตกต่างกันอย่างชัดเจนจากธรรมชาติ แต่ยังคงเป็นมนุษย์

Pitch: -4 ถึง -5 semitones
Formant: -20 ถึง -28%
Low shelf EQ: +3 ถึง +4 dB ที่ 80 Hz
Mild chorus: ความลึก 10%, อัตรา 0.5 Hz (เพิ่มความกว้างเล็กน้อยและขนาดที่รู้สึก)

คุณจะสังเกตเห็นว่าเสียงฟังใหญ่ขึ้นมากและน่าประทับใจกว่าโดยไม่สูญเสียความชัดเจนของพยัญชนะ Plosives (b, p, d, t) ยังคงชัดเจน ซึ่งมีความสำคัญสำหรับการโทร gaming

การตั้งค่าสุดขั้ว: Monster, Villain, Narrator

นี่คือเนื้อหาแบบจัดแต่งทรงผม - creepypasta narration ตัวละครเจ้าชู่ gimmick VTuber เนื้อหาสยองขวัญ

Pitch: -6 ถึง -8 semitones
Formant: -30 ถึง -40%
Low shelf EQ: +4 ถึง +5 dB ที่ 70 Hz โดยมีการตัด high shelf ด้านบน 8 kHz เพื่อลดความหยาบ
Short reverb: decay 0.6 ถึง 0.8 วินาที ในการตั้งค่าห้องขนาดใหญ่

ที่ค่าเหล่านี้ ความชัดเจนจะเริ่มลดลง - โดยเฉพาะอย่างยิ่งสำหรับ sibilants (s, z, sh) ชะลอวิธีพูดของคุณลงนิดหน่อยและออกเสียงชัดเจนมากขึ้นเมื่อใช้การตั้งค่าสุดขั้ว

ตารางเปรียบเทียบการตั้งค่า

กรณีการใช้งาน	Pitch Shift	Formant Shift	Low Shelf EQ	Reverb
Narration ละเอียด / อำนาจ	-2 ถึง -3 st	-10 ถึง -18%	+2 dB @ 100 Hz	ไม่มี
Streaming persona	-4 ถึง -5 st	-20 ถึง -28%	+3 dB @ 80 Hz	ห้องสั้น
ตัวละครเกม	-3 ถึง -4 st	-18 ถึง -24%	+2 dB @ 90 Hz	ไม่มี
เสียง villain / monster	-6 ถึง -8 st	-30 ถึง -40%	+4 dB @ 70 Hz	ห้องขนาดใหญ่
แชทเสียงไม่เปิดเผยตัวตน	-3 ถึง -5 st	-15 ถึง -25%	+2 dB @ 100 Hz	ไม่มี

st = semitones ค่า EQ ทั้งหมดเป็นเสียงบูสต์ใน dB ปรับตามรสชาติตามการตอบสนองความถี่ต่ำของไมโครโฟนของคุณ

ทีละขั้นตอน: การตั้งค่าเสียงลึกใน VoxBooster

นี่คือการตั้งค่าที่สมบูรณ์จากการติดตั้งไปจนถึงการใช้งานสด ใน Discord หรือซอฟต์แวร์สตรีมมิ่งของคุณ

ขั้นตอนที่ 1 - ติดตั้งและเปิด

ดาวน์โหลด VoxBooster จาก /download และเรียกใช้โปรแกรมติดตั้ง VoxBooster ลงทะเบียนไมโครโฟนเสมือน WASAPI ที่เรียกว่า ‘VoxBooster Virtual Mic’ ระหว่างการติดตั้ง ไม่มีการติดตั้งไดรเวอร์เคอร์เนล และไม่จำเป็นต้องเริ่มระบบใหม่

ขั้นตอนที่ 2 - ตั้งค่าไมโครโฟนอินพุตของคุณ

เปิด VoxBooster ไปที่ Settings → Audio Devices และเลือกไมโครโฟนกายภาพของคุณเป็นแหล่งอินพุต หากคุณใช้อินเตอร์เฟสเสียง ให้เลือกอินพุท WASAPI ของอินเตอร์เฟสแทนตัวแปร MME หรือ DirectSound - WASAPI ให้เส้นทาง latency ต่ำสุดผ่านลูกโซ่สัญญาณ

ขั้นตอนที่ 3 - เปิดแผง Voice Effects

คลิกแท็บ Voice Effects คุณจะเห็นแถบเลื่อน pitch, แถบเลื่อน formant และช่องลูกโซ่เอฟเฟกต์ไม่บังคับด้านล่าง สำหรับเสียงลึก คุณทำงานหลักกับ pitch และ formant - ปล่อยให้ส่วนที่เหลือปิดเพื่อเริ่มต้น

ขั้นตอนที่ 4 - ใช้ Pitch และ Formant

ตั้งแถบเลื่อน pitch ไปที่ค่า semitone เป้าหมายของคุณ เริ่มด้วย -3 และพูดตามธรรมชาติ - ฟังกลับผ่านหูฟังของคุณ (เปิดใช้งานการตรวจสอบที่ Settings → Monitor Input) ปรับจนกว่าเสียงจะอยู่ที่ตำแหน่งที่คุณต้องการ

จากนั้นลดแถบเลื่อน formant ลง เริ่มที่ -15% และเพิ่มการลดลงแบบค่อยเป็นค่อยไปขณะพูด ณ จุดหนึ่ง เสียงจะเริ่มฟังเต็มไปด้วยและเป็นธรรมชาติมากขึ้น เลยเกณฑ์หนึ่ง มันจะเริ่มฟังไม่เป็นมนุษย์ ค้นหาจุดหวาน สำหรับเสียงและกรณีการใช้งานของคุณ

ขั้นตอนที่ 5 - เพิ่ม EQ (ไม่บังคับ แต่แนะนำ)

คลิกปุ่ม + ในลูกโซ่เอฟเฟกต์และเพิ่มโมดูล EQ ใช้เสียงบูสต์ low shelf ที่ +2 ถึง +3 dB รอบ 80 ถึง 100 Hz นี่เพิ่มน้ำหนักที่รู้สึกและเสียงที่อกของ resonance หากไมโครโฟนของคุณมีเบส - heavy เรียบร้อยแล้ว ให้ข้ามนี้หรือใช้เสียงบูสต์ที่เล็กกว่า

อย่าเพิ่มด้านล่าง 60 Hz - พิสัยนั้นส่วนใหญ่เป็นเสียงนอฟนของห้อง และจะทำให้เสียงฟังขุ่นมากกว่าลึก

ขั้นตอนที่ 6 - ส่งไปยังแอปของคุณ

ใน Discord: ไปที่ User Settings → Voice & Video → Input Device และเลือก ‘VoxBooster Virtual Mic’ ใน OBS: เพิ่มแหล่ง Audio Input Capture และตั้งเป็น ‘VoxBooster Virtual Mic’ สำหรับเกม ให้ไปที่การตั้งค่าเสียงในเกมและเลือก VoxBooster Virtual Mic เป็นอินพุตไมโครโฟนของคุณ

นั่นคือการตั้งค่าแบบสมบูรณ์ VoxBooster ประมวลผลเสียงด้วย latency ที่เพิ่มเติมต่ำกว่า 10ms ดังนั้นเสียงและวิดีโอจึงยังคงซิงค์แม้บนเหล้า

มันทำงานแบบเรียลไทม์หรือมี Latency ที่เห็นได้ชัด?

การประมวลผลแบบเรียลไทม์เป็นข้อกำหนดที่จำเป็นสำหรับ voice changers ที่ใช้ในการสื่อสารสด Latency ใด ๆ ที่สูงกว่าประมาณ 30ms เริ่มรู้สึกเหมือนเสียงสะท้อน เกิน 50ms จึงกลายเป็นที่เห็นจริง

VoxBooster ครอบแครง latency ที่เพิ่มเติมต่ำกว่า 10ms สำหรับการประมวลผล pitch และ formant Latency รอบท้องจริงของคุณขึ้นอยู่กับฮาร์ดแวร์เสียงและขนาดบัฟเฟอร์ - ขนาดบัฟเฟอร์ที่เล็กกว่าจะลด latency ด้วยค่าใช้จ่ายของโหลด CPU ที่สูงกว่า บนเครื่อง Windows 10 mid-range ที่มีอินเตอร์เฟสเสียงมาตรฐานที่ตั้งเป็นบัฟเฟอร์ 128-sample การประมวลผลเสียงลึกแบบเรียลไทม์ทั่วไปจะทำงานประมาณ 15 ถึง 25ms รอบท้องทั้งหมด ต่ำกว่าเกณฑ์การบานออกของการรับรู้อย่างมาก

เพื่อการเปรียบเทียบ โหมดเรียลไทม์ของ Voicemod มักนั่งที่ 30 ถึง 50ms ขึ้นอยู่กับความซับซ้อนของเอฟเฟกต์ และ MorphVOX Pro สามารถ push สูงกว่านั้นใน presets ที่หนักกว่า เส้นทาง WASAPI-native ของ VoxBooster รักษาการประมวลผลให้แน่น

กรณีการใช้งานสำหรับ Deep Voice Changer

Gaming Personas

ผู้เล่นจำนวนมากสร้าง audio identities ที่แตกต่างกันสำหรับเกม roleplay หรือการแข่งขัน เสียงที่ลึกกว่าจะอ่านเป็นคำสั่งมากขึ้นในการสื่อสารของทีม - การวิจัยในด้านจิตวิทยาสังคมพบอย่างสม่ำเสมอว่าเสียงที่มีระดับต่ำกว่าถูกมองว่ามีอำนาจและครอบงำมากขึ้นในบริบทการสื่อสารกลุ่ม เสียง gaming persona ที่นั่งที่ -3 ถึง -4 semitone ต่ำกว่าเสียงตามธรรมชาติของคุณด้วยการชดเชย formant ให้คุณมีความได้เปรียบนั้น โดยไม่ฟังเทียมสังเคราะห์

ดูเพิ่มเติมที่: วิธีใช้ voice changer บน Discord และคำแนะนำทั่วไปเกี่ยวกับ voice changers latency ต่ำ สำหรับบริบทการตั้งค่าเพิ่มเติม

Streaming และ VTubing

ตัวละคร streaming ได้รับประโยชน์จากความสม่ำเสมอของเสียง: ผู้ชมของคุณสร้างการเชื่อมโยงระหว่างตัวละครของคุณและเสียงของคุณ เสียงที่ประมวลผลแล้วล็อกตัวตนนั้นแม้ว่าคุณจะสตรีมมิ่งในหลายวันและเสียงตามธรรมชาติของคุณแตกต่างจากความเหน็ดเหนื่อยหรือปวดศีรษะ นอกจากนี้ยังเพิ่มชั้นการแยกระหว่างเสียงส่วนตัวของคุณและ persona streaming ของคุณ ซึ่งผู้สร้างจำนวนมากต้องการ

Voice-Over และการบรรยาย

สำหรับการบรรยายสไตล์เอกสาร วิดีโอคำอธิบาย หรืองานหนังสือเสียง การเปลี่ยน pitch -2 ถึง -3 semitone ที่มีการควบคุมด้วยการชดเชย formant สามารถปรับให้เรียบเสียงที่บางหรือจมูกในธรรมชาติโดยไม่ทำให้ผลลัพธ์ฟังเป็นการประมวลผล คุณหลัก ให้เก็บการเปลี่ยนแปลงไว้เล็กพอที่ผู้ฟังจะสนใจเนื้อหา ไม่ใช่เสียง

ความเป็นส่วนตัวในการสื่อสารออนไลน์

เสียงคือชีวมิเตอร์ - ติดกันอยู่เลย ระดับและรูปแบบการพูดที่สม่ำเสมอสามารถระบุตัวคุณได้ทั่วแพลตฟอร์มแม้ไม่มีข้อมูลการรับรองตัวตนอื่น ๆ การเปลี่ยนระดับเสียงและ formant โดยจำนวนที่ปานกลาง (แม้แต่ -2 semitone และ -12% formant) จะสร้างระยะห่างเสียงเพียงพอเพื่อขัดขวางการจดจำเสียงสุ่มอย่างมีนัยสำคัญขณะยังคงรักษาความชัดเจนของธรรมชาติ

นี่คือกรณีการใช้งานความเป็นส่วนตัวที่ถูกต้องตามกฎหมาย โดยเฉพาะอย่างยิ่งที่เกี่ยวข้องกับนักข่าว นักเคลื่อนไหว นักวิจัย และใครก็ตามที่เข้าร่วมชุมชนที่พวกเขาไม่ต้องการเชื่อมโยงกับตัวตนออฟไลน์ของพวกเขา

โครงการสร้างสรรค์และงานตัวละคร

เนื้อหาสยองขวัญ podcast ฟิกชัน tabletop RPG actual plays เสียง game master - ทั้งหมดนี้ได้รับประโยชน์จากความสามารถในการสร้างเสียงตัวละครที่ลึกและแตกต่างกันตามความต้องการ แทนที่จะรักษาเสียงวิวเล้ว voice deepener ช่วยให้คุณประหยัดตัวละครนานหลายชั่วโมง โดยไม่มีความเหน็ดเหนื่อยเสียง

AI Voice Cloning vs. DSP Deepening: อะไรคือความแตกต่าง?

VoxBooster นำเสนอเอฟเฟกต์เสียง DSP ดั้งเดิม (pitch shift, formant shift, ลูกโซ่ EQ) และการโคลนเสียง AI แนวทางพื้นฐานที่แตกต่างกันเพื่อการแปลงเสียง

DSP deepening จัดการเสียงของคุณเองแบบเรียลไทม์โดยใช้อัลกอริธึมการประมวลผลสัญญาณ เอาต์พุตยังคงฟังเหมือนคุณ เพียงแค่เปลี่ยนแปลง Latency ต่ำมาก (ต่ำกว่า 10ms) และการประมวลผลเป็นแบบ deterministic - อินพุตเดียวกันจะสร้างเอาต์พุตเดียวกันเสมอ

AI voice cloning ใช้การแปลงเสียง neural เพื่อแมปเสียงของคุณไปยังโมเดลเสียงที่ได้รับการฝึกอบรม เอาต์พุตฟังเหมือนคนที่แตกต่างกันจริง ๆ ไม่ใช่เวอร์ชันเลื่อนของคุณ Latency สูงกว่า (โดยปกติ 80 ถึง 200ms ขึ้นอยู่กับฮาร์ดแวร์และโมเดล) และคุณภาพขึ้นอยู่กับข้อมูลการฝึกอบรมของโมเดล

สำหรับเอฟเฟกต์เสียงลึกระหว่างการเล่นเกมสดหรือการโทร Discord DSP เกือบจะเป็นตัวเลือกที่ดีกว่า - ความแตกต่าง latency มีนัยสำคัญเพียงพอที่จะมีผลต่อคุณภาพการสื่อสาร AI voice cloning เหมาะสำหรับเนื้อหา pre-recorded streaming ที่ซิงค์เสียง-วิดีโอน้อยสำคัญ หรือกรณีที่คุณต้องการตัวตนที่แตกต่างกันโดยสิ้นเชิง แทนที่จะเป็นเวอร์ชันลึกของตัวเอง

หน้า voice changer features และ voice effects ของ VoxBooster อธิบายโหมดทั้งสองโดยละเอียด

ความผิดพลาดทั่วไปและวิธีแก้ไข

Pitch มากเกินไป formant ไม่เพียงพอ เสียงฟังเพื่อหรือยาง ซ่อม: ลด formant จนกว่าการสั่นพ้องจะตรงกับความลึกของ pitch

Low shelf EQ boost หนักเกินไป เสียงฟังเพื่อเพื่อและสูญเสีย definition ต่ำกว่า 200 Hz ซ่อม: ให้ low shelf boost ต่ำกว่า +4 dB และ high-pass filter ที่ 60 Hz เพื่อตัดเสียงนอฟนของห้อง

Monitoring บน ขณะพูด หากคุณเปิดใช้งานการตรวจสอบอินพุตด้วย latency ที่เห็นได้ สมองของคุณจะพยายามชดเชยสิ่งสะท้อนโดยการเปลี่ยนวิธีที่คุณพูด - เสียงจึงกลายเป็นเครียดและไม่สม่ำเสมอ ซ่อม: ใช้การตรวจสอบ zero-latency หรือปิด ไว้ใจการตั้งค่าของคุณและฟังกลับบนการบันทึก

เลือก preset สุดขั้วโดยไม่ปรับแต่งเสียงของคุณ Presets ได้รับการสอบเทียมบนเสียงตัวอย่าง - มักเป็นจุดกึ่งกลางเอกจน โครงสร้าง formant ตามธรรมชาติของเสียง อัตราการพูด และความถี่พื้นฐานของคุณจะแตกต่างกัน เริ่มจาก preset เสมอ จากนั้นปรับ pitch และ formant ให้ตรงกับเสียงตามธรรมชาติของคุณก่อน ก่อนเพิ่มเอฟเฟกต์อื่น

หมดพื้นที่ CPU การซ้อน 5 หรือ 6 เอฟเฟกต์พร้อมกันสามารถทำให้เกิด dropouts คลิก หรือ artifact ประมวลผลบนฮาร์ดแวร์ที่เก่ากว่า ซ่อม: ใช้โหมด low-latency ของ VoxBooster ลดขนาดบัฟเฟอร์เป็น 256 ตัวอย่าง และปิดซอฟต์แวร์หนักเสียงอื่น ๆ ดูคำแนะนำของเราเกี่ยวกับ การตั้งค่า voice changer low-latency สำหรับขั้นตอนการหาปัญหาที่ละเอียด

Deep เท่าไหร่คือเกินไป?

มีจุดที่การเปลี่ยนแปลง pitch ลงและ formant เริ่มทำงานต่อต้านคุณ ความชัดเจนลดลง: สระกลายเป็นคลุมเครือ พยัญชนะสูญเสีย cues ออก ผู้ฟังต้องทำงานหนักกว่าเพื่อแยกวิเคราะห์สิ่งที่คุณพูด ความเหน็ดเหนื่อยตั้งค่าอย่างรวดเร็วบนด้านผู้ฟัง และบนด้านผู้พูด คุณอาจเริ่มโดยไม่สม่ำเสมอมากขึ้น ซึ่งทำให้เสียงที่ประมวลผลฟังมีการกำหนดเสียง

กฎหลักที่ดี: หากผู้พูดภาษาอังกฤษเจ้าหนาวีดีดีดีดีดีดีดีดี ‘บิต’ จาก ‘เดือย’ ในเสียงที่ประมวลผลที่ดังเสียงสนทนา คุณได้เลยห่างไกลเกินไป ดึงการตั้งค่ากลับมาจนกว่าเสียงจะลึกและน่าประทับใจ แต่ยังคงชัดเจน

เพดาน acoustics สำหรับ deepening สุดขั้วโดยไม่สูญเสียความชัดเจนคือ roughly -7 semitones ด้วย formants scaled สัดส่วนโลก เลยอีกหนึ่ง คุณอยู่ในดินแดนเนื้อหาสยองขวัญ ซึ่งดีหากนั่นคือจุดประสงค์ - เพียง ไม่ใช่สำหรับการสื่อสารประจำวัน

การเปรียบเทียบเครื่องมือเสียงลึก

สำหรับความสมบูรณ์ นี่คือวิธีการตัวเลือกหลักไปตามสัดส่วน:

VoxBooster: เลื่อน pitch และ formant อิสระ routing latency ต่ำ WASAPI ลูกโซ่ EQ และเอฟเฟกต์ AI voice cloning mode พร้อม DSP Windows 10/11 ลองใช้ฟรี 3 วัน DSP latency ต่ำกว่า 10ms

Voicemod: ไลบรารี preset ที่ดี ตรวจสอบ Discord ที่ดี แต่ latency real-time สูงกว่า และเบอร์ฟรีถูก จำกัด อย่างมาก ไม่มีการควบคุม formant อิสระในอิน UI พื้นฐาน

MorphVOX Pro: Windows app ยาว - จักรวาล ควบคุม formant ยุติธรรม latency สูงขึ้นบนเอฟเฟกต์ที่ซับซ้อน UI เก่า ดีสำหรับผู้ใช้ที่ต้องการการประมวลผล offline-only โดยไม่มีการสมัครสมาชิก

Clownfish Voice Changer: ฟรี การติดตั้งระดับระบบ latency ขั้นต่ำ แต่คุณภาพ DSP จำกัด และไม่มี formant shifting ทำงานในทุก apps แต่คุณภาพเสียงสำหรับเอฟเฟกต์เสียงลึกต่ำกว่า visibly

สำหรับการแจกแจงอย่างสมบูรณ์ โปรดดูการเปรียบเทียบ voice changers ที่ดีที่สุดสำหรับ PC ของเรา

คำถามที่พบบ่อย

Deep voice changer คืออะไร?

Deep voice changer เป็นซอฟต์แวร์ที่ลดระดับเสียงและปรับเปลี่ยนสิ่งสั่นพ้องของ formant ของเสียงของคุณแบบเรียลไทม์ ทำให้ดูเต็มไปด้วยและมีอำนาจมากขึ้น โปรแกรมนี้กำหนดเส้นทางเสียงที่ประมวลผลแล้วผ่านไมโครโฟนเสมือน ดังนั้นแอปใด ๆ - Discord, OBS, games - จึงรับมันเป็นอินพุตไมค์ปกติ

ฉันควรเปลี่ยนระดับเสียงลงกี่เซมิโทนเพื่อให้ฟังลึกกว่า?

สำหรับเอฟเฟกต์การทำให้ลึกตามธรรมชาติ ให้เปลี่ยนระดับเสียงระหว่าง -2 ถึง -5 semitones เลยจุด -6 หรือ -7 เสียงจะเริ่มฟังขุ่นหรือตลกขบขัน ต่ำเว้นแต่ formants ก็เปลี่ยนไปด้วย ผลลัพธ์ที่น่าเชื่อถือมากที่สุดสำหรับการใช้งานในแต่ละวันอยู่ในช่วง -3 ถึง -4 semitones โดยมีการลด formant ประมาณ -15 ถึง -25 เปอร์เซ็นต์

ทำไมเสียงลึกของฉันจึงฟังเหมือนมีเสียงหรือเหมือนหุ่นยนต์?

การเปลี่ยนแปลงระดับเสียงลงโดยไม่ปรับเปลี่ยน formant เป็นสาเหตุทั่วไปที่สุด Formants เป็นความถี่ที่สั่นพ้องของช่องเสียงของคุณ - พวกมันกำหนด ‘สี’ ของเสียงของคุณ เมื่อคุณลดระดับเสียงแต่ปล่อยให้ formants ไม่เปลี่ยนแปลง เสียงจะฟังเพื่อและไม่เป็นธรรมชาติ ลดฟอร์แมนต์พร้อมกับระดับเสียงเพื่อแก้ไข

Deep voice changer ทำงานบน Discord หรือไม่?

ใช่. ซอฟต์แวร์เช่น VoxBooster ติดตั้งไมโครโฟนเสมือน WASAPI คุณเลือกไมโครโฟนเสมือนนั้นในการตั้งค่าอินพุต Discord และ Discord จะรับเสียงลึกที่ประมวลผลแล้วโดยตรง ไม่จำเป็นต้องมีเครื่องมือการกำหนดเส้นทางเพิ่มเติม

การใช้ voice deepener จะทำให้ฉันถูกแบนในเกมหรือไม่?

VoxBooster ลงทะเบียนเป็นไมโครโฟนเสมือน Windows มาตรฐานโดยใช้ WASAPI - ไม่มี kernel driver ไม่มี process injection ระบบ anti-cheat ปฏิบัติต่อมันเหมือนกับอุปกรณ์เสียงอื่น ๆ ความเสี่ยงมีประสิทธิผลเป็นศูนย์ แม้ว่าคุณควรตรวจสอบเงื่อนไขของแต่ละเกมหากคุณใช้ AI voice cloning

ฉันสามารถเพิ่มเบสและ reverb ด้านบนการเปลี่ยนระดับเสียงเพื่อให้ได้เอฟเฟกต์ที่ลึกกว่าหรือไม่?

ใช่ และมันใช้งานได้ดี เพิ่ม low shelf EQ ประมาณ 80-150 Hz เพิ่มน้ำหนัก ในขณะที่ short room reverb หรือ mild chorus เพิ่มขนาด อย่างไรก็ตาม ให้เก็บเอฟเฟกต์ไว้เล็กน้อย - การซ้อนตัวกรองมากเกินไปจะลดความชัดเจน ให้ความสำคัญกับการปรับปรุงระดับเสียงและ formant ก่อน จากนั้นเพิ่มเอฟเฟกต์หนึ่งหรือสองอย่างที่เสริม

อะไรคือความแตกต่างระหว่าง pitch shift และ formant shift ในการทำให้เสียงลึก?

Pitch shift ลดความถี่พื้นฐาน - โน้ตดนตรีที่เสียงของคุณอยู่ Formant shift ลดยอดสั่นพ้องของช่องเสียงของคุณ ซึ่งกำหนดขนาดที่รู้สึกและเสียงกึ่งที่อกของคุณ การลดระดับเสียงเพียงอย่างเดียวฟังเหมือนกล: การลด formant พร้อมกับระดับเสียงสร้างเสียงที่ลึกกว่าและใหญ่ขึ้นอย่างน่าเชื่อถือ

บทสรุป

ได้รับเสียงที่ลึกและน่าเชื่อถือจริง ๆ จากตัวลึกเสียงเป็นปัญหาพารามิเตอร์สอง: pitch down บวก formant ลง ระดับเสียงควบคุมที่ที่เสียงของคุณอยู่บนเครื่องชั่งดนตรี formants ควบคุมขนาดและ resonance ของร่างกายที่สร้างเสียง เล็บทั้งสอง เพิ่มเบา low shelf EQ และผลลัพธ์ยืนหยัดต่อการฟังที่เคร่งครัด

VoxBooster จัดการทั้งหมดนี้ผ่านลูกโซ่สัญญาณ WASAPI-native ที่มี latency ที่เพิ่มเติมต่ำกว่า 10ms การควบคุม pitch และ formant อิสระ EQ chainable และชั้นวาง EQ ไมโครโฟนเสมือนที่ทุก Windows app นำมาโดยไม่มีการตั้งค่าเพิ่มเติม ไม่ว่าคุณจะใช้มันสำหรับ persona streaming gaming comms narration หรือเพียงเพื่อดูว่าเสียงของคุณฟังเหมือนไร กับ 40 Hz resonance ที่อกเพิ่มเติม - ฟรีไปลอง

ดาวน์โหลด VoxBooster และเริ่มการลองใช้งานฟรี 3 วันเพื่อทดลองกับการตั้งค่าทุกอย่างที่ครอบคลุมในคำแนะนำนี้โดยไม่ต้องเสีย