ซอฟต์แวร์ระงับเสียง: ลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณ
วิธีการลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณเป็นหนึ่งในคำถามเกี่ยวกับเสียงที่ค้นหามากที่สุดในบรรดาผู้สตรีมมิง คนงานระยะไกล และนักเล่นเกม - และมีเหตุผลที่ดี เสียงกระแทกแป้นพิมพ์ พัดลมตัวเรือน หน่วยปรับอากาศ และเสียงสะท้อนห้องไหลเข้าไปในไมโครโฟนของคุณมากกว่าที่คุณคิดจนกว่าคุณจะได้ยินการบันทึก stream ของคุณเอง คำแนะนำนี้อธิบายว่าซอฟต์แวร์ระงับเสียงทำงานอย่างไร วิธีการใดที่คุ่มค่า ตำแหน่งที่เทคโนโลยีนี้อยู่ในห่วงโซ่เสียงของคุณ ต้นทุนของมันในแง่ของความล่าช้า และวิธีการกำหนดค่าไม่ว่าคุณจะเลือกเส้นทางตัวกรอง OBS ฟรีหรือแอปพลิเคชันแบบเรียลไทม์ที่ทุ่มเท”
สรุป
- ซอฟต์แวร์ระงับเสียงวิเคราะห์สัญญาณไมโครโฟนของคุณในเวลาจริง และลดความสำคัญของทุกสิ่งที่ไม่เหมือนเสียง
- RNNoise (ใช้ใน OBS และเครื่องมือฟรีหลายตัว) เป็นเส้นฐานที่มั่นคง - ประมาณ 10 มิลลิวินาที ความล่าช้า จัดการเสียงคงที่ได้ดี
- Denoiser ที่ใช้ AI/ML ไปไกลกว่านั้น - พวกเขาจัดการเสียงแป้นพิมพ์และเสียงสุ่มเจอ - ด้วยค่าใช้จ่ายความล่าช้า 10-30 มิลลิวินาที อย่างพอสมควร
- การระงับเสียงต้องรันก่อนเอฟเฟกต์เสียงในห่วงโซ่ ไม่ใช่หลังจากนั้น หรือคุณจะแนะนำสิ่งประดิษฐ์ที่ตัวระงับต่อมาจะต่อสู้
- คุณสามารถตั้งค่าได้ฟรีภายใน OBS วันนี้ หรือใช้ซอฟต์แวร์เฉพาะสำหรับปกคลุมทั่วระบบที่ใช้งานใน Discord การโทร และทุกแอปพลิเคชันอื่นพร้อมกัน
- VoxBooster วางการระงับเสียงไว้เป็นอันดับแรกในห่วงโซ่การประมวลผลโดยอัตโนมัติ ดังนั้นมันจึงใช้งานได้อย่างถูกต้องไม่ว่าคุณจะเปลี่ยนเสียงของคุณหรือเพียงแค่ทำความสะอาดไมโครโฟนดิบ
แพลตฟอร์มการสตรีมมิงบีบอัดเสียงอย่างหนัก การบีบอัดนั้นขยายสิ่งประดิษฐ์เสียงที่ฟังค่อนข้างเบาในการบันทึกดิบ แต่กลายเป็นเสียงฟื่อต่อเนื่องบนวิดีโอ VOD ของ Twitch การควบคุมอัตราขยายอัตโนมัติของ Discord ทำเช่นเดียวกัน - มันเพิ่มสัญญาณเงียบ ซึ่งหมายความว่าเสียงพัดลมของคุณได้รับการเพิ่มขึ้นพอลี่ข้างเสียงของคุณ การรับการระงับเสียงที่เหมาะสมจะแก้ไขปัญหาทั้งสองในครั้งเดียว
ซอฟต์แวร์ระงับเสียงทำอะไรจริง ๆ
การระงับเสียงไม่ได้เพียงแค่ใช้การตัด EQ หรือเกต เกตเงียบเสียงใต้เกณฑ์ - มีประโยชน์สำหรับการเงียบที่สมบูรณ์ระหว่างประโยค แต่ไม่มีประโยชน์สำหรับเสียงที่ทับซ้อนกับเสียงของคุณในความถี่ การตัด EQ ช่วงความถี่คงที่ ซึ่งจะตัดฮาร์มอนิกเสียงด้วย
ซอฟต์แวร์ระงับเสียงสมัยใหม่ทำงานแตกต่างกัน มันถือว่าเสียงเป็นกระแสของเฟรมสั้น ๆ (โดยปกติ 10-20 มิลลิวินาที แต่ละอัน) วิเคราะห์แต่ละเฟรมเพื่อแยกเนื้อหาเสียงจากเนื้อหาเสียง และลดความสำคัญของเสียงในขณะที่ผ่านเสียง ขั้นตอนการวิเคราะห์คือจุดที่วิธีการแตกต่างกัน
การลบสเปกตรัมแบบดั้งเดิม
เครื่องมือที่เก่ากว่าใช้การลบสเปกตรัม: วัดพื้นเสียงในช่วงเงียบ สร้างโปรไฟล์เสียง ลบโปรไฟล์นั้นออกจากทุกเฟรมที่ตามมา สิ่งนี้ใช้งานได้ค่อนข้างดีสำหรับเสียงคงที่เช่นเสียงพัดลมหรือเครื่องปรับอากาศที่อยู่ที่ความถี่และระดับคงที่ มันต่อสู้กับเสียงที่เปลี่ยนแปลง - คลิกแป้นพิมพ์ คลิกเมาส์ ใครบางคนพูดในเบื้องหลัง - เพราะโปรไฟล์ที่วัดได้ในช่วงเงียบไม่ตรงกับสิ่งที่มาถึงกลางประโยค
RNNoise - เส้นฐานปฏิบัติฟรี
RNNoise เป็นตัวระงับเสียงตามเครือข่าย recurrent neural ที่พัฒนาโดย Mozilla และ Jean-Marc Valin มันใช้เครือข่าย GRU (gated recurrent unit) ที่ได้รับการฝึกอบรมในหลายพันชั่วโมงของเสียงที่มีเสียงดังเพื่อจำแนกแต่ละแถบความถี่เป็นเสียงหรือเสียงในทุกเฟรม เนื่องจากเรียนรู้จากการบันทึกจริง มันจัดการกับชั้นเรียนเสียงที่กว้างกว่ามากกว่าการลบสเปกตรัม
RNNoise เป็นโอเพนซอร์ส มีขนาดเท้าที่เล็กมาก (รันบนหนึ่ง CPU core) เพิ่ม 10 มิลลิวินาที ประมาณ และรวมอยู่โดยตรงใน OBS Studio Chromium (เครื่องยนต์อยู่เบื้องหลังแท็บเบราว์เซอร์ Discord) และเครื่องมืออื่น ๆ หลายตัว สำหรับคนส่วนใหญ่ที่สตรีมมิงเป็นการแสดงสดหรือการโทรแบบสั่งซื้อ RNNoise เพียงพอจริงๆ
ที่ RNNoise แสดงข้อ จำกัด: เสียงรบกวนที่ขาดตอนมากมาย (แป้นพิมพ์เครื่องกลที่ WPM สูงขวาข้างไมโครโฟน) เสียงสะท้อนห้อง/reverb และสภาพแวดล้อมอะคูสติกที่ซับซ้อนพร้อมแหล่งเสียงที่แข่งขันกันหลายตัว มันยังมีรุ่นคงที่ - ไม่สามารถปรับแต่งไปยังห้องเฉพาะของคุณได้โดยไม่มีการรีคอมไพล์
Denoiser AI/ML
ซอฟต์แวร์ระงับเสียงที่มีเนื้อหาใหม่กว่าใช้เครือข่ายนิวรอนที่ใหญ่กว่าได้รับการฝึกอบรมในข้อมูลมากขึ้น โดยมีพารามิเตอร์มากขึ้นซึ่งอุทิศให้กับการแยกเสียงจากพื้นหลังที่ซับซ้อน เครื่องมือเช่น Krisp NVIDIA RTX Voice (ส่วนหนึ่งของ NVIDIA Broadcast) และการระงับเสียง VoxBooster อยู่ในหมวดหมู่นี้ การปรับปรุงโดยทั่วไปเมื่อเทียบกับ RNNoise นั้นเห็นได้ชัดเจนที่สุดใน:
- เสียงแป้นพิมพ์ - typist 60 WPM บนแป้นพิมพ์เครื่องกลเสียงดังขวาข้างไมโครโฟน ซึ่ง RNNoise จัดการได้ไม่ดี
- เสียงสะท้อนห้องและ reverb - การสะท้อนที่มาถึงไมโครโฟนมิลลิวินาทีหลังจากเสียงดั้งเดิมและทำให้ความชัดเจนของเสียงพูด
- เสียงพูดเบื้องหลัง - คนอื่นพูดในห้องเดียวกัน ซึ่งมีลักษณะเฉพาะของสเปกตรัมเหมือนเสียงที่สร้างความสับสนให้กับโมเดลที่ง่ายกว่า
- เสียงระดับตัวแปร - การจราจรที่กระเพื่อมกับทุกคนที่ผ่านไปมา HVAC ที่เปิด/ปิด
ค่าแลกเปลี่ยนคือต้นทุนการคำนวณ โมเดลที่หนักกว่าต้องการ CPU มากขึ้น (หรือ GPU สำหรับตัวแปรที่ใหญ่ที่สุด) ความล่าช้ายังคงอยู่ในช่วง 10-30 มิลลิวินาที สำหรับการใช้งานแบบเรียลไทม์เนื่องจากใช้ขนาดชิ้นเล็ก แต่เวลาการสรุปอนุมานของโมเดลตั้งค่าพื้น
ที่มี Noise Suppression นั่นอยู่ในห่วงโซ่เสียง
นี่คือที่ที่การตั้งค่าส่วนใหญ่ล้มเหลว ตำแหน่งของตัวระงับเสียงที่สัมพันธ์กับขั้นตอนการประมวลผลอื่น ๆ นั้นมีความสำคัญอย่างมาก
ลำดับที่ถูกต้อง: ระงับก่อนอื่น
ไมโครโฟน -> ระงับเสียง -> เอฟเฟกต์เสียง / EQ / การบีบอัด -> เอาต์พุต
หากการระงับเสียงรันก่อน มันจะได้รับข้อมูลเข้าที่สะอาดที่สุดที่เป็นไปได้: เสียงไมโครโฟนดิบก่อนที่การประมวลผลใด ๆ จะเพิ่มสิ่งประดิษฐ์ มันสามารถระบุเสียงกับเสียงได้อย่างแม่นยำเนื่องจากทั้งสองยังไม่ได้ปรับแต่ง
สิ่งที่ผิดเมื่อคุณพลิกมัน
หากคุณวาง pitch-shifter หรือเครื่องเปลี่ยนเสียงก่อนตัวระงับเสียง ห่วงโซ่จะมีลักษณะดังนี้:
ไมโครโฟน -> เครื่องเปลี่ยนเสียง -> ระงับเสียง -> เอาต์พุต
เครื่องเปลี่ยนเสียงสร้างฮาร์มอนิกใหม่ เลื่อน formant และสร้างเนื้อหาสเปกตรัมที่ไม่อยู่ในการบันทึกดั้งเดิม ตัวระงับเสียงจึงพบเหตุการณ์สัญญาณที่ปรับเปลี่ยนนี้และไม่สามารถแยกแยะฮาร์มอนิกเสียง (ขณะนี้ที่ความถี่ไม่คุ้นเคย) จากเสียงได้ผลลัพธ์คือเสียงที่ถูกใช้งานบางส่วนพร้อมกับเสียง - บาง ชุ่มฉ่ำ หรือมีพยัญชนะตัด
VoxBooster บังคับใช้ลำดับที่ถูกต้องภายใน ขั้นตอนการระงับเสียงของมันทำงานที่ด้านบนของห่วงโซ่การประมวลผลโดยไม่คำนึงถึงคุณสมบัติอื่น ๆ ที่คุณมีการทำงาน นี่ไม่ใช่รายละเอียดที่ชัดเจนจนกว่าคุณจะได้ยินว่าลำดับที่ผิดฟังเหมือนไร
ลำดับการได้มาก่อนตัวระงับ
อัลกอริทึมการระงับเสียงมักเทียบเคียงสำหรับช่วงระดับการป้อนข้อมูลเฉพาะ หากไมโครโฟนของคุณมีการได้มาสตรีมเกินไป (สัญญาณที่ล่อแหว่งใกล้ 0 dBFS) สิ่งประดิษฐ์คลิปจะเข้าสู่สัญญาณก่อนการระงับและไม่สามารถลบได้ หากเงียบเกินไป อัลกอริทึมทำงานที่ SNR ต่ำและอาจไม่แยกแยะเสียงจากพื้นเสียงได้อย่างน่าเชื่อถือ ลำดับที่ระดับไมโครโฟนที่เสียงพูดยอดเขา 12 ถึง -6 dBFS ก่อนตัวระงับ
RNNoise กับ Denoiser AI/ML: การเปรียบเทียบแบบ Head-to-Head
| คุณสมบัติ | RNNoise | Denoiser AI/ML (เช่น VoxBooster) |
|---|---|---|
| ความล่าช้า | ~10 ms | 10-30 ms |
| การใช้ CPU | ต่ำมาก (< 5% บน 1 core) | ต่ำถึงปานกลาง (5-20% ขึ้นอยู่กับโมเดล) |
| เสียงคงที่ (พัดลม AC) | เยี่ยมยอด | เยี่ยมยอด |
| เสียงแป้นพิมพ์ / คลิก | ปานกลาง | เยี่ยมยอด |
| เสียงสะท้อนห้อง / reverb | ไม่ดี-ปานกลาง | ดี-เยี่ยมยอด |
| เสียงพูดเบื้องหลัง | ไม่ดี | ดี |
| เสียงระดับตัวแปร | ดี | เยี่ยมยอด |
| ความแรงที่ปรับได้ | ไม่มี (เปิด/ปิด) | ใช่ (เลื่อนระดับการระงับ) |
| ทำงานทั่วระบบ | ไม่มี (ต่อแอป) | ใช่ |
| ราคา | ฟรี | ที่เสียค่า (มีการทดลองใช้) |
ตารางทำให้การตัดสินใจค่อนข้างตรงไปตรงมา หากสภาพแวดล้อมอะคูสติกของคุณสะอาดด้วยเสียงพัดลมหรือ AC ที่มั่นคง RNNoise ใน OBS หรือ Discord คือทั้งหมดที่คุณต้องการ - ฟรี ไม่มีการติดตั้ง หากคุณมีเสียงแป้นพิมพ์ เสียงสะท้อน หรือต้องการให้การระงับเสียงทำงานบนแอปพลิเคชันทั้งหมดในเวลาเดียวกัน (ไม่ใช่เพียง OBS) เครื่องมือเฉพาะจะสมเด็จจ่ายสำหรับตัวของมันเอง
ตั้งค่าการระงับเสียงใน OBS
OBS Studio มีการระงับเสียงในตัวผ่านตัวกรองเสียง ต่อไปนี้คือขั้นตอนสำหรับทั้ง RNNoise และ denoiser Speex (ทางเลือก DSP ทดแทน):
เพิ่มตัวกรองระงับเสียงใน OBS
- เปิด OBS Studio ในแผง Audio Mixer ให้หาแหล่ง ไมโครโฟนของคุณ
- คลิกที่ไอคอนเกียร์ข้าง ๆ แหล่ง mic และเลือก Filters
- ในหน้าต่าง Filters ให้คลิก + (Add) -> Noise Suppression
- ตั้งชื่อให้กับมันแล้วคลิก OK
- ในการตั้งค่าตัวกรอง เลือก RNNoise จากตัวเลือก Method
- คลิก Close
นั่นคือการตั้งค่าทั้งหมด OBS ใช้ตัวกรองในเวลาจริงกับไมโครโฟนก่อนที่จะส่งเสียงไปยังสตรีมหรือการบันทึกของคุณ ไม่มีเลื่อนความแรงสำหรับ RNNoise - มันเปิดหรือปิด วิธี Speex มีเลื่อน Suppression Level (dB) หากคุณต้องการตัวเลือกที่ปรับได้
ลำดับตัวกรองที่ถูกต้องใน OBS
OBS ประมวลผลตัวกรองจากบนลงล่างในหน้าต่าง Filters การระงับเสียงควรอยู่ที่ด้านบนของรายการ - เหนือการบีบอัด EQ หรือปลั๊กอินเอฟเฟกต์เสียงอื่น ๆ ลากไปยังตำแหน่ง 1 หากจำเป็น
ตาม เอกสาร OBS เกี่ยวกับตัวกรองเสียง ตัวกรองจะทำงานตามลำดับในรายการ นั่นคือเหตุที่ตำแหน่งมีความสำคัญ
ข้อ จำกัด ของวิธี OBS เท่านั้น
ตัวกรอง OBS ใช้เฉพาะกับเสียงที่ประมวลผลโดย OBS ไมโครโฟน Discord แท็บเบราว์เซอร์ เสียงเกมโต้ตอบและแอปพลิเคชันอื่น ๆ ที่ไม่ได้ถูกเส้นทางผ่าน OBS จะไม่ได้รับประโยชน์ หากคุณต้องการระงับเสียงทั่วระบบ คุณต้องการซอฟต์แวร์ที่แทรกตัวเองที่ระดับไดรเวอร์เสียง Windows - ซึ่งเป็นเครื่องมือเช่น VoxBooster Krisp และ NVIDIA Broadcast
ตั้งค่าการระงับเสียงทั่วระบบด้วยซอฟต์แวร์เฉพาะ
ซอฟต์แวร์ระงับเสียงทั่วระบบลงทะเบียนไมโครโฟนเสมือนใน Windows คุณสลับแอปพลิเคชันของคุณ (Discord OBS Zoom เกมของคุณ) เพื่อใช้ไมโครโฟนเสมือนนี้ และซอฟต์แวร์จัดการการจับภาพจากไมโครโฟนจริงของคุณ ระงับเสียง และป้อนสัญญาณสะอาดให้กับแอปพลิเคชันใด ๆ ที่ฟัง
เวิร์กโฟลว์ทั่วไป
- ติดตั้งซอฟต์แวร์และเปิดใช้งาน
- ในการตั้งค่าซอฟต์แวร์ ให้ยืนยันว่าไมโครโฟนทางกายภาพของคุณถูกเลือกเป็นอินพุต
- เปิดใช้งานการระงับเสียง (และตั้งค่าระดับความแรงหากมีตัวเลือก)
- ใน Discord OBS Zoom หรือเกมของคุณ ให้ไปที่การตั้งค่าเสียง/mic และเลือกไมโครโฟนเสมือนที่ซอฟต์แวร์สร้างขึ้นเป็นอุปกรณ์อินพุตของคุณ
- ทำการบันทึกทดสอบเพื่อยืนยันว่าสัญญาณสะอาดกำลังออก
การตั้งค่า VoxBooster
ดาวน์โหลด VoxBooster และติดตั้ง ตัวช่วยในการตั้งค่าขอให้คุณเลือกไมโครโฟนทางกายภาพของคุณและตั้งค่าอุปกรณ์เสมือนโดยอัตโนมัติ การระงับเสียงได้รับการเปิดใช้งานตามค่าเริ่มต้นและทำงานก่อนเอฟเฟกต์เสียงใด ๆ ในห่วงโซ่
ในการตั้งค่า VoxBooster:
- Noise Suppression Strength: เริ่มจาก Medium หากคุณยังได้ยินเสียงพัดลมให้ย้ายไป High หากเสียงของคุณเริ่มฟังประมวลผลหรือหายใจลงมาเพื่อ Medium หรือ Low
- Voice Activity Detection (VAD): ทำให้จับคู่กับการระงับเสียงเพื่อ - มันเงียบเอาต์พุตทั้งหมดในระหว่างการหยุด ซึ่งจะขจัดพื้นเสียงตกค้างระหว่างประโยค
ไมโครโฟนเสมือนที่ VoxBooster สร้างขึ้นปรากฏในการตั้งค่าเสียง Windows เป็นอุปกรณ์เสียงมาตรฐาน Discord OBS และแอปพลิเคชันอื่น ๆ เห็นมันว่าเป็นไมโครโฟนปกติ
ประเภทของเสียงเฉพาะและวิธีจัดการกับพวกเขา
เสียงพัดลมและเครื่องปรับอากาศ
เสียงคงที่ความถี่ต่ำ RNNoise จัดการสิ่งนี้ได้ดี หากคุณมีส่วนประกอบ 50/60 Hz ที่สำคัญจากการรบกวนทางไฟฟ้า ตัวกรอง EQ การบ่นแคบที่ความถี่นั้นก่อนตัวระงับสามารถช่วยได้ - มันเป็นปัญหาคงที่ที่ EQ แก้ได้อย่างมีประสิทธิภาพมากกว่าการอนุมาน ML
เสียงกระแทกแป้นพิมพ์เครื่องกล
การเปลี่ยน broadband gapped ที่ส่วนที่เข้ามาในกลุ่มแน่นที่ความเร็วการพิมพ์ นี่คือที่ RNNoise แสดงให้เห็นน้อยลงเมื่อเทียบกับ denoiser AI การเปลี่ยนมีขนาดเล็กพอที่จะทับซ้อนกับเสียงพยัญชนะที่พูด (โดยเฉพาะ stop consonants เช่น P T K) ทำให้การจำแนกได้ยากขึ้น
หากคุณใช้แป้นพิมพ์เครื่องกล การบรรเทาทางกายภาพช่วยได้: mat แผ่นใต้แป้นพิมพ์ วงแหวน O บน switches หรือไมโครโฟนแบบทิศทางวางให้ย่อให้น้อยที่สุดการรับของพื้นผิวตั้งโต๊ะ รวมกับ denoiser AI เสียงแป้นพิมพ์กลายเป็นปัญหา
เสียงสะท้อนห้องและ reverb
เสียงสะท้อนคือเสียงที่สะท้อนที่ไมโครโฟนหนึ่งวินาทีหลังจากเสียงดั้งเดิม Reverb คือการสะสมของการสะท้อนที่ทับซ้อนกันหลายแบบที่สร้างเสียง “ห้อง” diffuse ไม่มีอะไรหนึ่งได้รับการจัดการโดย RNNoise ได้ดี
การบำรุงรักษาเชิงกายภาพ (แผ่นโฟมอะคูสติก ตัวกรองการสะท้อนด้านหลังไมโครโฟน ย้ายไมโครโฟนใกล้ปากและลดอัตราขยายตามที่เหมาะสม) เป็นวิธีแก้ไขที่มีประสิทธิภาพมากที่สุด ซอฟต์แวร์สามารถลดเสียงสะท้อนแต่ไม่สามารถได้รับค่าเสียญหาสำหรับห้องที่มี reverb tails ยาว สำหรับการตั้งค่าบ้าน ตัวกรองการสะท้อนด้านหลังไมโครโฟนและลวดโพลาร์เคาดีออยด์เพื่อปฏิเสธเสียงห้องจากด้านหลังทำให้เกิดความแตกต่างมากขึ้นกว่าการตั้งค่าซอฟต์แวร์ใด ๆ
เสียงพูดเบื้องหลัง
Denoiser AI ได้รับการฝึกอบรมเพื่อรับรู้ลวดรูปแบบความถี่เสียงของมนุษย์ เมื่อเสียงเบื้องหลังก็เป็นเสียงของมนุษย์ (สมาชิกครอบครัวพูดทีวีในเบื้องหลัง) ตัวจำแนกมีงานที่ยากกว่า การใช้งาน AI ที่ดีจัดการสิ่งนี้อย่างสมเหตุสมผลโดยมองไปที่เบาะแสเชิงพื้นที่และสเปกตรัม แต่ไม่มีซอฟต์แวร์ที่แยกเสียงสองเสียงพร้อมกันที่ไมโครโฟนเดียวได้อย่างสมบูรณ์ แยกเนื้อหา - ปิดประตู ย้ายไปยังพื้นที่เงียบ - ยังคงเป็นวิธีแก้ปัญหาที่ดีที่สุด
คลิกเมาส์
คล้ายกับเสียงแป้นพิมพ์ แต่มีโปรไฟล์การเปลี่ยนแปลงที่แตกต่างกัน โดยทั่วไปแล้วจะระงับได้ง่ายกว่าเสียงแป้นพิมพ์เพราะอัตราการคลิกต่ำกว่าและการเปลี่ยนแปลงน้อยกว่า Denoiser AI ส่วนใหญ่จัดการกับการคลิกเมาส์อย่างสะอาดที่การตั้งค่าการระงับปานกลาง
ความล่าช้า: สิ่งที่ตัวเลขหมายถึงจริง ๆ
ความกังวลทั่วไปคือว่าการระงับเสียงเพิ่มความล่าช้าที่รับรู้ได้ให้กับเสียงของคุณเอง ต่อไปนี้คือวิธีการคิดเกี่ยวกับเรื่องนี้:
- ต่ำกว่า 20 ms: ไม่มีการรับรู้โดยสิ้นเชิงในขณะที่พูดสด คุณจะไม่มีวันสังเกต
- 20-50 ms: มีอยู่ในเชิงเทคนิค แต่ไม่ได้ยินเสียงสะท้อนในระหว่างเสียงพูดปกติ Edge case: หากคุณตรวจสอบไมโครโฟนของคุณเองผ่านหูฟัง บางคนสังเกตเห็นในช่วงนี้
- 50-100 ms: เริ่มรู้สึกเหมือน lag เล็กน้อย หากคุณตรวจสอบเสียงที่ประมวลผลของคุณในเวลาจริง
- เหนือ 100 ms: เสียงสะท้อนที่เห็นได้ชัดเจนเมื่อตรวจสอบ ไม่สามารถยอมรับได้สำหรับการใช้งาน live performance
RNNoise เพิ่ม 10 มิลลิวินาที ประมาณ Denoiser AI ในเวลาจริง 15-30 มิลลิวินาที ไม่มีอะไรจึงเป็นปัญหาสำหรับการใช้งานส่วนใหญ่ สถานการณ์เดียวที่ความล่าช้าในการระงับเสียงสำคัญคือหากคุณทำการบันทึกเพลงมืออาชีพด้วยสมาธิการตรวจสอบแบบเรียลไทม์ - ซึ่งมีข้อกำหนดความล่าช้าต่ำของตัวเองที่ใช้ยาวนานก่อนที่การระงับเสียงจะเข้ามา
การระงับเสียงและเครื่องเปลี่ยนเสียง: การสร้างงาน
หากคุณใช้ เครื่องเปลี่ยนเสียง แบบเรียลไทม์ พร้อมกับการระงับเสียง ระงับ ลำดับจากเร็ว ๆ นี้กลายเป็นเสียง ว่าช่วงหลัก Mode ล้มเหลว คือ:
- ผู้ใช้เปิดใช้งานการระงับเสียงใน OBS
- ผู้ใช้ยังเปิดใช้งานปลั๊กอินเครื่องเปลี่ยนเสียงใน DAW หรือแอปพลิเคชันแยก
- เครื่องเปลี่ยนเสียง DAW ประมวลผลไมโครโฟนดิบเป็นครั้งแรก จากนั้นการระงับเสียง OBS ทำงานบนเสียงที่เปลี่ยนแปลง
- ตัวระงับเสียง ประสบเนื้อหาสเปกตรัมไม่คุ้นเคยจากเสียงที่เปลี่ยน pitch ลบบางส่วนไปพร้อมกับเสียง
หากคุณเรียกใช้ทั้งสองคุณลักษณะผ่านแอปพลิเคชันแยก ให้แน่ใจว่าสัญญาณไมโครโฟนสะอาดไปยังตัวระงับเสียงเป็นอันดับแรก จากนั้นจึงไปยังเครื่องเปลี่ยนเสียง VoxBooster sidesteps สิ่งนี้โดยสิ้นเชิงเนื่องจากทั้งสองคุณลักษณะถูกรวมเข้ากับแอปพลิเคชันเดียวที่มีลำดับที่ถูกต้องคงที่
สำหรับผู้สตรีมมิงเรียกใช้กล้องเสมือน OBS และเอฟเฟกต์เสียงพร้อมกัน ให้ดูคำแนะนำเกี่ยวกับ วิธีใช้เครื่องเปลี่ยนเสียงบน Discord สำหรับการตั้งค่าการเส้นทางแบบเต็ม
ระงับเสียง Built-In Discord ทำให้ซอฟต์แวร์เฉพาะซ้ำซ้อนหรือไม่
Discord ให้สามระดับของการระงับเสียง (ไม่มี ต่ำ สูง) และสลับยกเลิกเสียงสะท้อนในการตั้งค่า Voice & Video สิ่งเหล่านี้ใช้การรวมกันของการยกเลิกเสียงสะท้อน WebRTC และ denoiser ที่ใช้ ML ที่ใช้กับสัญญาณขาเข้าของคุณในไคลเอนต์
ระงับเสียง Discord ดีสำหรับการโทรแบบสั่งซื้อ ข้อ จำกัด ของมัน:
- ใช้กับแอปพลิเคชัน Discord เท่านั้น - ไม่มีประโยชน์ใน OBS เกม หรือแอปพลิเคชันอื่น ๆ
- คุณไม่สามารถควบคุมว่ามันนั่งที่สัมพันธ์กับการประมวลผลอื่น
- มันแสดงผลเฉพาะในเอาต์พุต Discord ของตัวเอง - การบันทึกสตรีมของคุณผ่าน OBS ไม่ได้รับประโยชน์
- ที่ระดับ “สูง” บางโทนเสียง (โดยเฉพาะเสียงหญิงที่สูงขึ้น) ฟังอย่างเห็นได้ชัดว่าได้รับการประมวลผล
ปิดระงับเสียง Discord เมื่อใช้ซอฟต์แวร์เฉพาะเพื่อหลีกเลี่ยงการประมวลผลแบบสองครั้ง ซึ่งลดคุณภาพเสียง ยกเลิกเสียงสะท้อน Discord สามารถอยู่อย่างอิสระ หากคุณต้องการ
ประเมินคุณภาพการระงับเสียง
คุณจะตัดสินใจได้อย่างไรว่าการตั้งค่าของคุณมีการทำงานจริง ๆ? บันทึกคลิป 30 วินาทีด้วยไมโครโฟนบนเดสก์ พูดตามธรรมชาติขณะที่แหล่งเสียงของคุณทำงาน (พัดลม AC แป้นพิมพ์) จากนั้นปิดเสียงตัวเองกลางประโยคเป็นเวลา 5 วินาทีเพื่อจับพื้นเสียง
ตรวจสอบ:
- พื้นเสียง (ส่วนเงียบ 5 วินาที) - อย่างเหมาะสมต่ำกว่า -50 dBFS ต่ำกว่า -60 dBFS ยอดเยี่ยม
- ความชัดเจนของเสียง - คุณ sibilant (เสียง S) ยังคงฟังธรรมชาติหรือเสียงเสียดสี/ประมวลผล?
- การรักษาพยัญชนะ - พูดคำที่มีเสียง P T K เสียงที่คมชัดหรือค่อนข้าง muffled?
- สิ่งประดิษฐ์การเปลี่ยนแปลง - ขวาเมื่อคุณเริ่มพูดหลังจากเงียบ เสียงป๊อปปราศจากความทะเยอทะยาน หรือมีการคลิกสั้น ๆ?
หากคุณผ่านการตรวจสอบทั้งสี่ การระงับเสียงของคุณปรับแต่งได้ดี ปรับความแรงลดลงหากคุณได้ยินการเสื่อมคุณภาพเสียง ปรับสูงขึ้นหากการทดสอบพื้นเสียงอยู่เหนือ -40 dBFS
สำหรับเพิ่มเติมเกี่ยวกับ พื้นฐานของการระงับเสียงเสียง บทความ Wikipedia เกี่ยวกับการลดเสียง ครอบคลุมพื้นหลังการประมวลผลสัญญาณในความลึกที่สามารถอ่านได้ หน้า โครงการ RNNoise มีเสียง demo แบบโต้ตอบเปรียบเทียบบันทึก filtered และ unfiltered
การรวมการระงับเสียงกับคุณสมบัติเสียงอื่น ๆ
ระงับเสียง pairs ดีกับขั้นตอนการประมวลผลเพิ่มเติมเหล่านี้:
- เกตเสียง - วางหลังตัวระงับเป็นเส้นป้องกันครั้งที่สอง Gate เงียบเสียงคงที่ตกค้างในระหว่างการหยุดชั่วคราวที่ตัวระงับลดลงแต่ไม่ขจัด ตั้งค่าเกตเกณฑ์เพียงเหนือระดับพื้นเสียงที่ระงับ
- การบีบอัด - หลังจากระงับและการชักระวาง บีบอัดอ่อน (3:1 อัตราส่วน slow attack) เสียงเรียบวลีสัญญาณโวคัลของคุณโดยไม่ re-amplifying เสียง เนื่องจากเสียงถูกลบออกแล้ว การบีบอัดจึงทำงานเพื่อ ความสะอาด
- เอฟเฟกต์เสียง - สุดท้ายในห่วงโซ่ pitch shift resonance และเอฟเฟกต์อักขระทั้งหมดให้ผลลัพธ์ที่ดีกว่าบนสัญญาณสะอาดและระงับ
หากคุณยังใช้การระงับเสียงพร้อมกับ soundboard โปรดทราบว่าเสียง soundboard มักจะข้ามห่วงโซ่ไมโครโฟนอย่างสมบูรณ์ - มันเส้นทางโดยตรงไปยังเอาต์พุตเสมือน ซึ่งหมายความว่าการระงับเสียงไม่ส่งผลกระทบต่อเสียง soundboard ซึ่งเป็นพฤติกรรมที่ถูกต้อง
คำถามที่พบบ่อย
ฉันจะลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของฉันได้อย่างไร
เส้นทางที่มีประสิทธิภาพมากที่สุดคือซอฟต์แวร์ระงับเสียงเฉพาะ ซึ่งประมวลผลสัญญาณไมโครโฟนของคุณในเวลาจริงก่อนที่จะไปถึง Discord OBS หรือแอปพลิเคชันอื่น ๆ เครื่องมือเช่น VoxBooster ใช้การกรองตามปัญญาประดิษฐ์ที่ระดับระบบ ดังนั้นทุกแอปพลิเคชันจึงได้รับประโยชน์โดยอัตโนมัติโดยไม่ต้องมีการกำหนดค่าต่อแอปพลิเคชัน
ซอฟต์แวร์ระงับเสียงที่ดีที่สุดสำหรับการสตรีมมิงคืออะไร
ขึ้นอยู่กับฮาร์ดแวร์และเวิร์กโฟลว์ของคุณ ผู้สตรีมที่ต้องการให้แอปพลิเคชันเดียวจัดการระงับเสียง เอฟเฟกต์เสียง และบอร์ดเสียงพร้อมกันมักชอบ VoxBooster ผู้ที่อยู่ในระบบนิเวศ OBS แล้วมักจะเริ่มต้นด้วยตัวกรอง RNNoise ในตัว ก่อนตัดสินใจอัปเกรดเป็นเครื่องมือเฉพาะ
ซอฟต์แวร์ระงับเสียงเพิ่มความล่าช้าหรือไม่
ใช่ แต่การใช้งานสมัยใหม่ทำให้มันต่ำมาก RNNoise เพิ่ม 10 มิลลิวินาที โดยประมาณ ตัวกรอง AI/ML ที่มีประสิทธิภาพมากขึ้นจะเพิ่ม 10-30 มิลลิวินาที ขึ้นอยู่กับขนาดชิ้นและความซับซ้อนของโมเดล สำหรับเสียงสด เรื่องนี้ไม่มีการรับรู้ โมเดลลบเสียงที่หนักกว่าที่ออกแบบมาสำหรับ post-production สามารถเพิ่ม 100 มิลลิวินาที ขึ้นไป และไม่เหมาะสำหรับการใช้งานแบบเรียลไทม์
ความแตกต่างระหว่างการระงับเสียงและการยกเลิกเสียงคืออะไร
การระงับเสียงกรองเสียงที่ไม่ต้องการออกจากสัญญาณไมโครโฟนในซอฟต์แวร์ - มันวิเคราะห์เสียงและลดความเสีย ทำให้ความถี่ที่ไม่ใช่เสียง การยกเลิกเสียง (เช่นในหูฟัง ANC) ใช้ไมโครโฟนทางกายภาพและลำโพงเพื่อสร้างคลื่นเสียงผกผันที่ยกเลิกเสียงทางอะคูสติก ทั้งคู่มีจุดมุ่งหมายเพื่อให้ได้ผลลัพธ์เดียวกันผ่านวิธีการที่แตกต่างกันมาก
การระงับเสียงทำงานกับไมโครโฟนใด ๆ หรือไม่
ใช่ การระงับเสียงตามซอฟต์แวร์อยู่ในห่วงโซ่การประมวลผลเสียงหลังจากขั้นตอน ADC ดังนั้นจึงใช้งานได้กับ USB mic อินเตอร์เฟส XLR ไมโครโฟนในตัวแล็ปท็อป และ mic ชุดหูฟัง ไมโครโฟนที่ดีกว่าให้ป้อนข้อมูลที่สะอาดกว่าให้กับอัลกอริทึม แต่แม้แต่ไมโครโฟนแล็ปท็อปที่มีเสียงดังก็ยังคงเห็นการปรับปรุงที่ชัดเจน
การระงับเสียงจะส่งผลต่อคุณภาพเสียงของฉันหรือไม่
การระงับเสียงจากน้อยไปปานกลางมีผลกระทบน้อยต่อเสียง การตั้งค่าที่เข้มงวดหรือ อัลกอริทึมคุณภาพต่ำสามารถทำให้เสียงฟังเหมือนเปียก เหมือนหุ่นยนต์ หรือตัด กุญแจคือการปรับความแรงของการระงับเสียงให้เหมาะสมกับสภาพแวดล้อมของคุณ - เพียงพอที่จะฆ่าพื้นเสียง ไม่มากจนกว่าอัลกอริทึมจะเริ่มกินพยัญชนะ
ฉันสามารถใช้การระงับเสียงและเครื่องเปลี่ยนเสียงในเวลาเดียวกันได้หรือไม่
ใช่ และลำดับก็มีความสำคัญ การระงับเสียงจะต้องรันก่อน ก่อนที่เครื่องเปลี่ยนเสียงจะประมวลผลสัญญาณ หากคุณรวมมันไว้ด้วยกันในลำดับที่ผิด เครื่องเปลี่ยนเสียงจะสร้างสิ่งประดิษฐ์ฮาร์มอนิกใหม่ที่ตัวระงับจะพยายามลบออก ซึ่งจะลดคุณภาพ VoxBooster จัดการลำดับที่ถูกต้องภายในตัวเอง ดังนั้นคุณจึงไม่ต้องจัดการด้วยตนเอง
บทสรุป
การลบเสียงรบกวนเบื้องหลังออกจากไมโครโฟนของคุณไม่ใช่การแก้ไขการตั้งค่าเดียว - มันต้องการความเข้าใจว่าการระงับเสียงนั่นอยู่ในห่วงโซ่ของคุณ เทคโนโลยีใดจัดการกับประเภทเสียงไหน และวิธีปรับความแรงโดยไม่ลดคุณภาพเสียง เส้นทางฟรี (RNNoise ใน OBS) ครอบคลุมมากมายและเป็นค่าตัดสินได้ถึงแม้ว่าคุณวางแผนในการย้ายไปที่ซอฟต์แวร์เฉพาะต่อไป สำหรับปกคลุมทั่วระบบ การจัดการแป้นพิมพ์และเสียงสะท้อน และการรวมกับเอฟเฟกต์เสียง เครื่องมือเฉพาะจึงจ่ายสำหรับตัวของมันเอง
VoxBooster รวม AI-based noise suppression เป็นขั้นตอนการประมวลผล first-stage ในตัว ซึ่งหมายความว่าการทำความสะอาดไมโครโฟนของคุณก่อนเอฟเฟกต์เสียง soundboard routing หรืออย่างอื่นที่สัญญาณ ไม่ว่าคุณจะสตรีมมิง ใน Discord calls หรือในการประชุม video คน มันจึงทำงานบนทุกแอปพลิเคชันพร้อมกันผ่านอุปกรณ์ไมโครโฟนเสมือนเดียว ตรวจสอบ หน้า pricing สำหรับตัวเลือกแผน
ดาวน์โหลด VoxBooster - ทดลอง 3 วันฟรี ไม่จำเป็นต้องมีบัตรเครดิต