คำแนะนำผลประทับใจเสียง Senku Ishigami: คำแนะนำที่สมบูรณ์
ผลประทับใจเสียง Senku Ishigami เป็นเสียงอนิเมะที่น่าพอใจที่สุดในการทำให้เชี่ยวชาญ - และเป็นหนึ่งในเสียงที่มีเทคนิคมากที่สุด เซนกุ นักวิทยาศาสตรองค์ที่มีจำนวนผู้นำ Dr. Stone พูดด้วยความเชื่อมั่นที่ตัดขาดและวางตำแหน่งไปข้างหน้าซึ่งดูเหมือนว่าแตกต่างไปจากความอบอุ่นตามแบบของผู้นำ shonen ทั่วไป คำแนะนำนี้ครอบคลุมทั้งหมด: กายวิภาคเสียงของเสียงการตั้งค่า DSP สำหรับการแปลงแบบเรียลไทม์แบบฝึกหัดการฝึกอบรมสำหรับการแสดงสดและขั้นตอนการโคลนเสียง AI เพื่อความซื่อสัตย์สูงสุด - ทั้งหมดทำงานบน Windows ไม่มีไดรเวอร์เคอร์เนล ใช้ได้ใน Discord OBS หรือเกมใด ๆ
TL;DR
- เสียง Senku นั่งใกล้กับระดับเสียงธรรมชาติของผู้ชายแต่ได้คุณสมบัติของเขาจากการวางตำแหน่งฟอร์แมนต์ไปข้างหน้าที่แข็งแกร่งพยัญชนะที่ตัดขาดและการเร่งจังหวะ - ไม่ใช่จากการเปลี่ยน pitch ที่น่าประทับใจ
- การกระโดดขึ้น ‘พันล้านเปอร์เซ็นต์’ เป็นการกระโดด +2 ถึง +3 semitone สั้นๆ รวมกับการเพิ่มระดับเสียงอย่างรวดเร็วไม่ใช่เสียงสำเร็จรูปที่ยาว
- ท่อนเพลงญี่ปุ่น (Yusuke Kobayashi): ระบาย sibilance ที่ตาราญั่น จังหวะที่เร็วกว่าการลัดเจาะที่รุนแรง ท่อนเพลงภาษาอังกฤษ (Aaron Dismuke): ทำให้ขึ้นน้อย
- DSP เพียงอย่างเดียว ได้คุณ 70% ของวิธี; การโคลนเสียง AI ปิดช่องว่างเพื่อให้สามารถเลือก shade หรือการแสดงแบบดับ
- VoxBooster จัดการไปป์ไลน์แบบเต็มบน Windows ด้วยเวลาในการประมวลผล sub-300 มิลลิวินาที และการกำหนดเส้นทาง WASAPI - ไม่มีไดรเวอร์เคอร์เนล ปลอดภัยต่อต้านการโกง
- การใช้แฟนสำหรับ Discord สตรีมมิ่ง และเกมเป็นบรรทัดฐานที่ก่อตั้งขึ้น; ป้ายชื่อเนื้อหาของคุณอย่างชัดเจนและหลีกเลี่ยงการใช้ทางพาณิชย์
Senku Ishigami คือใครและเหตุใดเสียงของเขาจึงโดดเด่น?
Senku Ishigami เป็นตัวละครหลักของ Dr. Stone ซีรีส์แมนงาโดย Riichiro Inagaki และ Boichi ปรับตัวเป็นอนิเมะโดย TMS Entertainment Senku เป็นอัจฉริยะนักวิทยาศาสตรวัยรุ่นที่รอดชีวิตจากเหตุการณ์ petrification ทั่วโลกที่ลึกลับและทุ่มเทตัวเองให้สร้างอารยธรรมใหม่ตั้งแต่ต้น - ผ่านวิทยาศาสตร์ที่สิบพันล้านเปอร์เซ็นต์
เสียงของเขาสะท้อนให้เห็นถึงตัวละครของเขาด้วยความแม่นยำที่ผิดปกติ ไม่เหมือนความตั้งใจตาโตของผู้นำ shonen ทั่วไป Senku ฟังเหมือนคนที่แก้ไขปัญหาแล้วก่อนที่เขาจะเริ่มอธิบายให้คุณฟัง การแสดงของเขาคือการมั่นใจจนถึงเหตุร้าย รวดเร็วมักจะขัดขวางด้วยความกระตุ้นของเขาเองและจุดสูงสุดด้วยการกระโดดแบบเห่อหมกนั้นเมื่อสมมติฐานถูกยืนยัน
ในเชิงอะคูสติกสิ่งนี้สร้างความท้าทายเฉพาะ: เสียงของเขาไม่ได้กำหนดโดยการจัดการ pitch ที่รุนแรง Senku ไม่ใช่เสียงกระรอก ไม่ใช่วิลเลนที่กำลังหมดอำนาจ ไม่ใช่ไอดอล androgynous เขาครอบครองสเปกตรัมผู้ชายปกติและบรรลุความเป็นเอกลักษณ์ผ่าน รูปแบบการออกเสียงและการวางตำแหน่งฟอร์แมนต์ - ซึ่งทำให้ยากต่อการจำลองด้วยเครื่องมือ pitch slider อย่างง่ายแต่สามารถจำลองได้ดีมากเมื่อคุณเข้าใจพารามิเตอร์
การแสดงสองแบบตามพระราชกฤษฎีกา
Yusuke Kobayashi — Dub ญี่ปุ่น
การแสดงโดยใช้ภาษาญี่ปุ่นของ Kobayashi นั้นเป็นต้นฉบับและวิเคราะห์มากที่สุดโดยชุมชนศิลปะการพูด Senku ของเขามี sibilance ที่คมชัดและเกือบเป็นการบ้านบนเสียง ‘s’ การเร่งความเร็วจังหวะที่จงใจในระหว่างคำอธิบายเทคนิคและการลัดเจาะเสียงที่พูดถึงข้อ จำกัด สูง บนพยัญชนะสำคัญก่อนคืนฟุตไลน์ สเตตหลังไม่เปลี่ยนแปลงตลอดเวลา - ซึ่งทำให้การกระโดดเป็นตัวอักษรที่มีประสิทธิผลตามความเปรียบต่าง สำหรับการมองเป้าหมาย DSP, Senku ของ Kobayashi นั่งใกล้กับระดับเสียงธรรมชาติของผู้ชาย (ปรับสัมสวน 0 semitone ใกล้เคียง) มีการเลื่อน formant ในช่วง +6 ถึง +9% ซึ่งสร้างคุณภาพไปข้างหน้าเล็กน้อยและสว่างโดยไม่ต้องเข้าไปในดินแดนระดับเสียงสูง
Aaron Dismuke — Dub อังกฤษ
การนำเสนอท่อนเพลงภาษาอังกฤษของ Dismuke จะอบอุ่นกว่านิดในเฉดสีและค่อนข้างวัดได้มากขึ้นในการเดิน การกระโดดแบบเห่อหมกมีอยู่แต่น้อยลง; สเตตโดยรวมรู้สึกว่าเต็มไปด้วยมากขึ้นเล็กน้อย ชุมชน Discord ที่พูดภาษาอังกฤษมักจะพบว่าเวอร์ชันนี้สามารถอ่านได้ทันที ‘Senku’ เพราะการเดินก่อคู่กับโครงสร้างประโยคอังกฤษได้ดีขึ้น
สำหรับ DSP สเตต Dismuke ต้องการการเลื่อน formant น้อยกว่าเล็กน้อย (+4 ถึง +6%) และฟุตไลน์ pitch ประมาณเดียวกัน หากคุณแสดงสำหรับผู้ชมที่พูดภาษาอังกฤษการปรับแต่งนี้จะอ่านได้ธรรมชาติมากขึ้น
วิภาวะอะคูสติก: สิ่งที่กำหนดเสียง Senku
การแยกเสียงของเขาออกเป็นองค์ประกอบทำให้มันสามารถจำลองได้ทั้งในการแสดงสดและการกำหนดค่า DSP
การวางตำแหน่งฟอร์แมนต์
ลักษณะเฉพาะที่แตกต่างมากที่สุด เสียง Senku นั่งไปข้างหน้าในปาก - การเรโซแนนซ์ไม่อยู่ในหน้าอกหรือคอ แต่นำไปสู่ส่วนหน้าของโพรงปาก สร้างคุณภาพสว่างและเบาะว่านโดยไม่ต้องเป็นจริงๆ การวางตำแหน่งไปข้างหน้านี้คือสิ่งที่ให้เสียงคุณภาพ ‘ผู้อัจฉริยะคม’ ในแง่ DSP: การเลื่อน formant +5 ถึง +9% ไม่มีการเพิ่มประสิทธิ์ resonance หน้าอก
ฟุตไลน์ Pitch และการกระโดดแบบเห่อหมก
ระยะเสียงพื้นฐานอยู่ใกล้กับระดับเสียงพูดธรรมชาติของผู้ชาย - นี่เป็นเรื่องที่ขัดแย้งกับสัญชาติญาณสำหรับผลประทับใจเสียงอนิเมะซึ่งคนส่วนใหญ่คาดว่าการปรับเปลี่ยน pitch ขนาดใหญ่ Senku เดินออกมาจากการกระโดด: การกระโดด +2 ถึง +3 semitone ที่รวดเร็วดำเนินการ 300-500 มิลลิวินาที จับคู่กับการเพิ่มขึ้นของระดับเสียงในช่วงเวลาเพื่อการค้นพบสำคัญหรือวลี ‘สิบพันล้านเปอร์เซ็นต์’ การกระโดดควรสั้นและกลับไปยังฟุตไลน์ทันที - ระดับเสียงสูงอย่างต่อเนื่องฟังผิดสำหรับตัวละครนี้
การเร่งความเร็วจังหวะ
เมื่อ Senku อธิบายบางสิ่งทางวิทยาศาสตร์พูดของเขาบีบอัด: ช่วงกลางของประโยคความเร็ว พยัญชนะเป็นเกล็ดมากขึ้นและคำหรือวลีสุดท้ายจอดลงด้วยน้ำหนักที่จงใจ ฝึกฝนสิ่งนี้โดยการใช้ประโยคทางเทคนิคใด ๆ และสติหรือบีบอัดคำสั่งสุดท้ายในขณะที่แข็งพยัญชนะสุดท้ายของคุณ
Vibrato ขั้นต่ำการบีบอัดสูงสุด
Senku แทบจะไม่เคยใช้ความอบอุ่นของเสียงหรือการสั่นของเสียงอารมณ์ ช่วงอารมณ์ของเขาแสดงผ่านการเดินและการกระโดดไม่ใช่ผ่านความนุ่มหรือความเสี่ยง ในแง่การประมวลผล: reverb ขั้นต่ำอัตราส่วนการบีบอัดสูงไม่มี wobble pitch correction
การตั้งค่า DSP สำหรับการแปลงเสียง Senku เรียลไทม์
นี่คือจุดเริ่มต้น - เสียงของคุณจะต้องปรับตามระดับเสียงและเฉดสีของคุณ
| พารามิเตอร์ | การตั้งค่า Kobayashi | การตั้งค่า Dismuke | บันทึก |
|---|---|---|---|
| การเลื่อน pitch | 0 ถึง +1 st | 0 ถึง +1 st | ฟุตไลน์ใกล้ผู้ชายธรรมชาติ |
| การเลื่อน Formant | +6 ถึง +9% | +4 ถึง +6% | การวางตำแหน่งสว่างไปข้างหน้า |
| อัตราส่วนคอมเพรสเซอร์ | 4:1 | 3:1 | ช่วงไดนามิกคลิปเพิ่มสแน็ป |
| การโจมตี Compressor | 5 ms | 8 ms | การโจมตีที่เร็วจับพยัญชนะ |
| EQ 200-400 Hz | -3 dB | -2 dB | ลดเสียงสั่น chest |
| EQ 2-5 kHz | +3 dB | +2 dB | เพิ่มความชัดเจนของการออกเสียง |
| Reverb เปียก | 5% | 8% | เกือบแห้งสำหรับความชัดเจนของห้องแล็บ |
| เกณฑ์ประตูเสียง | -40 dB | -40 dB | ขจัดเสียงลมหายใจระหว่างการปล่อย |
การกระโดดแบบเห่อหมกเป็นองค์ประกอบการแสดงสด - ยกระดับเสียง pitch ของคุณ 2-3 semitone แบบเรียลไทม์โดยใช้ keybind หรือแป้นการแสดงออกหากซอฟต์แวร์ของคุณรองรับ โหมดการแปลงเสียง AI จัดการการเปลี่ยนแปลง shade; คุณให้พลวัต
แบบฝึกหัดการแสดงสด
DSP ให้คุณ chain processing ที่ถูกต้อง แบบฝึกหัดการแสดงสร้างอนุภาคของกล้ามเนื้อสำหรับรูปแบบการแสดง
แบบฝึกหัด 1: บรรทัดฐาน Consonant ที่ตัดขาด
อ่านย่อหน้าทางเทคนิคใด ๆ โดยใช้เสียงดัง โฟกัสบนการทำให้พยัญชนะสุดท้ายในทุกคำได้ยินและเล็กน้อยปีกไก่ - ‘แนวคิด’ ลงท้ายด้วย ‘t’ ที่ตัดขาด ‘อย่างแม่นยำ’ ลงท้ายด้วย ‘ee’ ที่ตัดขาดสะอาด แม้แต่อย่างเดียวนี้เลื่อนไหล่เสียงไปยังรูปแบบ Senku อย่างมีนัยสำคัญ
แบบฝึกหัด 2: การบีบอัดประโยค
ใช้ประโยคที่มีสองเงื่อนไข พูดอนุประโยคแรกด้วยความเร็วปกติ พูดอนุประโยคที่สองร้อยละ 20 เร็วกว่า สิ้นสุดประโยคด้วยน้ำหนักที่ตั้งใจและหนักกว่าในคำสุดท้าย ทำซ้ำด้วยร้อยละ 30 จากนั้นร้อยละ 40 การบีบอัดในอนุประโยคสุดท้าย
แบบฝึกหัด 3: การกระโดดและสแน็ป
แบบฝึกหัดการกระโดดแบบเห่อหมกแยกต่างหาก พูด ‘สิบพันล้านเปอร์เซ็นต์’ ด้วยความเร็วปกติ บน ‘พันล้าน’ ดันระดับเสียง pitch ของคุณสูงขึ้นสองแป้นและเพิ่มระดับเสียงประมาณ 6 dB จากนั้นกลับไปที่ฟุตไลน์ทันทีสำหรับ ‘เปอร์เซ็นต์’ ระยะเวลาการกระโดดควรต่ำกว่า 30 วินาที รูปแบบนี้ย้อนกลับไปยังวลีเทียบเท่าใด ๆ ในศัพท์ Senku
แบบฝึกหัด 4: บรรทัดฐานอารมณ์
บันทึกตัวเองเล่านิทานบางสิ่ง - เล่นกีฬาสูตรอะไรก็ได้ ฟังกลับมาและระบุทุกช่วงเวลาที่เสียงของคุณเพิ่มความอบอุ่นการผ่อนคลายหรือความเสี่ยงเป็นธรรมชาติ นั่นเป็นช่วงเวลาที่ Senku จะไม่เพิ่ม ฝึกฝนการอ่านข้อความเดียวกันด้วยบรรทัดฐานอารมณ์ที่คงที่เพื่อให้เฉพาะช่วงเวลาการกระโดดเจาะทะลุ
ขั้นตอนการโคลนเสียง AI
เมื่อการแสดงสดบวก DSP ไม่พอ - หรือเมื่อคุณต้องเรียกใช้เสียง Senku ในบริบทที่คุณไม่สามารถแสดงสดได้ - การโคลนเสียง AI กรรมการช่องว่าง
ขั้นตอน 1: สร้างชุดข้อมูลการฝึกอบรมของคุณ
บทสนทนา Senku สะอาดและแยกแหล่ง หลีกเลี่ยงฉากที่มีเพลงบ้านหรือเอฟเฟกต์เสียงดัง แหล่งที่ดีรวมถึงฉากห้องแล็บแบบเงียบฉากโมโนโลก และคลิปปฏิกิริยาตัวละครเท่านั้น เล็งที่ 20-30 นาทีของเสียงสะอาดผ่านสภาวะอารมณ์ต่างๆ - คำอธิบายเงียบการกระโดดการค้นพบแบบเห่อหมกการปฏิเสธจริงจัง
ใช้การประมวลผลก่อนแยกระบบสแต็นกับคลิปใด ๆ ที่มีเสียงผสม ขั้นตอนนี้ควรได้รับการใช้เวลา: ข้อมูลการฝึกอบรมที่มีเสียงเนื้อหาสิ่งแนบที่สามารถได้ยินในเอาต์พุตแบบจำลองที่ยากต่อการแก้ไขในภายหลัง
ขั้นตอน 2: ฝึกอบรมหรือนำเข้าแบบจำลองที่ฝึกอบรมไว้ล่วงหน้า
หากแบบจำลองที่ฝึกอบรมชุมชนมีอยู่แล้วในการจัดเก็บเช่น weights.gg หรือสิ่งที่เหมือนกัน ประเมินคุณภาพก่อนการฝึกอบรมตั้งแต่ต้น - แบบจำลองที่ฝึกอบรมมาก่อนที่ดีจะประหยัดชั่วโมงของการทำงาน ตรวจสอบคุณภาพ: เรียกใช้วลี 10-15 หลัก ผ่านแบบจำลองนั้นและเปรียบเทียบกับการแสดงแหล่ง เพื่อให้ได้ความถูกต้องของ formant การสร้างการกระโดดใหม่และการไม่มีสิ่งแนบโลหะ
หากการฝึกอบรมตั้งแต่ต้น ให้ใช้การประมวลผลการแปลงเสียง AI มาตรฐาน เวลาการฝึกอบรมแตกต่างกันอย่างมาก โดยอยู่ที่ฮาร์ดแวร์
ขั้นตอน 3: กำหนดค่า VoxBooster สำหรับการอนุมานแบบเรียลไทม์
นำเข้าแบบจำลองที่ฝึกอบรมไปยังโมดูลการแปลงเสียง AI ของ VoxBooster VoxBooster รองรับการนำเข้าแบบจำลองดั้งเดิมบน Windows 10/11 โดยไม่ต้องมีสภาพแวดล้อม Python แยกต่างหากหรือการตั้งค่าบรรทัดคำสั่ง ตั้งค่าเป้าหมายการหน่วงเวลาเป็นค่าที่เสถียรต่ำสุดที่ CPU/GPU ของคุณบรรลุ - บน GPU ระดับกลาง sub-300 ms อาจบรรลุได้อย่างสม่ำเสมอ
เส้นทางอุปกรณ์เสียงเสมือน VoxBooster เป็นอินพุตไมโครโฟนของคุณใน Discord หรือ OBS VoxBooster ใช้ WASAPI สำหรับการแทรกเสียง - ไม่มีไดรเวอร์เคอร์เนล - ซึ่งหมายความว่ามันทำงานร่วมกับซอฟต์แวร์ anti-cheat ในเกมการแข่งขันโดยไม่มีความขัดแย้ง
ขั้นตอน 4: ชั้น DSP บนการแปลงเสียง AI
การโคลนเสียง AI จัดการเฉดสี ชั้นการตั้งค่า DSP จากตารางข้างต้นบนเอาต์พุตที่แปลงแล้วสำหรับ formant และลักษณะการบีบอัดที่กำหนดรูปแบบการแสดง Senku การรวมกัน - เฉดสี AI บวกกับการออกเสียง DSP - เป็นที่ที่ผลประทับใจกลายเป็นเชื่อมั่นไปยังผู้ฟังที่รู้จักต้นฉบับ
Discord OBS และการตั้งค่าเกม
Discord
ในการตั้งค่าเสียง Discord ให้ตั้งค่าอุปกรณ์อินพุตเป็นไมโครโฟนเสมือน VoxBooster เปิดใช้งานการบีบอัดเสียงรบกวนปิด (ช่วงการประมวลผลจัดการสิ่งนี้ภายใน) ทดสอบด้วยการบันทึกสั้น ๆ ในช่องเสียงใด ๆ ก่อนไปออนไลน์
OBS
เพิ่มแหล่งที่มาจากการจับเสียงอินพุตโดยใช้อุปกรณ์เสมือน VoxBooster หากคุณสตรีมมิ่งและต้องการบันทึกเสียงดิบของคุณแยกต่างหากสำหรับการประมวลผลหลัง ให้เพิ่มเสียงแบบฟ้องร้อง 2 ด้วยไมโครโฟนทางกายภาพของคุณก่อนการประมวลผลใด ๆ
เกมแข่งขัน
เลือกไมโครโฟนเสมือน VoxBooster ในการตั้งค่าเสียงของเกมในลักษณะเดียวกับที่คุณจะใช้ไมโครโฟนใด ๆ เพราะ VoxBooster เส้นทางผ่าน WASAPI แทนไดรเวอร์เคอร์เนลจึงไม่มีความขัดแย้งกับ EAC BattlEye หรือระบบที่คล้ายกัน นี่คือข้อดีในทางปฏิบัติอย่างหนึ่งของการกำหนดเส้นทาง WASAPI มากกว่าวิธีการแทรกที่เก่ากว่า
การเปรียบเทียบ: DSP-Only vs โคลนเสียง AI vs การแสดงสด
| วิธี | เวลาการตั้งค่า | ความสอดคล้องของเฉดสี | การหน่วงเวลา | ข้อกำหนดฮาร์ดแวร์ |
|---|---|---|---|---|
| การแสดงสดเท่านั้น | 0 นาที | ขึ้นอยู่กับทักษะ | 0 ms | ไมโครโฟนเท่านั้น |
| การประมวลผล DSP เท่านั้น | 5-15 นาที | 60-70% | <30 ms | CPU ใด ๆ |
| โคลนเสียง AI (GPU) | 30-120 นาที | 85-95% | <300 ms | GTX 1060+ |
| โคลนเสียง AI (CPU เท่านั้น) | 30-120 นาที | 85-95% | 500-800 ms | CPU สมัยใหม่ |
| DSP + AI รวมกัน | 30-120 นาที | 90-97% | <300 ms (GPU) | GTX 1060+ |
สำหรับการโทร Discord สดหรือการเล่นเกม DSP เท่านั้นคือจุดเข้าระดับแรงเสียดทาน หากคุณมีฮาร์ดแวร์และแบบจำลองที่ดี วิธีการรวมกันคือเพดาน
แนวทางด้านจริยธรรมและเนื้อหาแฟน
ตัวละคร Senku และ IP Dr. Stone เป็นเจ้าของสิทธิ์โดยผู้ถือแต่ละคนพร้อมกับการปรับตัวแบบอนิเมะที่ผลิตโดย TMS Entertainment ความประทับใจเสียงแฟนสำหรับการใช้งานส่วนตัว - สตรีมมิ่งเกมและบท Discord roleplay - ครอบครองพื้นที่เดียวกับงานสร้างสรรค์แฟนทั้งหมด: แพร่หลายยอมรับและชัดเจนแตกต่างจากการละเมิดทางการค้าตราบเท่าที่เนื้อหามีข้อบ่งชี้ชัดเจนว่าเป็น fan-created
แนวทางเชิงปฏิบัติ:
- ป้ายชื่อเนื้อหาเป็น ‘ผลประทับใจแฟน’ หรือ ‘ผลประทับใจเสียง’ - ไม่ใช่เป็นวัสดุ ที่ได้รับอนุญาต ของ ระบบ
- อย่าใช้ผลประทับใจในการสร้างรายได้จากผลิตภัณฑ์หรือบริการที่มีแบรนด์ Senku
- อย่าใช้เสียงที่โคลนมาปลอมตัวเป็นนักแสดงเสียง (Kobayashi หรือ Dismuke) ตามส่วนตัว
- สำหรับโครงการทั่วโลกใด ๆ โปรดปรึกษากับทนายความที่คุ้นเคยกับ IP ญี่ปุ่นและหลักคำว่า ยุติธรรมตามพื้นที่ก่อนการเผยแพร่
พื้นที่สีเทาสร้างขึ้นในวัฒนธรรมแฟนอนิเมะ บรรทัดฐานแฟนวิธีการนั้นใช้ที่นี่
ทรัพยากรภายใน
กำลังมองหาการสร้างชุดเครื่องมือการพูดอนิเมะที่กว้างขึ้น คำแนะนำตัวละครอื่น ๆ ในซีรีส์นี้:
- คำแนะนำตัวแปลงเสียงอนิเมะ - ภาพรวมของเทคนิคในประเภทตัวละครต่างๆ
- ตัวแปลงเสียง Deku - ผู้นำ shonen ที่มีความจริงใจซึ่งเป็นโปรไฟล์ที่ขัดแย้งกับ Senku
- การตั้งค่าตัวแปลงเสียงลึก - สำหรับตัวละครวิลเลนและต่อต้าน
- พื้นฐานตัวแปลงเสียง AI - มูลนิธิเทคนิคสำหรับการทำงานการโคลน
- การตั้งค่าตัวเปลี่ยนเสียง Discord - การอ้างอิงการเส้นทางและการกำหนดค่า
บทสรุป
ความประทับใจเสียง Senku Ishigami ให้รางวัลการลงทุน เสียงของตัวละครมีรายละเอียดเพียงพอที่ความพยายามเล็กน้อยอ่านเป็นเสียงอนิเมะทั่วไป - แต่เมื่อการวางตำแหน่ง formant ไปข้างหน้ารูปแบบพยัญชนะที่ตัดขาดและพลวัตการกระโดด snap ถูกล็อก ผลประทับใจนั้นสามารถรู้จักได้ทันที
เริ่มต้นด้วยการตั้งค่า DSP ในตารางฝึกหัดการแสดงสี่ครั้งและชั้นแบบจำลอง AI ที่ด้านบนหากต้องการความซื่อสัตย์สูงสุด VoxBooster จัดการการตั้งค่า Windows - การเส้นทาง WASAPI การนำเข้าแบบจำลองการอนุมาน sub-300 ms - โดยไม่ต้องมีพื้นหลังทางเทคนิก สิบพันล้านเปอร์เซ็นต์
FAQ
อะไรทำให้เสียงของเซนกุแตกต่างจากตัวละครเอกโดยทั่วไปของอนิเมะ เซนกุนั่งอยู่ใกล้กับระดับเสียงธรรมชาติของผู้ชายแต่ใช้การวางตำแหน่งฟอร์แมนต์ไปข้างหน้าที่แข็งแกร่งพยัญชนะที่ตัดขาดและการเร่งความเร็วจังหวะที่จงใจเมื่อตื่นเต้น การสั่นเสียงน้อยที่สุดการตั้งค่าอารมณ์พื้นฐานแบบตรงที่ลูกศรขึ้นบนเส้นตรง เป้าหมายการเลื่อน formant +5 ถึง +8% ระดับเสียงคงที่ใกล้ 0 semitone การบีบอัดสูง
ฉันจะสร้างการส่งเสียงเห่อหมกวุ่น ‘10 พันล้านเปอร์เซ็นต์’ ตามคำขอได้อย่างไร การกระโดดเป็นทั้งระดับเสียง (+2 ถึง +3 semitone สำหรับ 300-500 ms) และการเพิ่มระดับเสียง - ไม่ใช่เสียงสำเร็จรูปแต่เป็นการเพิ่มขึ้นแบบรวดเร็ว แบบฝึกหัดการเร่งความเร็วของวลีแยก: เริ่มต้นประโยคด้วยจังหวะปกติบีบอัดเงื่อนไขสุดท้ายลง 30% เพิ่มการกระโดดระดับเสียงเฉพาะคำนามที่สำคัญ การแปลงเสียง AI จัดการกับเฉดสี; การจับเวลาเป็นการแสดงแบบแท้ๆ
การใช้เสียงเซนกุที่โคลนด้วย AI สำหรับการโทร Discord หรือสตรีมมิ่งถูกกฎหมายหรือไม่ ความประทับใจเสียงของแฟนสำหรับสตรีมมิ่งไม่ใช่เชิงพาณิชย์เกมและบท Discord roleplay ครอบครองพื้นที่เดียวกับงานสร้างสรรค์แฟนแบบดั้งเดิม: แพร่หลายยอมรับและชัดเจนแตกต่างจากการละเมิดทางการค้าตราบเท่าที่เนื้อหามีข้อบ่งชี้อย่างชัดเจนว่าสร้างสรรค์โดยแฟน สำหรับผลิตภัณฑ์หรือบริการที่ให้มูลค่า โปรดปรึกษากับทนายความที่คุ้นเคยกับสิทธิ์ IP ของญี่ปุ่นและหลักคำว่า ยุติธรรมตามพื้นที่
ฉันควรฝึกอบรมแบบจำลอง AI เกี่ยวกับเสียงตัวแสดงสตรีมไหน การแสดงภาษาญี่ปุ่นของ Kobayashi มี sibilance ที่ดีกว่าจังหวะที่เร็วกว่าและการลัดเจาะสูงสุดที่มากขึ้นบนการกระโดดแบบเห่อหมก การท่อนเพลงภาษาอังกฤษของ Dismuke จะอบอุ่นกว่าและวัดผลได้มากขึ้น เพื่อการรู้จำตัวละครสูงสุดทั่วโลกให้ฝึกอบรม Kobayashi สำหรับชุมชนที่พูดภาษาอังกฤษเสียงของ Dismuke มักจะเข้าใจได้ทันที
ตัวแปลงเสียง Senku ทำงานได้โดยไม่มี GPU หรือไม่ โหมด DSP เท่านั้น - การเปลี่ยน pitch และการจัดการ formant - ทำงานบน CPU สมัยใหม่ใด ๆ ที่มีเวลาในการประมวลผลต่ำกว่า 30 ms การอนุมานการโคลนเสียง AI มีน้ำหนักมากขึ้น: GPU ที่ทุ่มเท (GTX 1060 หรือดีกว่า) ทำให้เวลาในการประมวลผลต่ำกว่า 300 ms; CPU เพียงอย่างเดียวเพิ่มเติม 500-800 ms CPU เพียงอย่างเดียวสามารถทำได้ด้วยระเบียบวินัยแบบพุชทูทอก กราฟิกที่บูรณาการไม่ได้เร่งการอนุมานอย่างมีความหมาย
ฉันต้องมีเสียงสะอาดเท่าใดเพื่อฝึกอบรมแบบจำลองเสียง Senku AI แบบกำหนดเอง คุณภาพที่ใช้ได้เริ่มต้นที่ 10-15 นาทีของบทสนทนาที่สะอาดและแยกออกมา - ไม่มีเพลงบ้านและไม่มีเอฟเฟกต์ของเสียง สำหรับแบบจำลองที่ยืดหยุ่นที่ครอบคลุมเสียงพูดประเภทและการกระโดดแบบเห่อหมกให้เล็งที่ 25-30 นาทีในสภาวะการรู้สึกที่หลากหลาย การดึงข้อมูล YouTube มีเสียงผสม ใช้แหล่งเสียงที่แยกฉากหากมีหรือใช้การประมวลผลก่อนการแยกระบบสแต็นโดยเฉพาะ
ฉันสามารถใช้ตัวแปลงเสียง Senku ในเกมการแข่งขันโดยไม่ทำให้เกิด anti-cheat ได้หรือไม่ ใช่ โดยให้ซอฟต์แวร์ใช้การกำหนดเส้นทางเสียง WASAPI แทนไดรเวอร์เคอร์เนล เครื่องมือเสียงระดับเคอร์เนลอาจขัดแย้งกับ EAC BattlEye และ Riot Vanguard VoxBooster เส้นทางโดยสมบูรณ์ผ่าน API WASAPI Windows ที่ไม่มีการเข้าถึงเคอร์เนล ดังนั้นจึงอาศัยอยู่ร่วมกันอย่างปลอดภัยด้วยระบบ anti-cheat ในหัวข้อทั้งหมดที่ทดสอบ