คำแนะนำผลประทับใจเสียง Senku Ishigami: คำแนะนำที่สมบูรณ์

ผลประทับใจเสียง Senku Ishigami เป็นเสียงอนิเมะที่น่าพอใจที่สุดในการทำให้เชี่ยวชาญ - และเป็นหนึ่งในเสียงที่มีเทคนิคมากที่สุด เซนกุ นักวิทยาศาสตรองค์ที่มีจำนวนผู้นำ Dr. Stone พูดด้วยความเชื่อมั่นที่ตัดขาดและวางตำแหน่งไปข้างหน้าซึ่งดูเหมือนว่าแตกต่างไปจากความอบอุ่นตามแบบของผู้นำ shonen ทั่วไป คำแนะนำนี้ครอบคลุมทั้งหมด: กายวิภาคเสียงของเสียงการตั้งค่า DSP สำหรับการแปลงแบบเรียลไทม์แบบฝึกหัดการฝึกอบรมสำหรับการแสดงสดและขั้นตอนการโคลนเสียง AI เพื่อความซื่อสัตย์สูงสุด - ทั้งหมดทำงานบน Windows ไม่มีไดรเวอร์เคอร์เนล ใช้ได้ใน Discord OBS หรือเกมใด ๆ

TL;DR

เสียง Senku นั่งใกล้กับระดับเสียงธรรมชาติของผู้ชายแต่ได้คุณสมบัติของเขาจากการวางตำแหน่งฟอร์แมนต์ไปข้างหน้าที่แข็งแกร่งพยัญชนะที่ตัดขาดและการเร่งจังหวะ - ไม่ใช่จากการเปลี่ยน pitch ที่น่าประทับใจ
การกระโดดขึ้น ‘พันล้านเปอร์เซ็นต์’ เป็นการกระโดด +2 ถึง +3 semitone สั้นๆ รวมกับการเพิ่มระดับเสียงอย่างรวดเร็วไม่ใช่เสียงสำเร็จรูปที่ยาว
ท่อนเพลงญี่ปุ่น (Yusuke Kobayashi): ระบาย sibilance ที่ตาราญั่น จังหวะที่เร็วกว่าการลัดเจาะที่รุนแรง ท่อนเพลงภาษาอังกฤษ (Aaron Dismuke): ทำให้ขึ้นน้อย
DSP เพียงอย่างเดียว ได้คุณ 70% ของวิธี; การโคลนเสียง AI ปิดช่องว่างเพื่อให้สามารถเลือก shade หรือการแสดงแบบดับ
VoxBooster จัดการไปป์ไลน์แบบเต็มบน Windows ด้วยเวลาในการประมวลผล sub-300 มิลลิวินาที และการกำหนดเส้นทาง WASAPI - ไม่มีไดรเวอร์เคอร์เนล ปลอดภัยต่อต้านการโกง
การใช้แฟนสำหรับ Discord สตรีมมิ่ง และเกมเป็นบรรทัดฐานที่ก่อตั้งขึ้น; ป้ายชื่อเนื้อหาของคุณอย่างชัดเจนและหลีกเลี่ยงการใช้ทางพาณิชย์

Senku Ishigami คือใครและเหตุใดเสียงของเขาจึงโดดเด่น?

Senku Ishigami เป็นตัวละครหลักของ Dr. Stone ซีรีส์แมนงาโดย Riichiro Inagaki และ Boichi ปรับตัวเป็นอนิเมะโดย TMS Entertainment Senku เป็นอัจฉริยะนักวิทยาศาสตรวัยรุ่นที่รอดชีวิตจากเหตุการณ์ petrification ทั่วโลกที่ลึกลับและทุ่มเทตัวเองให้สร้างอารยธรรมใหม่ตั้งแต่ต้น - ผ่านวิทยาศาสตร์ที่สิบพันล้านเปอร์เซ็นต์

เสียงของเขาสะท้อนให้เห็นถึงตัวละครของเขาด้วยความแม่นยำที่ผิดปกติ ไม่เหมือนความตั้งใจตาโตของผู้นำ shonen ทั่วไป Senku ฟังเหมือนคนที่แก้ไขปัญหาแล้วก่อนที่เขาจะเริ่มอธิบายให้คุณฟัง การแสดงของเขาคือการมั่นใจจนถึงเหตุร้าย รวดเร็วมักจะขัดขวางด้วยความกระตุ้นของเขาเองและจุดสูงสุดด้วยการกระโดดแบบเห่อหมกนั้นเมื่อสมมติฐานถูกยืนยัน

ในเชิงอะคูสติกสิ่งนี้สร้างความท้าทายเฉพาะ: เสียงของเขาไม่ได้กำหนดโดยการจัดการ pitch ที่รุนแรง Senku ไม่ใช่เสียงกระรอก ไม่ใช่วิลเลนที่กำลังหมดอำนาจ ไม่ใช่ไอดอล androgynous เขาครอบครองสเปกตรัมผู้ชายปกติและบรรลุความเป็นเอกลักษณ์ผ่าน รูปแบบการออกเสียงและการวางตำแหน่งฟอร์แมนต์ - ซึ่งทำให้ยากต่อการจำลองด้วยเครื่องมือ pitch slider อย่างง่ายแต่สามารถจำลองได้ดีมากเมื่อคุณเข้าใจพารามิเตอร์

การแสดงสองแบบตามพระราชกฤษฎีกา

Yusuke Kobayashi — Dub ญี่ปุ่น

การแสดงโดยใช้ภาษาญี่ปุ่นของ Kobayashi นั้นเป็นต้นฉบับและวิเคราะห์มากที่สุดโดยชุมชนศิลปะการพูด Senku ของเขามี sibilance ที่คมชัดและเกือบเป็นการบ้านบนเสียง ‘s’ การเร่งความเร็วจังหวะที่จงใจในระหว่างคำอธิบายเทคนิคและการลัดเจาะเสียงที่พูดถึงข้อ จำกัด สูง บนพยัญชนะสำคัญก่อนคืนฟุตไลน์ สเตตหลังไม่เปลี่ยนแปลงตลอดเวลา - ซึ่งทำให้การกระโดดเป็นตัวอักษรที่มีประสิทธิผลตามความเปรียบต่าง สำหรับการมองเป้าหมาย DSP, Senku ของ Kobayashi นั่งใกล้กับระดับเสียงธรรมชาติของผู้ชาย (ปรับสัมสวน 0 semitone ใกล้เคียง) มีการเลื่อน formant ในช่วง +6 ถึง +9% ซึ่งสร้างคุณภาพไปข้างหน้าเล็กน้อยและสว่างโดยไม่ต้องเข้าไปในดินแดนระดับเสียงสูง

Aaron Dismuke — Dub อังกฤษ

การนำเสนอท่อนเพลงภาษาอังกฤษของ Dismuke จะอบอุ่นกว่านิดในเฉดสีและค่อนข้างวัดได้มากขึ้นในการเดิน การกระโดดแบบเห่อหมกมีอยู่แต่น้อยลง; สเตตโดยรวมรู้สึกว่าเต็มไปด้วยมากขึ้นเล็กน้อย ชุมชน Discord ที่พูดภาษาอังกฤษมักจะพบว่าเวอร์ชันนี้สามารถอ่านได้ทันที ‘Senku’ เพราะการเดินก่อคู่กับโครงสร้างประโยคอังกฤษได้ดีขึ้น

สำหรับ DSP สเตต Dismuke ต้องการการเลื่อน formant น้อยกว่าเล็กน้อย (+4 ถึง +6%) และฟุตไลน์ pitch ประมาณเดียวกัน หากคุณแสดงสำหรับผู้ชมที่พูดภาษาอังกฤษการปรับแต่งนี้จะอ่านได้ธรรมชาติมากขึ้น

วิภาวะอะคูสติก: สิ่งที่กำหนดเสียง Senku

การแยกเสียงของเขาออกเป็นองค์ประกอบทำให้มันสามารถจำลองได้ทั้งในการแสดงสดและการกำหนดค่า DSP

การวางตำแหน่งฟอร์แมนต์

ลักษณะเฉพาะที่แตกต่างมากที่สุด เสียง Senku นั่งไปข้างหน้าในปาก - การเรโซแนนซ์ไม่อยู่ในหน้าอกหรือคอ แต่นำไปสู่ส่วนหน้าของโพรงปาก สร้างคุณภาพสว่างและเบาะว่านโดยไม่ต้องเป็นจริงๆ การวางตำแหน่งไปข้างหน้านี้คือสิ่งที่ให้เสียงคุณภาพ ‘ผู้อัจฉริยะคม’ ในแง่ DSP: การเลื่อน formant +5 ถึง +9% ไม่มีการเพิ่มประสิทธิ์ resonance หน้าอก

ฟุตไลน์ Pitch และการกระโดดแบบเห่อหมก

ระยะเสียงพื้นฐานอยู่ใกล้กับระดับเสียงพูดธรรมชาติของผู้ชาย - นี่เป็นเรื่องที่ขัดแย้งกับสัญชาติญาณสำหรับผลประทับใจเสียงอนิเมะซึ่งคนส่วนใหญ่คาดว่าการปรับเปลี่ยน pitch ขนาดใหญ่ Senku เดินออกมาจากการกระโดด: การกระโดด +2 ถึง +3 semitone ที่รวดเร็วดำเนินการ 300-500 มิลลิวินาที จับคู่กับการเพิ่มขึ้นของระดับเสียงในช่วงเวลาเพื่อการค้นพบสำคัญหรือวลี ‘สิบพันล้านเปอร์เซ็นต์’ การกระโดดควรสั้นและกลับไปยังฟุตไลน์ทันที - ระดับเสียงสูงอย่างต่อเนื่องฟังผิดสำหรับตัวละครนี้

การเร่งความเร็วจังหวะ

เมื่อ Senku อธิบายบางสิ่งทางวิทยาศาสตร์พูดของเขาบีบอัด: ช่วงกลางของประโยคความเร็ว พยัญชนะเป็นเกล็ดมากขึ้นและคำหรือวลีสุดท้ายจอดลงด้วยน้ำหนักที่จงใจ ฝึกฝนสิ่งนี้โดยการใช้ประโยคทางเทคนิคใด ๆ และสติหรือบีบอัดคำสั่งสุดท้ายในขณะที่แข็งพยัญชนะสุดท้ายของคุณ

Vibrato ขั้นต่ำการบีบอัดสูงสุด

Senku แทบจะไม่เคยใช้ความอบอุ่นของเสียงหรือการสั่นของเสียงอารมณ์ ช่วงอารมณ์ของเขาแสดงผ่านการเดินและการกระโดดไม่ใช่ผ่านความนุ่มหรือความเสี่ยง ในแง่การประมวลผล: reverb ขั้นต่ำอัตราส่วนการบีบอัดสูงไม่มี wobble pitch correction

การตั้งค่า DSP สำหรับการแปลงเสียง Senku เรียลไทม์

นี่คือจุดเริ่มต้น - เสียงของคุณจะต้องปรับตามระดับเสียงและเฉดสีของคุณ

พารามิเตอร์	การตั้งค่า Kobayashi	การตั้งค่า Dismuke	บันทึก
การเลื่อน pitch	0 ถึง +1 st	0 ถึง +1 st	ฟุตไลน์ใกล้ผู้ชายธรรมชาติ
การเลื่อน Formant	+6 ถึง +9%	+4 ถึง +6%	การวางตำแหน่งสว่างไปข้างหน้า
อัตราส่วนคอมเพรสเซอร์	4:1	3:1	ช่วงไดนามิกคลิปเพิ่มสแน็ป
การโจมตี Compressor	5 ms	8 ms	การโจมตีที่เร็วจับพยัญชนะ
EQ 200-400 Hz	-3 dB	-2 dB	ลดเสียงสั่น chest
EQ 2-5 kHz	+3 dB	+2 dB	เพิ่มความชัดเจนของการออกเสียง
Reverb เปียก	5%	8%	เกือบแห้งสำหรับความชัดเจนของห้องแล็บ
เกณฑ์ประตูเสียง	-40 dB	-40 dB	ขจัดเสียงลมหายใจระหว่างการปล่อย

การกระโดดแบบเห่อหมกเป็นองค์ประกอบการแสดงสด - ยกระดับเสียง pitch ของคุณ 2-3 semitone แบบเรียลไทม์โดยใช้ keybind หรือแป้นการแสดงออกหากซอฟต์แวร์ของคุณรองรับ โหมดการแปลงเสียง AI จัดการการเปลี่ยนแปลง shade; คุณให้พลวัต

แบบฝึกหัดการแสดงสด

DSP ให้คุณ chain processing ที่ถูกต้อง แบบฝึกหัดการแสดงสร้างอนุภาคของกล้ามเนื้อสำหรับรูปแบบการแสดง

แบบฝึกหัด 1: บรรทัดฐาน Consonant ที่ตัดขาด

อ่านย่อหน้าทางเทคนิคใด ๆ โดยใช้เสียงดัง โฟกัสบนการทำให้พยัญชนะสุดท้ายในทุกคำได้ยินและเล็กน้อยปีกไก่ - ‘แนวคิด’ ลงท้ายด้วย ‘t’ ที่ตัดขาด ‘อย่างแม่นยำ’ ลงท้ายด้วย ‘ee’ ที่ตัดขาดสะอาด แม้แต่อย่างเดียวนี้เลื่อนไหล่เสียงไปยังรูปแบบ Senku อย่างมีนัยสำคัญ

แบบฝึกหัด 2: การบีบอัดประโยค

ใช้ประโยคที่มีสองเงื่อนไข พูดอนุประโยคแรกด้วยความเร็วปกติ พูดอนุประโยคที่สองร้อยละ 20 เร็วกว่า สิ้นสุดประโยคด้วยน้ำหนักที่ตั้งใจและหนักกว่าในคำสุดท้าย ทำซ้ำด้วยร้อยละ 30 จากนั้นร้อยละ 40 การบีบอัดในอนุประโยคสุดท้าย

แบบฝึกหัด 3: การกระโดดและสแน็ป

แบบฝึกหัดการกระโดดแบบเห่อหมกแยกต่างหาก พูด ‘สิบพันล้านเปอร์เซ็นต์’ ด้วยความเร็วปกติ บน ‘พันล้าน’ ดันระดับเสียง pitch ของคุณสูงขึ้นสองแป้นและเพิ่มระดับเสียงประมาณ 6 dB จากนั้นกลับไปที่ฟุตไลน์ทันทีสำหรับ ‘เปอร์เซ็นต์’ ระยะเวลาการกระโดดควรต่ำกว่า 30 วินาที รูปแบบนี้ย้อนกลับไปยังวลีเทียบเท่าใด ๆ ในศัพท์ Senku

แบบฝึกหัด 4: บรรทัดฐานอารมณ์

บันทึกตัวเองเล่านิทานบางสิ่ง - เล่นกีฬาสูตรอะไรก็ได้ ฟังกลับมาและระบุทุกช่วงเวลาที่เสียงของคุณเพิ่มความอบอุ่นการผ่อนคลายหรือความเสี่ยงเป็นธรรมชาติ นั่นเป็นช่วงเวลาที่ Senku จะไม่เพิ่ม ฝึกฝนการอ่านข้อความเดียวกันด้วยบรรทัดฐานอารมณ์ที่คงที่เพื่อให้เฉพาะช่วงเวลาการกระโดดเจาะทะลุ

ขั้นตอนการโคลนเสียง AI

เมื่อการแสดงสดบวก DSP ไม่พอ - หรือเมื่อคุณต้องเรียกใช้เสียง Senku ในบริบทที่คุณไม่สามารถแสดงสดได้ - การโคลนเสียง AI กรรมการช่องว่าง

ขั้นตอน 1: สร้างชุดข้อมูลการฝึกอบรมของคุณ

บทสนทนา Senku สะอาดและแยกแหล่ง หลีกเลี่ยงฉากที่มีเพลงบ้านหรือเอฟเฟกต์เสียงดัง แหล่งที่ดีรวมถึงฉากห้องแล็บแบบเงียบฉากโมโนโลก และคลิปปฏิกิริยาตัวละครเท่านั้น เล็งที่ 20-30 นาทีของเสียงสะอาดผ่านสภาวะอารมณ์ต่างๆ - คำอธิบายเงียบการกระโดดการค้นพบแบบเห่อหมกการปฏิเสธจริงจัง

ใช้การประมวลผลก่อนแยกระบบสแต็นกับคลิปใด ๆ ที่มีเสียงผสม ขั้นตอนนี้ควรได้รับการใช้เวลา: ข้อมูลการฝึกอบรมที่มีเสียงเนื้อหาสิ่งแนบที่สามารถได้ยินในเอาต์พุตแบบจำลองที่ยากต่อการแก้ไขในภายหลัง

ขั้นตอน 2: ฝึกอบรมหรือนำเข้าแบบจำลองที่ฝึกอบรมไว้ล่วงหน้า

หากแบบจำลองที่ฝึกอบรมชุมชนมีอยู่แล้วในการจัดเก็บเช่น weights.gg หรือสิ่งที่เหมือนกัน ประเมินคุณภาพก่อนการฝึกอบรมตั้งแต่ต้น - แบบจำลองที่ฝึกอบรมมาก่อนที่ดีจะประหยัดชั่วโมงของการทำงาน ตรวจสอบคุณภาพ: เรียกใช้วลี 10-15 หลัก ผ่านแบบจำลองนั้นและเปรียบเทียบกับการแสดงแหล่ง เพื่อให้ได้ความถูกต้องของ formant การสร้างการกระโดดใหม่และการไม่มีสิ่งแนบโลหะ

หากการฝึกอบรมตั้งแต่ต้น ให้ใช้การประมวลผลการแปลงเสียง AI มาตรฐาน เวลาการฝึกอบรมแตกต่างกันอย่างมาก โดยอยู่ที่ฮาร์ดแวร์

ขั้นตอน 3: กำหนดค่า VoxBooster สำหรับการอนุมานแบบเรียลไทม์

นำเข้าแบบจำลองที่ฝึกอบรมไปยังโมดูลการแปลงเสียง AI ของ VoxBooster VoxBooster รองรับการนำเข้าแบบจำลองดั้งเดิมบน Windows 10/11 โดยไม่ต้องมีสภาพแวดล้อม Python แยกต่างหากหรือการตั้งค่าบรรทัดคำสั่ง ตั้งค่าเป้าหมายการหน่วงเวลาเป็นค่าที่เสถียรต่ำสุดที่ CPU/GPU ของคุณบรรลุ - บน GPU ระดับกลาง sub-300 ms อาจบรรลุได้อย่างสม่ำเสมอ

เส้นทางอุปกรณ์เสียงเสมือน VoxBooster เป็นอินพุตไมโครโฟนของคุณใน Discord หรือ OBS VoxBooster ใช้ WASAPI สำหรับการแทรกเสียง - ไม่มีไดรเวอร์เคอร์เนล - ซึ่งหมายความว่ามันทำงานร่วมกับซอฟต์แวร์ anti-cheat ในเกมการแข่งขันโดยไม่มีความขัดแย้ง

ขั้นตอน 4: ชั้น DSP บนการแปลงเสียง AI

การโคลนเสียง AI จัดการเฉดสี ชั้นการตั้งค่า DSP จากตารางข้างต้นบนเอาต์พุตที่แปลงแล้วสำหรับ formant และลักษณะการบีบอัดที่กำหนดรูปแบบการแสดง Senku การรวมกัน - เฉดสี AI บวกกับการออกเสียง DSP - เป็นที่ที่ผลประทับใจกลายเป็นเชื่อมั่นไปยังผู้ฟังที่รู้จักต้นฉบับ

Discord OBS และการตั้งค่าเกม

Discord

ในการตั้งค่าเสียง Discord ให้ตั้งค่าอุปกรณ์อินพุตเป็นไมโครโฟนเสมือน VoxBooster เปิดใช้งานการบีบอัดเสียงรบกวนปิด (ช่วงการประมวลผลจัดการสิ่งนี้ภายใน) ทดสอบด้วยการบันทึกสั้น ๆ ในช่องเสียงใด ๆ ก่อนไปออนไลน์

OBS

เพิ่มแหล่งที่มาจากการจับเสียงอินพุตโดยใช้อุปกรณ์เสมือน VoxBooster หากคุณสตรีมมิ่งและต้องการบันทึกเสียงดิบของคุณแยกต่างหากสำหรับการประมวลผลหลัง ให้เพิ่มเสียงแบบฟ้องร้อง 2 ด้วยไมโครโฟนทางกายภาพของคุณก่อนการประมวลผลใด ๆ

เกมแข่งขัน

เลือกไมโครโฟนเสมือน VoxBooster ในการตั้งค่าเสียงของเกมในลักษณะเดียวกับที่คุณจะใช้ไมโครโฟนใด ๆ เพราะ VoxBooster เส้นทางผ่าน WASAPI แทนไดรเวอร์เคอร์เนลจึงไม่มีความขัดแย้งกับ EAC BattlEye หรือระบบที่คล้ายกัน นี่คือข้อดีในทางปฏิบัติอย่างหนึ่งของการกำหนดเส้นทาง WASAPI มากกว่าวิธีการแทรกที่เก่ากว่า

การเปรียบเทียบ: DSP-Only vs โคลนเสียง AI vs การแสดงสด

วิธี	เวลาการตั้งค่า	ความสอดคล้องของเฉดสี	การหน่วงเวลา	ข้อกำหนดฮาร์ดแวร์
การแสดงสดเท่านั้น	0 นาที	ขึ้นอยู่กับทักษะ	0 ms	ไมโครโฟนเท่านั้น
การประมวลผล DSP เท่านั้น	5-15 นาที	60-70%	<30 ms	CPU ใด ๆ
โคลนเสียง AI (GPU)	30-120 นาที	85-95%	<300 ms	GTX 1060+
โคลนเสียง AI (CPU เท่านั้น)	30-120 นาที	85-95%	500-800 ms	CPU สมัยใหม่
DSP + AI รวมกัน	30-120 นาที	90-97%	<300 ms (GPU)	GTX 1060+

สำหรับการโทร Discord สดหรือการเล่นเกม DSP เท่านั้นคือจุดเข้าระดับแรงเสียดทาน หากคุณมีฮาร์ดแวร์และแบบจำลองที่ดี วิธีการรวมกันคือเพดาน

แนวทางด้านจริยธรรมและเนื้อหาแฟน

ตัวละคร Senku และ IP Dr. Stone เป็นเจ้าของสิทธิ์โดยผู้ถือแต่ละคนพร้อมกับการปรับตัวแบบอนิเมะที่ผลิตโดย TMS Entertainment ความประทับใจเสียงแฟนสำหรับการใช้งานส่วนตัว - สตรีมมิ่งเกมและบท Discord roleplay - ครอบครองพื้นที่เดียวกับงานสร้างสรรค์แฟนทั้งหมด: แพร่หลายยอมรับและชัดเจนแตกต่างจากการละเมิดทางการค้าตราบเท่าที่เนื้อหามีข้อบ่งชี้ชัดเจนว่าเป็น fan-created

แนวทางเชิงปฏิบัติ:

ป้ายชื่อเนื้อหาเป็น ‘ผลประทับใจแฟน’ หรือ ‘ผลประทับใจเสียง’ - ไม่ใช่เป็นวัสดุ ที่ได้รับอนุญาต ของ ระบบ
อย่าใช้ผลประทับใจในการสร้างรายได้จากผลิตภัณฑ์หรือบริการที่มีแบรนด์ Senku
อย่าใช้เสียงที่โคลนมาปลอมตัวเป็นนักแสดงเสียง (Kobayashi หรือ Dismuke) ตามส่วนตัว
สำหรับโครงการทั่วโลกใด ๆ โปรดปรึกษากับทนายความที่คุ้นเคยกับ IP ญี่ปุ่นและหลักคำว่า ยุติธรรมตามพื้นที่ก่อนการเผยแพร่

พื้นที่สีเทาสร้างขึ้นในวัฒนธรรมแฟนอนิเมะ บรรทัดฐานแฟนวิธีการนั้นใช้ที่นี่

ทรัพยากรภายใน

กำลังมองหาการสร้างชุดเครื่องมือการพูดอนิเมะที่กว้างขึ้น คำแนะนำตัวละครอื่น ๆ ในซีรีส์นี้:

คำแนะนำตัวแปลงเสียงอนิเมะ - ภาพรวมของเทคนิคในประเภทตัวละครต่างๆ
ตัวแปลงเสียง Deku - ผู้นำ shonen ที่มีความจริงใจซึ่งเป็นโปรไฟล์ที่ขัดแย้งกับ Senku
การตั้งค่าตัวแปลงเสียงลึก - สำหรับตัวละครวิลเลนและต่อต้าน
พื้นฐานตัวแปลงเสียง AI - มูลนิธิเทคนิคสำหรับการทำงานการโคลน
การตั้งค่าตัวเปลี่ยนเสียง Discord - การอ้างอิงการเส้นทางและการกำหนดค่า

บทสรุป

ความประทับใจเสียง Senku Ishigami ให้รางวัลการลงทุน เสียงของตัวละครมีรายละเอียดเพียงพอที่ความพยายามเล็กน้อยอ่านเป็นเสียงอนิเมะทั่วไป - แต่เมื่อการวางตำแหน่ง formant ไปข้างหน้ารูปแบบพยัญชนะที่ตัดขาดและพลวัตการกระโดด snap ถูกล็อก ผลประทับใจนั้นสามารถรู้จักได้ทันที

เริ่มต้นด้วยการตั้งค่า DSP ในตารางฝึกหัดการแสดงสี่ครั้งและชั้นแบบจำลอง AI ที่ด้านบนหากต้องการความซื่อสัตย์สูงสุด VoxBooster จัดการการตั้งค่า Windows - การเส้นทาง WASAPI การนำเข้าแบบจำลองการอนุมาน sub-300 ms - โดยไม่ต้องมีพื้นหลังทางเทคนิก สิบพันล้านเปอร์เซ็นต์

FAQ

อะไรทำให้เสียงของเซนกุแตกต่างจากตัวละครเอกโดยทั่วไปของอนิเมะ เซนกุนั่งอยู่ใกล้กับระดับเสียงธรรมชาติของผู้ชายแต่ใช้การวางตำแหน่งฟอร์แมนต์ไปข้างหน้าที่แข็งแกร่งพยัญชนะที่ตัดขาดและการเร่งความเร็วจังหวะที่จงใจเมื่อตื่นเต้น การสั่นเสียงน้อยที่สุดการตั้งค่าอารมณ์พื้นฐานแบบตรงที่ลูกศรขึ้นบนเส้นตรง เป้าหมายการเลื่อน formant +5 ถึง +8% ระดับเสียงคงที่ใกล้ 0 semitone การบีบอัดสูง

ฉันจะสร้างการส่งเสียงเห่อหมกวุ่น ‘10 พันล้านเปอร์เซ็นต์’ ตามคำขอได้อย่างไร การกระโดดเป็นทั้งระดับเสียง (+2 ถึง +3 semitone สำหรับ 300-500 ms) และการเพิ่มระดับเสียง - ไม่ใช่เสียงสำเร็จรูปแต่เป็นการเพิ่มขึ้นแบบรวดเร็ว แบบฝึกหัดการเร่งความเร็วของวลีแยก: เริ่มต้นประโยคด้วยจังหวะปกติบีบอัดเงื่อนไขสุดท้ายลง 30% เพิ่มการกระโดดระดับเสียงเฉพาะคำนามที่สำคัญ การแปลงเสียง AI จัดการกับเฉดสี; การจับเวลาเป็นการแสดงแบบแท้ๆ

การใช้เสียงเซนกุที่โคลนด้วย AI สำหรับการโทร Discord หรือสตรีมมิ่งถูกกฎหมายหรือไม่ ความประทับใจเสียงของแฟนสำหรับสตรีมมิ่งไม่ใช่เชิงพาณิชย์เกมและบท Discord roleplay ครอบครองพื้นที่เดียวกับงานสร้างสรรค์แฟนแบบดั้งเดิม: แพร่หลายยอมรับและชัดเจนแตกต่างจากการละเมิดทางการค้าตราบเท่าที่เนื้อหามีข้อบ่งชี้อย่างชัดเจนว่าสร้างสรรค์โดยแฟน สำหรับผลิตภัณฑ์หรือบริการที่ให้มูลค่า โปรดปรึกษากับทนายความที่คุ้นเคยกับสิทธิ์ IP ของญี่ปุ่นและหลักคำว่า ยุติธรรมตามพื้นที่

ฉันควรฝึกอบรมแบบจำลอง AI เกี่ยวกับเสียงตัวแสดงสตรีมไหน การแสดงภาษาญี่ปุ่นของ Kobayashi มี sibilance ที่ดีกว่าจังหวะที่เร็วกว่าและการลัดเจาะสูงสุดที่มากขึ้นบนการกระโดดแบบเห่อหมก การท่อนเพลงภาษาอังกฤษของ Dismuke จะอบอุ่นกว่าและวัดผลได้มากขึ้น เพื่อการรู้จำตัวละครสูงสุดทั่วโลกให้ฝึกอบรม Kobayashi สำหรับชุมชนที่พูดภาษาอังกฤษเสียงของ Dismuke มักจะเข้าใจได้ทันที

ตัวแปลงเสียง Senku ทำงานได้โดยไม่มี GPU หรือไม่ โหมด DSP เท่านั้น - การเปลี่ยน pitch และการจัดการ formant - ทำงานบน CPU สมัยใหม่ใด ๆ ที่มีเวลาในการประมวลผลต่ำกว่า 30 ms การอนุมานการโคลนเสียง AI มีน้ำหนักมากขึ้น: GPU ที่ทุ่มเท (GTX 1060 หรือดีกว่า) ทำให้เวลาในการประมวลผลต่ำกว่า 300 ms; CPU เพียงอย่างเดียวเพิ่มเติม 500-800 ms CPU เพียงอย่างเดียวสามารถทำได้ด้วยระเบียบวินัยแบบพุชทูทอก กราฟิกที่บูรณาการไม่ได้เร่งการอนุมานอย่างมีความหมาย

ฉันต้องมีเสียงสะอาดเท่าใดเพื่อฝึกอบรมแบบจำลองเสียง Senku AI แบบกำหนดเอง คุณภาพที่ใช้ได้เริ่มต้นที่ 10-15 นาทีของบทสนทนาที่สะอาดและแยกออกมา - ไม่มีเพลงบ้านและไม่มีเอฟเฟกต์ของเสียง สำหรับแบบจำลองที่ยืดหยุ่นที่ครอบคลุมเสียงพูดประเภทและการกระโดดแบบเห่อหมกให้เล็งที่ 25-30 นาทีในสภาวะการรู้สึกที่หลากหลาย การดึงข้อมูล YouTube มีเสียงผสม ใช้แหล่งเสียงที่แยกฉากหากมีหรือใช้การประมวลผลก่อนการแยกระบบสแต็นโดยเฉพาะ

ฉันสามารถใช้ตัวแปลงเสียง Senku ในเกมการแข่งขันโดยไม่ทำให้เกิด anti-cheat ได้หรือไม่ ใช่ โดยให้ซอฟต์แวร์ใช้การกำหนดเส้นทางเสียง WASAPI แทนไดรเวอร์เคอร์เนล เครื่องมือเสียงระดับเคอร์เนลอาจขัดแย้งกับ EAC BattlEye และ Riot Vanguard VoxBooster เส้นทางโดยสมบูรณ์ผ่าน API WASAPI Windows ที่ไม่มีการเข้าถึงเคอร์เนล ดังนั้นจึงอาศัยอยู่ร่วมกันอย่างปลอดภัยด้วยระบบ anti-cheat ในหัวข้อทั้งหมดที่ทดสอบ