ตัวสร้างเสียง AI สำหรับประกาศชั้นลิฟต์
เสียง AI ลิฟต์ได้ย้ายจากส่วนเสริมฮาร์ดแวร์เฉพาะด้านไปเป็นเครื่องมือการผลิตที่ใช้ได้จริงสำหรับผู้จัดการสถานที่, เครือโรงแรม และที่ปรึกษาเรื่องการเข้าถึง ไม่ว่าคุณจะต้องการ “ชั้น 3 - การตลาด”, “ประตูปิด” หรือชุดประกาศหลายภาษาแบบสมบูรณ์สำหรับหอคอย 40 ชั้น ตัวสร้างเสียง AI ตอนนี้สร้าง WAV คลิปคุณภาพเสียงสตูดิโอในเวลาเพียงไม่กี่นาที ไม่ต้องจองสตูดิโอบันทึกเสียงหรือจ่ายค่าปรับปรุงแบบต่อรายสำหรับนักพูดเสียงที่ว่าจ้าง คู่มือนี้ครอบคลุมวิธีการทำงานของเทคโนโลยี สิ่งที่ระบบ KONE, Otis และ Mitsubishi ต้องการจริง ๆ วิธีการสร้างสคริปต์สำหรับการปฏิบัติตาม ADA และวิธีที่แบรนด์โรงแรมใช้มันเพื่อรวมตัวตนเสียงแบรนด์ทั่วหลายร้อยทรัพย์สิน”
TL;DR
- ตัวสร้างเสียงชั้นลิฟต์ผลิตประกาศที่พูดออกมาภายในห้องโดยสารลิฟต์ – หมายเลขชั้น, เสียงทิศทาง, การเตือนสถานะประตู
- ส่วน 4.10.13 ของ ADA และ EN 81-70 (ยุโรป) กำหนดตัวบ่งชี้ชั้นที่ได้ยิน; การสร้างเสียง AI เป็นวิธีที่ประหยัดที่สุดในการปฏิบัติตาม
- ระบบลิฟต์ KONE, Otis และ Mitsubishi ยอมรับ mono WAV ที่ 8-48 kHz ขึ้นอยู่กับรุ่นควบคุม ตรวจสอบเสมอก่อนการผลิต
- โปรไฟล์เสียง AI เดียวสามารถสร้างสคริปต์ชั้นทุกชั้นในอาคาร จากนั้นจึงขยายไปยังแต่ละทรัพย์สินในเครือโรงแรม
- อาคารหลายภาษาต้องการงาน batch หนึ่งรายต่อภาษา ไม่ใช่เซสชันบันทึกหนึ่งรายต่อภาษา
- เอนจิน AI voice ของ VoxBooster จัดการการผลิตเสียงสำหรับ PA และเวิร์กโฟลว์ประกาศบน Windows ด้วยการโคลนเสียงแบบกำหนดเองเพื่อความสม่ำเสมอของแบรนด์
ประกาศชั้นลิฟต์เสียง AI คืออะไร
เสียง AI ลิฟต์หมายถึงระบบสังเคราะห์เสียงที่วางมาตรฐานซึ่งเรียกชั้น ทิศทาง และสถานะประตูภายในห้องโดยสารลิฟต์ วลี “elevator voice AI” ครอบคลุมทั้งไฟล์ WAV ที่บันทึกไว้ก่อนหน้านี้ที่โหลดลงบนบอร์ดควบคุมและแนวทางที่ใหม่กว่าในการสร้างไฟล์เหล่านั้นจากเอนจิน text-to-speech ประสาท
ชุดประกาศหลักสำหรับอาคารใด ๆ โดยทั่วไปรวมถึง:
- หมายเลขชั้น: “ชั้น 1”, “ชั้น 2”, “ล็อบบี้”, “ชั้นใต้ดิน 1”
- เสียงทิศทาง: “ขึ้น”, “ลง”
- สถานะประตู: “ประตูเปิด”, “ประตูปิด”
- ป้ายชั้นแบบกำหนดเอง: “ชั้น 14 – ห้องอักษร”, “ชั้น 6 – ศูนย์การประชุม”, “เพนท์เฮาส์”
- ข้อความเตือนภัย: “กรุณากดปุ่มปิดประตู”, “ความจุสูงสุดถึง”, “ฉุกเฉิน – กรุณากดปุ่มปิด”
ในอาคารสำนักงาน 20 ชั้นที่มีเสียงทิศทางและชั้นที่มีชื่อ คุณกำลังมองหา 60-80 คลิปเสียงแต่ละรายการ การจัดการโดยใช้นักพูดเสียงที่ว่าจ้างและการบันทึกใหม่ทุกครั้งที่ชื่อชั้นเปลี่ยน มีค่าใช้จ่าย การสร้างเสียง AI ทำให้ชุดทั้งหมดเป็นงานวันเดียว
การปฏิบัติตาม ADA: สิ่งที่กฎหมายต้องการจริง ๆ
ส่วน 4.10.13 ของ ADA เป็นมาตรฐานของรัฐบาลกลาง สหรัฐฯ ที่ใช้กับตัวบ่งชี้ชั้นลิฟต์ที่ได้ยิน ข้อกำหนดนั้นตรงไปตรงมา: ลิฟต์ที่ให้บริการมากกว่าสามชั้นจะต้องจัดให้มีสัญญาณที่ได้ยินและประกาศด้วยวาจาในแต่ละจุดหยุดชั้น การประกาศต้องระบุระดับชั้นและทิศทางการเดินทาง
สิ่งที่หมายถึงในทางปฏิบัติคือ:
- การหยุดแต่ละชั้นต้องมีหมายเลขชั้นที่พูดออกมา
- เสียงทิศทาง (“ขึ้น” / “ลง”) ต้องมาพร้อมกับการโทรชั้นในการเดินทางหลายชั้น
- เสียงต้องได้ยินสูงกว่าเสียงรบกวนโดยรอบปกติของห้องโดยสาร โดยปกติ 65-70 dB SPL ที่ 1 เมตรจากลำโพง ซึ่งหมายความว่าไฟล์ต้นทางของคุณต้องมีการปรับเกนที่ถูกต้องก่อนส่งมอบ
EN 81-70 (เทียบเท่ายุโรป) เพิ่มข้อกำหนดเกี่ยวกับคะแนนปัญญาด้านเสียง และการวางตำแหน่งลำโพง แต่ตรรมชาติของการเขียนสคริปต์เหมือนกัน
สำหรับผู้เช่าตาบอดและผู้มีสายตาต่ำ การประกาศด้วยวาจาไม่ใช่เพียงกล่องทำเครื่องหมายการปฏิบัติตาม มันเป็นเครื่องมือนำทางหลักสำหรับการนั่งลิฟต์ทุกครั้ง การพูดชัดเจน ระดับเสียงที่สม่ำเสมอ และการตั้งชื่อชั้นที่ชัดเจนมีความสำคัญเท่ากับหมายทีม การกำหนดกฎหมาย ตัวสร้างเสียง AI ที่ช่วยให้คุณสามารถตั้งค่าเป้าหมาย loudness ที่สม่ำเสมอ (ประมาณ -18 LUFS integrated สำหรับการส่งมอบห้องโดยสาร) และตรวจสอบความเสี่ยงสูงกว่าเสียงรบกวนโดยรอบก่อนส่งออกนั้นมีประโยชน์มากกว่าที่สร้างขึ้นในหูฟังแต่ถูกตัดสั้นบนลำโพงห้องโดยสาร 3 นิ้ว
เกินไปกว่า ADA แนวทางเข้าถึงคู่มือ ADAAG ยังครอบคลุมข้อกำหนด Braille และปุ่มแบบสัมผัส แต่ด้านเสียง ส่วนเสียง AI จัดการ เป็นคุณภาพและความสม่ำเสมอของการประกาศที่พูดออกมาโดยทั้งหมด”
วิธีการที่ระบบ KONE, Otis และ Mitsubishi จัดการเสียง
ผู้ผลิตลิฟต์สามอันดับแรกมีวิธีการแต่ละอย่างสำหรับเสียงประกาศแบบกำหนดเอง และข้อกำหนดรูปแบบแตกต่างกันเพียงพอสำหรับการครอบคลุมแต่ละรายการ
KONE
ชุดของ KDS และ MonoSpace ของ KONE สนับสนุนการประกาศเสียงแบบปรับได้ผ่านแพลตฟอร์มการติดตามระยะไกล KONE E-Link หรือโดยตรงผ่านโมดูลเสียงบอร์ดควบคุม รูปแบบเสียงมาตรฐานสำหรับระบบ KONE ปัจจุบันคือ mono WAV ที่ 44.1 kHz หรือ 48 kHz, 16-bit PCM ระบบ KDS ที่เก่ากว่าอาจต้องการ 8 kHz mono พอร์ทัลบูรณาการ KONE ให้รายชื่อเทมเพลตของชื่อไฟล์คลิปที่จำเป็น ไฟล์ที่สร้างขึ้น AI ของคุณจะต้องตรงกับชื่อไฟล์เหล่านั้นอย่างแน่นอน หรือตัวควบคุมจะปฏิเสธพวกมัน
Otis
ชุด Otis Gen2 และ Skyrise ใช้โปรเซสเซอร์เสียงรวมในตัวที่ยอมรับ 8 kHz mono WAV บนหน่วยเก่าและ 16 kHz หรือ 44.1 kHz mono WAV บนหน่วยรุ่นปัจจุบัน Otis มีเครื่องมือบริการสำหรับการอัพโหลดชุดประกาศแบบกำหนดเอง; เครื่องมือตรวจสอบรูปแบบก่อนการโหลด จุดขาดของทั่วไปคือไฟล์ WAV แบบสเตริโอ – ตัวควบคุม Otis ปฏิเสธพวกมัน ส่งออก mono จากตัวสร้างเสียง AI ของคุณ ไม่ใช่เสเตริโอ
Mitsubishi
Mitsubishi NEXIEZ, ELENESSA และ DATLIER series ใช้ 8 kHz หรือ 16 kHz mono WAV ในอดีต หน่วยพูดของ Mitsubishi มักเป็นบอร์ดแยกจากตัวควบคุมหลัก สามารถเข้าถึงได้ผ่านอินเทอร์เฟซการจัดการสถานที่ของอาคาร ELENESSA Smart Series ได้แนะนำการสนับสนุนสำหรับ 44.1 kHz ในเฟิร์มแวร์ล่าสุด – ตรวจสอบคู่มือการติดตั้งสำหรับเฟิร์มแวร์รุ่นเฉพาะที่ติดตั้งไว้ก่อนการผลิตชุดเต็ม
| ผู้ผลิต | รูปแบบทั่วไป | ยอมรับเสเตริโอ? | วิธีการอัปโหลด |
|---|---|---|---|
| KONE (ปัจจุบัน) | 44.1-48 kHz mono WAV | ไม่ | E-Link / บอร์ดควบคุม |
| KONE (KDS เก่า) | 8 kHz mono WAV | ไม่ | บอร์ดควบคุมโดยตรง |
| Otis Gen2 (เก่า) | 8 kHz mono WAV | ไม่ | เครื่องมือบริการ Otis |
| Otis (รุ่นปัจจุบัน) | 16-44.1 kHz mono WAV | ไม่ | เครื่องมือบริการ Otis |
| Mitsubishi NEXIEZ | 8-16 kHz mono WAV | ไม่ | อินเทอร์เฟซการจัดการสถานที่ |
| Mitsubishi ELENESSA (FW ล่าสุด) | 44.1 kHz mono WAV | ไม่ | อินเทอร์เฟซการจัดการสถานที่ |
ธีมที่สอดคล้องกัน: mono เท่านั้น, ไม่มี MP3 และชื่อไฟล์ประเพณีเรื่องที่สำคัญ ผลิตในคุณภาพสูงสุดที่ระบบของคุณยอมรับ จากนั้นให้ตัวอย่างลดลงหากจำเป็น ไม่ต้องยอกตัวอย่างแหล่งที่มาคุณภาพต่ำ
การเขียนสคริปต์ประกาศลิฟต์เพื่อให้มีเสียงธรรมชาติ
สคริปต์คือที่ที่โครงการประกาศลิฟต์ DIY ส่วนใหญ่ผิด Elevator PA มีรูปแบบเสียงเฉพาะที่ตัวสร้างเสียง AI สามารถให้ส่วนหากสคริปต์ถูกจัดโครงสร้างอย่างถูกต้อง
ให้การพูดอยู่ในระยะสั้น ประกาศลิฟต์มีความยาว 3-7 คำ สคริปต์ยาวที่มีอัตราการพูดแบบสนทนาแบบธรรมชาติจะฟังเหมือนผิด เนื่องจากความเงียบตามหลังและขอบเขต clip เป็นส่วนของประสบการณ์การฟัง “ชั้น 3 – แผนกการตลาด” ถูกต้อง “คุณกำลังมาถึงชั้นสามซึ่งเป็นแผนกการตลาด” จะรู้สึกว่าไม่เข้าที่และจะวิ่งไปยังเสียงปลายของประตู
ใช้ตัวเลขลำดับที่ ไม่ใช่ลำดับที่ เขียน “ชั้น 3” ไม่ใช่ “ชั้นที่สาม” รูปแบบลำดับที่สะอาดกว่าเมื่อสังเคราะห์และตรงกับสิ่งที่ผู้โดยสารส่วนใหญ่คาดหวัง ข้อยกเว้น: “ชั้นล่างสุด” และ “ล็อบบี้” เป็นธรรมชาติมากกว่า “ชั้นที่ 0” หรือ “ชั้น 1” ขึ้นอยู่กับการกำหนดหมายเลขอาคาร
การวางตำแหน่งหยุดสำคัญ สำหรับ “ชั้น 14 – ห้องอักษร” ใส่เครื่องหมายจุลภาค หรือเส้นประยาวในสคริปต์ของคุณเพื่อกระตุ้นการหยุดสั้น ๆ ระหว่างหมายเลขชั้นและชื่อ ตัวสร้างเสียง AI ส่วนใหญ่เคารพเครื่องหมายวรรคตอนเป็นคำแนะนำ prosody โดยไม่หยุด “ชั้น 14 ห้องอักษร” วิ่งเข้าด้วยกันและสูญเสียความชาญฉลาด
เสียงทิศทางคือคลิปแยกต่างหาก อย่าเชื่อมต่อ “ขึ้น” เข้าในคลิปประกาศชั้น ตัวควบคุมลิฟต์เล่นคลิปทิศทางและชั้นอย่างอิสระ ตัวควบคุมจะตัดสินใจว่าจะเล่นคลิปใดตามทิศทางการเรียก หากคุณฝังทิศทางลงในคลิปชั้น ตัวควบคุมจะเล่นเสียงทิศทางสองครั้งหรือไม่ตามลำดับ
ป้ายชั้นแบบกำหนดเองสำหรับอาคารสำนักงาน:
ชั้น 1 – ล็อบบี้
ชั้น 2 – ร้านค้าปลีก
ชั้น 3 – การตลาด
ชั้น 4 – การเงิน
ชั้น 5 – ทรัพยากรบุคคล
ชั้น 6 – บริหาร
ชั้น 7 – ศูนย์การประชุม
ชั้น 8 – โรงอาหาร
ชั้นใต้ดิน 1 – ที่จอด
ชั้นใต้ดิน 2 – ที่จอด
คลิปความปลอดภัยและประตูมาตรฐาน:
ประตูเปิด
ประตูปิด
กรุณาห่างจากประตู
ขึ้น
ลง
ลิฟต์นี้อยู่นอกการใช้งาน
ฉุกเฉิน – กรุณากดปุ่มปิด
ความจุสูงสุดถึงแล้ว
ชุดประกาศที่สมบูรณ์สำหรับอาคาร 10 ชั้นที่มีชั้นที่ตั้งชื่อ เสียงทิศทาง และข้อความความปลอดภัยรวมทั้ง 35-45 คลิปแต่ละรายการ การสร้าง AI ของชุดนี้จากโปรไฟล์เสียงเดียว ใช้เวลา 10-20 นาที การบันทึกชั้นที่มีชื่อใหม่ต้องใช้เวลา 60 วินาที
เสียงแบรนด์สำหรับเครือโรงแรม: อาร์กิวเมนต์ความสม่ำเสมอ
สำหรับกลุ่มโรงแรมที่ทำงานในหลายสิบหรือหลายร้อยทรัพย์สิน เสียงประกาศลิฟต์เป็นจุดติดต่อแบรนด์ที่น่ายินดี แขกที่พักบ่อยครั้งทั่ว เครือสังเกตเห็นความไม่สม่ำเสมอ – เสียงที่อบอุ่นและเป็นมืออาชีพในทรัพย์สินหลักและเสียงหุ่นยนต์ทั่วไปที่ทรัพย์สินสนามบินสร้างความแตกแยกแบรนด์ที่ละเอียด แต่จริง
วิธีการดั้งเดิม – การจ้างนักพูดเสียง การบันทึกที่สตูดิโอ การแจกจ่ายไฟล์ WAV ให้กับแต่ละทรัพย์สิน – พังนอกเหนือจากขนาด นักพูดเสียงที่บันทึกสำหรับเครือสามปีที่แล้วอาจไม่พร้อมใช้งานสำหรับทรัพย์สินใหม่ที่เปิดในประเทศอื่น เซสชั่นสตูดิโออยู่สำหรับ 15 ภาษาทั่ว 5 ทรัพย์สินใหม่เป็นปัญหาโลจิสติกส์และงบประมาณ
การสร้างเสียง AI แก้ปัญหานี้ด้วยการแยกตัวตนเสียงออกจากเซสชั่นบันทึก แบรนด์โรงแรมกำหนดโปรไฟล์เสียงเดียว – โทน, จังหวะ, สำเนียง, การลงทะเบียนเพศ – และแต่ละทรัพย์สินดึงข้อมูลจากโปรไฟล์เดียวกัน ทรัพย์สินใหม่ได้รับชุดประกาศที่สร้างขึ้นในชั่วโมง การเปลี่ยนชื่อชั้น (การแปลงชั้นร้านอาหารเป็นพื้นที่อรรถกถา) หมายความว่าการสร้างคลิปเดียวทั่ว ทรัพย์สินทั้งหมดจากการอัปเดตสคริปต์ศูนย์กลาง
เวิร์กโฟลว์ที่ใช้ได้จริงสำหรับการเปิดตัวเครือโรงแรม:
- กำหนดโปรไฟล์เสียงแบรนด์ – โดยปกติเสียงอบอุ่น mid-register ที่ 130-140 WPM สำเนียงตัดสิน, ความเป็นทางการเล็กน้อยโดยไม่ต้องเย็น
- สร้างสคริปต์เทมเพลตต้นแบบครอบคลุมคลิปมาตรฐานทั้งหมด (หมายเลขชั้น, ทิศทาง, ประตู, ความปลอดภัย)
- เพิ่มป้ายชั้นเฉพาะทรัพย์สินต่อโรงแรม (การกำหนดหมายเลขห้อง ชื่อร้านอาหาร, ชั้นสปา, ล็อบบี้อยก)
- สร้างชุด WAV เต็มต่อทรัพย์สินต่อภาษา
- ส่งมอบให้ผู้ติดตั้งลิฟต์หรือทีมสถานที่ที่มีข้อมูลจำเพาะรูปแบบสำหรับรุ่นตัวควบคุมในแต่ละทรัพย์สิน
ความสม่ำเสมอของเสียงแบรนด์ที่จะต้องมีสัญญาหลังจากที่สตูดิโอและความสัมพันธ์ที่ดำเนินไป ตอนนี้อยู่ในโปรไฟล์เสียงที่นำมาใช้ได้ใหม่ สำหรับการขยายเครือจาก 20 ถึง 80 ทรัพย์สิน นี่คือการเรียบง่ายของการดำเนินการที่มีนัยสำคัญ
สำหรับกรณีการใช้งานติดกัน – การสร้างเสียงที่สม่ำเสมอสำหรับประกาศ PA ทั้งหมดในทรัพย์สิน ไม่ใช่แค่ลิฟต์ – ดูคู่มือของเราเกี่ยวกับ ตัวสร้างเสียง AI สำหรับประกาศลำโพงร้านขายของชำ ซึ่งครอบคลุมตรรมชาติของเสียงแบรนด์เดียวกันในมาตราส่วนค้นหา
ประกาศลิฟต์หลายภาษา: วิธีจัดโครงสร้างการเปิดตัว
อาคารในเขตการเงินระหว่างประเทศ โรงแรมรสรวม และสิ่งอำนวยความสะดวกในพื้นที่หลายภาษามากขึ้น ต้องการประกาศลิฟต์ในมากกว่าหนึ่งภาษา คำถามไม่ใช่เพียงแค่ภาษาใด แต่วิธีจัดลำดับและจัดโครงสร้างเสียง
ประกาศแบบลำดับ vs แบบขนาน:
ตัวควบคุมลิฟต์ส่วนใหญ่เล่นประกาศหนึ่งรายต่อจุดหยุดชั้น ในสถานการณ์หลายภาษา คุณมีสองตัวเลือก:
- คลิปแบบลำดับ: ตัวควบคุมเล่นประกาศภาษา A, หยุด 0.5 วินาที, เล่นประกาศภาษา B ต้องใช้ตัวควบคุมที่รองรับลำดับหลายคลิปต่อเหตุการณ์ชั้น
- คลิปแบบรวม: สร้างคลิปต่อชั้นที่มีภาษา A + หยุด + ภาษา B ในไฟล์ WAV เดียว นี่ใช้ได้กับตัวควบคุมใด ๆ แต่น้อยกว่าอ่านได้ – การเปลี่ยนชุดภาษาต้องสร้างคลิปทั้งหมด
สำหรับระบบ KONE และ Otis สมัยใหม่ การเล่นแบบลำดับผ่านสล็อตทริกเกอร์ที่แตกต่างกันได้รับการสนับสนุน สำหรับตัวควบคุมที่เก่ากว่า วิธีการคลิปแบบรวมเป็นตัวเลือกเดียว
ตัวเลือกภาษาสำหรับประเภทอาคารทั่วไป:
| ประเภทอาคาร | ชุดภาษาทั่วไป |
|---|---|
| โรงแรมระหว่างประเทศ (เครือทั่วโลก) | ภาษาอังกฤษ + ภาษาท้องถิ่น + 1-2 ภาษาแขก |
| หอคอยเขตการเงิน | ภาษาอังกฤษ + ภาษาท้องถิ่น |
| อาคารรัฐบาล / พลเรือน | ภาษาประจำชาติอย่างเป็นทางการ (บังคับตามกฎหมายในเขตอำนาจบางแห่ง) |
| โรงแรมสนามบิน | ภาษาอังกฤษ + ภาษาท้องถิ่น + 2-3 ภาษาโดยสารจราจร |
| โรงพยาบาล (เขตระหว่างประเทศ) | ภาษาอังกฤษ + ภาษาท้องถิ่น + ภาษาอารบิกหรือจีนขึ้นอยู่กับภูมิภาค |
สำหรับการเปิดตัวที่แท้จริงหลายภาษา – ภาษาอังกฤษ, สเปน, ฝรั่งเศส, ญี่ปุ่น และภาษาอารบิก – การจ้างนักพูดเสียงพื้นเพสำหรับแต่ละภาษาและการรักษาโทนที่สม่ำเสมอทั่ว ห้า เซสชั่นบันทึกแยกต่างหากมีราคาแพงและไม่ทำได้จริง การสร้างเสียง AI ช่วยให้คุณผลิตชุดภาษาทั้งหมด 5 ชุดจากห้าโปรไฟล์เสียงที่สม่ำเสมอในงานแบตช์เดียว เวอร์ชันสเปนและฝรั่งเศสสามารถตรงกับอุ่นไอและการลงทะเบียนเดียวกับเวอร์ชันภาษาอังกฤษเพราะคุณควบคุมพารามิเตอร์ทุกอย่างต่อภาษา
สำหรับมุมมองที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับวิธีการที่ตัวสร้างเสียง AI จัดการเวิร์กโฟลว์การผลิตหลายภาษา คู่มือ ตัวสร้างเสียง AI สำหรับประกาศประตูสนามบิน ของเราครอบคลุมตรรมชาติภาษาหลายภาษาเดียวกันในมาตราส่วนที่ใหญ่กว่า
ข้อกำหนดทางเทคนิค: การผลิตเสียงลิฟต์ที่ทำงานจริง
เกินไปกว่าข้อกำหนดรูปแบบที่ครอบคลุมในส่วน KONE/Otis/Mitsubishi มีการตัดสินใจฝั่งการผลิตที่กำหนดว่าคลิปที่สร้างขึ้น AI ของคุณฟังเป็นมืออาชีพผ่านลำโพงห้องโดยสาร
อัตราตัวอย่าง: ผลิตที่ 48 kHz จากนั้นให้ตัวอย่างลดลงเป็นอัตราเป้าหมาย ไม่เคยผลิตที่ 8 kHz และพูดว่า “เสร็จสิ้น” คุณภาพแหล่งสำคัญแม้หลังจากการลดตัวอย่าง
ความลึกของบิต: 16-bit เป็นมาตรฐานลิฟต์ PA 24-bit ในการผลิต หรือ dithered เป็น 16-bit สำหรับการส่งออก
ช่อง: Mono ลำโพงลิฟต์ส่วนใหญ่เป็น mono เกือบสากล ไฟล์ เสตริโอได้รับการยอมรับโดยตัวควบคุมหรือเล่นเป็นการลดตัวอย่าง mono อยู่ดี, ผลิต mono ตั้งแต่แรก
ความดัง: เป้าหมาย -18 LUFS รวมสำหรับการส่งมอบห้องโดยสารลิฟต์ นี้เงียบกว่าทีวีเพื่อค้นหา (-16 LUFS) เนื่องจากลำโพงห้องโดยสารใกล้เคียงกับผู้โดยสาร และประกาศที่ดังเกินไปรู้สึกคมคับในพื้นที่ขนาดเล็ก ใช้ มิเตอร์ loudness, อย่าเพียง normalize ถึงจุดสูง
นำหน้า และท้าย ความเงียบ: เพิ่ม 100ms ความเงียบที่จุดเริ่มต้นและ 200-300ms ที่ตอนท้ายของแต่ละคลิป นี้ป้องกันไม่ให้ประกาศถูกตัดโดยขอบเขตคลิปตัวควบคุมและช่วยให้มั่นใจว่าการหยุดตามธรรมชาติก่อนเสียงหรือเสียงมอเตอร์ประตูตามมา
Codec: WAV (PCM) เพียงอย่างเดียว MP3 นำเสนออยดแต่งตัวเข้ารหัสที่ได้ยินมากในคลิปพูดสั้น ๆ ที่ประกาศลิฟต์ใช้ ประหยัดขนาดไฟล์จาก MP3 ไม่เกี่ยวข้องเมื่อชุดประกาศ 40 ชั้นที่สมบูรณ์ใน WAV ยังอยู่ต่ำกว่า 50 MB
สำหรับบริบทเกี่ยวกับวิธีการสนับสนุนการผลิตนี้ใช้กับสถานการณ์ประกาศอื่น ๆ คู่มือ ตัวสร้างเสียง AI สำหรับ PA สถานีรถไฟ ครอบคลุมข้อมูลจำเพาะทางเทคนิคเดียวกันสำหรับสภาวะ PA ที่ซับซ้อนมากขึ้นและปริมาณสูง
การเปรียบเทียบตัวสร้างเสียง AI สำหรับการผลิตประกาศลิฟต์
แพลตฟอร์มหลักที่ใช้สำหรับการผลิตประกาศลิฟต์มีจุดแข็งที่ต่างกัน:
| แพลตฟอร์ม | ส่งออก WAV | สคริปต์แบตช์ | โคลนเสียง | ไม่อยู่ออนไลน์ / ท้องถิ่น |
|---|---|---|---|---|
| ElevenLabs | ใช่ (ชำระ) | ผ่าน API | ใช่ (ชำระ) | ไม่ |
| Murf | ใช่ (ชำระ) | ผ่าน API | จำกัด | ไม่ |
| Azure TTS | ใช่ | ใช่ (SSML) | Custom Neural Voice | ไม่ |
| Google Cloud TTS | ใช่ | ใช่ | Custom Voice | ไม่ |
| VoxBooster | ใช่ | ใช่ | ใช่ (ท้องถิ่น) | ใช่ (Windows) |
ความแตกต่างที่สำคัญต่อประเมิน:
-
การประมวลผลออนไลน์: สำหรับเครือโรงแรมที่มีทรัพย์สินในพื้นที่ที่มี API cloud แฝง ไม่มีการทำนาย, หรือสิ่งอำนวยความสะดวกที่มีความเสี่ยง การสร้างเสียงท้องถิ่นเป็นข้อมูลดีที่มีความหมาย
-
โคลนเสียงเพื่อความสม่ำเสมอแบรนด์: ถ้าคุณต้องการให้เสียงลิฟต์ตรงกับเสียง IVR แผนกต้อนรับหรือวิดีโอโฆษณาโรงแรม โคลนเสียงจากการบันทึกอ้างอิงเป็นคุณลักษณะที่ทำให้สิ่งนั้นเป็นไปได้ แพลตฟอร์มเมฆค่าต่อตัวอักษรที่สร้างขึ้นบวกกับการฝึกอบรมแบบจำลอง; เครื่องมือท้องถิ่นประมวลผลนั้นเพียงครั้งเดียว
-
การสนับสนุน SSML: เพื่อให้มีการควบคุมที่ดีกว่าความยาว หยุด, การออกเสียงของตัวอักษร (“B2” vs “B-2”) และท้ายน้อย, SSML (Speech Synthesis Markup Language) เป็นสิ่งจำเป็น ไม่ใช่ทุกแพลตฟอร์มที่เปิดเผย SSML เต็ม
-
ส่งออกแบตช์: การผลิตคลิป WAV 45 แต่ละรายการจากรายชื่อสคริปต์ควรยัติภาค, ไม่ใช่ทีละรายการผ่าน UI เว็บ
สำหรับกรณีการใช้โคลนเสียง ซึ่งคุณต้องการตรงกับการบันทึกเสียงมนุษย์เฉพาะในประกาศอาคารทั้งหมด คู่มือ โคลนเสียงสำหรับ voiceover ของเราครอบคลุมวิธีการ, มาตรฐานคุณภาพ และเวิร์กโฟลว์โดยละเอียด
ข้อผิดพลาดทั่วไปในการผลิตประกาศลิฟต์
การใช้เสียง TTS ผู้บริโภคโดยตรง TTS ผู้บริโภค ได้รับการฝึกอบรม สำหรับความเป็นธรรมชาติบทสนทนา, prosody หลากหลาย, ความอบอุ่นอารมณ์ ประกาศลิฟต์เป็นสั้น, ประกาศ, และต้องมีความแน่นอน เทพาธรรมว่าฟังดีในการสาธิต podcast อาจมีการเปลี่ยนแปลงระดับเสียงบิดเบือนระหว่างคลิปที่อ่อนแอเห็นชัดเจนเมื่อคลิปเล่นต่อเนื่องในห้องโดยสารเงียบสงบ
การผลิตที่ 22 kHz เพราะ preview เว็บฟังดี ผู้เล่นเว็บจำลองตัวอย่างสำหรับการเล่น ตัวควบคุมไม่ได้ ผลิตที่คุณ ระบบ เบื้องรายรับ
บัญชี ชื่อคลิปประเพณี KONE, Otis และ Mitsubishi ทั้งหมดต้องการชื่อไฟล์เฉพาะสำหรับประเภทประกาศบางประเภท “floor3.wav” อาจไม่ได้รับการรับรู้ “F03.wav” หรือ “FLOOR_003.wav” อาจเป็นรูปแบบที่ต้องการ ดาวน์โหลดข้อมูล integration เสียง controller ก่อน naming ไฟล์
Forgetting ช่องว่างเงียบก่อนประกาศ ตัวควบคุมจำนวนมากกระตุ้นคลิปเสียง ทันทีเมื่อการมาถึงชั้น ถ้าคลิปของคุณเริ่มต้นด้วย “ประตูเปิด” ตัวอย่าง 0 พยางค์อักษรแรกจะตัดสั้น ความเงียบ leading 100ms ป้องกัน
Clips overloud Normalizing ถึง -0.5 dBFS สูงให้ความดังสูงสุดบนมิเตอร์ DAW แต่จะบิดเบือนผ่านลำโพง cabin 5-watt ที่เสียง Normalize loudness ถึง -18 LUFS ไม่สูง”
การรวม Elevator Voice กับระบบ PA อาคาร
อาคารสำนักงานสมัยใหม่ขยายใช้ระบบ PA แบบรวมศูนย์ที่ประกาศลิฟต์ ล็อบบี้ ทางเดิน และการประกาศฉุกเฉินจัดการจากแพลตฟอร์มเดียว ผู้ผลิตเช่น Bosch, TOA และ Zenitel ทำให้ตัวควบคุม PA ที่จัดการหลายโซนประกาศรวมทั้งห้องโดยสารลิฟต์เป็นโซนเดียวในระหว่างจำนวนมาก
ในการตั้งค่านี้ คลิปประกาศลิฟต์อยู่ใจในไลบรารี WAV เดียวกันกับประกาศชั้นค้นหา ข้อความการอพยพฉุกเฉิน และเพลงฉากหลัง เสียงสม่ำเสมอทั่วทั้งโซน – ลิฟต์ ทางเดิน ล็อบบี้ ที่จอด – สนับสนุนเอกลักษณ์เสียง อาคารและหลีกเลี่ยง jarring การได้ยินเสียงล็อบบี้อบอุ่นตามด้วยเสียงลิฟต์หุ่นยนต์
นี้คือการตั้งค่าแบบ unified ที่มีตัวสร้างเสียง AI กับ clone เสียงกลายเป็นสินทรัพย์อาคารกว้าง แทน tool ลิฟต์เฉพาะ กำหนดหนึ่ง voice อาคาร, สร้างประเภทประกาศทั้งหมด, และทุก โซนฟังดังมันอยู่สภาพแวดล้อม
สำหรับบริบทกว้างเกี่ยวกับความสม่ำเสมอ voice ประกาศอาคาร wide, ดู คู่มือ AI voice generator สำหรับ hospital pager ระบบที่ครอบคลุมการจัดการ zone และความสม่ำเสมอ challenge ใน ใหญ่กว่า facility บริบท
ขั้นตอน: Producing First Elevator Announcement Set ของคุณ
นี่เป็น workflow ที่ใช้ได้จริงสำหรับ 10-floor commercial building ที่มีภาษาเดียว และ ADA compliance goal:
-
ดาวน์โหลดข้อมูล controller audio spec ชื่อไฟล์ convention, format (sample rate, bit depth, mono/stereo) จาก elevator manufacturer หรือ installer.
-
โครงร่าง escript รายการทั้งหมด required clip: floor หมายเลข (1-10 + Lobby + ชื่อ floor), direction cues (Up / Down), door cues (Doors opening / Doors closing), safety messages.
-
เลือก voice profile neutral accent, 130-140 WPM, mid-register Match ให้กับ existing audio identity บน building ถ้า any.
-
Generate clips batch Input full script list, select voice, set output format (48 kHz, mono, 16-bit WAV), export Add 100ms leading silence และ 200-300ms trailing silence.
-
Loudness normalize Process all clips เป็น -18 LUFS integrated Use loudness-normalization tool, ไม่ peak normalize.
-
Rename files per controller spec Match required filename convention exactly.
-
Test single floor Upload one clip set (floor 3, up, down, doors opening, doors closing) ไป controller and verify playback before uploading full set.
-
Deploy document Keep source scripts และ voice profile settings When floor renamed, regenerating clip ต้องใต้ minute.
คำถามที่พบบ่อย
elevator voice AI คืออะไร
Elevator voice AI เป็นระบบ text-to-speech ที่สร้างประกาศชั้นที่ออกเสียงซึ่งคุณได้ยินภายในห้องโดยสารลิฟต์, เช่น ‘ชั้น 3’, ‘ประตูปิด’, ‘ขึ้น’ ตัวสร้างเสียง AI สมัยใหม่ผลิตคลิปเหล่านี้ด้วยสำเนียงธรรมชาติ, โทนเสียงที่สม่ำเสมอ และการปฏิบัติตามมาตรฐาน ADA/EN 81-70 อย่างเต็มที่, แทนที่การบันทึกเก่าที่ต้องใช้สตูดิโอและนักพูดเสียงที่ว่าจ้าง
มีตัวสร้างเสียงชั้นลิฟต์ฟรีหรือไม่
แพลตฟอร์มเสียง AI หลายแห่งมีแผนฟรีที่สามารถส่งออกประกาศแบบลิฟต์ได้ คุณภาพแตกต่างกันอย่างมีนัยสำคัญ แผนฟรีโดยทั่วไปจำกัดการส่งออกเป็น MP3 ที่ 22 kHz ซึ่งต่ำกว่ามาตรฐาน WAV 48 kHz ที่บอร์ดควบคุมลิฟต์ส่วนใหญ่คาดหวัง สำหรับการเปิดตัวการผลิตภาพในอาคารหรือเครือโรงแรม แผนแบบจ่ายเงินพร้อมการส่งออก WAV และการเขียนสคริปต์แบบแบตช์เป็นตัวเลือกที่ใช้ได้จริง
ระบบลิฟต์ KONE และ Otis ยอมรับรูปแบบเสียงใด
บอร์ดควบคุมส่วนใหญ่ของ KONE และ Otis ยอมรับ WAV PCM ที่ไม่บีบอัดที่ 8 kHz mono (ระบบเก่า) หรือ 16-48 kHz mono (รุ่นปัจจุบัน) ซีรีส์ NEXIEZ และ ELENESSA ของ Mitsubishi โดยทั่วไปต้องการ WAV 8 kHz หรือ 16 kHz mono ตรวจสอบเสมอกับคู่มือการรวมอักษรของผู้ติดตั้ง – ความไม่สอดคล้องของรูปแบบเป็นเหตุผลที่พบบ่อยที่สุดในการประกาศแบบกำหนดเองล้มเหลว
ฉันจะทำให้ประกาศลิฟต์ของฉันเป็นไปตามมาตรฐาน ADA ได้อย่างไร
ส่วน 4.10.13 ของ ADA กำหนดให้ตัวบ่งชี้ชั้นที่มีเสียงในลิฟต์ที่ให้บริการมากกว่าสามชั้น ประกาศต้องบ่งชี้ระดับชั้นและทิศทางการเดินทาง ตัวสร้างเสียง AI เป็นไปตามนี้โดยการเขียนสคริปต์หมายเลขชั้นแต่ละชั้นบวกกับเสียง ‘ขึ้น’ / ‘ลง’ สำหรับผู้เช่าที่มองไม่เห็นและมีสายตาต่ำ การออกเสียงที่ชัดเจนที่ 120-150 WPM และระดับเสียงที่สม่ำเสมอมีความสำคัญเท่ากับกล่องทำเครื่องหมายตามกฎหมาย
สามารถใช้เสียง AI เดียวสำหรับประกาศลิฟต์ทั้งหมดในเครือโรงแรมได้หรือไม่
ใช่ นี่คือกรณีการใช้งานที่เข้มแข็งที่สุดอย่างหนึ่งสำหรับการสร้างเสียง AI บันทึกโปรไฟล์เสียงหนึ่งรายการ, สร้างสคริปต์ชั้นทั้งหมดจากโปรไฟล์นั้น, และปรับใช้ชุด WAV เดียวกันไปยังแต่ละทรัพย์สินในเครือ การอัปเดต (ชื่อชั้นใหม่ หรือแผนก rebranded) ต้องสร้างสคริปต์คลิปเดียว ไม่ใช่การจองเวลาในสตูดิโอใหม่ ความสม่ำเสมอของเสียงแบรนด์ทั่ว 50 ทรัพย์สินเป็นอัตโนมัติ
ประกาศลิฟต์หลายภาษาควรครอบคลุมกี่ภาษา
มันขึ้นอยู่กับประเภทของอาคาร หอคอยองค์กรในเขตการเงินโลกโดยทั่วไปครอบคลุมภาษาอังกฤษบวกภาษาท้องถิ่น 1-2 ภาษา โรงแรมระหว่างประเทศมักเพิ่มภาษา 3-5 ภาษา (สเปน, ฝรั่งเศส, จีนแมนดาริน, ญี่ปุ่น, อารบิก เป็นที่พบบ่อย) ตัวสร้างเสียง AI สามารถผลิตสคริปต์เดียวกันในแต่ละภาษาจากงาน batch เดียว ทำให้การเปิดตัวหลายภาษาเป็นไปได้จริง ซึ่งการจ้างนักพูดเสียงแยกกันสำหรับแต่ละภาษาจะไม่ทำได้
อะไรทำให้เสียงประกาศลิฟต์แตกต่างจากอักษรเสริมที่เป็นมาตรฐาน
Elevator PA ต้องการการพูดที่กระชับและประกาศ (3-6 คำ), ความเงียบตามหลังที่หมาะสมเพื่อให้คลิปไม่พบปลายแบบปัพ และเกนที่สม่ำเสมอเพื่อไม่ให้บิดเบือนผ่านลำโพงห้องโดยสารขนาดเล็ก TTS ผู้บริโภคได้รับการเพิ่มประสิทธิ์สำหรับย่อหน้าบทสนทนา ตัวสร้างเสียง AI ที่ออกแบบมาเป็นพิเศษช่วยให้คุณควบคุมความยาวของการพักตัว, ตั้งค่า loudness ที่สม่ำเสมอ (ประมาณ -18 LUFS integrated) และส่งออก mono WAV ซึ่งเป็นข้อกำหนดทั้งหมดที่ผลิตภัณฑ์อักษรเสริมมาตรฐานละเลย
บทสรุป
elevator voice AI ชั้นได้ทำให้การผลิตประกาศที่สม่ำเสมอและแบรนด์ที่สม่ำเสมอเข้าถึงได้สำหรับผู้จัดการสถานที่ใด ๆ ที่มีสคริปต์และเดือน ข้อกำหนดทางเทคนิค, mono WAV, sample rate correct, loudness normalization, file names correct, ไม่ยาก เมื่อคุณรู้พวกเขา; พวกเขาจำเป็นต้องติดตาม ระบบ KONE, Otis และ Mitsubishi แต่ละมีความคาดหวัง format specific, และ format mismatch เป็น production failure ที่พบบ่อยกว่า voice quality issues
สำหรับเครือโรงแรมและผู้ประกอบการ multi-property, voice brand argument มี compelling: single AI voice profile generates consistent, on-brand elevator announcements ทั่วหมดทรัพย์สิน, ในทุก language needed, ด้วย trivial update cost เมื่อ floor names change.
สำหรับการทีมเข้าถึง, ADA และ EN 81-70 compliance ผ่าน AI-generated audio เป็น most cost-effective path – particularly สำหรับ existing buildings retrofitting compliant audio เข้า legacy controller systems ที่ never designed สำหรับ studio-quality recordings.
VoxBooster handles voice generation และ custom AI voice cloning สำหรับ Windows-based production workflows, including batch script generation สำหรับ announcement sets ถ้าคุณ need voice ที่ match existing brand voice reference, cloning workflow covered ใน voice cloning สำหรับ voiceover guide applies directly ไป elevator และ building PA production ทดลอง 3 วันฟรี – ไม่ต้อง credit card.