KI-Sprachgenerator für Zapfsäulen an Tankstellen
KI-Sprachsysteme an Zapfsäulen führen Sie durch jeden Schritt an einem Selbstbedienungs-Kraftstoffdispenser — “Bitte führen Sie Ihre Karte ein”, “Wählen Sie Ihre Kraftstoffsorte”, “Heben Sie den Zapfhahn an und beginnen Sie mit dem Tanken”, “Bitte entnehmen Sie Ihre Quittung”. Diese Ansagen stammen aus einem eingebetteten Audiosystem, das in Gilbarco Veeder-Root- und Wayne Fueling Systems-Dispensern verbaut ist — den beiden Hardwareplattformen, die den Großteil des nordamerikanischen Kraftstoffeinzelhandels abwickeln. Dieser Leitfaden erklärt, wie diese Ansagen erstellt werden, wie das vollständige Audio-Set aussieht, wie Shell, BP, Chevron und Petrobras das Voice-Branding handhaben, und wie Sie professionelles Zapfsäulen-Audio mit einem modernen KI-Sprachgenerator produzieren.
Kurzübersicht
- Tankstellen-Zapfsäulen verwenden synthetisches Sprach-KI, um Kunden durch Kartenzahlung und Tankvorgang zu führen — Karte einführen, Kraftstoffsorte wählen, Quittung nehmen.
- Gilbarco Veeder-Root und Wayne Fueling Systems sind die dominanten Dispenser-Hardwarehersteller; ihre Firmware spielt WAV-Dateien ab, die vom Betreiber geladen werden.
- Shell, BP, Chevron und Petrobras haben jeweils Audio-Markenrichtlinien; Franchise-Standorte variieren.
- Mehrsprachige Zapfsäulen (Englisch/Spanisch/Portugiesisch) sind an Standorten mit hohem Verkehrsaufkommen im US-Süden, Südwesten und Lateinamerika Standard.
- Die Audioproduktion erfordert die Anpassung an die niedrigbitratigen WAV-Spezifikationen eingebetteter Dispenser-Hardware.
- VoxBoosters KI-Sprachengine kann das vollständige Pumpanfragen-Set in jeder Sprache generieren und exportieren, abgestimmt auf die Hardwarespezifikation.
Warum Zapfsäulen konsistentes KI-Sprachsystem benötigen
Jedes Mal wenn Sie zu einer Selbstbedienungs-Zapfsäule in Nordamerika gehen, hören Sie keine Aufnahme eines menschlichen Mitarbeiters — es handelt sich um ein synthetisches Ansagensystem, das in die Dispenser-Hardware eingebettet ist. Die praktischen Gründe liegen auf der Hand. Ein Kraftstoff-Einzelhandelsnetzwerk kann Tausende von Standorten in mehreren Bundesstaaten oder Ländern betreiben. Eine einzige Ansagen-Aktualisierung — das Hinzufügen einer neuen Zahlungsoption, das Ändern einer Sicherheitswarnung oder die Auffrischung einer Markenbegrüßung — erfordert den Austausch von Audiodateien auf Tausenden von Geräten.
Der andere Treiber ist Genauigkeit. Zapfsäulen-Ansagen führen Kunden durch eine echte Finanztransaktion an einem physischen Outdoor-Gerät. Mehrdeutige oder unhörbare Ansagen erzeugen Reibung: Kunden, die nicht verstehen, ob die Zapfsäule ihre Karte akzeptiert hat, können den richtigen Zapfhahn nicht identifizieren oder verpassen die Quittungsaufforderung — und müssen dann reingehen, um einen Kassierer zu fragen.
Gilbarco Veeder-Root und Wayne Fueling Systems: Die Hardware-Plattformen
Das Verständnis der Zapfsäulen-Audioproduktion beginnt mit der Hardware. In Nordamerika dominieren zwei Hersteller den Forecourt-Dispenser-Markt:
Gilbarco Veeder-Root (ein Fortive-Unternehmen) produziert die Encore-, Edge- und Passport-Produktlinien. Ihre Dispenser sind weit verbreitet bei Chevron, BP und unabhängigen Standorten. Gilbarcos eingebettetes Audiosystem spielt vorgeladene WAV-Dateien aus dem internen Flash-Speicher ab.
Wayne Fueling Systems (eine Enovis-Marke) produziert die Ovation-, Helix- und iXPay-Dispenser. Wayne-Hardware dominiert bei vielen Shell-, ExxonMobil- und großen Kettenstandorten. Wayne Nucleus ermöglicht es Betreibern, Audio-Updates remote über eine Flotte zu verteilen.
Beide Plattformen haben Legacy-Hardware im Einsatz, die nur 8 kHz oder 16 kHz PCM WAV akzeptiert — eine Abtastrate aus frühen 1990er-Jahren-Dispenser-Hardware. Neuere Generation Hardware (Gilbarco Encore 700 S und Wayne Helix) unterstützt 44,1 kHz. Bei der Produktion für eine gemischte Flotte ist es am sichersten, bei 44,1 kHz zu produzieren und dann für ältere Geräte auf 16 kHz downzusampeln.
| Merkmal | Gilbarco Veeder-Root | Wayne Fueling Systems |
|---|---|---|
| Wichtige Modelle | Encore, Edge, Passport | Ovation, Helix, iXPay |
| Häufige Netzwerke | Chevron, BP, unabhängig | Shell, ExxonMobil, Kette |
| Audioformat (Legacy) | WAV PCM 16-Bit, 8–16 kHz | WAV PCM 16-Bit, 8–16 kHz |
| Audioformat (neu) | WAV 44,1 kHz (Encore 700 S) | WAV 44,1 kHz (Helix) |
| Remote-Audio-Update | Passport Site Controller | Wayne Nucleus Cloud |
| Mehrsprachige Unterstützung | Ja, Datei pro Sprache | Ja, Datei pro Sprache |
Das vollständige Kraftstoff-Zapfsäulen-Audio-Ansagen-Set
Ein gut gestaltetes Pay-at-Pump-Audiosystem deckt jeden Transaktionsstatus ab. Nachfolgend finden Sie eine Referenztabelle für ein vollständiges Deployment.
| Ansagen-ID | Skript (neutral Englisch) | Auslösestatus |
|---|---|---|
| BEGRÜSSUNG | ”Willkommen. Bitte führen Sie Ihre Karte ein oder halten Sie sie ans Gerät.” | Kundennäherung / Pumpenwecken |
| KARTE_EINFÜHREN | ”Bitte führen Sie Ihre Karte in den Schlitz ein.” | Karte noch nicht erkannt |
| TAP_ZU_ZAHLEN | ”Halten Sie Ihre Karte oder Ihr Telefon zum kontaktlosen Zahlen ans Gerät.” | NFC-Zahlung aktiviert |
| PIN_EINGABE | ”Bitte geben Sie Ihre PIN ein und drücken Sie Bestätigen.” | Chip/PIN-Karte erkannt |
| PLZ_EINGABE | ”Bitte geben Sie Ihre Rechnungs-Postleitzahl ein.” | Kreditkarten-PLZ-Verifizierung |
| AUTOWÄSCHE | ”Möchten Sie heute eine Autowäsche hinzufügen?” | Upsell-Trigger nach Autorisierung |
| KRAFTSTOFF_WÄHLEN | ”Bitte wählen Sie Ihre Kraftstoffsorte.” | Autorisierung genehmigt |
| ZAPFHAHN_ANHEBEN | ”Heben Sie den Zapfhahn an und beginnen Sie mit dem Tanken.” | Kraftstoffsorte gewählt |
| TANK_START | ”Tankvorgang hat begonnen.” | Zapfhahn-Durchflusssensor aktiv |
| TANK_STOP | ”Tankvorgang abgeschlossen.” | Zapfhahn zurückgehängt |
| QUITTUNG_ANGEBOT | ”Möchten Sie eine Quittung? Drücken Sie Ja oder Nein.” | Transaktionsabschluss |
| QUITTUNG_DRUCKEN | ”Bitte entnehmen Sie Ihre Quittung.” | Quittung wird gedruckt |
| KEINE_QUITTUNG | ”Danke. Gute Fahrt.” | Keine Quittung gewählt |
| KARTE_ABGELEHNT | ”Ihre Karte wurde nicht genehmigt. Bitte verwenden Sie eine andere Karte.” | Autorisierung abgelehnt |
| PUMPEN_FEHLER | ”Diese Pumpe ist vorübergehend außer Betrieb. Bitte wenden Sie sich an die Kasse.” | Hardwarefehler |
| ZAPFHAHN_FEHLER | ”Zapfhahn nicht erkannt. Bitte hängen Sie den Zapfhahn ein und versuchen Sie es erneut.” | Zapfhahn-Sensorfehler |
Audio-Engineering für Outdoor-Kraftstoffdispenser-Lautsprecher
Die akustische Umgebung an einer Tankstelle ist für die Sprachverständlichkeit ungünstig. Umgebungslärm umfasst:
- Verkehrslärm: 65–80 dB SPL auf einer belebten Straße
- Vordach-Echo: Das Metalldach erzeugt frühe Reflexionen, die Konsonanten verwaschen
- Wind: Böen von 15–30 km/h erzeugen breitbandiges Rauschen
- Motorlärm: Kundautos im Leerlauf bei 50–60 dB
Der Dispenser-Lautsprecher ist typischerweise ein kleiner Breitband-Konus-Treiber (7,5–10 cm) in einem versiegelten Kunststoffgehäuse. Die Frequenzantwort hat einen Höhepunkt um 1–3 kHz und fällt unterhalb 200 Hz und oberhalb 8 kHz stark ab.
Schritt 1 — Hochpassfilter bei 200 Hz
Der Dispenser-Lautsprecher kann unterhalb 200 Hz keinen sinnvollen Bass wiedergeben. Wenden Sie einen 24 dB/Oktave-Butterworth-Hochpassfilter bei 180–200 Hz auf das generierte Audio an.
Schritt 2 — Präsenzanhebung bei 2–4 kHz
Der 2–4-kHz-Band enthält die wichtigsten Sprachkonsonanten. Eine Anhebung dieses Bereichs um +2 bis +3 dB verbessert die Verständlichkeit im Umgebungslärm erheblich.
Schritt 3 — Peaknormalisierung
Zielpeaks bei -3 dBFS mit einem Limiter bei -1 dBFS. Konsistente Peakpegel über alle Audiodateien verhindern, dass einige Ansagen deutlich lauter oder leiser als andere klingen.
Schritt 4 — Exportformat
Legacy Gilbarco Veeder-Root und Wayne Hardware: WAV PCM 16-Bit, 16 kHz (oder 8 kHz für älteste Geräte). Neue Generation Hardware: WAV PCM 16-Bit oder 24-Bit, 44,1 kHz.
Shell, BP, Chevron und Petrobras Audio-Markenrichtlinien
Die großen Ölnetzwerke haben jeweils Voice-Markenstandards, die über die Wahl des Geschlechts der Stimme hinausgehen.
Shell pflegt eine globale Markenstimme, die Klarheit und Zugänglichkeit betont. Shell-markierte Dispenser an firmeneigenen Standorten verwenden eine neutrale weibliche Stimme mit einem gemäßigten nordamerikanischen Akzent in den USA. Shells Audio-Richtlinien legen Mindest-Verständlichkeitsstandards fest.
BP (British Petroleum) verwendet eine ähnlich neutrale Stimme für ihr US-Netzwerk, oft mit etwas wärmerer Intonation als Mitbewerbernetzwerke. BPs globales Netzwerk umfasst genug Regionen, dass ihr Audio-Team Sprachvarianten für nordamerikanisches Englisch, britisches Englisch, Deutsch, Niederländisch und mehrere andere Märkte pflegt.
Chevron (das in vielen Märkten auch Texaco-Standorte betreibt) verfolgt einen funktionaleren Ansatz beim Zapfsäulen-Audio — die Stimme ist sauber und direkt, nicht besonders warm oder markenbewusst. Chevrons zweisprachige Englisch/Spanisch-Anforderung an Standorten in Kalifornien gehört zu den strengsten in Nordamerika.
Petrobras betreibt das größte Kraftstoffeinzelnetz in Lateinamerika mit Tausenden von Standorten in Brasilien. Petrobras-Zapfsäulen-Audio ist primär auf brasilianisches Portugiesisch (pt-BR) ausgerichtet — das Vokal-System, die Prosodie und die Intonationskonturen unterscheiden sich so stark vom europäischen Portugiesisch, dass ein EU-PT-Sprachmodell für brasilianische Standorte deutlich unnatürlich klingt.
Mehrsprachiges Gas-Pumpen-Audio: Englisch, Spanisch und Portugiesisch
Die häufigste mehrsprachige Anforderung im nordamerikanischen Kraftstoffeinzelhandel ist Englisch und Spanisch. In Bundesstaaten mit großer spanischsprachiger Bevölkerung — Kalifornien, Texas, Florida, Arizona, New Mexico — stehen Zapfsäulenbetreiber sowohl kommerziellen als auch regulatorischen Anforderungen gegenüber, spanischsprachige Ansagen anzubieten.
Die Registerauswahl für spanischsprachige Zapfsäulen-Audio folgt derselben Konvention wie bei Fluggesellschaften und Bankautomaten-IVR: formelles “usted” statt informelles “tú”. Alle spanischen Ansagen für Kraftstoffdispenser sollten das formelle Usted-Register verwenden.
Die Spracherkennungs-Pipeline an einer mehrsprachigen Zapfsäule funktioniert folgendermaßen:
- Das Zahlungsterminal liest die BIN (Bank Identification Number) der Karte.
- Der Touchscreen zeigt zu Beginn der Transaktion eine Sprachauswahl an.
- Der Site-Controller leitet die Sprachwahl des Kunden an den Firmware-Audioplayer weiter, der die korrekte Sprachspur für jeden nachfolgenden Ansageschritt abspielt.
- Wenn innerhalb eines Timeout-Fensters keine Auswahl getroffen wird, fällt der Dispenser auf Englisch zurück.
Häufig gestellte Fragen
Was ist KI-Sprachsystem an Zapfsäulen?
KI-Sprachsystem an Zapfsäulen ist ein synthetisches Text-to-Speech-System, das in Selbstbedienungs-Kraftstoffdispensern verbaut ist. Es spielt bei jedem Transaktionsschritt geskriptete Audioanweisungen ab — Karte einführen, Kraftstoffsorte wählen, Zapfhahn anheben, Tanken beginnen, Quittung entnehmen — und ersetzt damit die Notwendigkeit, Kunden mündlich durch den Zahlungs- und Tankvorgang zu führen.
Wer produziert die Stimme an Tankstellenzapfsäulen?
Das Audio an Tankstellenzapfsäulen wird vom Dispenser-Hersteller oder dem Ölkonzern-Marketingteam produziert. Gilbarco Veeder-Root und Wayne Fueling Systems sind die beiden dominanten Hardwarehersteller in Nordamerika. Ihre Dispenser-Firmware spielt WAV- oder MP3-Audiodateien ab, die Betreiber in das Gerät laden.
Kann ein KI-Sprachgenerator Zapfsäulen-Ansagen erstellen?
Ja. Ein moderner KI-Sprachgenerator ermöglicht es Ihnen, die vollständige Zahlungssequenz zu skripten und Audiodateien im WAV-Format zu exportieren, das die meisten Dispenser-Firmwares benötigen. Sie können dasselbe Skript auf Englisch, Spanisch, Portugiesisch oder anderen Sprachen aus einem einzigen Workflow produzieren, ohne für jede Sprache separate Sprachtalente zu engagieren.
Welches Audioformat verwenden Kraftstoffdispenser?
Die meisten Gilbarco Veeder-Root- und Wayne Fueling Systems-Dispenser akzeptieren WAV-Dateien mit PCM 16-Bit, 8 kHz oder 16 kHz Abtastrate — eine Legacy-Spezifikation der eingebetteten Hardware in älteren Geräten. Neuere Dispenser-Plattformen unterstützen 44,1 kHz PCM. Prüfen Sie immer die Site-Controller-Dokumentation für Ihre spezifische Hardware, bevor Sie den endgültigen Export produzieren.
Fazit
Zapfsäulen-KI-Sprachsysteme sind keine glamouröse Infrastruktur, aber eine Infrastruktur, die täglich Millionen von Kundeninteraktionen über Kraftstoff-Einzelhandelsnetzwerke abwickelt, die auf Gilbarco Veeder-Root und Wayne Fueling Systems-Dispensern aufgebaut sind. Die Ansagen richtig zu machen — klar, konsistent gesprochen, mehrsprachig wo erforderlich, ADA-konform, abgestimmt auf die akustischen Grenzen der Lautsprecher-Hardware — ist der Unterschied zwischen einer reibungslos abgeschlossenen Transaktion und einer, die damit endet, dass der Kunde hineingeht, um einen Kassierer zu fragen.
Laden Sie VoxBooster herunter — kostenlose 3-Tage-Testversion, keine Kreditkarte erforderlich.