Voice Changer für DaVinci Resolve Editoren

Wie man einen Echtzeit-Voice-Changer in DaVinci Resolve 20+ über Fairlight integriert: WASAPI-Routing, AI ADR-Ersatz, mehrsprachige Sprachausgabe und Whisper-Untertitel.

DaVinci Resolve ist still zu Hollywoods Standard-Editing-Umgebung für einen großen Teil des Indie-Films, YouTube-Dokumentationen und des Unternehmensvideomarktes geworden — hauptsächlich, weil der kostenlose Tarif wirklich professionell ist. Wenn Sie in Resolve bearbeiten und auch Ihre eigene Sprachausgabe, ADR-Nachnahmen oder mehrsprachige Bereitstellung durchführen, passt ein Echtzeit-Voice-Changer in diesen Arbeitsablauf auf nützlichere Weise, als die meisten Editoren realisieren.

Dieser Leitfaden richtet sich an Editoren, die bereits mit Resolve vertraut sind und genau verstehen möchten, wie Sprachverarbeitung in Fairlight, wo KI-Klone praktischen Wert hinzufügen, und wie man Untertitel-Generierung ohne Verlassen der Resolve-Timeline einrichtet.


TL;DR

  • Leiten Sie die Voice-Changer-Ausgabe als WASAPI-Eingabegerät in den Aufnahmevorgaben von Fairlight — keine Resolve-Plugins erforderlich
  • KI-Sprachklone abdecken ADR-Nachnahmzeilen ohne Wiederversammlung einer Studiositzung
  • Mehrsprachige Sprachausgabe-Durchläufe: Klonen Sie die Quellstimme einmal, generieren Sie Zielsprachen-Audio, legen Sie auf einem parallelen Fairlight-Track ab
  • Whisper transkribiert die verarbeitete Audio zu SRT; direkt in Resolve’s Subtitles-Track importieren
  • Latenz unter 300 ms ist angenehm für Live-Overdub-Überwachung; die meisten KI-Prozessoren erreichen 80–250 ms auf WASAPI
  • Kein Kerneltreiber = kein Konflikt mit Resolve’s Audio-Engine

Warum Editoren sich 2026 Voice-Changer in DaVinci Resolve ansehen

Die kreative Wirtschaft rund um DaVinci Resolve hat sich über Coloristen hinaus erweitert. Da der kostenlose Tarif von DaVinci Resolve vollständige Multi-Track-Audio-Bearbeitung über Fairlight abdeckt, beenden Editoren Audio in-house, anstatt zu einer separaten DAW zu springen. Diese Verschiebung bringt neue Anforderungen: Sprachausgaben-Overdubs, Zeichenstimmen-Konsistenz über erneut bearbeitete Sequenzen und internationale Bereitstellung ohne Einstellung neuer Talente für jeden lokalen Markt.

KI-Sprachverarbeitung füllt spezifische Lücken in dieser Produktionskette — nicht als Gimmick, sondern als Tool für Aufgaben, die früher eine komplette Studiobuchung erforderten.


Die Fairlight Audio-Seite verstehen

Fairlight ist nicht eine vereinfachte Audio-Suite, die an einen Video-Editor angehängt ist. Es ist eine vollständige Digital Audio Workstation in Resolve, aufgebaut um die gleiche Engine, die dedizierte Fairlight-Hardware-Konsolen in der Post-Produktion antreibt. Für die Voice-Changer-Integration sind die relevanten Teile:

Geräte-Setup: Fairlight verwendet WASAPI (oder ASIO) für Audio-Erfassung auf Windows. Die Geräteliste ist unter Einstellungen > System > Audio I/O konfigurierbar. Jedes WASAPI-verfügbar gemachte Eingabegerät erscheint hier — einschließlich der virtuellen Ausgabe eines Sprachprozessors.

Track-Typen: Audio-Tracks in Fairlight unterstützen Multi-Take-Aufnahmen, Punch-In und Track-Schichtung. Sie können eine verarbeitete Stimme auf einem dedizierten Track aufnehmen, während das Original VO auf einem separaten Track bleibt, und dann zwischen ihnen nicht-destruktiv wechseln.

FX-Kette: Die eingebaute Effects-Kette von Fairlight (EQ, Kompressor, De-Esser, Reverb) sitzt auf allem, was passierte, bevor die Audio in Resolve eintrat. Sie stapeln Standard-Post-Produktion auf eine Stimme, die bereits KI-Umwandlung hatte — die zwei Pipelines interferieren nicht.

Für einen tieferen Blick auf Fairlights Fähigkeiten, der DaVinci Resolve Wikipedia-Eintrag hat einen soliden Überblick, wie die Fairlight-Integration von BlackMagics Akquisition des ursprünglichen Fairlight-Unternehmens evolvierte.


WASAPI in Fairlight leiten

Der Integrationspunkt ist der WASAPI-Geräte-Selector. Hier ist der genaue Pfad:

  1. Öffnen Sie DaVinci Resolve → DaVinci Resolve-Menü > Einstellungen > System
  2. Unter Audio I/O, stellen Sie das Input Device auf die virtuelle Ausgabe Ihres Voice-Processors ein
  3. Auf der Fairlight-Seite, rüsten Sie einen neuen Audio-Track für die Aufnahme aus
  4. Sprechen Sie in Ihr Mikrofon — Fairlight erfasst die umgewandelte Stimme in Echtzeit

Der Voice-Processor läuft außerhalb von Resolve als separater Windows-Prozess. Resolve sieht einen sauberen WASAPI-Stream und nimmt ihn genau wie jedes andere Mikrofon auf. Wenn Ihr System das virtuelle Gerät als WASAPI-Ausgabe statt Eingabe anzeigt, überprüfen Sie, ob Ihr Voice-Processor eine Monitor-/Loopback-Erfassungsoption verfügbar macht — die meisten tun das.

Puffergröße zählt. Ein 512-Sample-WASAPI-Puffer bei 48 kHz addiert etwa 10 ms Systemlatenz zu allem, was der Voice-Processor selbst beiträgt. Für Sprachausgaben-Overdubs, bei denen Sie die Wiedergabe überwachen, während Sie aufnehmen, halten Sie die totale Kette unter 300 ms oder verwenden Sie einen direkten Kopfhörer-Feed vom Prozessor, bevor er in Resolve eintritt.


KI ADR: Dialog ohne Wiederversammlung ersetzen

ADR (Automated Dialogue Replacement) ist die Post-Produktion-Praxis, on-set-Dialog in einer kontrollierten Studienumgebung erneut aufzunehmen. Traditionell erfordert dies:

  • Studio-Zeit buchen
  • Die Cast wieder zusammenbringen
  • Ein Sound-Ingenieur und Regisseur anwesend für Konsistenz

Für professionelle Feature-Filme ist dieser Prozess unverhandelbar. Für Indie-Produktionen, Unternehmensvideos und YouTube-Dokumentationen ist der Overhead oft disproportional zur Anzahl der Zeilen, die ersetzt werden müssen — typischerweise eine Handvoll Nachnahmen, wo On-Set-Audio zu laut war oder die Lieferung nach dem Schnitt Anpassung benötigte.

KI-Sprachklone ändern die Berechnung. Der Arbeitsablauf:

  1. Erfassen Sie eine kurze Referenzsitzung mit dem Talent (5–10 Minuten sauberer Audio)
  2. Trainieren Sie ein Stimmmodell aus der Referenz
  3. Nehmen Sie die Nachnahmzeilen selbst erneut auf oder geben Sie sie als TTS-Eingabe ein, wobei das Modell in der ursprünglichen Talent-Stimme rendert
  4. Legen Sie die gerrendete Audio auf den ADR-Track auf Fairlights Timeline

Das Ergebnis ist unter jeder Umstand nicht vom Live-Studio-Session unterscheidbar, aber für eine Zeilen-Anpassung oder einen schnellen Einsatz ist die Qualität für die meisten Dokumentar-, Unternehmens- und Narrative-Web-Video-Formate ausreichend. Die Fairlight Audio-Seite Dokumentation behandelt das ADR-Track-Setup im Detail.

Was dies praktisch statt nur theoretisch macht, ist Latenz. Echtzeit-KI-Sprachklone-Prozessoren, die eine WASAPI-Ausgabe verfügbar machen, können ADR-Überwachung live laufen — der Editor hört die geklonte Stimme in den Kopfhörern, während er aufnimmt, ohne auf Offline-Rendering zu warten. Unter 300 ms Round-Trip-Verarbeitung lässt sich dies wie natürliche Overdub-Arbeit anfühlen, statt Stop-and-Wait-Synthese.


Mehrsprachige Sprachausgaben-Durchläufe in einer Timeline

Die Bereitstellung eines Videos in mehreren Sprachen bedeutete traditionell das Einstellen von separatem Sprachtalent für jeden lokalen Markt. Für Kanäle, die ein globales Publikum anpeilen, waren die Kosten und Planungsreibung der mehrsprachigen Bereitstellung historisch ein limitierender Faktor.

Der Voice-Cloning-Arbeitsablauf für mehrsprachige Sprachausgabe:

  1. Nehmen Sie eine saubere Referenzstimme auf (der Sprecher, den Sie klonen möchten — einschließlich selbst)
  2. Bereiten Sie Skripte in jeder Zielsprache vor (menschliche Übersetzung lohnt sich immer noch für Nuancen)
  3. Generieren Sie Sprachausgaben-Audio für jede Sprache mit dem geklonten Stimmmodell
  4. In Fairlight, erstellen Sie einen parallelen Audio-Track für jede Sprachversion
  5. Exportieren Sie separate Mischungen mit dem entsprechenden Sprachausgaben-Track aktiviert

Dies hält das gesamte Projekt in einer Resolve-Timeline. Das Wechseln zwischen Sprachversionen ist eine Track-Stummschaltungs-/Aufhebungs-Operation, nicht eine separate Export-Sitzung für jeden lokalen Markt. Musik, SFX und atmosphärische Betten bleiben auf gemeinsamen Tracks. Der Editor muss nicht mehrere Projektdateien verwalten.

Für den Untertitel-Track, der jeder Sprachausgaben-Version folgt, verarbeitet Whisper den Transkriptions-Schritt.


Whisper-Untertitel für Resolves Untertitel-Track

Resolve 18.6+ hat einen nativen Untertitel-Track mit SRT-Import. Whisper — OpenAIs Open-Source-Speech-Recognition-Modell — generiert SRT-Dateien mit hoher Genauigkeit auf sauberer Audio, einschließlich Audio, die von einem Voice-Changer verarbeitet wurde.

Schritt-für-Schritt:

  1. Exportieren Sie einen flachen Mix des Sprachausgaben-Tracks aus Fairlight (keine Musik/SFX, nur die Stimme)
  2. Führen Sie Whisper auf der exportierten Audio aus: whisper narration.wav --language en --output_format srt
  3. Überprüfen Sie die SRT auf Timing-Anpassungen — Whisper liegt gewöhnlich innerhalb eines Wortes der tatsächlichen Grenze
  4. Auf Resolves Edit-Seite: Timeline > Subtitle importieren → wählen Sie die SRT
  5. Die Untertitel erscheinen auf einem dedizierten Untertitel-Track über dem Video, inline bearbeitbar

Für mehrsprachige Bereitstellung führen Sie Whisper einmal pro Sprachausgaben-Track aus. Das Untertitel-Timing passt natürlich zur gesprochenen Audio, da die SRT von diesem spezifischen Take abgeleitet ist, nicht von einer Annäherung vom Skript.

Whisper verarbeitet sprachverarbeitete Audio gut, weil seine Genauigkeit von Phonem-Mustern im Audio-Signal abhängt, nicht von der spezifischen Timbre oder dem Resonanz der Stimme. Eine Stimme, die pitch-verschoben oder zu einer anderen Sprecher-Identität geklont wurde, ist immer noch phonetisch lesbar für das Modell.


Vergleich: Sprachverarbeitungs-Ansätze für Resolve-Editoren

AnsatzLatenzADR-VerwendungMehrsprachigWhisper-kompatibelTreibertyp
Keine Verarbeitung (Raw-Mic)~10 msNeinNeinJaN/A
DSP Pitch-Versatz<15 msBegrenztNeinJaBenutzermodus
KI-Sprachklon (Echtzeit)80–250 msJaJaJaBenutzermodus
Offline TTS-RenderN/A (Offline)JaJaJaN/A
Kernel virtuelles Audio-TreiberVariiertBegrenztNeinJaKernel (Risiko)

Für die meisten Resolve-Editoren ist die praktische Wahl zwischen Echtzeit-KI-Klonen (nützlich zum Überwachen während der Aufnahme) und Offline-TTS-Rendering (höhere Qualität, keine Latenz-Einschränkung). Echtzeit funktioniert besser für Sprachausgaben-Overdubs, bei denen Timing und Sync zu Bildern zählen. Offline-Rendering funktioniert besser für mehrsprachige ADR, wo Sie vor dem Platzieren in der Timeline überprüfen und akzeptieren können.


VoxBooster als WASAPI-Quelle für Fairlight einrichten

VoxBooster macht ein WASAPI-Ausgabegerät auf Windows 10/11 verfügbar, ohne dass eine Kernel-Treiber-Installation erforderlich ist. Der Setup-Pfad für Fairlight:

  1. Starten Sie VoxBooster und bestätigen Sie, dass die virtuelle Ausgabe in den Windows-Soundeinstellungen angezeigt wird
  2. In Resolve-Einstellungen > System > Audio I/O, wählen Sie die VoxBooster-virtuelle Ausgabe als Eingabegerät
  3. Stellen Sie WASAPI-Exklusiv-Modus aus — Fairlight muss das Gerät teilen, wenn Sie auch darunter überwachen
  4. Nehmen Sie einen Fairlight-Track auf und überprüfen Sie, dass das Signal in den Level-Metern vorhanden ist, bevor Sie eine Aufnahme starten

Für ADR-Arbeit speziell: aktivieren Sie VoxBooster’s KI-Klone-Modus mit Ihrem geladenen Referenz-Stimmmodell, bevor die Sitzung beginnt. Die Verarbeitungslatenz unter 300 ms bedeutet, dass Sie die geklonte Stimme in Echtzeit durch Kopfhörer überwachen können, während Sie Resolve’s Wiedergabe ansehen — die gleiche Muskelgedächtnis wie Standard-Overdub-Aufnahme. Der Tarif von $6.99 USD pro Monat umfasst den KI-Klone-Feature-Satz, der für diesen Arbeitsablauf erforderlich ist.


Praktische Workflow-Tipps für DaVinci-Editoren

Farbe und Audio parallel, nicht in Serie. Resolve’s Timeline wird über Cut, Edit, Fairlight und Color-Seiten geteilt. Sie müssen die Farbe nicht fertigstellen, bevor Sie Audio anfassen. Führen Sie Sprachausgaben-Aufnahmen-Sitzungen gegen einen groben Schnitt durch — Sie werden näher am finalen Timing sein, und ADR-Nachnahmen werden mehr natürlich synchronisieren.

Nutzen Sie Fairlights ADR-Panel. Das ADR-Panel (zugänglich über Fairlight > ADR) bietet einen Count-In, einen Beep-Track und visuelle Sync-Hinweise. Dies ist genau für den hier beschriebenen Neuaufnahme-Arbeitsablauf ausgelegt. Es funktioniert mit jeder WASAPI-Quelle, einschließlich eines Voice-Processor-Ausgangs.

Bounce zu Clip für Sprachausgaben-Renders. Nach der Aufnahme einer verarbeiteten Sprachausgaben-Aufnahme verwenden Sie Fairlights “Bounce to new track”, um die Audio zu einem sauberen WAV-Clip abzuflachen. Dies entfernt die Abhängigkeit vom externen Voice-Processor, der während des Exports läuft, und macht das Projekt tragbar.

Verweisen Sie auf Resolves Untertitel-Export. Sobald Untertitel importiert sind, können Sie sie als SRT, VTT oder Burned-In über die Deliver-Seite’s Untertitel-Optionen exportieren. Für YouTube-Uploads ist der SRT-Export sauberer als Burned-In-Captions, da YouTube ihn für seine eigene Untertitel-Schicht verwenden kann.


Wem dieser Arbeitsablauf tatsächlich passt

Dieses Setup ist am nützlichsten für einen spezifischen Editor-Typ: jemand, der allein oder in einem sehr kleinen Team arbeitet, komplett in Resolve fertigstellt, und auch der Sprecher oder VO-Künstler für seinen eigenen Inhalt ist. Der KI-Klone-Schritt erfordert eine Referenzstimme — typischerweise bedeutet das, dass Sie sich selbst klonen, was Ihnen Flexibilität ohne die Kosten für Talent gibt.

Es ist auch genuinely nützlich für Unternehmensvideos-Editoren, die den gleichen Inhalt an mehrere regionale Märkte liefern. Wenn Sie Trainings- oder Erklärbedürfnis-Videos für ein internationales Unternehmen produzieren, schafft eine mehrsprachige Sprachausgaben-Pipeline in einem Resolve-Projekt den Bereitstellungs-Prozess erheblich ab.

Für Editoren, die mit externem VO-Talent unter Vertrag arbeiten, erfordert der ADR-Ersatz-Use-Case explizite Genehmigung vom Talent für Voice-Klone — das ist eine vertragliche Angelegenheit, um vor der Referenz-Aufnahme-Sitzung zu adressieren.


Interne Ressourcen


FAQ

Kann ich einen Echtzeit-Voice-Changer auf der Fairlight-Seite von DaVinci Resolve verwenden? Ja. Leiten Sie die virtuelle Ausgabe Ihres Voice-Changers als WASAPI-Eingabegerät in den Aufnahmevorgaben von Fairlight. Resolve nimmt die umgewandelte Stimme genau wie jede andere Standard-Mikrofoningabe auf — es sind keine Plugins oder speziellen Treiber auf der Resolve-Seite erforderlich.

Funktioniert ein Voice-Changer mit der kostenlosen Version von DaVinci Resolve? Ja, vollständig. Der kostenlose Tarif von DaVinci Resolve 20 enthält die komplette Fairlight-Audioseite mit Multi-Track-Aufnahme. WASAPI-Geräteauswahl ist in beiden kostenlosen und Studio-Versionen verfügbar, daher funktioniert die Voice-Changer-Integration in beiden identisch.

Was ist KI ADR-Ersatz und wie hilft ein Voice-Changer? ADR (Automated Dialogue Replacement) re-recorded Dialoge in einem Studio, um laute oder fehlgeschlagene Originalaufnahmen zu ersetzen. KI-Sprachklone ermöglichen es einem einzelnen Editor, Zeilen mit einem trainierten Klon der Originalstimme des Schauspielers erneut aufzunehmen und vermeiden die Notwendigkeit, eine komplette Studiositzung für kleine Nachnahmen zu wiederholen.

Kann ich mehrsprachige Sprachausgabe für die Resolve-Timeline generieren, ohne Sprachtalent einzustellen? KI-Sprachklone können Sprachausgabe in mehreren Sprachen mit einem Quellstimmmodell erzeugen. Der Arbeitsablauf ist: Aufnahme oder Import einer Referenzstimme, Klonen, Generierung des Zielsprachenskripts als Audio und dann Ablegen auf einem separaten Fairlight-Track neben dem Original. Nützlich für YouTube-Lokalisierung oder Unternehmensvideobereitstellung.

Wie verbinden sich Whisper-generierte Untertitel mit DaVinci Resolve? Whisper transkribiert eine Audiodatei in das SRT-Format. Importieren Sie die SRT in Resolve über den Subtitles-Track (Edit-Seite > Timeline > Subtitle importieren). Für beste Genauigkeit führen Sie Whisper auf dem sauberen Mix-Down aus, nicht auf der Raw-Location-Audio — es verarbeitet eine veränderte Stimme genauso gut wie das Original.

Welche Latenz ist akzeptabel für die Live-Sprachausgabenaufnahme in Resolve? Fairlights Überwachung nutzt den ASIO- oder WASAPI-Puffer des Systems. Bei Sprachausgaben-Overdubs, bei denen Sie bei der Aufnahme die Wiedergabe hören, ist eine Verarbeitungslatenz von unter 300 ms angenehm. Die meisten Echtzeit-KI-Sprachprozessoren mit WASAPI-Ausgabe liegen im Bereich von 80–250 ms, was innerhalb akzeptabler Grenzen liegt.

Benötigt ein Voice-Changer einen Kerneltreiber, der mit Resolve in Konflikt geraten könnte? Treiberkonfikte sind ein echtes Problem mit älteren virtuellen Audio-Tools. Moderne Voice-Changer, die vollständig im Benutzermodus arbeiten und ein Standard-WASAPI-Gerät verfügbar machen, installieren keine Kerneltreiber, was diese Konfliktkategorie vollständig ausschließt. Überprüfen Sie immer vor der Installation, dass kein Kernel-Level-Audiotreiber erforderlich ist.

VoxBooster testen — 3 Tage kostenlos.

Echtzeit-Stimmklon, Soundboard und Effekte — überall, wo du schon redest.

  • Keine Kreditkarte
  • ~30 ms Latenz
  • Discord · Teams · OBS
3 Tage kostenlos testen