Comment changer votre voix au microphone : tutoriel complet

Apprenez à changer votre voix au microphone. Tonalité, formants, résonance expliqués, chaîne de signal WASAPI et configuration étape par étape pour Discord, Zoom, OBS et in-game.

Comment changer votre voix au microphone : tutoriel complet

Changer votre voix au microphone est plus simple que la plupart des guides ne le font paraître - mais seulement si vous comprenez ce que le logiciel fait réellement. Ce tutoriel couvre les fondamentaux acoustiques (tonalité, formants, résonance), la chaîne de signal audio Windows et la configuration étape par étape pour Discord, Zoom, OBS et la voix en jeu.


TL;DR

  • Le changement de voix fonctionne en interceptant le signal de microphone en logiciel, avant que n’importe quelle application ne le voie
  • Le décalage de tonalité seul semble robotique - combinez-le avec le décalage de formants pour des résultats naturels
  • WASAPI est l’API audio de bas niveau Windows qui permet la latence de traitement sous 20 ms
  • La sortie achemine vers un microphone virtuel que vos applications sélectionnent à la place du vrai
  • La configuration est le même motif pour chaque application : sélectionner le microphone virtuel comme entrée
  • VoxBooster gère WASAPI, le clonage de voix par IA et le routage virtuel en une installation - sous 300 ms bout à bout sur n’importe quelle machine Windows 10/11

1. Ce qui se passe réellement quand vous « changez votre voix »

Votre voix est un signal acoustique complexe. Trois propriétés déterminent comment elle sonne:

Tonalité (F0 - fréquence fondamentale) La tonalité est la vitesse à laquelle vos cordes vocales vibrent. Les hommes adultes en moyenne autour de 85-180 Hz; les femmes adultes autour de 165-255 Hz. Augmenter la tonalité d’une octave double F0; l’abaisser le réduit de moitié.

Formants Les formants sont les pics résonnants produits par votre tractus vocal (gorge, bouche, cavité nasale) façonnant le bourdonnement brut de vos cordes vocales. F1 et F2 sont les plus importants perceptuellement - ils déterminent les sons de voyelles et donnent à une voix sa timbre caractéristique. Un baryton et un ténor chantant la même note à la même tonalité sonnent toujours différents parce que leurs formants diffèrent.

Enveloppe spectrale La distribution globale de l’énergie à travers les fréquences - ce qui rend une voix semble « chaleureuse », « nasale », « aérée » ou « nette ».

Un décaleur de tonalité de base déplace F0 sans toucher aux formants. C’est pourquoi les changeurs de voix bon marché sonnent comme des écureuils ou des monstres grondants - la fondamentale se déplace mais les résonances restent au mauvais endroit. Le changement vocal en temps réel de qualité professionnelle décale la tonalité et les formants indépendamment et ajuste l’enveloppe spectrale pour correspondre au profil de voix cible. C’est cette combinaison qui produit une voix convaincante différente plutôt qu’une clairement traitée.


2. La chaîne de signal WASAPI sous Windows

Comprendre le chemin du signal vous aide à tout configurer correctement et à diagnostiquer les problèmes.

Microphone physique

Pilote audio Windows (WASAPI)

Logiciel de changement de voix (boucle de capture)
     → Moteur de décalage de tonalité
     → Moteur de décalage de formants
     → Chaîne d'effets (EQ, réverbération, porte bruit)

Périphérique audio virtuel (microphone virtuel)

Application cible (Discord / Zoom / OBS / jeu)

Pourquoi WASAPI est important

Windows a deux interfaces audio principales : DirectSound (hérité, latence élevée) et WASAPI (Windows Audio Session API, introduit dans Vista). WASAPI peut fonctionner en deux modes :

  • Mode partagé - le moteur audio Windows mélange plusieurs flux. Ajoute un buffer de mélange (généralement 10-20 ms) mais permet à d’autres applications d’utiliser le même périphérique simultanément.
  • Mode exclusif - l’application prend la propriété directe de l’interface matérielle. Latence de mélangeur nulle, mais aucune autre application ne peut utiliser ce périphérique simultanément.

Les logiciels de changement de voix tournent généralement en mode WASAPI partagé du côté capture (lecture de votre microphone) et créent un périphérique WDM/MME virtuel pour la sortie - le microphone virtuel. Cela permet à Discord, Zoom et à d’autres applications de l’utiliser via l’énumération audio Windows normale.

Répartition de latence typique (bureau typique, matériel 2024)

ÉtapeLatence typique
Microphone analogique → numérique (ADC)1-3 ms
Buffer de capture WASAPI5-10 ms
Traitement (tonalité + formants)10-30 ms
Buffer de sortie du périphérique virtuel5-10 ms
Réception de l’application1-5 ms
Total~22-58 ms

Sous 50 ms est imperceptible en conversation vocale. Sous 100 ms est acceptable. Les logiciels nécessitant des pilotes en mode noyau ou de grands buffers DSP peuvent dépasser 150 ms, ce qui devient perceptible dans la conversation.


3. Choisir le bon logiciel de changement de voix

Avant d’entrer dans la configuration par application, choisissez le logiciel qui convient à votre cas d’usage :

Pour une utilisation occasionnelle / streaming / jeux : Un changeur de voix en temps réel avec une bibliothèque de paramètres prédéfinis et une sortie microphone virtuelle. Recherchez la prise en charge WASAPI et le décalage de formants - pas seulement la tonalité.

Pour du contenu professionnel / des voix uniques : Clonage de voix par IA, qui mappe votre discours sur un modèle de voix entraîné en temps réel. La latence est légèrement supérieure (moins de 300 ms avec les moteurs modernes) mais le résultat est indiscernable d’une voix enregistrée.

Pour la latence absolue la plus basse : Mode WASAPI exclusif natif + petites tailles de buffer (128 samples à 48 kHz = 2,67 ms par passage de buffer). Seulement important pour la performance en direct ou l’utilisation sur scène - pas nécessaire pour Discord ou les jeux.

Fonctionnalités clés à vérifier avant l’installation :

  • Crée un microphone virtuel qui apparaît dans les paramètres de son Windows
  • Aucun pilote noyau requis (les pilotes noyau peuvent entrer en conflit avec les logiciels anti-triche dans les jeux)
  • S’exécute sur Windows 10 et Windows 11 sans installations Visual C++ supplémentaires
  • Support de capture WASAPI (pas seulement l’interrogation WDM/MME)

VoxBooster installe un périphérique audio WDM virtuel signé et traite via WASAPI, sans pilote en mode noyau. Il fonctionne sur Windows 10 et Windows 11 et ajoute le clonage de voix par IA en plus des effets de tonalité/formants standard.


4. Étape par étape : Configuration pour Discord

Discord est le cas d’usage le plus courant et le plus facile à configurer.

Étape 1 — Installez et lancez votre logiciel de changement de voix

Exécutez le programme d’installation et lancez le logiciel. Confirmez qu’il apparaît dans la barre d’état système Windows et que l’audio s’écoule (le mètre d’entrée devrait réagir quand vous parlez).

Étape 2 — Vérifiez le microphone virtuel dans Windows

Ouvrez Paramètres → Système → Son → Plus de paramètres audio (ou clic droit sur l’icône du haut-parleur → Sons → onglet Enregistrement). Vous devriez voir un nouveau périphérique d’enregistrement - généralement appelé quelque chose comme “VoxBooster Virtual Microphone” ou similaire. S’il apparaît comme “Non connecté”, redémarrez le service de changement de voix.

Étape 3 — Désactivez votre microphone physique dans le mélangeur Windows

Clic droit sur votre microphone physique dans l’onglet Enregistrement → Désactiver. Cela empêche Discord de capturer également l’audio brut de votre vrai microphone simultanément. Vous pouvez le réactiver plus tard.

Étape 4 — Configurez Discord

Allez à Paramètres utilisateur → Voix & Vidéo. Sous Périphérique d’entrée, sélectionnez le microphone virtuel dans la liste déroulante. Définissez Mode d’entrée sur Voice Activity et ajustez le curseur de sensibilité jusqu’à ce que Discord n’active que quand vous parlez.

Étape 5 — Testez

Utilisez le test d’écho Vérifions cela dans les paramètres Voix & Vidéo de Discord, ou rejoignez un serveur privé avec un ami. Confirmez qu’ils entendent la voix traitée, pas votre original.

Dépannage d’écho Discord : Si d’autres vous entendent deux fois, votre microphone physique est toujours activé dans Windows - revérifiez l’étape 3.


5. Étape par étape : Configuration pour Zoom

Zoom ajoute sa propre couche de traitement audio (suppression automatique du bruit, annulation d’écho) qui peut interférer avec la sortie du changeur de voix.

Étape 1 — Complétez les étapes 1–3 de la section Discord ci-dessus (installer, vérifier le microphone virtuel, désactiver le microphone physique dans Windows).

Étape 2 — Configurez Zoom

Ouvrez Paramètres → Audio. Sous Microphone, sélectionnez le microphone virtuel. Cliquez sur Tester le microphone pour confirmer que le niveau s’enregistre.

Étape 3 — Désactivez le traitement audio de Zoom

C’est critique : allez à Paramètres → Audio → Avancé et définissez :

  • Supprimer le bruit de fond → Bas (ou Désactivé)
  • Supprimer les bruits intermittents → Désactivé
  • Annulation d’écho → Auto

La suppression agressive du bruit de Zoom traite les artefacts du changeur de voix comme du « bruit » et les filtre, dégradant l’effet. Définir sur Bas ou Désactivé permet au son traité de passer proprement.

Étape 4 — Testez

Utilisez Tester le haut-parleur et le microphone dans les paramètres audio de Zoom, ou démarrez une réunion de test. Vérifiez que la voix transformée semble propre sans artefacts.


6. Étape par étape : Configuration pour OBS

OBS (Open Broadcaster Software) est utilisé pour le streaming et l’enregistrement. Il gère les sources audio différemment des applications de communication - il capture l’audio en tant que source plutôt que de sélectionner un périphérique d’entrée système.

Étape 1 — Installez le changeur de voix et vérifiez le microphone virtuel (étapes 1–2 de la section Discord).

Étape 2 — Ajoutez le microphone virtuel en tant que source de capture d’entrée audio dans OBS

Dans OBS, allez à Sources → Ajouter → Audio Input Capture. Nommez-le (par ex., “Voice Changer”). Dans la liste déroulante de périphérique, sélectionnez le microphone virtuel.

Étape 3 — Supprimez ou mettez en sourdine votre source microphone physique

Si vous aviez auparavant une source de microphone dans OBS pointant vers votre vrai microphone, mettez-la en sourdine ou supprimez-la pour éviter le doublement.

Étape 4 — Ajoutez un filtre Noise Gate (optionnel mais recommandé)

Clic droit sur la source Audio Input Capture → Filtres → Ajouter → Noise Gate. Définissez le seuil de fermeture autour de -50 dB et le seuil d’ouverture autour de -40 dB. Cela empêche les artefacts de traitement pendant le silence d’apparaître dans l’enregistrement.

Étape 5 — Surveillez dans OBS

Clic droit sur la source audio → Paramètres audio avancés → activez Surveiller et Sortie pour entendre la voix traitée en temps réel via vos casques pendant que vous enregistrez ou diffusez.


7. Étape par étape : Voix en jeu

La plupart des jeux (Valorant, Fortnite, Counter-Strike, etc.) utilisent le périphérique de communication par défaut de Windows ou vous permettent de sélectionner un périphérique d’entrée dans les paramètres audio du jeu.

Option A — Définir comme périphérique de communication par défaut

Dans Windows Son → onglet Enregistrement, clic droit sur le microphone virtuel → Définir comme périphérique de communication par défaut. Les jeux qui sélectionnent automatiquement le périphérique de communication l’utiliseront.

Option B — Définir en jeu

Ouvrez les paramètres audio ou voix du jeu. Trouvez la liste déroulante d’entrée microphone/voix et sélectionnez le microphone virtuel par nom. Cela remplace le paramètre par défaut de Windows pour ce jeu spécifiquement.

Considérations anti-triche

Certains systèmes anti-triche (Vanguard, EAC) surveillent les pilotes en mode noyau. Un changeur de voix qui s’installe à ring-0 (pilote noyau) peut déclencher des drapeaux anti-triche. Le logiciel qui s’exécute en tant qu’application en espace utilisateur avec un périphérique audio WDM virtuel signé - aucun pilote noyau - évite complètement ce problème.

Latence dans les jeux

La voix en jeu ajoute sa propre latence réseau en plus de la latence de changement de voix local. La partie du traitement local (votre microphone → microphone virtuel) devrait rester sous 50 ms; la partie réseau est hors de votre contrôle. Le délai total perçu dépend du ping du serveur, pas principalement du changeur de voix.


8. Régler la voix : tonalité, formants et effets

Une fois que le routage fonctionne, la qualité de la transformation dépend de la façon dont vous accordez les paramètres.

Décalage de tonalité

Les voix les plus naturelles se situent dans ±12 demi-tons (une octave) de leur tonalité d’origine. Au-delà, les artefacts deviennent perceptibles. Pour un décalage convaincant de masculin → féminin, essayez +5 à +8 demi-tons. Pour féminin → masculin, essayez -4 à -6 demi-tons.

Décalage de formants

Le décalage de formants déplace les résonances du tractus vocal indépendamment de la tonalité. Augmentez les formants pour semer plus jeune/petit; abaissez-les pour semer plus grand/plus profond. Un bon point de départ pour une voix dont la tonalité a déjà été décalée est d’augmenter les formants de +1 à +2 demi-tons pour correspondre.

Porte de bruit

Définissez une porte de bruit pour se fermer autour de -55 dB pour empêcher l’algorithme de traiter les bruits ambiants ou les bruits de respiration. Cela garde la sortie propre pendant les silences.

Réverbération et EQ

La réverbération de salle modérée (décroissance 0,3-0,5 s) peut masquer les artefacts de décalage de tonalité. Un léger boost en étagère haute (+2 dB au-dessus de 8 kHz) ajoute de la clarté. Évitez la grande réverbération dans les contextes de communication - cela vous fait ressembler à être dans une grotte.

Clonage de voix par IA

Si votre logiciel prend en charge les modèles de voix par IA, l’approche d’accord est différente : au lieu d’ajuster manuellement la tonalité et les formants, vous sélectionnez un modèle de voix entraîné et ajustez l’intensité de conversion (à quel point le moteur pousse votre discours vers la voix cible). Commencez à 70-80 % d’intensité - trop haut cause des artefacts sur la parole rapide; trop bas laisse votre voix d’origine s’échapper.


9. Dépannage des problèmes courants

« Les applications ne voient pas le microphone virtuel » Redémarrez le service de changement de voix, puis rouvrez l’application cible. Certaines applications mettent en cache la liste des périphériques au démarrage et ne détectent pas les nouveaux périphériques ajoutés après.

« La voix semble robotique ou métallique » La tonalité est décalée mais les formants ne le sont pas. Activez la préservation des formants ou ajustez le curseur de décalage des formants pour correspondre approximativement à la direction de décalage de la tonalité.

« Écho ou voix double dans Discord » Le microphone physique est actif à côté du virtuel. Désactivez ou mettez en sourdine le microphone physique dans Windows Son → Enregistrement.

« La suppression du bruit de Zoom tue l’effet » Définissez la suppression audio de Zoom sur Bas ou Désactivé (Paramètres → Audio → Avancé).

« Le changeur de voix cause un crash de jeu ou un ban anti-triche » Le logiciel utilise un pilote en mode noyau. Basculez vers un changeur de voix en espace utilisateur avec un seul périphérique audio WDM virtuel signé.

« Latence élevée - délai évident lors de la parole » Augmentez la taille du buffer WASAPI dans les paramètres du changeur de voix (buffer plus petit = latence plus basse mais risque CPU plus élevé). Sinon, fermez les applications audio concurrentes utilisant le même périphérique WASAPI.


Conclusion

Changer votre voix au microphone sous Windows revient à quatre choses : comprendre les propriétés acoustiques que vous manipulez (tonalité, formants, résonance), acheminer le signal via une application de changement de voix via WASAPI, le sortir vers un microphone virtuel et sélectionner ce microphone virtuel dans chaque application cible. La configuration par application est pratiquement identique une fois que vous comprenez le motif sous-jacent.

La partie la plus difficile est généralement de faire sonner la transformation naturellement - et cela nécessite un décalage de formants aux côtés du décalage de tonalité, pas seulement une simple décalage de fréquence.

Pour tout en un endroit - traitement WASAPI, clonage par IA, routage virtuel, aucun pilote noyau, compatible avec Windows 10 et 11 - VoxBooster vaut le coup d’essayer à votre prochaine session.

Essayez VoxBooster — essai gratuit de 3 jours.

Clonage vocal en temps réel, soundboard et effets — partout où vous parlez déjà.

  • Sans carte bancaire
  • ~30 ms de latence
  • Discord · Teams · OBS
Essayer gratuitement 3 jours