Analyseur de Spectre

Visualisez le spectre de fréquences en FFT 60 fps : courbe, barres, forme d'onde. MP3, WAV, FLAC, vidéo. 100 % navigateur, aucun téléversement.

Upload
Glissez-déposez un fichier audio ici
ou cliquez pour parcourir (MP3, WAV, FLAC, OGG, M4A, MP4, MOV, AVI)
Choisissez un fichier audio à analyser (tout format)

À propos de cet analyseur de spectre

Un analyseur de spectre audio transforme le signal en domaine temporel que vous entendez en une image en domaine fréquentiel que vous pouvez lire. Au lieu de tracer l'amplitude par rapport au temps, il trace la magnitude par rapport à la fréquence, révélant exactement quelles tonalités, harmoniques et composantes de bruit sont présentes à chaque instant. Cet outil en ligne fonctionne entièrement dans votre navigateur via la Web Audio API et la bibliothèque d'extraction de caractéristiques Meyda — vos fichiers audio ne quittent jamais votre appareil. Les mêmes techniques sont utilisées par les systèmes de mesure professionnels d'Audio Precision, Rohde & Schwarz et Stanford CCRMA.

L'outil accepte pratiquement tout conteneur que le navigateur sait décoder : MP3, WAV, FLAC, OGG, M4A, OPUS, AAC, ainsi que les fichiers vidéo (MP4, MOV, AVI, MKV) dont nous extrayons la piste audio à l'aide de ffmpeg.wasm. Après décodage, le tampon audio est acheminé via un AnalyserNode qui calcule une FFT en temps réel sur des fenêtres chevauchantes. Le résultat est rendu sous forme de courbe de spectre lisse, de barres verticales classiques ou de forme d'onde temporelle, le tout piloté par requestAnimationFrame pour un affichage à 60 fps stable.

Les ingénieurs du son — des studios de chanson française à Paris aux producteurs d'électro à Lyon ou Bruxelles — utilisent l'analyse spectrale lors du mixage et du mastering : un coup d'œil suffit pour vérifier que la grosse caisse a bien sa fondamentale entre 60 et 80 Hz, que la voix occupe bien la bande de présence 2–5 kHz, ou si de la boue s'accumule autour de 200–400 Hz. Les musiciens vérifient l'accordage des instruments, les enseignants illustrent les harmoniques, les podcasteurs détectent le ronflement secteur à 50 Hz, et les acousticiens étudient les modes de salle lorsqu'un microphone calibré est disponible. L'outil enregistre aussi une vidéo de l'animation en WebM (VP9/VP8) ou MP4 (H.264) — utile pour le contenu YouTube en français et les visualiseurs musicaux.

Trois commandes méritent attention. Le lissage (timeSmoothingConstant du FFT) moyenne les trames successives : des valeurs proches de 0 donnent une réponse nerveuse révélant les transitoires ; proches de 0,9 elles produisent un visuel calme mais masquent les événements brefs. Le type de visualisation alterne entre courbe spectrale continue, barres discrètes (style VU vintage hi-fi) et forme d'onde brute. Les outils de téléchargement permettent de sauvegarder des captures fixes ou des enregistrements du spectre pour des tutoriels et publications. Tout le traitement est local, tout résultat vous appartient, et aucune télémétrie du contenu audio n'est collectée.

Comment l'analyseur fonctionne

L'audio est décodé par la Web Audio API en un tampon PCM flottant 32 bits à la fréquence d'échantillonnage native du fichier (typiquement 44,1 kHz ou 48 kHz). Le tampon traverse la chaîne AudioBufferSourceNode → AnalyserNode → AudioContext.destination. L'AnalyserNode est configuré avec fftSize = 2048 par défaut, donnant 1024 bins de fréquence couvrant de 0 Hz à Nyquist (sampleRate / 2). Chaque bin représente donc sampleRate / fftSize ≈ 21,5 Hz à 44,1 kHz — la limite fondamentale de résolution fréquentielle de cet outil.

Avant la FFT, l'AnalyserNode applique une fenêtre de Blackman à chaque trame. Le fenêtrage atténue les bords de la trame d'analyse à zéro, ce qui empêche la fuite spectrale qu'une fenêtre rectangulaire provoquerait quand les fréquences ne tombent pas exactement au centre d'un bin. D'autres choix DSP courants — Hann, Hamming, Kaiser — équilibrent largeur du lobe principal et rejet des lobes latéraux ; Blackman est le défaut Web Audio et un choix raisonnable d'usage général.

Après la FFT, l'analyseur renvoie soit des échantillons en domaine temporel (getByteTimeDomainData) pour la vue forme d'onde, soit des données de magnitude spectrale en dBFS (getByteFrequencyData, mises à l'échelle 0–255 entre minDecibels = −100 dBFS et maxDecibels = −30 dBFS). Les trames successives sont lissées par la formule : out[i] = α · prev[i] + (1−α) · current[i], où α est la constante de lissage. C'est un filtre IIR à un seul pôle dont la fréquence de coupure dépend de α et du taux de trames.

L'axe de magnitude affiché est logarithmique en décibels, ce qui correspond à l'audition humaine. L'axe de fréquence peut être linéaire (espacement Hz uniforme, utilisé ici pour la ligne spectrale) ou logarithmique (correspond aux octaves musicales). Pour la vue en barres, nous regroupons les bins en bandes perceptuellement significatives (sub-bass, bass, low-mid, mid, high-mid, treble, presence, brilliance) selon les conventions des consoles de mixage. Magnitude versus puissance est une source fréquente de confusion : ici nous montrons la magnitude (proportionnelle à l'amplitude), donc une augmentation de 3 dB correspond à un rapport de pression d'environ 1,4× ; pour la puissance (proportionnelle à l'énergie), le même nombre double.

Les captures sont exportées en lisant le canvas en PNG via canvas.toBlob. Les enregistrements en direct utilisent MediaRecorder sur un flux capturé via canvas.captureStream(60), donnant une vraie capture d'écran à 60 fps sans logiciel externe. Quand MP4 est sélectionné, le WebM enregistré est transcodé en H.264 dans le navigateur avec ffmpeg.wasm — un portage de la bibliothèque ffmpeg compilé en WebAssembly. Plus lent que VP9 mais produit des fichiers compatibles iOS, PowerPoint et la plupart des éditeurs anciens.

Précision et limites

Cet outil donne une image fiable du contenu spectral relatif, mais il ne peut pas mesurer le niveau absolu de pression acoustique (SPL en dB SPL) sans étalonnage. Le microphone ou l'interface qui a originellement capturé le fichier a sa propre réponse en fréquence, son gain et son plancher de bruit, et rien de cela ne peut être retrouvé après coup. Considérez l'axe dB comme des décibels par rapport à la pleine échelle (dBFS), pas dB SPL. Pour obtenir des dB SPL il vous faut un microphone de mesure classe 1, une source de référence connue (typiquement un pistonphone à 94 dB SPL) et un étalonnage hors ligne dans une application de métrologie — pas un outil de navigateur.

La précision en fréquence est bornée par la largeur du bin : à 44,1 kHz avec fftSize 2048, deux tons séparés de moins de ~22 Hz ne peuvent être résolus comme pics distincts. C'est l'inverse du compromis temps-fréquence de type Heisenberg. Pour une meilleure résolution, augmentez le fftSize au prix d'une mise à jour plus lente ; pour une meilleure résolution temporelle (détection de transitoires), réduisez le fftSize. La constante de lissage ajoute encore du moyennage temporel, souhaitable pour un affichage calme mais qui masque les événements courts ; mettez-la à 0 pour traquer les clics ou pops.

  • Ne mesure pas le SPL absolu (dB SPL) sans microphone calibré et signal de référence — les lectures sont en dBFS uniquement.
  • Résolution fréquentielle limitée à sampleRate ÷ fftSize ≈ 21,5 Hz à 44,1 kHz / FFT 2048.
  • L'AnalyserNode Web Audio applique une fenêtre Blackman fixe ; les chercheurs ayant besoin d'autres fenêtres doivent utiliser des bibliothèques DSP hors ligne.
  • Les formats à compression destructive lourde (MP3 bas débit, AAC) perdent du détail dans les hautes fréquences et peuvent montrer des artefacts d'encodeur.
  • Les décodeurs du navigateur peuvent rééchantillonner les fréquences non standard (ex. 96 kHz) à la fréquence de l'AudioContext, masquant le contenu ultrasonique.
  • L'animation tourne à 60 fps ; les transitoires très rapides (sous ~17 ms) peuvent passer entre les trames.

Glossaire

FFT (Transformée de Fourier Rapide)
Algorithme efficace en O(N log N) pour calculer la Transformée de Fourier Discrète, qui décompose un signal de longueur finie en somme de sinusoïdes complexes à fréquences également espacées.
Bin de fréquence
L'un des N/2 emplacements de fréquence produits par une FFT à N points, chacun centré à k × sampleRate / N pour k entier. Largeur de bin = sampleRate / fftSize.
Fréquence de Nyquist
La moitié de la fréquence d'échantillonnage. La plus haute fréquence représentable sans ambiguïté dans un signal numérique ; le contenu au-dessus se replie en aliasing à l'enregistrement.
dBFS (décibels Full Scale)
Référence de niveau numérique où 0 dBFS est la valeur maximale représentable (typiquement un pic à ±1,0 en flottant 32 bits ou ±32767 en 16 bits). Toutes les valeurs sont négatives ; le plancher de bruit d'un enregistrement 16 bits propre est autour de −96 dBFS.
Magnitude vs puissance
La magnitude est |X(f)| ; la puissance est |X(f)|². Une augmentation de 3 dB correspond à un rapport de puissance de 2× mais un rapport de magnitude de √2 ≈ 1,41×. Cet outil affiche la magnitude.
Fenêtrage
Multiplier la trame d'analyse par une fonction de pondération atténuante (Hann, Hamming, Blackman, Kaiser…) avant la FFT pour supprimer la fuite spectrale due aux bords de trame.
Spectrogramme
Graphique bidimensionnel des magnitudes FFT au cours du temps : fréquence en ordonnée, temps en abscisse, intensité codée par couleur. Apparenté à la vue spectre mais déroulé dans le temps.
Fréquence d'échantillonnage
Nombre d'échantillons audio capturés par seconde, exprimé en Hz. Qualité CD = 44,1 kHz ; pro audio = 48 kHz, 96 kHz ou 192 kHz.

Foire aux Questions

Quels formats audio sont pris en charge ?

Tous les formats que votre navigateur sait décoder : MP3, WAV, OGG, AAC, M4A, FLAC, OPUS, plus les conteneurs vidéo (MP4, MOV, MKV, AVI) dont l'audio est extrait automatiquement. Le décodage se fait entièrement dans votre navigateur via la Web Audio API.

À quoi sert un analyseur de spectre ?

Vérifications de mixage et de mastering, accordage d'instruments, étude des modes de salle, détection du ronflement secteur (50/60 Hz) et de ses harmoniques, comparaison de deux enregistrements, démonstration de l'analyse de Fourier en classe, création de visualiseurs musicaux pour la vidéo, contrôle qualité audio en radio ou podcast.

Quelle taille de FFT l'outil utilise-t-il ?

La fftSize par défaut est 2048, donnant 1024 bins de fréquence et ≈21,5 Hz de résolution à 44,1 kHz. L'AnalyserNode Web Audio prend en charge toute puissance de 2 entre 32 et 32768 ; l'outil choisit 2048 comme équilibre entre résolution, latence et charge CPU.

Que fait le curseur de lissage ?

Il contrôle le timeSmoothingConstant de l'AnalyserNode : un filtre IIR à un seul pôle sur les trames FFT successives. 0,0 montre le spectre brut trame par trame (utile pour les transitoires, aspect plus nerveux) ; 0,8–0,9 produit un visuel calme adapté à la musique ; 1,0 fige l'affichage.

Quelle différence entre Spectre, Barres et Forme d'onde ?

Spectre est une courbe continue de 0 Hz à Nyquist. Barres regroupe les bins en bandes perceptuelles sub-bass / bass / mid / treble / presence — visuellement comme un équipement hi-fi classique. Forme d'onde montre le signal brut dans le domaine temporel, utile pour repérer le clipping, l'offset DC ou l'asymétrie.

Puis-je mesurer le dB SPL ?

Non. L'affichage est en dBFS (décibels par rapport à la pleine échelle numérique). Mesurer le SPL réel exige un microphone de référence calibré (Earthworks M30, B&K 4189), une source acoustique connue et un logiciel de métrologie. Les outils de navigateur ne le permettent pas, mais pour la comparaison relative et l'analyse de forme, le dBFS suffit.

Pourquoi mon spectre est-il vide au-delà de 16 kHz ?

Probablement parce que votre fichier est un MP3 ou AAC à bas débit ; les codecs destructifs coupent agressivement les hautes fréquences (souvent un passe-bas raide à 16 kHz pour MP3 128 kbps). Essayez un WAV ou FLAC de la même source. Cela peut aussi indiquer que l'enregistrement original était à bande limitée.

Que la capture/enregistrement exporte-t-il ?

La capture sauvegarde un PNG du canvas actuel à pleine résolution. L'enregistrement capture l'animation en direct en WebM (VP9 meilleure qualité, VP8 plus large compatibilité) ou la transcode en MP4 (H.264) avec ffmpeg.wasm dans le navigateur. L'audio est multiplexé avec la vidéo, prêt à charger sur YouTube ou les réseaux sociaux.

Mon audio est-il envoyé quelque part ?

Non. Décodage, FFT, rendu et enregistrement se déroulent tous localement dans votre navigateur. Aucun octet de votre audio ne quitte l'appareil. La page utilise des analyses standard pour le comptage de trafic uniquement.

Pourquoi le spectre paraît différent dans ma DAW ?

Les DAWs appliquent souvent une pondération A ou K, des FFTs plus longues ou un lissage psychoacoustique. Elles peuvent afficher du RMS par bande plutôt que du pic. Utilisez cet outil pour des vérifications rapides et la comparaison de forme ; utilisez un analyseur DAW calibré (FabFilter Pro-Q, Voxengo SPAN, iZotope Insight) pour des décisions de mastering.

Références et lectures complémentaires

  1. W3C Audio Working Group. (2021). Spécification Web Audio API (W3C Recommendation) World Wide Web Consortium.
  2. Smith, J. O.. (2007). Mathematics of the Discrete Fourier Transform (DFT), with Audio Applications Stanford CCRMA / W3K Publishing.
  3. Secteur des radiocommunications de l'UIT. (2023). ITU-R BS.1387-2 : Méthode de mesure objective de la qualité audio perçue (PEAQ) Union internationale des télécommunications.
  4. IEEE Instrumentation and Measurement Society. (2017). IEEE Std 1057-2017: Standard for Digitizing Waveform Recorders IEEE.
  5. Harris, F. J.. (1978). On the use of windows for harmonic analysis with the discrete Fourier transform Proceedings of the IEEE.

Last reviewed: · Reviewed by Équipe d'ingénierie audio WuTools