Traducteur IA

Traducteur IA gratuit exécutant NLLB-200 distilled 600M sur l'appareil, dans votre navigateur. 15+ langues, WebGPU. Sans upload, sans clé API, privé.

Vous avez des commentaires ? Signalez des bugs, suggérez des fonctionnalités ou partagez vos idées — nous lisons tout

À propos du Traducteur IA

Traducteur IA est un outil de traduction automatique neuronale entièrement côté client qui exécute le modèle NLLB-200 distilled 600M de Meta directement dans votre navigateur via Transformers.js et WebGPU. Contrairement à Google Traduction, DeepL ou ChatGPT, aucun texte ne quitte votre appareil : les poids du modèle sont récupérés une seule fois depuis un CDN public, puis la traduction s'effectue localement sur votre CPU ou GPU. Cela signifie que les avocats, médecins, journalistes et développeurs peuvent traduire des brouillons confidentiels, des commentaires de code source, des NDA et de la documentation interne sans les envoyer à un tiers. L'outil prend en charge 15 langues les plus courantes du vocabulaire complet de 200 langues de NLLB-200, incluant l'anglais, le vietnamien, l'espagnol, le portugais, le français, l'allemand, l'italien, le russe, le chinois simplifié, le japonais, le coréen, l'arabe, l'hindi, le thaï et l'indonésien. La première traduction déclenche un téléchargement unique d'environ 600 mégaoctets de poids quantifiés, que le navigateur met en cache indéfiniment ; les traductions suivantes sont essentiellement gratuites en bande passante et se terminent en moins de deux secondes pour un paragraphe sur un ordinateur portable moderne. Les textes longs sont découpés aux frontières de phrases pour entrer dans le contexte de 1024 tokens du modèle, puis recousus. L'outil convient aux passages courts à moyens (moins de 5000 caractères) ; pour des documents de la taille d'un livre, divisez l'entrée en lots ou exécutez le traducteur dans plusieurs onglets. Voir aussi notre Correcteur Grammatical et Paraphraseur IA et notre Résumeur de Texte IA.

Quel modèle de traduction cet outil utilise-t-il et est-il bon ?

Nous utilisons NLLB-200 distilled 600M, le modèle open source de Meta (No-Language-Left-Behind) entraîné sur 200 langues incluant des dizaines de langues à faibles ressources. Sur des benchmarks standards comme FLORES-200, NLLB-200 distilled 600M obtient des scores BLEU à quelques points seulement de systèmes commerciaux bien plus grands pour les paires à hautes ressources (anglais/espagnol, anglais/français, anglais/chinois) et surpasse largement les modèles ouverts plus anciens pour les paires à faibles ressources comme anglais/vietnamien, anglais/khmer ou anglais/yoruba. La version distillée est un modèle élève plus petit et rapide entraîné sur les sorties du modèle maître à 54 milliards de paramètres ; la qualité est très proche du maître pour la plupart des paires tout en étant assez petite pour s'exécuter localement. Pour le jargon technique dense, les idiomes ou un contenu littéraire exigeant, vous préférerez peut-être DeepL ou un LLM affiné, mais pour les e-mails quotidiens, les pages web, les modèles juridiques et les commentaires de code, NLLB-200 est largement suffisant et particulièrement privé.

Pourquoi la première traduction est-elle si longue ?

La première fois que vous cliquez sur Traduire, le navigateur doit télécharger les poids de NLLB-200 (environ 600 Mo sous forme quantifiée) depuis un CDN public et les compiler en un graphe WebGPU ou WebAssembly. Comptez 30 secondes à quelques minutes selon votre connexion. Une fois mis en cache, les poids restent dans le stockage du navigateur (IndexedDB / Cache API) et se chargent en moins d'une seconde lors des visites suivantes, de sorte que toutes les traductions ultérieures se terminent en 1 à 3 secondes pour un paragraphe. Si vous effacez les données du navigateur, le modèle devra être téléchargé à nouveau. Pour vérifier, ouvrez DevTools, allez dans Application > Cache Storage ; vous verrez des entrées sous huggingface.co ou jsdelivr après la première exécution.

Mon texte est-il vraiment privé ? Où va-t-il ?

Oui. Votre texte est traité entièrement dans l'onglet du navigateur par JavaScript et WebGPU. Il n'existe aucune API de traduction côté serveur ni aucune requête réseau contenant votre texte. Vous pouvez le vérifier en ouvrant l'onglet Network de DevTools avant de cliquer sur Traduire : vous verrez les poids du modèle téléchargés depuis un CDN, mais jamais votre texte d'entrée envoyé quelque part. Cela rend l'outil idéal pour la traduction juridique ou médicale confidentielle, les brouillons internes d'entreprise, le matériel de sources journalistiques, les NDA et tout autre contenu pour lequel l'envoi de texte à Google ou OpenAI n'est pas acceptable. Les poids du modèle eux-mêmes sont open source, publiés par Meta en 2022 ; aucune télémétrie ni comportement de rappel à la maison n'y est intégré.

Pourquoi WebGPU est-il plus rapide que WASM et comment l'activer ?

WebGPU est une API moderne du navigateur qui permet à JavaScript d'exécuter des calculs directement sur votre carte graphique ; pour un transformeur de 600 millions de paramètres comme NLLB-200, cela est généralement 5 à 20 fois plus rapide que le backend WebAssembly (CPU). L'outil détecte automatiquement le support WebGPU et l'utilise lorsqu'il est disponible ; un badge vert 'WebGPU' apparaît en haut de la page si tel est le cas. WebGPU est activé par défaut dans Chrome 113+, Edge 113+ et les versions récentes d'Opera/Brave ; sur Firefox il est derrière un drapeau (about:config -> dom.webgpu.enabled) ; Safari le prend en charge en Technology Preview et dans les builds stables récents. Avec WebGPU, un paragraphe se traduit en environ 1 à 2 secondes sur un iGPU d'ordinateur portable ; en WASM pur, le même paragraphe prend 8 à 15 secondes. Si vous voyez le badge jaune 'WASM', votre navigateur n'expose pas d'adaptateur GPU à WebGPU et l'outil bascule automatiquement sur le CPU.

Traducteur IA — Traducteur IA gratuit exécutant NLLB-200 distilled 600M sur l'appareil, dans votre navigateur. 15+ langues, WebGPU. Sans — **Traducteur IA**

Quelles langues et paires de langues sont prises en charge ?

Le modèle complet NLLB-200 prend en charge 200 langues et toutes les directions entre elles ; pour la simplicité d'UX, nous exposons 15 des plus demandées dans cette build : anglais, vietnamien, espagnol, portugais (Brésil et européen partagent le tokenizer), français, allemand, italien, russe, chinois simplifié, japonais, coréen, arabe, hindi, thaï et indonésien. Vous pouvez traduire dans n'importe quelle direction entre deux d'entre elles, donc 15 x 14 = 210 paires sont disponibles sans téléchargement supplémentaire une fois le modèle mis en cache. Nous passons les codes de langue NLLB (eng_Latn, vie_Latn, zho_Hans, etc.) au modèle en interne ; si vous avez besoin d'une paire que nous n'avons pas exposée (swahili, tagalog, bengali, etc.), ouvrez un ticket et nous l'ajouterons dans une build future.

Quelle est la limite de caractères et comment les longs documents sont-ils gérés ?

L'interface accepte jusqu'à 5000 caractères par clic de traduction, ce qui correspond à environ 700 à 1000 mots en anglais. En interne, l'outil divise l'entrée aux frontières de phrases (points, points d'interrogation, ponctuation pleine chasse pour CJK) en morceaux d'environ 500 caractères, envoie chaque morceau au modèle avec sa fenêtre de contexte de 1024 tokens et recoud les sorties. Une phrase unique de plus de ~1000 caractères (ou un texte CJK avec très peu de délimiteurs) est découpée par longueur afin de ne pas être perdue en silence, et l'outil affiche un avis lorsque cela se produit. Pour les documents de la taille d'un livre, nous recommandons d'exécuter le traducteur par lots de quelques pages et de copier les résultats dans un fichier principal. Nous avons choisi 5000 caractères comme limite par exécution parce que le temps croît approximativement de manière linéaire avec la longueur, et que des exécutions très longues augmentent considérablement le risque de rafraîchissement d'onglet ou de pression mémoire sur du matériel plus modeste.

Puis-je faire confiance à ces traductions pour un travail juridique ou médical ?

Traitez chaque sortie comme une estimation automatique, pas comme une traduction assermentée. NLLB-200 distilled 600M est solide pour le sens général, les brouillons et le tri, mais les modèles neuronaux peuvent mal traduire les nombres, les noms, les posologies, les négations et la portée des clauses d'une manière qui paraît fluide mais change le sens. Pour tout ce qui a une valeur juridiquement ou cliniquement contraignante, un traducteur humain qualifié doit post-éditer et valider, et un expert du domaine doit relire la terminologie. L'avantage ici est le flux de travail, pas l'autorité : comme la traduction s'exécute entièrement sur l'appareil, sans upload ni clé API, vous pouvez rédiger des contrats confidentiels, des notes de patients ou des NDA localement, puis les transmettre à un relecteur humain, plutôt que de coller du texte sensible dans un service cloud. Utilisez l'export JSON pour remettre aux relecteurs un enregistrement auditable et aligné par segment de ce que le modèle a exactement produit.

Puis-je exporter ou traiter par lots les traductions pour un pipeline CAT ou de QA ?

Oui. Après chaque traduction, Copier en JSON et Télécharger le JSON émettent un enregistrement lisible par machine construit à partir des paires par morceau réellement produites par le modèle : {source_lang, target_lang, model: 'nllb-200-distilled-600M', device: 'webgpu' ou 'wasm', segments: [{src, tgt}], elapsed_ms, char_count, word_counts}. Les segments source/cible alignés s'intègrent directement dans l'ingestion de mémoires de traduction (TM) ou CAT, dans les outils de post-édition et les scripts de QA, et les champs appareil/modèle/temps donnent aux ingénieurs de localisation une trace auditable indiquant quel moteur a produit quelle sortie. L'export est généré localement dans votre navigateur, ce qui préserve la même garantie de confidentialité sur l'appareil que la traduction : rien n'est envoyé. Pour traiter par lots de grands documents, traduisez quelques pages à la fois et concaténez les tableaux de segments JSON exportés.

Voir aussi

OUTILS IA33

WUTOOLS