Traducteur IA

Traducteur IA gratuit exécutant NLLB-200 dans votre navigateur. Traduit plus de 15 langues avec WebGPU. Aucun upload, aucune clé API, totalement privé.

AI Propulsé par NLLB-200 (Meta). La première exécution télécharge le modèle (~600 Mo) ; les suivantes sont instantanées. 100% privé.
Détection du matériel...
clearClearpastePaste
Jusqu'à 5000 caractères par traduction0 / 5000

À propos du Traducteur IA

Traducteur IA est un outil de traduction automatique neuronale entièrement côté client qui exécute le modèle NLLB-200 distilled 600M de Meta directement dans votre navigateur via Transformers.js et WebGPU. Contrairement à Google Traduction, DeepL ou ChatGPT, aucun texte ne quitte votre appareil : les poids du modèle sont récupérés une seule fois depuis un CDN public, puis la traduction s'effectue localement sur votre CPU ou GPU. Cela signifie que les avocats, médecins, journalistes et développeurs peuvent traduire des brouillons confidentiels, des commentaires de code source, des NDA et de la documentation interne sans les envoyer à un tiers. L'outil prend en charge 15 langues les plus courantes du vocabulaire complet de 200 langues de NLLB-200, incluant l'anglais, le vietnamien, l'espagnol, le portugais, le français, l'allemand, l'italien, le russe, le chinois simplifié, le japonais, le coréen, l'arabe, l'hindi, le thaï et l'indonésien. La première traduction déclenche un téléchargement unique d'environ 600 mégaoctets de poids quantifiés, que le navigateur met en cache indéfiniment ; les traductions suivantes sont essentiellement gratuites en bande passante et se terminent en moins de deux secondes pour un paragraphe sur un ordinateur portable moderne. Les textes longs sont découpés aux frontières de phrases pour entrer dans le contexte de 1024 tokens du modèle, puis recousus. L'outil convient aux passages courts à moyens (moins de 5000 caractères) ; pour des documents de la taille d'un livre, divisez l'entrée en lots ou exécutez le traducteur dans plusieurs onglets.

Quel modèle de traduction cet outil utilise-t-il et est-il bon ?

Nous utilisons NLLB-200 distilled 600M, le modèle open source de Meta (No-Language-Left-Behind) entraîné sur 200 langues incluant des dizaines de langues à faibles ressources. Sur des benchmarks standards comme FLORES-200, NLLB-200 distilled 600M obtient des scores BLEU à quelques points seulement de systèmes commerciaux bien plus grands pour les paires à hautes ressources (anglais/espagnol, anglais/français, anglais/chinois) et surpasse largement les modèles ouverts plus anciens pour les paires à faibles ressources comme anglais/vietnamien, anglais/khmer ou anglais/yoruba. La version distillée est un modèle élève plus petit et rapide entraîné sur les sorties du modèle maître à 54 milliards de paramètres ; la qualité est très proche du maître pour la plupart des paires tout en étant assez petite pour s'exécuter localement. Pour le jargon technique dense, les idiomes ou un contenu littéraire exigeant, vous préférerez peut-être DeepL ou un LLM affiné, mais pour les e-mails quotidiens, les pages web, les modèles juridiques et les commentaires de code, NLLB-200 est largement suffisant et particulièrement privé.

Pourquoi la première traduction est-elle si longue ?

La première fois que vous cliquez sur Traduire, le navigateur doit télécharger les poids de NLLB-200 (environ 600 Mo sous forme quantifiée) depuis un CDN public et les compiler en un graphe WebGPU ou WebAssembly. Comptez 30 secondes à quelques minutes selon votre connexion. Une fois mis en cache, les poids restent dans le stockage du navigateur (IndexedDB / Cache API) et se chargent en moins d'une seconde lors des visites suivantes, de sorte que toutes les traductions ultérieures se terminent en 1 à 3 secondes pour un paragraphe. Si vous effacez les données du navigateur, le modèle devra être téléchargé à nouveau. Pour vérifier, ouvrez DevTools, allez dans Application > Cache Storage ; vous verrez des entrées sous huggingface.co ou jsdelivr après la première exécution.

Mon texte est-il vraiment privé ? Où va-t-il ?

Oui. Votre texte est traité entièrement dans l'onglet du navigateur par JavaScript et WebGPU. Il n'existe aucune API de traduction côté serveur ni aucune requête réseau contenant votre texte. Vous pouvez le vérifier en ouvrant l'onglet Network de DevTools avant de cliquer sur Traduire : vous verrez les poids du modèle téléchargés depuis un CDN, mais jamais votre texte d'entrée envoyé quelque part. Cela rend l'outil idéal pour la traduction juridique ou médicale confidentielle, les brouillons internes d'entreprise, le matériel de sources journalistiques, les NDA et tout autre contenu pour lequel l'envoi de texte à Google ou OpenAI n'est pas acceptable. Les poids du modèle eux-mêmes sont open source, publiés par Meta en 2022 ; aucune télémétrie ni comportement de rappel à la maison n'y est intégré.

Traducteur IA — Traducteur IA gratuit exécutant NLLB-200 dans votre navigateur. Traduit plus de 15 langues avec WebGPU. Aucun upload, au
Traducteur IA

Pourquoi WebGPU est-il plus rapide que WASM et comment l'activer ?

WebGPU est une API moderne du navigateur qui permet à JavaScript d'exécuter des calculs directement sur votre carte graphique ; pour un transformeur de 600 millions de paramètres comme NLLB-200, cela est généralement 5 à 20 fois plus rapide que le backend WebAssembly (CPU). L'outil détecte automatiquement le support WebGPU et l'utilise lorsqu'il est disponible ; un badge vert 'WebGPU' apparaît en haut de la page si tel est le cas. WebGPU est activé par défaut dans Chrome 113+, Edge 113+ et les versions récentes d'Opera/Brave ; sur Firefox il est derrière un drapeau (about:config -> dom.webgpu.enabled) ; Safari le prend en charge en Technology Preview et dans les builds stables récents. Avec WebGPU, un paragraphe se traduit en environ 1 à 2 secondes sur un iGPU d'ordinateur portable ; en WASM pur, le même paragraphe prend 8 à 15 secondes. Si vous voyez le badge jaune 'WASM', votre navigateur n'expose pas d'adaptateur GPU à WebGPU et l'outil bascule automatiquement sur le CPU.

Quelles langues et paires de langues sont prises en charge ?

Le modèle complet NLLB-200 prend en charge 200 langues et toutes les directions entre elles ; pour la simplicité d'UX, nous exposons 15 des plus demandées dans cette build : anglais, vietnamien, espagnol, portugais (Brésil et européen partagent le tokenizer), français, allemand, italien, russe, chinois simplifié, japonais, coréen, arabe, hindi, thaï et indonésien. Vous pouvez traduire dans n'importe quelle direction entre deux d'entre elles, donc 15 x 14 = 210 paires sont disponibles sans téléchargement supplémentaire une fois le modèle mis en cache. Nous passons les codes de langue NLLB (eng_Latn, vie_Latn, zho_Hans, etc.) au modèle en interne ; si vous avez besoin d'une paire que nous n'avons pas exposée (swahili, tagalog, bengali, etc.), ouvrez un ticket et nous l'ajouterons dans une build future.

Quelle est la limite de caractères et comment les longs documents sont-ils gérés ?

L'interface accepte jusqu'à 5000 caractères par clic de traduction, ce qui correspond à environ 700 à 1000 mots en anglais. En interne, l'outil divise l'entrée aux frontières de phrases (points, points d'interrogation, ponctuation pleine chasse pour CJK) en morceaux d'environ 500 caractères, envoie chaque morceau au modèle avec sa fenêtre de contexte de 1024 tokens et recoud les sorties. Cela signifie que les phrases très longues (plus de ~500 caractères) peuvent être tronquées et que vous devriez les diviser manuellement ; pour les documents de la taille d'un livre, nous recommandons d'exécuter le traducteur par lots de quelques pages et de copier les résultats dans un fichier principal. Nous avons choisi 5000 caractères comme limite par exécution parce que le temps croît approximativement de manière linéaire avec la longueur, et que des exécutions très longues augmentent considérablement le risque de rafraîchissement d'onglet ou de pression mémoire sur du matériel plus modeste.