Résumeur de Texte IA

Résumeur de texte IA 100% privé qui s'exécute sur votre appareil, dans le navigateur. Sans téléversement, sans inscription ni clé API. Résumez articles et documents hors ligne.

Texte à résumer

Open file

Clear

Copy

Paste

Minimum 50 mots requis pour de meilleurs résultats. Le mode abstractif exécute un vrai modèle d'IA sur votre appareil ; votre texte ne quitte jamais le navigateur.

Longueur du résumé

Quelle longueur doit avoir le résumé ?

Style de résumé

Extractif : sélecteur de phrases local et rapide. Abstractif : un vrai modèle d'IA s'exécute dans votre navigateur et réécrit le texte.

Format de sortie

Comment le résumé doit être présenté

Résumé

Select

Copy

Download text

Vous avez des commentaires ? Signalez des bugs, suggérez des fonctionnalités ou partagez vos idées — nous lisons tout

À propos du Résumeur de Texte IA

Notre Résumeur de Texte IA exécute un véritable modèle d'apprentissage automatique entièrement dans votre navigateur. Le mode abstractif charge Xenova/distilbart-cnn-6-6 (une distillation de BART au format ONNX, quantifiée en INT8) via Transformers.js et génère le résumé sur votre propre appareil grâce à WebGPU, avec un repli automatique vers WebAssembly. Votre texte n'est jamais envoyé à un serveur, aucune clé API n'est requise et aucun compte n'est nécessaire.

Le mode extractif est une heuristique locale et rapide qui note chaque phrase selon sa position, sa longueur et ses mots-clés, puis renvoie les phrases les mieux classées sans modification. Le mode abstractif, lui, lit l'ensemble du texte et le réécrit avec de nouveaux mots, comme le ferait une personne.

Comme l'inférence se fait sur l'appareil, l'outil convient aux brouillons confidentiels, mémoires juridiques, notes médicales et rapports internes que vous ne pouvez pas légalement coller dans une API cloud. Voir aussi notre Correcteur Grammatical et Paraphraseur IA et notre Extracteur de mots-clés IA.

Le résumeur IA s'exécute-t-il entièrement dans mon navigateur ?

Oui. Le modèle abstractif est téléchargé une seule fois via Transformers.js, puis s'exécute localement dans l'onglet de votre navigateur grâce à WebGPU ou WebAssembly. Après le téléchargement initial (mis en cache dans IndexedDB pour les visites futures), il n'y a aucun aller-retour serveur par résumé — chaque token de votre texte et chaque mot du résumé généré reste sur votre appareil. Nous ne voyons jamais vos documents et aucun journal n'est créé côté serveur. Cela rend l'outil sûr pour les brouillons confidentiels, rapports internes, mémoires juridiques, notes médicales ou tout texte que vous ne pouvez pas légalement téléverser vers une API externe comme OpenAI ou Anthropic. La contrepartie est le téléchargement initial (environ 60 Mo pour le modèle INT8 par défaut).

Quel modèle alimente les résumés abstractifs ?

Le modèle abstractif par défaut est Xenova/distilbart-cnn-6-6 — une distillation au format ONNX, quantifiée en INT8, du BART-large-CNN de Facebook. BART est un transformeur encodeur-décodeur : un encodeur bidirectionnel lit toute la source, puis un décodeur de gauche à droite génère une réécriture abstractive. La variante DistilBART 6-6 conserve une qualité proche de BART-large sur les textes d'actualité tout en pesant environ 60 Mo et en étant plusieurs fois plus rapide à charger et exécuter, ce qui compte beaucoup pour l'inférence dans le navigateur. Il est chargé et exécuté via Transformers.js (ONNX Runtime Web).

Quels formats et longueurs de texte sont pris en charge ?

Vous pouvez coller du texte brut, du Markdown ou du contenu copié depuis un PDF, Word, des articles web ou des e-mails. Le modèle accepte l'UTF-8 et fonctionne mieux en anglais (le domaine d'entraînement CNN/DailyMail). La longueur pratique par passage est limitée par la fenêtre de contexte du modèle — environ 1024 tokens, soit à peu près 700 mots en anglais. Pour les documents plus longs, l'outil découpe l'entrée en fenêtres chevauchantes d'environ 700 mots, résume chaque bloc, puis résume la concaténation (résumé récursif/hiérarchique). Les entrées très longues (>20 pages) peuvent prendre 30 à 60 secondes.

Résumeur de Texte IA — Résumeur de texte IA 100% privé qui s'exécute sur votre appareil, dans le navigateur. Sans téléversement, sans inscripti — **Résumeur de Texte IA**

Pourquoi le premier résumé est-il long mais les suivants rapides ?

La première exécution doit télécharger les poids du modèle (environ 60 Mo pour le modèle INT8 par défaut), les analyser, construire le graphe de calcul et compiler les noyaux pour votre CPU ou GPU. Ce démarrage à froid peut prendre 10 à 40 secondes sur un ordinateur de bureau typique et davantage sur mobile. Une fois chargés, les poids résident dans la mémoire du navigateur et dans le cache IndexedDB, de sorte que les résumés suivants réutilisent le même modèle compilé et s'achèvent en 1 à 5 secondes pour de courts passages. Si vous fermez l'onglet, la mémoire est libérée, mais le cache IndexedDB subsiste : la visite suivante ne fait que recompiler, sans retélécharger.

Quelle est la précision des résumés et peuvent-ils halluciner ?

DistilBART-CNN atteint des scores ROUGE-L d'environ la fin des 30 au début des 40 sur le benchmark CNN/DailyMail — comparable à des résumeurs humains non experts sur du contenu d'actualité, et quelques points en dessous du BART-large dont il est distillé. La qualité baisse sur des textes très techniques, spécialisés ou narratifs que le modèle n'a pas vus. Comme tout modèle abstractif, il peut halluciner — introduire des faits absents de la source — vérifiez donc toujours chiffres, noms et citations par rapport à l'original avant publication. Pour une fidélité exacte, utilisez le mode extractif, qui ne fait que réordonner vos propres phrases.

WebGPU est-il plus rapide que WebAssembly pour résumer ?

Oui, souvent de façon spectaculaire. WebGPU décharge les multiplications de matrices qui dominent l'inférence du transformeur vers votre GPU intégré ou dédié, avec des accélérations de plusieurs fois par rapport au backend SIMD-WebAssembly sur CPU. Cet outil essaie d'abord WebGPU et affiche un badge « Exécution sur WebGPU » en cas de succès. WebGPU nécessite un navigateur récent (Chrome 113+, Edge, Safari 18+, Firefox récent) et un pilote GPU compatible. S'il est indisponible, l'outil se rabat automatiquement sur WebAssembly avec SIMD et multithreading (badge « Exécution sur CPU (WASM) ») — plus lent, mais fonctionnel sur tout navigateur moderne et toujours entièrement sur l'appareil.

Qu'est-ce que la quantification INT8 et nuit-elle à la qualité ?

La quantification stocke chaque poids sous forme d'entier 8 bits (256 valeurs possibles) au lieu d'un flottant 32 bits. Elle réduit la taille du téléchargement d'environ 4x et accélère l'inférence CPU de 2 à 4x, car l'arithmétique INT8 utilise moins de cycles et loge plus de valeurs par registre SIMD. Pour le résumé, INT8 ne coûte généralement que 1 à 3 points ROUGE par rapport à FP32 — souvent invisible dans la sortie. C'est pourquoi nous livrons par défaut la version INT8 ONNX de distilbart-cnn-6-6 : environ 60 Mo à télécharger, rapide à exécuter et facile à mettre en cache pour un usage répété. ONNX Runtime Web gère la déquantification INT8 à la volée.

Voir aussi

OUTILS IA33

WUTOOLS