PDF vers Markdown
Convertissez un PDF en Markdown gratuitement dans le navigateur. OCR pour PDF scannés en 10 langues, détection titres et listes, front matter YAML, aperçu.
À propos du convertisseur PDF vers Markdown
Cet outil convertit les documents PDF en format Markdown. Il extrait le texte et le formate automatiquement avec la syntaxe Markdown incluant les titres, listes et paragraphes. Pour les PDF scannés ou basés sur des images, l'OCR intégré (Tesseract) lit le texte en 10 langues, dont l'anglais, le vietnamien, le chinois, le japonais, le coréen, le français, l'allemand, l'espagnol et le portugais. Vous pouvez aussi ajouter un bloc de front matter YAML (titre, auteur, date) pour que le résultat s'intègre directement dans Obsidian, Hugo, Jekyll ou MkDocs. Tout le traitement se fait dans votre navigateur pour une confidentialité totale.
Comment fonctionne la conversion ?
Le convertisseur extrait le texte de chaque page PDF et analyse les tailles de police et la mise en forme pour détecter les titres, puces, listes numérotées et structure de paragraphes. Il convertit ensuite cela en syntaxe Markdown correctement formatée.
Quels éléments Markdown sont détectés ?
Le convertisseur peut détecter les titres (basés sur la taille de police), les puces, les listes numérotées et les sauts de paragraphe. Il préserve la structure logique de votre document autant que possible.
Puis-je convertir uniquement des pages spécifiques ?
Oui ! Vous pouvez choisir de convertir toutes les pages ou spécifier des pages particulières en utilisant des numéros de page (ex., '1, 3, 5') ou des plages (ex., '1-5, 10-15').
Qu'en est-il des images dans le PDF ?
Les images intégrées ne sont pas copiées dans la sortie Markdown, mais leur texte l'est. Pour les PDF scannés ou basés sur des images, l'outil bascule automatiquement vers l'OCR intégré (Tesseract.js) pour lire le texte directement dans votre navigateur. Laissez simplement l'option OCR activée et choisissez la langue d'OCR correspondante avant de convertir.
Quelles langues l'OCR prend-il en charge, et quelle est sa précision ?
L'OCR intégré prend en charge 10 langues : anglais, vietnamien, chinois simplifié et traditionnel, japonais, coréen, français, allemand, espagnol et portugais. La précision est maximale sur des numérisations nettes, en haute résolution, avec un texte imprimé clair ; les pages pâles, inclinées ou manuscrites peuvent nécessiter une légère correction manuelle. Choisissez la langue correspondant à votre document pour de meilleurs résultats.

Puis-je importer la sortie dans Obsidian, Hugo ou GitHub ?
Oui. Activez « Ajouter un front matter YAML » pour ajouter un bloc --- titre / auteur / pages / source / date --- en tête du fichier .md, que Obsidian, Hugo, Jekyll et MkDocs lisent comme métadonnées de page. Le corps Markdown utilise une syntaxe standard compatible GitHub (titres, listes, blocs de code), il s'affiche donc correctement sur GitHub et dans les générateurs de sites statiques sans édition manuelle.
Le formatage sera-t-il parfait ?
Le convertisseur fait de son mieux pour détecter et préserver la structure du document, mais les mises en page complexes peuvent nécessiter des ajustements manuels. Les documents simples avec des titres et listes clairs se convertissent avec plus de précision.
Y a-t-il une limite de taille de fichier ?
La taille maximale du fichier est de 50 Mo. Cela garantit des performances fluides dans votre navigateur. Pour les fichiers plus volumineux, envisagez de diviser le PDF d'abord.
Mon fichier PDF est-il sécurisé ?
Absolument ! Toute la conversion se fait entièrement dans votre navigateur. Votre fichier PDF n'est jamais envoyé à aucun serveur, garantissant une confidentialité et une sécurité totales.
Puis-je modifier la sortie ?
La sortie Markdown est fournie dans une zone de texte que vous pouvez copier ou télécharger. Vous pouvez ensuite la modifier dans n'importe quel éditeur de texte ou éditeur Markdown de votre choix.
