PDF a Markdown
Convierte PDF a Markdown gratis en tu navegador. OCR para PDF escaneados en 10 idiomas, detección de encabezados y listas, front matter YAML y vista previa.
Acerca del convertidor PDF a Markdown
Esta herramienta convierte documentos PDF a formato Markdown. Extrae el texto y lo formatea automáticamente con sintaxis Markdown incluyendo encabezados, listas y párrafos. Para PDF escaneados o basados en imágenes, el OCR integrado (Tesseract) lee el texto en 10 idiomas, entre ellos inglés, vietnamita, chino, japonés, coreano, francés, alemán, español y portugués. También puedes añadir un bloque de front matter YAML (título, autor, fecha) para que el resultado se integre directamente en Obsidian, Hugo, Jekyll o MkDocs. Todo el procesamiento ocurre en tu navegador para completa privacidad.
¿Cómo funciona la conversión?
El convertidor extrae texto de cada página PDF y analiza tamaños de fuente y formato para detectar encabezados, viñetas, listas numeradas y estructura de párrafos. Luego convierte esto en sintaxis Markdown correctamente formateada.
¿Qué elementos Markdown se detectan?
El convertidor puede detectar encabezados (basados en tamaño de fuente), viñetas, listas numeradas y saltos de párrafo. Preserva la estructura lógica de tu documento tanto como sea posible.
¿Puedo convertir solo páginas específicas?
¡Sí! Puedes elegir convertir todas las páginas o especificar páginas particulares usando números de página (ej., '1, 3, 5') o rangos (ej., '1-5, 10-15').
¿Qué pasa con las imágenes en el PDF?
Las imágenes incrustadas no se copian en la salida Markdown, pero su texto sí. Para PDF escaneados o basados en imágenes, la herramienta recurre automáticamente al OCR integrado (Tesseract.js) para leer el texto directamente en tu navegador. Solo deja activada la opción de OCR y elige el idioma de OCR correspondiente antes de convertir.
¿Qué idiomas admite el OCR y qué precisión tiene?
El OCR integrado admite 10 idiomas: inglés, vietnamita, chino simplificado y tradicional, japonés, coreano, francés, alemán, español y portugués. La precisión es mayor en escaneos limpios y de alta resolución con texto impreso claro; las páginas tenues, inclinadas o manuscritas pueden requerir una ligera corrección manual. Elige el idioma que coincida con tu documento para obtener los mejores resultados.

¿Puedo importar el resultado en Obsidian, Hugo o GitHub?
Sí. Activa 'Agregar front matter YAML' para anteponer un bloque --- título / autor / pages / source / fecha --- al archivo .md, que Obsidian, Hugo, Jekyll y MkDocs leen como metadatos de página. El cuerpo Markdown usa sintaxis estándar compatible con GitHub (encabezados, listas, bloques de código), por lo que se muestra correctamente en GitHub y en los generadores de sitios estáticos sin editar a mano.
¿El formato será perfecto?
El convertidor hace su mejor esfuerzo para detectar y preservar la estructura del documento, pero diseños complejos pueden requerir ajustes manuales. Documentos simples con encabezados y listas claras se convierten con mayor precisión.
¿Hay límite de tamaño de archivo?
El tamaño máximo de archivo es 50MB. Esto asegura un rendimiento fluido en tu navegador. Para archivos más grandes, considera dividir el PDF primero.
¿Mi archivo PDF está seguro?
¡Absolutamente! Toda la conversión ocurre completamente en tu navegador. Tu archivo PDF nunca se carga a ningún servidor, asegurando completa privacidad y seguridad.
¿Puedo editar la salida?
La salida Markdown se proporciona en un área de texto que puedes copiar o descargar. Luego puedes editarla en cualquier editor de texto o editor Markdown de tu elección.
