Dividir Texto

Divide texto por tokens, delimitador, caracteres, palabras, líneas, oración o párrafo. Solapamiento, numerar, recortar y copiar en tu navegador.

¿Tienes comentarios? Reporta errores, sugiere funciones o comparte tus ideas — leemos todos

Acerca del Divisor de Texto

Divisor de Texto fragmenta el texto de entrada en piezas ordenadas usando una de siete estrategias: delimitador literal (cualquier cadena que proporciones, incluyendo secuencias de escape como \t o \n), conteo fijo de caracteres, conteo fijo de palabras (tokens separados por espacios), conteo fijo de líneas, frontera de oración (puntuación final . ! ? seguida de espacio), frontera de párrafo (una o más líneas en blanco como separadores) y cadena personalizada completa. Cada estrategia se implementa como String.prototype.split() con el separador apropiado o una ventana deslizante para divisiones basadas en tamaño. Las opciones se aplican a todos los modos: 'Recortar espacios' llama a String.trim() en cada fragmento antes de la salida, 'Eliminar fragmentos vacíos' filtra resultados de longitud cero (útil cuando los delimitadores aparecen consecutivos como ',,'), y 'Numerar fragmentos' antepone '1. ', '2. ', etc. a cada pieza de salida. El separador de salida controla cómo se unen los fragmentos para mostrar — doble salto de línea da separación visual clara, coma-espacio da salida estilo CSV, guiones dan divisor visible. Flujos típicos: dividir cuerpos de mensajes SMS en fragmentos de 160 caracteres para entrega multi-parte, descomponer un artículo largo en fragmentos de 280 caracteres para hilos de X/Twitter, fragmentar texto para ventanas de contexto LLM (ej., límites de 4096 tokens vía conteo de palabras), dividir CSV pegado como una sola celda en filas, separar entradas de log concatenadas por delimitador de timestamp, y procesar importaciones masivas donde una entrada representa muchos registros.

¿En qué se diferencia la división por conteo de caracteres de la de palabras y cuál debo usar para SMS o tweets?

El conteo de caracteres divide en fronteras exactas de byte/unidad UTF-16 — el fragmento 3 se detiene en el carácter 480 incluso si cae en medio de una palabra. El conteo de palabras divide en tokens separados por espacios, así 'hola mundo foo' con fragmento 2 da 'hola mundo' + 'foo'. Para SMS (160 caracteres GSM-7 o 70 caracteres UCS-2 para emoji), usa conteo de caracteres para evitar desbordamiento. Para tweets (280 caracteres, pero Twitter cuenta los emoji como 2), el conteo de caracteres funciona pero deberías agregar marcador 'continuado (1/3)' vía Numerar Fragmentos. Para ventanas de contexto LLM (basado en tokens, ~4 caracteres por token en inglés), el conteo de palabras está más cerca de la realidad.

¿La división por oraciones maneja correctamente abreviaturas como 'Dr.' y 'Sr.'?

Parcial — el regex usa una heurística que divide en '. ', '! ' o '? ' seguido de mayúscula. Esto maneja correctamente la mayoría de prosa pero divide mal en 'Dr. Smith', 'EE.UU.', '3.14 es' y 'Sr. Brown dijo'. Para segmentación de oraciones de grado investigativo usa una herramienta NLP dedicada (spaCy, NLTK o tokenizers de HuggingFace). Para división casual de posts de blog, artículos o transcripciones la heurística funciona ~95% del tiempo. Si tienes un patrón de abreviatura conocido, reemplázalo con un placeholder primero ('Dr.' → 'Dr@') usando Reemplazar Palabras, divide y luego restaura.

¿Qué considera la división por párrafos como salto de párrafo?

Una o más líneas vacías (coincidida por regex /\n\s*\n+/) actúa como frontera de párrafo. Así 'párrafo uno\n\npárrafo dos' da dos fragmentos. Saltos de línea simples dentro de un párrafo se preservan como parte del mismo fragmento. Esto coincide con convención markdown y comportamiento Enter-Enter de Word. Si tu entrada usa '\r\n\r\n' estilo Windows, sigue funcionando porque \r es espacio. Si no tienes líneas en blanco, el modo párrafo devuelve toda la entrada como un fragmento — usa división por conteo de líneas en su lugar.

Dividir Texto — Divide texto por tokens, delimitador, caracteres, palabras, líneas, oración o párrafo. Solapamiento, numerar, recortar y — **Dividir Texto**

¿Puedo usar caracteres especiales como tabulador o salto de línea como delimitador?

Sí — escribe secuencias de escape directamente: \t para tabulador, \n para salto de línea, \r para retorno de carro, \u00A0 para espacio no separable. La herramienta los interpreta en tiempo de parseo. Para una barra invertida literal escribe \\. Para dividir en un patrón regex (no cadena literal), usa primero la herramienta Reemplazar Palabras para sustituir tus coincidencias regex con un marcador único como '@@SPLIT@@', luego divide aquí en '@@SPLIT@@'. Este enfoque de dos pasos da poder regex completo sin complicar la UI del divisor.

¿Qué hace 'Recortar espacios' realmente a fragmentos con espacios internos?

Solo elimina espacios iniciales y finales de cada fragmento, preservando espacios internos. Así 'hola mundo ' se vuelve 'hola mundo' (recortado en los extremos, el doble espacio en medio queda). Esto coincide con String.trim() de JavaScript y str.strip() de Python. Para colapsar también espacios internos, pasa la salida por Limpiador de Texto después. Recortar es particularmente útil con divisiones basadas en delimitador donde un carácter delimitador puede incluir un espacio final (', '), dejando espacios sueltos en los límites del fragmento.

¿Por qué 'Eliminar fragmentos vacíos' puede devolver menos fragmentos de los que espero?

Los fragmentos vacíos surgen cuando los delimitadores aparecen consecutivos (',,' da '', '' entre ellos), cuando la entrada empieza o termina con un delimitador (',a,b' da '', 'a', 'b') o cuando el modo de tamaño fijo cae en límites exactamente vacíos. Con Eliminar Vacíos activado, el filtro descarta todos los fragmentos de longitud cero antes de la salida. Si quieres preservarlos (ej., representando columnas CSV faltantes donde vacío significa null), desactiva la opción. El contador Total de Fragmentos muestra el conteo post-filtro, no el conteo de división bruto.

¿La división se realiza en el navegador y mi texto es privado?

Sí, toda división se ejecuta en JavaScript vía String.split() y map/filter de array — sin fetch() al servidor, sin analítica con contenido, sin escritura en localStorage. Abre la pestaña Network de DevTools y pulsa Dividir para verificar cero peticiones salientes. Esto hace la herramienta segura para dividir texto confidencial como documentos internos, PII de clientes, código fuente con lógica propietaria, o borradores pre-publicación bajo embargo. Incluso entradas de 10 MB se dividen del lado cliente en muy por debajo de un segundo.

Ver también

HERRAMIENTAS DE TEXTO65

WUTOOLS