Contador de Caracteres

Contador en tiempo real de caracteres, palabras, líneas, párrafos y oraciones. Caracteres sin espacios, tokens LLM, título/meta SEO, límite de Twitter y SMS.

¿Tienes comentarios? Reporta errores, sugiere funciones o comparte tus ideas — leemos todos

Acerca de la Herramienta Contador de Caracteres

Contar caracteres parece trivial — pero "¿cuántos caracteres tiene este texto?" admite cuatro respuestas legítimas según la capa que consultes: bytes (octetos UTF-8, lo que cobra el almacenamiento en la nube), unidades de código (trozos UTF-16, lo que devuelve str.length de JavaScript y el límite de SQL Server NVARCHAR), codepoints (caracteres Unicode, lo que produce la iteración de cadenas en Python 3 y JS moderno) o grafemas (lo que las personas perciben como un carácter). Las cuatro pueden diferir mucho — el emoji familiar 👨‍👩‍👧‍👦 es 1 grafema pero 7 codepoints, 11 unidades UTF-16 y 25 bytes UTF-8. Este contador reporta grafemas, así el número coincide con lo que ves en pantalla, y por separado expone palabras, líneas, párrafos y oraciones con detección de fronteras Unicode (UAX #29). Como los límites de cada plataforma son específicos por capa — Twitter/X cuenta CJK como 2, los SMS GSM-7 empaquetan 160 ASCII en 140 bytes y caen a 70 en cuanto aparece un emoji (UCS-2), los títulos SEO se miden en píxeles (~580 px) no en caracteres, y los tokenizadores de LLM promedian ~4 caracteres por token en inglés pero 1-2 en español por las tildes — usa este contador para redactar y valida en el contador oficial de cada plataforma antes de publicar. El conteo corre localmente con un debounce de 300 ms; nada se sube. Ver también nuestro Convertidor de Mayúsculas y el Generador Lorem Ipsum.

¿Por qué difieren los conteos de caracteres entre esta herramienta, Microsoft Word y Twitter?

Diferentes plataformas cuentan caracteres usando reglas distintas. Esta herramienta cuenta cada codepoint Unicode, tratando cada glifo visible como una unidad. "Caracteres" de Microsoft Word reporta dos números — con y sin espacios — y puede excluir notas al pie por defecto. Twitter/X es el más complejo: cuenta URLs como 23 caracteres independientemente de la longitud real (envoltura de enlace), cuenta la mayoría de emojis como 2 caracteres, trata los rangos Han/Hangul/Hiragana como 2 caracteres cada uno, y aplica una fórmula ponderada en su API. Para mantenerte seguro bajo los límites de plataforma, siempre cuenta usando el contador oficial de cada plataforma para validación final; esta herramienta es para redacción general y es conservadora.

¿Cómo se cuentan emojis, letras acentuadas y caracteres combinantes?

El conteo ingenuo de caracteres puede dar resultados sorprendentes porque el modelo Unicode subyacente es más complejo que "un carácter = una cuenta." Un emoji simple como 😀 es un codepoint y un carácter percibido — directo. Pero un emoji de familia 👨‍👩‍👧‍👦 técnicamente son cuatro codepoints de emoji unidos por tres zero-width joiners — siete codepoints, un glifo visible. Las letras acentuadas pueden ser un codepoint precompuesto (é, NFC) o dos combinados (e + ́, NFD). Esta herramienta cuenta caracteres percibidos (clusters de grafemas) cuando es posible, así que 👨‍👩‍👧‍👦 lee como 1. La propiedad str.length de JavaScript todavía devuelve conteo de codepoints (a menudo 11 para ese emoji de familia) — diferentes herramientas pueden discrepar por diseño.

¿Cuál es el conteo óptimo de caracteres para etiquetas title y meta descriptions SEO en 2026?

El SERP de Google renderiza títulos en alrededor de 580 píxeles y descripciones en alrededor de 920 píxeles de ancho, no un conteo fijo de caracteres — letras anchas (W, M) ocupan más espacio que estrechas (i, l). Como proxy práctico, apunta a: títulos 50-60 caracteres (móvil trunca antes a 50), descripciones 120-160 caracteres (móvil muestra ~120, escritorio ~160). Google no penaliza texto más largo; solo trunca con puntos suspensivos, lo que puede dañar el CTR. Coloca las palabras más importantes al inicio. Para otras plataformas: títulos Open Graph 60-90, descripciones ~200; tarjetas Twitter 70/200; comparticiones LinkedIn 150 títulos, 250 descripciones.

¿Qué dice WCAG 2.2 sobre el conteo ideal de caracteres por línea para accesibilidad?

El Criterio de Éxito 1.4.8 de WCAG 2.2 (Presentación Visual, Nivel AAA) recomienda una longitud máxima de línea de 80 caracteres (40 para chino, japonés y coreano). La investigación de estudios tipográficos converge en 50-75 caracteres por línea como óptimo para velocidad de lectura y comprensión — líneas más cortas (menos de 40) fuerzan demasiados saltos oculares; líneas más largas (más de 90) hacen que los lectores pierdan posición al volver para iniciar nueva línea. Para texto de cuerpo en web, establece CSS max-width en aproximadamente 65ch (la unidad ch equivale al ancho del carácter 0). Esta herramienta cuenta caracteres totales en todo el texto, no por línea — para verificar conteos por línea, divide por saltos de línea y mide cada substring.

Contador de Caracteres — Contador en tiempo real de caracteres, palabras, líneas, párrafos y oraciones. Caracteres sin espacios, tokens LLM, títu — **Contador de Caracteres**

¿Cómo funcionan los segmentos de SMS y por qué un emoji divide mi texto en múltiples mensajes?

SMS usa dos codificaciones. GSM-7 (por defecto) empaqueta 160 caracteres en un SMS de 140 bytes usando caracteres de 7 bits — funciona para ASCII más acentos básicos (é, à, ñ están bien; otros disparan respaldo). UCS-2 (Unicode) se usa en el momento que aparece cualquier carácter fuera de GSM-7 — incluyendo emojis, comillas curvas, guiones largos o muchos diacríticos vietnamitas — y reduce capacidad a 70 caracteres por segmento. SMS multi-segmento usa 153 (GSM) o 67 (UCS-2) por segmento porque las cabeceras de enrutamiento consumen el resto. Así un mensaje de 100 caracteres con un emoji se vuelve UCS-2 y abarca dos segmentos (140 chars totales facturados como 2 mensajes). Twilio factura por segmento, no por carácter. Quita comillas curvas y emojis para mantener textos en segmentos GSM-7 únicos y ahorrar dinero en SMS masivos.

¿Cuál es la diferencia entre bytes, codepoints, unidades de código y clusters de grafemas?

Estas cuatro capas son la fuente de la mayor confusión sobre conteo de caracteres. Bytes: los octetos crudos en el archivo codificado (UTF-8 usa 1-4 bytes por codepoint). Unidades de código: los trozos de 16 bits en UTF-16 (cadenas JavaScript y Java, API de Windows) — emojis sobre U+FFFF usan 2 unidades de código. Codepoints: caracteres Unicode reales (U+1F600 para 😀) — el iterador de cadena en lenguajes modernos devuelve codepoints. Clusters de grafemas: lo que los humanos perciben como un carácter — 👨‍👩‍👧‍👦 es 1 grafema pero 7 codepoints, 14 unidades de código UTF-16, 25 bytes UTF-8. Esta herramienta reporta el conteo de grafemas percibido por el usuario.

¿Cómo puedo estimar el tiempo de lectura desde conteo de caracteres o palabras para publicaciones de blog?

La velocidad promedio de lectura silenciosa de adultos en español es 220-260 palabras por minuto (WPM); en voz alta es más lenta a 150-160 WPM. El contenido técnico ralentiza lectores a 50-100 WPM. Para estimar tiempo de lectura: divide el conteo de palabras por 240 (predeterminado de Medium para español) y redondea hacia arriba. Para otros: inglés 238, francés 195, portugués 215, vietnamita 180 — los idiomas asiáticos sin espacios se miden en caracteres por minuto (chino ~300 cpm). Las estimaciones basadas en caracteres son útiles cuando los límites de palabra no son claros: divide los caracteres totales (con espacios) por 1.500 para obtener minutos para español. Este contador muestra palabras y caracteres; multiplica o divide para mostrar insignias "5 min de lectura."

¿Cómo se relacionan los conteos de tokens LLM con conteos de caracteres para estimación de costo de prompts?

Los grandes modelos de lenguaje (GPT, Claude, Llama, Gemini) cobran por tokens, no por caracteres. Como regla aproximada para texto inglés, 1 token ≈ 4 caracteres ≈ 0,75 palabras. Así un párrafo de 1.000 caracteres son aproximadamente 250 tokens. Pero esta proporción varía dramáticamente: el código usa menos caracteres por token (~3) porque la sintaxis es densa; el no-inglés usa más caracteres por token porque los tokenizadores BPE fueron entrenados principalmente en inglés. El español promedia ~3 caracteres por token (mejor que vietnamita), pero acentos y ñ aún consumen más. Para presupuestar costos de API con precisión, usa el tokenizador oficial del modelo (tiktoken para OpenAI, anthropic-tokenizer para Claude). Este contador de caracteres da una primera estimación rápida: divide caracteres por 3,5 para prompts cargados de español.