Detector de Idioma

Detector de idioma instantáneo en el navegador. Identifica el idioma de cualquier texto con códigos ISO 639-3, puntuaciones y exportación JSON/CSV. Sin subir nada.

¿Tienes comentarios? Reporta errores, sugiere funciones o comparte tus ideas — leemos todos

Acerca del Detector de Idioma

Este Detector de Idioma identifica el idioma de cualquier texto usando franc, un algoritmo estadístico ligero basado en trigramas de caracteres que se ejecuta totalmente en tu navegador. Compara la distribución de las secuencias de tres caracteres (trigramas) de tu texto con perfiles de trigramas de unos 80+ idiomas y devuelve una lista ordenada con puntuaciones de coincidencia normalizadas.

No hay red neuronal, ni descarga de modelo, ni petición al servidor — franc es una librería de JavaScript puro de ~40KB que se carga una vez con la página y funciona al instante y sin conexión. La herramienta devuelve códigos estándar ISO 639-3 (más ISO 639-1 cuando existe), muestra una barra de confianza por candidato y te permite copiar el ranking como JSON o descargarlo como CSV para alimentar tus pipelines de localización y otras herramientas.

¿Cómo funciona este detector de idioma por dentro?

Usa franc, un detector estadístico por trigramas (n-gramas) de caracteres. El texto se divide en secuencias solapadas de tres caracteres y el perfil de frecuencias resultante se compara con perfiles precalculados de cada idioma compatible. Gana el perfil más cercano. Es un método puramente estadístico, sin diccionario — rápido, diminuto y agnóstico del idioma — no una red neuronal ni un modelo de IA. Todo se ejecuta de forma síncrona en tu navegador, sin descargas ni dependencia de WebGPU/WASM.

¿Este detector envía mi texto a algún servidor?

No. franc es una librería de JavaScript puro de ~40KB que se carga una vez con la página y se ejecuta localmente; no hay llamada al servidor ni descarga de modelo al detectar. Puedes comprobarlo abriendo DevTools, yendo a la pestaña Network y confirmando que al pulsar Detectar no sale ninguna petición. Esto hace que la herramienta sea segura para correos confidenciales, borradores, pruebas legales o cualquier contenido privado del que solo necesitas saber el idioma.

¿Qué significa realmente la puntuación de coincidencia / porcentaje de confianza?

franc devuelve una puntuación normalizada entre 0 y 1 para cada candidato, donde 1 es la mejor coincidencia posible y el valor más alto es el idioma más probable. La herramienta lo reetiqueta y lo muestra como porcentaje con una barra — más alto es mejor. El primer resultado es el idioma más probable. Cuando las dos primeras puntuaciones están cercanas (menos de unos 10 puntos), trata el resultado como ambiguo; ocurre con idiomas emparentados como español vs portugués, noruego vs danés o indonesio vs malayo, y con entradas muy cortas.

¿Qué tan corto puede ser mi texto y aún tener detección precisa?

La detección por trigramas necesita suficientes caracteres para formar un perfil estable. franc ignora la entrada más corta que su longitud mínima y devuelve un resultado 'indeterminado', que esta herramienta muestra como un aviso claro en vez de una suposición falsamente segura. Para resultados fiables, pega al menos una frase completa (entre 30 y 100+ caracteres). Cadenas muy cortas, nombres propios o palabras sueltas son ambiguos incluso para humanos y pueden marcarse como indeterminados o con puntuaciones bajas y parejas — así que observa la lista ordenada, no solo la primera opción.

Detector de Idioma — Detector de idioma instantáneo en el navegador. Identifica el idioma de cualquier texto con códigos ISO 639-3, puntuacio — **Detector de Idioma**

¿Por qué los resultados usan códigos ISO 639-3 de tres letras como 'eng' y 'cmn'?

franc identifica los idiomas con ISO 639-3, el estándar de tres letras capaz de nombrar muchos más idiomas que el de dos letras ISO 639-1. Inglés es 'eng', chino mandarín es 'cmn', vietnamita es 'vie'. Cuando existe un equivalente de dos letras ISO 639-1 (en, zh, vi) la herramienta también lo muestra, para que elijas el código que espera tu framework i18n o tu base de datos. El JSON exportado incluye iso639_3 e iso639_1 más el nombre legible, sin necesidad de mapeo manual.

¿Cuántos idiomas admite franc-min aquí?

Esta herramienta carga franc-min, la versión compacta que cubre aproximadamente los 80+ idiomas más comunes (el paquete completo franc admite 400+). Maneja todos los idiomas europeos de uso amplio, CJK (chino, japonés, coreano), árabe, hindi, bengalí, tamil, telugu, tailandés, vietnamita, indonesio, turco, persa, hebreo y muchos idiomas regionales. Cada candidato se devuelve con su código ISO, nombre nativo y puntuación normalizada, para que resuelvas tú los casos ambiguos o mixtos.

¿Puedo exportar el ranking para un pipeline o una hoja de cálculo?

Sí — es la función principal para profesionales. Tras la detección, la herramienta muestra el desglose completo ordenado con barras de confianza y ofrece Copiar JSON y Descargar CSV. El objeto JSON incluye input_length, word_count, una marca de tiempo ISO generated_at y un array detected de {rank, iso639_3, iso639_1, name, score, confidence_pct}. El CSV usa la cabecera rank,iso639_3,iso639_1,name,confidence_pct. Ambos se generan totalmente en el navegador mediante una descarga Blob, así que nada se sube.

¿Por qué a veces confunde chino, japonés y coreano?

La detección CJK es complicada porque los kanji japoneses y los hanzi chinos comparten miles de caracteres, y una frase japonesa corta escrita solo con kanji puede parecerse estadísticamente al chino. Hiragana, katakana y hangul son exclusivos de un solo idioma, por lo que incluso un único carácter inclina franc de forma decisiva hacia el japonés o el coreano. Las entradas más largas y con escritura mixta casi siempre se resuelven bien. En cadenas muy cortas solo en kanji, comprueba si los dos primeros candidatos (cmn vs jpn) están parejos antes de fiarte de la mejor opción.

Ver también

HERRAMIENTAS IA33

WUTOOLS