Desduplicador de Datos
Desduplica CSV y JSON por columnas clave: elimina correos duplicados, coincidencia difusa por espacios y mayúsculas, conserva primera o última. Privado.
Acerca del Desduplicador de Datos
Desduplicador de Datos es una herramienta online potente que identifica y elimina filas duplicadas de archivos CSV y JSON. Elige columnas clave (como correo o ID de cliente), ignora opcionalmente mayúsculas y normaliza los espacios para detectar casi-duplicados que solo difieren por espacios sobrantes, luego decide mantener la primera o última ocurrencia y exporta registros únicos limpios. Todo el procesamiento ocurre localmente en tu navegador, así que incluso listas de correo grandes, exportaciones de CRM y datos confidenciales nunca salen de tu dispositivo.
¿Cómo funciona la detección de duplicados?
La herramienta compara filas basándose en las columnas que seleccionas (columnas clave). Si dos o más filas tienen valores idénticos en todas las columnas seleccionadas, se consideran duplicadas. Puedes elegir comparar todas las columnas o solo específicas, haciéndola flexible para diferentes escenarios de limpieza de datos.
¿Cuál es la diferencia entre mantener primera vs última ocurrencia?
Cuando se encuentran duplicados, puedes elegir qué copia mantener. 'Mantener primera ocurrencia' retiene la primera fila que aparece en el archivo y elimina duplicados subsecuentes. 'Mantener última ocurrencia' guarda el duplicado más reciente y elimina copias anteriores. Útil cuando datos nuevos deben reemplazar entradas antiguas.
¿Están seguros mis datos?
Sí. Todo el procesamiento de desduplicación ocurre localmente en tu navegador usando JavaScript. Tus archivos nunca salen de tu dispositivo, garantizando privacidad completa para conjuntos de datos sensibles como registros de clientes, datos financieros o listas confidenciales.
¿Qué formatos de archivo son compatibles?
Desduplicador de Datos admite archivos CSV (con varios delimitadores: coma, punto y coma, tabulación, barra vertical) y archivos JSON (arreglos de objetos). Ambos formatos pueden desduplicarse y exportarse a formato CSV o JSON después del procesamiento.

¿Puedo ver qué filas eran duplicadas?
Sí. La herramienta proporciona dos vistas separadas: Registros Únicos (filas que se mantendrán) y Registros Duplicados (filas que fueron eliminadas). Esto te permite revisar ambos conjuntos de datos antes de descargar, asegurando que la desduplicación funcionó como esperabas.
¿Qué hace la comparación sensible a mayúsculas?
Cuando está habilitada, 'Manzana' y 'manzana' se tratan como valores diferentes. Cuando está deshabilitada (predeterminado), letras mayúsculas y minúsculas se consideran idénticas. Útil cuando tus datos pueden tener mayúsculas inconsistentes pero quieres tratar entradas similares como duplicadas.
¿Qué hace 'Normalizar espacios antes de comparar'?
Cuando está habilitada, la herramienta recorta los espacios iniciales y finales y une las secuencias de espacios, tabulaciones y saltos de línea internos en un solo espacio antes de comparar. Así ' Juan Pérez ' y 'Juan Pérez', o '[email protected] ' y '[email protected]', se detectan como el mismo registro. Es esencial para exportaciones de CRM, listas de correo y hojas de cálculo, donde los espacios sobrantes son la causa más común de que la desduplicación exacta no detecte duplicados reales. Combínala con la comparación sin distinción de mayúsculas para obtener los resultados más limpios.
¿Qué columnas clave debo elegir para desduplicar correos o CRM?
Para listas de correo, selecciona solo la columna de correo como clave, así los contactos se fusionan cuando coincide la dirección, sin importar nombres o etiquetas diferentes. Para registros de CRM, usa un identificador único estable como el ID de cliente, o una combinación pequeña como correo más teléfono, en lugar de todas las columnas; seleccionar todas las columnas solo elimina filas idénticas en cada campo y dejará duplicados reales que difieren en una sola nota o marca de tiempo. Activar la normalización de espacios y la coincidencia sin mayúsculas en estas columnas clave captura las variaciones típicas de los datos exportados.
¿Maneja archivos grandes y por qué la vista previa se detiene en 100 filas?
Todas las filas de tu archivo se desduplican y el resultado completo se incluye en cada descarga CSV o JSON. Solo la vista previa en pantalla se limita a las primeras 100 filas de cada pestaña para mantener la interfaz rápida y fluida con conjuntos de datos grandes; el conteo que aparece junto a cada pestaña (por ejemplo 'mostrando 100 de 24.500') refleja los totales reales. Ten en cuenta que el Total de filas es igual a las Filas únicas más las Filas duplicadas, así puedes verificar la división de un vistazo antes de exportar.
