Table of Contents

El cotejo de datos es una tarea compleja que depende de tres factores clave: reglas, condiciones y el algoritmo de cotejo de datos adecuado. Hacer una selección incorrecta en cualquiera de estas áreas puede desbaratar tus esfuerzos de cotejo de datos y conducir a resultados inexactos.
Las reglas son un conjunto de condiciones que deben cumplirse para que se produzca una coincidencia.
Las condiciones son requisitos específicos que se colocan dentro de las reglas.
Al realizar una correspondencia de datos, es importante seleccionar cuidadosamente las condiciones adecuadas y colocarlas bajo las reglas correctas.
Esto garantizará que el proceso de correspondencia sea fluido y preciso.
Por ejemplo, puedes crear una regla que exija que los valores de dos columnas sean idénticos.
Ésta sería una buena regla si estás comparando dos listas de nombres de clientes.
Sin embargo, también podrías crear una condición que especifique que los valores de las dos columnas deben estar dentro de un rango determinado.
Esta sería una buena condición para comparar dos listas de edades de clientes.
Seleccionando cuidadosamente las reglas y condiciones adecuadas, puedes mejorar la precisión y eficacia de tus procesos de cotejo de datos.
Entonces, ¿cómo decidir qué normas y condiciones seleccionar?
Aquí tienes algunos consejos de nuestro equipo.
Cómo establecer las normas y condiciones adecuadas
El propósito de las reglas y condiciones es definir los criterios que deben cumplirse para que una coincidencia se considere válida.
Esencialmente, necesitas definir qué atributos de datos conectar para obtener los resultados que deseas.
Para tomar esta decisión, primero tienes que tener en cuenta tres factores:
➡️ La calidad de los datos: Si los datos son de mala calidad, puede que tengas que utilizar reglas y condiciones más indulgentes.
Por ejemplo, si los datos contienen muchas erratas o valores omitidos, puede que primero tengas que limpiar los datos antes de intentar utilizar reglas y condiciones.
Ésta es también una de las razones por las que el módulo de limpieza de WinPure se configura antes que el módulo de coincidencias.
Los resultados precisos de las coincidencias necesitan datos limpios.
➡️ La finalidad del cotejo de datos: ¿Qué intentas conseguir cotejando los datos?
¿Intentas identificar registros duplicados?
¿Intentas crear registros maestros?
La finalidad del cotejo de datos afectará al tipo de reglas y condiciones que debes seleccionar.
➡️ Las normas empresariales: ¿Hay reglas empresariales específicas que deban aplicarse al cotejo de datos?
Por ejemplo, puede que tengas que asegurarte de que el proceso de cotejo de datos cumple la normativa sobre privacidad.
Una vez que tengas una visión clara, puedes seleccionar las condiciones con las que quieres hacer coincidir los datos. En consecuencia, también puedes seleccionar el tipo de algoritmo de correspondencia que mejor se adapte a la condición.
Así que, teniendo en cuenta estos factores, veamos algunos ejemplos:
Ejemplo 1: Hacer coincidir nombres para identificar duplicados en dos archivos
Regla: Hacer coincidir el nombre de la empresa y el nombre del contacto para identificar duplicados de dos archivos. Condición: Para esta coincidencia, seleccionamos las columnas Nombre de la empresa y Nombre del contacto del fichero 1 y del fichero 2.
Coincidencia difusa: Como los nombres son alfabetos, utilizamos como algoritmo la concordancia difusa, con un umbral de similitud del 90%.
Resultado previsto: Los nombres de empresas y contactos que son similares hasta en un 90% son coincidentes y pueden agruparse como duplicados.


Este resultado indica que hay 6 ID que comparten el mismo nombre y dirección en dos archivos diferentes. Del mismo modo, puedes utilizar la misma lógica para identificar direcciones, números de teléfono y otros puntos de datos similares o duplicados. Todo lo que tienes que hacer es decidir qué columnas quieres establecer como condición dentro de la primera regla y dejar que el software haga la coincidencia. También puedes añadir reglas y condiciones adicionales para obtener un resultado de coincidencia más refinado.
Ejemplo 2: Identificar contactos y nombres de empresa con la misma dirección
En este ejemplo, utilizamos el mismo archivo de ejemplo anterior, añadiendo una nueva regla a la configuración de coincidencias. En esta configuración, queremos identificar nombres de empresas y contactos que tengan las mismas direcciones. Para ello, simplemente añadimos una regla a la configuración existente, como se muestra a continuación.

En los resultados, ¡puedes ver que hay contactos que comparten la misma dirección pero tienen nombres de empresa y de contacto diferentes!

Con este resultado, ahora sabes que tienes contactos duplicados en dos fuentes de archivos diferentes, y que la mayoría de ellos también comparten la misma dirección, aunque tengan números, códigos postales o funciones completamente diferentes. Puede que no sean necesariamente datos malos, pero si pretendes utilizar estos datos para análisis, sería una buena práctica analizar estas diferencias y asegurarte de que el contexto de estos datos coincide con el resultado. En este ejemplo, podría tratarse simplemente de una empresa con distintos nombres, perteneciente a distintos propietarios a la vez. O podría tratarse de un mismo lugar que ha tenido diferentes tiendas y propietarios a lo largo del tiempo. Puedes refinar aún más esta búsqueda y elegir diferentes condiciones para eliminar los duplicados ocultos que no son fácilmente visibles.
En conclusión, WinPure ayuda a establecer reglas y condiciones sencillas utilizando un enfoque verdaderamente sin código
Nuestro software facilita a cualquiera la creación y gestión de reglas y condiciones, independientemente de sus conocimientos técnicos. Esto puede ahorrarte horas de esfuerzo de programación, permitiéndote dedicar tiempo donde más se necesita: en el desarrollo estratégico y contextual de tus objetivos de datos. Ofrecemos una prueba gratuita de la demo para que puedas probarnos antes de comprar. La demo incluye todas las funciones del software completo, para que puedas ver por ti mismo lo fácil que es establecer reglas y condiciones y lo eficaces que somos cotejando datos. Te animamos a que pruebes la demostración de WinPure hoy mismo y compruebes por ti mismo cómo podemos ayudarte a establecer reglas y condiciones de forma sencilla utilizando un verdadero enfoque sin código. También puedes reservar una llamada de demostración o descargar una grabación para ver las capacidades de comparación y limpieza de datos del software.
Start Your 30-Day Trial!
Secure desktop tool.
No credit card required.
- Match & deduplicate records
- Clean and standardize data
- Use Entity AI deduplication
- View data patterns
... and much more!

