Las empresas están ahogadas en datos de clientes, la mayoría de ellos duplicados y dispersos en múltiples fuentes de datos. Un cliente puede tener cinco variaciones diferentes de nombre, direcciones de correo electrónico, direcciones físicas y números de teléfono. Estas variaciones pueden darse dentro de una misma plataforma, como un CRM, o en plataformas de terceros conectadas a la organización. ¿Cómo consolida una empresa todas estas variaciones para demostrar que pertenecen a un solo individuo? Mediante la ciencia de la resolución de identidades. En pocas palabras, la resolución de identidades es una forma de averiguar quiénes son las personas, qué les gusta, cómo están vinculadas a la empresa y, lo que es más importante, ¿se trata de una identidad robada? ¿Es la identidad de un estafador o un defraudador? ¿Están en alguna lista de delincuentes, sancionados o prohibidos? Todas estas preguntas se responden mediante el proceso de resolución de identidad.

RESOLUCIÓN DE IDENTIDAD BREVEMENTE EXPLICADA

El proceso técnico de resolución de identidades es el proceso de tomar conjuntos de datos de distintas fuentes y combinarlos en un único repositorio unificado para cumplir fines como: la gestión de datos maestros, la creación de vistas singulares de los clientes y la mejora de la calidad de los datos/información. Esto implica el uso de algoritmos como el procesamiento del lenguaje natural (PLN) u otras tecnologías avanzadas de cotejo para buscar patrones en los datos que puedan utilizarse para cotejar registros. La resolución de identidades sirve tanto a fines funcionales como empresariales. En el sentido funcional, la resolución de identidades se encuentra en el corazón de la gestión de datos maestros y la calidad de los datos. Con acceso a datos precisos y fiables, las empresas pueden tomar decisiones más perspicaces y seguras, lo que sirve al propósito empresarial de la resolución de identidades. En un mundo impulsado por los datos, en el que las empresas tienen una plétora de fuentes de datos, desde bases de datos de clientes a sistemas CRM, medios sociales y datos basados en la web, datos de terceros, etc., la resolución de identidades es la necesidad del momento.

EL PROCESO EN TRES ETAPAS DE LA RESOLUCIÓN DE LA IDENTIDAD

Para un conjunto de datos determinado, la resolución de identidades es un proceso de tres etapas. 1). Perfilado de datos: El primer paso en la resolución de identidades es el descubrimiento, revisión y limpieza de tu conjunto de datos. Esto implica identificar los errores que afectan a los datos, como problemas de normalización, datos corruptos o ruidosos, obsoletos o sucios. Una vez identificados los errores, los datos pasan por un proceso de tratamiento que implica limpiarlos, establecer reglas para normalizarlos (como utilizar DD/MM/AAAA como formato de fecha en lugar de DD/MM/AA). Una vez que tienes una copia limpia de los datos, pasas a la siguiente fase. 2). Cotejo de datos : La segunda etapa consiste en utilizar modelos probabilísticos para cotejar y vincular los datos. Esto incluye utilizar algoritmos de lógica difusa para identificar posibles coincidencias basadas en puntuaciones de similitud de atributos, como nombres, números y cualquier otra referencia/identificador único.

3).
Data consolidation:
La última etapa es la creación de un registro maestro final mediante la consolidación de datos. Una vez identificadas las coincidencias y tratados los duplicados, los datos se consolidan para formar la única fuente de verdad, término que designa los datos que representan la información más válida, precisa y completa en una sola vista. Al crear registros maestros, evita la tentación de ser perfecto. De forma realista, nunca podrás tener registros unificados al 100%. El objetivo es crear registros que respalden los casos de uso de tu organización, ni más ni menos. La resolución de identidades permite a las empresas comprender mejor a sus clientes a lo largo de su ciclo de vida, proporcionándoles una visión holística de sus identidades y actividades.

RESOLUCIÓN DE IDENTIDADES MEDIANTE LAS FUNCIONES DE PERFILADO Y CORRESPONDENCIA DE DATOS DE WINPURE

Antes de que existiera la tecnología de resolución de identidades, las organizaciones recurrían a métodos manuales para identificar a los clientes. Este enfoque solía implicar la recopilación de información limitada, como el nombre y el número de teléfono, a partir de formularios de contacto, y la búsqueda manual en los registros de clientes. El proceso llevaba mucho tiempo y era propenso a errores debido a las incoherencias de los datos de los clientes en múltiples fuentes. Era difícil obtener una visión fiable y unificada del cliente. Incluso cuando se desarrolló la tecnología de resolución de identidades, los profesionales aún tenían que tener conocimientos de programación y codificación para crear y probar algoritmos de correspondencia probabilística. Aunque esto reducía el proceso manual, no era capaz de manejar estructuras de datos complejas procedentes de fuentes basadas en Internet, como formularios web, formularios de redes sociales y software de terceros. Para adaptarse a las estructuras de datos modernas, los profesionales necesitan tecnologías que les permitan limpiar, cotejar y consolidar los datos en función de:

  1. Facilidad de uso
  2. Precisión del partido
  3. Capacidad para elaborar perfiles en profundidad
  4. Escalabilidad y personalización
  5. Asequibilidad y fácil integración

La solución WinPure Clean & Match cumple los cinco requisitos con la flexibilidad adicional de un módulo API que permite a los desarrolladores integrarse fácil y rápidamente con distintos sistemas y tratar, cotejar y consolidar datos con el mínimo esfuerzo. A continuación te explicamos cómo puedes realizar una resolución de identidades utilizando WinPure.

Paso 1: Integración de datos

Conéctate directamente a tu CRM o importa tu archivo CSV. Sea cual sea tu fuente de datos, puedes conectarla fácilmente al panel de control de WinPure para una revisión manual. También puedes revisar varios conjuntos de datos a la vez dentro del panel de control.

Paso 2: Perfilado de datos

Identifica valores incoherentes, comprueba si falta información, revisa los duplicados y establece tus propias reglas de normalización con la función de perfilado de datos de la herramienta.

Paso 3: Limpieza de datos

¿Quieres que todas tus fechas sigan una norma establecida? ¿Necesitas eliminar caracteres extraños de los campos de texto? No necesitas ejecutar scripts para eso. Puedes utilizar fácilmente las funciones de limpieza de datos de WinPure para eliminar los datos sucios con sólo unos clics.

Paso 4: Eliminar duplicados

Puedes definir criterios personalizados de coincidencia de datos que se utilizarán para determinar si dos registros se consideran duplicados. Esto podría incluir la comprobación de nombres idénticos, correos electrónicos, números de teléfono, etc., o atributos más complejos como direcciones (que pueden requerir mirar nombres de calles similares). La deduplicación de datos es fundamental para la resolución de identidades, porque si tienes varios registros de un cliente, no estás «resolviendo» una identidad.

Paso 5: Coincidencia de datos

La concordancia exacta, determinista y difusa, y el algoritmo patentado de WinPure se utilizan para buscar similitudes entre cadenas de texto o números e identificar vínculos entre registros de distintos conjuntos de datos, incluso cuando no coinciden exactamente en determinados criterios, como la ortografía o la puntuación.

Paso 6: Consolidación

El proceso de consolidación consiste en combinar varios registros fuente en un registro maestro. Esto puede hacerse tomando atributos de cada registro fuente, analizándolos y seleccionando el atributo más preciso para el registro maestro. El atributo seleccionado puede utilizarse entonces para eliminar duplicados y crear un único registro maestro con toda la información deseada incluida. Por término medio, los desarrolladores y analistas de datos pueden dedicar entre 100 y 200 horas simplemente a perfilar los datos y resolver los duplicados. La cantidad exacta de tiempo depende de la complejidad y el tipo de datos que se utilicen, así como de los procesos y tecnologías implementados para la IR. Por ejemplo, las soluciones más manuales, como la revisión humana o el cotejo de documentos, llevarán más tiempo que las soluciones de cotejo de datos. Con tareas como la normalización de datos, el proceso puede alargarse hasta semanas.

VENTAJAS DE UTILIZAR UNA SOLUCIÓN DE CONCORDANCIA DE DATOS PARA LA RESOLUCIÓN DE IDENTIDADES

Una solución de cotejo de datos es un software completo que permite incluso a usuarios no técnicos (también conocidos como usuarios empresariales) consolidar registros. Esto es especialmente importante para los usuarios de marketing que tienen que lidiar constantemente con las variaciones y complejidades de los datos de los clientes. Con una solución como WinPure, estos usuarios ya no tienen que depender de los equipos informáticos o de datos para tratar o consolidar sus datos. Otras ventajas de utilizar una solución automatizada para la resolución de identidades frente a las soluciones manuales son:

Mayor exactitud y precisión en el proceso de emparejamiento. Como las soluciones de cotejo de datos utilizan una combinación de algoritmos de cotejo, las herramientas pueden detectar errores en los que los humanos no piensan o no tienen en cuenta cuando revisan los registros manualmente. Además, la detección de errores es eficaz y precisa. Con el tiempo, los usuarios también pueden alimentar la herramienta con errores específicos que deben vigilar, simplemente escribiendo excepciones. No se necesita codificación para operaciones complejas.

Escalabilidad y agilidad mejoradas. Una solución de cotejo de datos puede reducir el tiempo necesario para procesar grandes cantidades de datos, ya que está automatizada. Esto permite a los equipos disponer del tiempo que necesitan para resolver cuestiones críticas, como la verificación humana de datos sospechosos. A su vez, esto permite a las organizaciones responder rápidamente a las actividades fraudulentas y protegerse contra las infracciones de sanciones.

Menores costes asociados al procesamiento de datos. Las soluciones automatizadas de cotejo de datos suelen ser más rentables que los enfoques manuales, ya que requieren menos mano de obra y menos recursos en general. En una época en la que los datos son petróleo, las empresas sencillamente no pueden permitirse el lujo de perder más tiempo en procesos manuales que bien pueden resolverse con soluciones automatizadas.

DESAFÍOS CON LA RESOLUCIÓN DE IDENTIDAD A TENER EN CUENTA

Como todas las estrategias e iniciativas de gestión de datos, la resolución de identidades es bastante compleja y conlleva su conjunto de retos. A lo largo de los años, en los que hemos ayudado a docenas de clientes con la resolución de identidades, algunos de los retos clave que recomendamos tener en cuenta son: 1 . Fuentes de datos incoherentes: Una organización media está conectada a unas 400 fuentes de datos, lo que hace difícil diferenciar entre información precisa y puntos de datos obsoletos o contradictorios. Un ejemplo sencillo: El nombre oficial de un cliente es John Smith, pero su nombre en las redes sociales o por correo electrónico podría ser Johnny Smith. Este tipo de incoherencia se convierte en un reto para identificar, por lo que las empresas deben crear procesos de gobernanza de datos para garantizar la credibilidad y exactitud de los datos.

2 .
Poor data quality:
Una de las razones por las que se recomiendan las soluciones de limpieza de datos es para hacer frente a los abrumadores retos que plantea la mala calidad de los datos. Los perfiles de clientes inexactos o incompletos son especialmente problemáticos porque pueden dar lugar a una identificación errónea o al acceso ilegal a datos confidenciales. Peor aún, también podría dar lugar a demandas judiciales contra la organización. Si los datos de una empresa están sucios, duplicados y desconectados, no será posible resolver la identidad antes de mejorar la calidad de los datos. 3 . Falta de normalización: Otro reto asociado a la resolución de identidades es la falta de estandarización entre los distintos tipos de fuentes de datos de clientes (por ejemplo, cuentas de redes sociales frente a correos electrónicos). Esto dificulta a las organizaciones vincular diferentes conjuntos de datos de clientes en una vista unificada, ya que cada fuente puede tener su propio formato para almacenar información sobre los clientes. Para superar este problema, las organizaciones deben buscar el aprovechamiento de tecnologías como los algoritmos de coincidencia difusa, que pueden reconocer valores similares pero no exactos en múltiples fuentes y fusionarlos en un registro para crear una visión unificada de la presencia online de cada cliente.

4 .
Scalability limitations:
Otro reto común es la escalabilidad; a medida que se añaden o actualizan más fuentes de datos con el tiempo, la resolución de identidades se convierte en un reto.
Una forma en que las organizaciones pueden manejar este problema es utilizando sistemas de procesamiento distribuido, dividiendo las tareas en pequeños casos de uso en lugar de intentar lograr la resolución de identidades a nivel organizativo.

5 . Complexity: El último reto importante asociado a la resolución de identidades es la complejidad; muchas veces simplemente hay demasiadas variables implicadas o relaciones entre entidades que son difíciles, si no imposibles, de analizar con precisión o rapidez por los humanos solos sin la ayuda de la automatización o de herramientas de correspondencia. Estos modelos y herramientas pueden encontrar rápidamente patrones dentro de grandes conjuntos de datos, incluso si esos patrones fueran de otro modo difíciles, si no imposibles, de identificar por los humanos solos. La resolución de identidades y entidades es una parte esencial de las empresas de hoy en día, pero hay que abordar los retos que conlleva antes de que las organizaciones puedan iniciar una estrategia de resolución con éxito.

CASOS DE USO EMPRESARIAL PARA LA RESOLUCIÓN DE IDENTIDADES

Las empresas adoptan cada vez más la resolución de identidades como una poderosa herramienta para construir y mantener relaciones con los clientes. De hecho, según una encuesta de 2019, el 84% de las organizaciones afirman que están utilizando la resolución de identidades para ayudar a automatizar procesos, reducir costes y mejorar la experiencia del cliente. Las cuatro áreas en las que se necesita la resolución de identidades incluyen: Marketing: La resolución de identidades es la que más beneficia a los departamentos de marketing. También es una de las más difíciles. Con datos de clientes procedentes de múltiples fuentes, como redes sociales, formularios web, correos electrónicos e integraciones de terceros, la resolución de identidades es CRÍTICA para los departamentos de marketing. Un informe de Forrester afirma que la resolución de identidades es un esfuerzo estratégico en marketing. Atención al cliente: La resolución de identidad puede utilizarse para garantizar que los clientes son reconocidos de forma coherente cuando utilizan varios canales de contacto, como el correo electrónico, el número de teléfono y las redes sociales. Esto ayuda al personal de atención al cliente a identificar rápidamente a sus clientes para proporcionarles una asistencia personalizada y eficiente. Gestión de riesgos: Al utilizar la resolución de identidades, las organizaciones pueden detectar posibles fraudes u otras actividades sospechosas cruzando la información de los clientes con bases de datos de actores fraudulentos conocidos. Esto puede ayudar a proteger a la organización de pérdidas financieras debidas a actividades maliciosas. Ventas: La resolución de identidades permite a los equipos de ventas identificar rápidamente los clientes potenciales y dirigirse a ellos de forma más eficaz basándose en los datos existentes asociados a ellos. Esto garantiza que los representantes de ventas dispongan de todos los detalles necesarios sobre un cliente potencial concreto antes de realizar intentos de contacto, lo que aumenta las tasas de conversión a lo largo del tiempo. Gestión de datos: Las organizaciones a menudo necesitan recopilar datos personales para hacer negocios, pero deben cumplir la normativa gubernamental que regula el tratamiento de esta información. La resolución de identidades ayuda a las organizaciones a garantizar el cumplimiento permitiéndoles hacer un seguimiento de cómo se recopilan, almacenan y comparten los datos interna o externamente. Sanciones y cumplimiento del GDPR: Al utilizar la resolución de identidades, las empresas pueden reducir el riesgo de infringir inadvertidamente las listas de sanciones o el GDPR, asegurándose de que sus datos reflejan información actualizada sobre las personas, como el nombre, la dirección, el número de teléfono, etc., y de que se examinan las identidades duplicadas. Además, las soluciones automatizadas de resolución de identidades pueden detectar rápidamente cualquier cambio en los registros que pueda infringir las políticas o normativas vigentes.

PARA CONCLUIR

La resolución de identidades es un proceso importante para las organizaciones, que les permite identificar con precisión a las personas y los datos asociados a ellas. Esto puede ayudar con:

  • Mejorar la experiencia del cliente en múltiples puntos de contacto.
  • Mejorar las actividades de marketing y publicidad con actividades específicas.
  • Mejorar la precisión de los análisis para conocer mejor el comportamiento, las preferencias y los intereses de los clientes.
  • Reducir el fraude verificando las identidades con fuentes fiables.
  • Mejorar la seguridad mediante procesos de identificación más precisos.
  • Aumentar la eficacia de las operaciones automatizando las comprobaciones de identidad y reduciendo la intervención manual.

Author

  • : Author

    The WinPure Team shares official updates on our products, features, and company news. From new releases and enhancements to behind-the-scenes developments, this space keeps you informed on how WinPure continues to deliver secure, reliable, and innovative data quality solutions.

Start Your 30-Day Trial!

Secure desktop tool.
No credit card required.

  • Match & deduplicate records
  • Clean and standardize data
  • Use Entity AI deduplication
  • View data patterns

  • ... and much more!
Índice