¿Alguna vez has tenido que hablar con un representante de servicio al cliente para corregir un detalle personal, como la falta de ortografía en un nombre (por ej.: Michelle en lugar de Michael), un número de calle transpuesto (por ej.: Unidad 1/34, no Unidad 34/1), u otro detalle incorrecto o faltante? Estos son casos en los que la integridad de los datos ha fallado.
Otras consecuencias reales relacionadas con fallos en la integridad de los datos incluyen:
- Dificultad para recuperar fondos de una transacción financiera debido a un error en el número de cuenta.
- Un fallo en el pago móvil debido a un emoji de carita sonriente incrustado.
- Nunca haber recibido un paquete debido a un error en la dirección.
De hecho, las políticas empresariales diseñadas para proteger los datos correctos hacen que corregir errores en los datos sea doloroso. Mientras que las regulaciones gubernamentales para proteger la información personal identificable (PII) hacen que los cambios en los datos de PII después de la inscripción sean difíciles y laboriosos para el cliente. Para evitar afectar la experiencia del cliente como en estos ejemplos, necesitamos una fuerte integridad de los datos.
La integridad de los datos es un proceso de rendimiento empresarial necesario que es vital para contrarrestar los errores que los datos sufren a medida que se inscriben, replican y de otro modo se transcriben a partir de hechos y eventos del mundo real.
A medida que los procesos digitales que las organizaciones usan cada vez más se vuelven impulsados por datos, especialmente a través del uso del aprendizaje automático, la capacidad de tomar decisiones empresariales basadas en datos se ve cada vez más afectada por la integridad de los datos operacionales y analíticos de una organización.
¿Qué es la integridad de los datos?
Integridad significa que los datos pueden ser confiables. En contabilidad, los estándares de reporte de resultados financieros significan que los números reportados en los estados financieros deben ser precisos, completos y consistentes.
Los mismos estándares se aplican a la integridad de los datos. Estos factores se pueden aplicar a los datos para probar su integridad:
- Está completo y no hay elementos de datos faltantes.
- Es preciso sin errores de datos desde la fuente.
- Es consistente en diferentes contextos.
- Es oportuno y está actualizado.
Cuando no se cumplen estas cuatro condiciones, los datos pueden fallar en las medidas de integridad. Muchos de estos problemas no son obvios y a veces solo se descubren a través de fallos en los procesos empresariales o esfuerzos exhaustivos de perfilado de datos.
Incompletitud de los datos
Debido a limitaciones históricas en los sistemas de información, tal vez no todos los datos puedan ser capturados porque faltan campos suficientes. Esto es menos común hoy en día debido a la extensibilidad de los esquemas de datos; sin embargo, puede resultar en datos capturados en el campo incorrecto (clasificación incorrecta) o condensados en un campo cuando se requieren más.
Aunque muchos sistemas tienen campos obligatorios, demasiados campos obligatorios ralentizan los procesos de inscripción de clientes. Esta elección empresarial también puede resultar en datos incompletos.
Inexactitud de los datos
Muchos tipos de datos consisten en largas cadenas de números que son propensas al error humano. Además, los errores ortográficos o el uso de caracteres extraños que necesitan ser limpiados en los esfuerzos de manipulación de datos posteriores afectan la usabilidad de los datos.
Los campos derivados o inferidos que tienen errores en la lógica empresarial también afectan la precisión. Los sistemas antiguos que solo soportan géneros masculino/femenino también son problemáticos. La inexactitud de los datos (y la incompletitud) a veces se puede reparar mediante la coincidencia retrospectiva de datos contra una fuente autorizada.
Inconsistencia de los datos
Otro tipo de problema de integridad de los datos es la inconsistencia entre el hecho natural y los procesos empresariales que transcriben esos hechos verdaderos en los almacenes de datos corporativos y registros dentro y entre organizaciones. O, inconsistencia entre un sistema de registro y un sistema secundario que tiene copias de esos datos — convirtiéndose en sí mismo en una fuente de verdad, resultando en dos fuentes autorizadas que son inconsistentes.
Desactualización de los datos
Si los datos son completos, precisos y consistentes, aún puede haber un problema con la integridad. Esto puede suceder cuando se usa la fecha de emisión de una factura en lugar de la fecha del pedido, que es la fecha contratada. Por eso también los procesos de contacto con clientes constantemente reconfirman los datos maestros clave de los clientes.
Inautenticidad de los datos
Aunque no necesariamente relevante para los datos contables, con los datos de PII en particular, también debemos tener cuidado de que la identidad del cliente sea auténtica, especialmente en la inscripción. Con el aumento del phishing y el spoofing, las empresas deben esforzarse por asegurar que los datos de identidad de los clientes sean precisos y completos desde el primer momento.
Un tipo de datos inauténticos que existe en los sistemas de producción es el dato de prueba. Aunque las mejores prácticas sugieren que no debe haber datos de prueba en los sistemas de producción, rara vez es el caso, ya que los operadores se ven obligados a realizar pruebas en producción para cambios en el negocio.
La importancia del origen de los datos para la integridad de los datos
Los procesos empresariales que refuerzan o degradan el origen de los datos son igualmente importantes para nutrir junto con los procesos empresariales que aumentan los ingresos o reducen los costos para una organización.
El origen de los datos es realmente importante para asegurar que el origen y lo que ha pasado con los datos durante su replicación y otros cambios (la genealogía) no se corrompa o de otro modo se rompa. También no solo es el dato sino la definición del dato (metadatos) que debe permanecer tan consistente como sea posible.
Muchas organizaciones tienen una inscripción robusta de hechos. Las industrias menos reguladas pueden optar por priorizar la velocidad de inscripción sobre la captura exhaustiva de detalles del cliente (afectando la completitud). El impacto de datos faltantes o inconsistentes en los procesos posteriores es que la capacidad de maximizar el valor de esa relación, por ejemplo, con campañas de marketing altamente personalizadas, está limitada, y las tasas de conversión permanecen bajas porque no son lo suficientemente adhesivas debido a datos faltantes.
Para que los datos empresariales sean de máxima efectividad en un intercambio de valor entre procesos empresariales, los datos críticos necesitan ser completos, precisos y consistentes con el hecho y evento verdadero (o natural), y también a través de los almacenes de datos relevantes dentro de los límites empresariales de una organización. La integridad de los datos a través de esos hechos y eventos para el mundo exterior para fines regulatorios y de cumplimiento también es crítica.