Cómo vamos a conectar la información de todas las áreas sin tener que cambiar la forma en la que trabajan hoy.
Mismo concepto, diferentes reglas. Esto hace imposible cruzar la información entre las distintas áreas y sistemas de forma automática.
Cómo alineamos a los sistemas, incluso cuando no pueden ser modificados.
Identificamos el concepto (ej. "Afiliación") y definimos la Regla de Oro Global para toda la empresa.
Nuevo Estándar Oficial:
Auditamos la realidad de cada sistema frente a nuestra nueva Regla de Oro para encontrar brechas y desviaciones.
| SiamonMA / CASSIA | ❌ Nombre mal ("Afiliacion") | ✅ Decimales OK |
| Saimon / GS | ✅ Nombre OK ("Location") | ❌ Decimales variables |
Acordamos con los dueños técnicos qué se puede ajustar de raíz y qué requiere apoyo central.
El equipo de TI actualizará el campo a "Location".
El software no permite fijar a 6 decimales de forma nativa.
Lo que no se puede arreglar en el origen (como Saimon/GS), lo transformamos en el cruce central. Luego, implementamos reglas de calidad automatizadas.
Un robot audita los datos diarios y alerta si algún sistema viola el estándar SGRT.
Visibilidad total de la adopción del estándar SGRT. Todos saben en qué confiar.
| Sistema Origen | Dato Crudo Entrante | Alerta de Monitoreo | Acción del Transformador Central |
|---|---|---|---|
| SiamonMA / CASSIA | Location: 8092.123456 | Regla Cumplida | Pasa directo a la analítica. |
| Saimon / GS | Location: 8092.1 | Error: Faltan decimales | Autocompleta ceros: 8092.100000 |
| Nuevo Sistema X | Ubicacion: 8092.123456 | Alerta: Nombre no estándar | Mapea "Ubicacion" hacia "Location" |
Una vez que los datos pasan el filtro de calidad, aterrizan en nuestra bóveda corporativa. Nadie se conecta directo a las fuentes, todos consumen del concentrado global de forma segura.
Solo los datos que cumplen con el Tablero de Salud entran al lago. Mantenemos cero "basura" y cero duplicados en la nube.
El repositorio histórico, escalable y único de la corporación. La única fuente de verdad autorizada para toda la empresa.
Reglas estrictas de acceso (RBAC), enmascaramiento de datos sensibles y trazabilidad total de quién consulta qué dato.
A medida que nuestro Tablero de Salud indique métricas estables (en verde), se irán desbloqueando progresivamente capacidades analíticas que antes eran imposibles.
El Tablero de Salud confirma que los sistemas respetan los términos globales (ej. Location). Tenemos una base sólida.
Desaparecen los cruces manuales en Excel. Generamos Dashboards donde Operaciones y Mantenimiento ven la misma verdad.
Solo sobre datos sanos y estandarizados podemos entrenar modelos predictivos (Machine Learning) confiables para anticipar escenarios.
El principal entregable de esta fase es el Directorio de Datos. Aquí tienes un ejemplo de los 10 primeros términos globales (Reglas de Oro) que definiremos para sincronizar todas las áreas:
| # | Término Global Acordado | Definición y Regla de Calidad |
|---|---|---|
| 01 | Location | Identificador espacial único formateado siempre a 6 decimales. |
| 02 | SLA | Service Level Agreement (Acuerdo de nivel de servicio). Medido en %. |
| 03 | Disponibilidad | Métrica de uptime del activo. Rango válido: 0.00 a 100.00. |
| 04 | SLO | Service Level Objective (Objetivo de nivel de servicio interno). |
| 05 | MTTR | Mean Time To Repair. Medido en horas enteras. |
| 06 | Ticket_ID | Identificador alfanumérico único para incidentes reportados. |
| 07 | Estado_Activo | Valores válidos permitidos: [Activo, Mantenimiento, Baja]. |
| 08 | Cliente_UID | Código único de cliente en CRM. Longitud fija de 10 caracteres. |
| 09 | Region_Op | Región operativa estandarizada (Norte, Sur, Centro, Este, Oeste). |
| 10 | Tipo_Falla | Categorización según catálogo maestro centralizado v2.1. |
Este entregable documenta el inventario de todas las fuentes de datos y lista los sesgos o desviaciones que cada sistema presenta frente a nuestro Directorio de Datos corporativo.
| Sistema / Fuente | Dato a Cruzar | Desviación / Sesgo Identificado | Impacto al Cruzar |
|---|---|---|---|
| SiamonMA / CASSIA | Location | Sesgo Semántico: El sistema lo nombra como "Afiliacion" en su base de datos en lugar de "Location". Formato de decimales correcto. | Medio |
| Saimon / GS | Location | Sesgo de Precisión: Trunca los valores de ubicación y maneja decimales variables (no garantiza los 6 decimales estándar). Nombre correcto. | Alto |
| SAP ERP | Cliente_UID | Sesgo de Formato: Usa IDs de solo 8 caracteres y agrega prefijos geográficos (ej. "MX-00123") en lugar de usar los 10 dígitos puros. | Alto |
| Odoo CRM | Estado_Activo | Sesgo de Catálogo: Usa los estados nativos en inglés ("Active", "Archived", "Draft") en lugar de la nomenclatura oficial corporativa en español. | Medio |
| Zendesk (Soporte) | Ticket_ID | Sesgo de Unicidad: Si un incidente entra por chat y por correo, el sistema crea dos Ticket_ID distintos para el mismo problema físico. | Crítico |
Este documento define los acuerdos con cada dueño de sistema. Establece cómo y cuándo se aplicará la corrección para eliminar el sesgo, ya sea desde el sistema origen o mediante reglas en el Data Lake.
| Sistema Objetivo | Sesgo a Mitigar | Acción de Corrección Acordada | Fecha / Periodo |
|---|---|---|---|
| SiamonMA / CASSIA | Campo llamado "Afiliacion" en vez de "Location" |
Cambio en Origen Actualización del esquema de Base de Datos y vistas de consumo de la aplicación. |
Mayo 2026 |
| Saimon / GS | Decimales truncados/variables |
Capa Intermedia (Data Lake) El sistema origen no soporta el cambio. Se creará una regla ETL que estandariza forzosamente a 6 decimales en la ingesta. |
Q2 2026 |
| SAP ERP | Prefijos en Cliente_UID (MX-00123) |
Capa Intermedia (Data Lake) Desarrollo de pipeline de limpieza para extraer (Regex) los 10 dígitos puros antes de consolidar el Golden Record. |
Q3 2026 |
| Odoo CRM | Estados en inglés (Active, Draft) |
Cambio en Origen El administrador del CRM actualizará el diccionario de datos nativo a la nomenclatura corporativa. |
Agosto 2026 |
| Zendesk | Duplicidad de Ticket_ID |
Motor MDM Implementación de reglas de desduplicación basadas en ID_Posicion y Timestamp para consolidar un Master Ticket. |
Q4 2026 |