sábado 21 de marzo de 2009

Administración de Metadata

Cuando implementamos soluciones de BI una parte de los proyectos probablemente consistirá en traspasar aquellos informes y definiciones de gestión más importantes y de valor que cada departamento mantiene en forma independiente en otros formatos y plataformas. De esta manera la plataforma de BI integrará la información hasta ahora dispersa por toda la organización, y se convertirá en datos e información común a todas las áreas y departamentos. Sin duda hay que dedicar un importante esfuerzo en conciliar las definiciones e indicadores departamentales y usar todos los apellidos necesarios para clarificar el significado de cada uno, esto para conseguir una sola versión de la verdad; me refiero con apellidos a por ejemplo si las ventas para marketing consideran sólo las ventas percibidas por campañas publicitarias entonces el indicador podría llamarse Ventas por Campañas Publicitarias y no Ventas a secas ya que provoca confusión para las demás áreas, tampoco sería claro llamarlo Ventas Marketing ya que esto da una vaga impresión de su definición y requiriríamos leer su definición para entenderla, el apellido sería por Campañas Publicitarias lo cual nos da un mejor entendimiento de los datos que estamos revisando.

La metadata, definida en forma simple como "los datos acerca de los datos que no son los mismos datos", debe estar disponible para los usuarios de los sistemas de información ya sea en un repositorio de metadata o en un catálogo de las soluciones. No deberíamos tener un repositorio por solución sino un repositorio para todas nuestras soluciones, este es el componente de integración e integridad de los datos que aporta business intelligence, la ventaja de poder unificar la información que la organización necesita.

Primero debemos estar de acuerdo con las fuentes de los datos, estas se pueden mantener automática o manualmente pero debemos asegurarnos de que sean las primeras que registren los cambios o las nuevas inserciones para así asegurar la actualización de nuestros modelos de información además las fuentes deben ser estables, debe ser basados en sistemas usados y que su precisión sea ampliamente aceptada por la organización (esto nos asegura la precisión de los datos), no se gana mucho basándo todo nuestro excelente modelo analítico en inputs manuales que se realicen una vez al mes con desfase de hasta 4 semanas en la información.

Un punto deseable es presentar el historial de cambios en la metadata, esto permite conocer la historia, asímismo si deseamos conocer el modelo de análisis del año pasado no queremos hacerlo con las definiciones actuales, necesitamos versionar la metadata.

Un mismo nombre no puede tener dos definiciones distintas y una definición no puede tener dos nombres distintos. Por ejemplo no podemos tener dos cubos sobre procesos, diferentes que en las medidas tengan el mismo nombre pero entreguen valores distintos si se cruzan con la misma dimensión.

Existen varias arquitecturas para asegurar el flujo de la metadata, pero con estos tips expresados en este post podemos construir o implementar algo que aporte valor a nuestras soluciones de business intelligence.

Como consejo final para los procesos de ETL, transformar los datos lo menos posible y a la vez dar la mayor la flexibilidad de análisis posible, esto permite la escalabilidad de las soluciones. Esto significa filtrar lo menos posible los datos pero entregar la capacidad de filtro, hacer las fórmulas e indicadores independientes del dato real y mostrar siempre ambos, si se requiere un criterio específico para realizar análisis entonces agregar la medida o dimensión con el criterio independiente de los datos reales, sólo si es común a toda la organización dejarlo como única fuente disponible de análisis.

Si tienes cualquier consulta o duda sobre Business Intelligence, DWH, PM, DM, BA, BAM o te interesaría que hablara sobre un tema en particular sólo escribe a darenasc@businessanalytics.cl y aparecerá en la sección de consultas.