Resolver Problemas Consiga ayuda para problemas específicos con sus proyectos, procesos y tecnologías.

Consejos para crear conjuntos de datos curados para usuarios de BI de autoservicio

Las iniciativas de curación de datos pueden ayudar a racionalizar los procesos de BI al reducir la cantidad de tiempo que los usuarios dedican a localizar y preparar datos. He aquí cuatro consejos para preparar conjuntos de datos.

Una parte clave de cualquier estrategia de autoservicio de inteligencia de negocios (BI) radica en presentar datos a los usuarios en un formato digerible. En muchos casos, esto toma la forma de conjuntos de datos curados creados por los equipos de BI y análisis.

Los usuarios comerciales a menudo no están equipados para encontrar, integrar y preparar datos para su análisis por sí mismos; solo quieren acceder y analizarlo como parte de las operaciones comerciales. La curación de datos para ellos puede simplificar y agilizar el proceso de BI, y puede ser el único enfoque realista en grandes organizaciones con miles de usuarios finales que dependen de los datos de BI para ayudar a impulsar las decisiones de negocios. Pero las iniciativas de curación de datos pueden ir mal si no se planifican y administran adecuadamente.

Debería adoptarse un enfoque doble al crear conjuntos de datos curados para usuarios de BI de autoservicio, dijo Rob Perry, vicepresidente de marketing de productos de ASG Technologies, un proveedor de gestión de servicios de TI. Las organizaciones deben comenzar estableciendo las bases: definir objetivos, combinar datos y audiencias, e instituir un flujo de trabajo de curación que tenga sentido para sus datos y audiencia.

Deben tener cuidado de elegir sus métodos de curación de datos de forma inteligente, así como de proporcionar diversos tipos de datos para garantizar una visión holística. Las fechas de caducidad también deben establecerse para garantizar que la información esté actualizada y sea oportuna.

Una vez que se establece la base, el enfoque puede cambiar al uso de los conjuntos de datos de una manera que agregue valor y permita que aquellos que crean los conjuntos de datos piensen críticamente sobre la información a la que están accediendo y sean selectivos sobre la calidad de la información que están incorporando. "Si bien no todo tiene que ser perfecto, es importante que nada en el conjunto de datos sea un misterio", dijo Perry.

Según los expertos, las organizaciones que crean conjuntos de datos curados deben centrarse en la integración de datos de los sistemas empresariales existentes, en la visualización de los datos, en el cambio de la curación a los usuarios y en una visión integral del ciclo de vida de los datos.

Comenzar con datos en sistemas existentes

La mayoría de las organizaciones tienen muchos sistemas de negocios. Es importante determinar qué puente construir primero cuando se crean conjuntos de datos curados para usuarios de BI de autoservicio. Una vez que se construye el primer puente, una organización puede pasar al siguiente y así sucesivamente hasta que tenga un conjunto de sistemas empresariales completamente interconectados.

Matthew Meigs, director de comunicaciones de marketing en la plataforma de gestión de contenido Nuxeo, dijo que algunas buenas preguntas para guiar esta exploración incluyen:

  • ¿Qué sistemas de negocios son los más utilizados?
  • ¿Qué sistema almacena información que podría beneficiar a más usuarios de los que actualmente pueden acceder?
  • ¿Qué sistema cuesta más administrar y mantener?
  • ¿Qué sistema existente podría beneficiarse del acceso a las tecnologías móviles, en la nube u otras nuevas?

También hay que curar la forma en que se visualizan los datos

La mayoría de los usuarios de BI de autoservicio no son expertos en datos, especialmente cuando se trata de otros departamentos. Una buena estrategia es encontrar herramientas para crear y organizar vistas de conjuntos de datos que puedan ser recogidos por los usuarios a pedido. Esto implica capturar todos los datos que sean factibles, luego extraerlos y cargarlos en almacenes de datos. El equipo de curación puede centrarse entonces en crear una transformación elegante de los datos en vistas organizadas en data marts específicos del tema.

"Las vistas se convierten en el santo grial de la incubación de la introspección", dijo Dave McCandless, vicepresidente de TI en Navis, un proveedor de software para la cadena de suministro de envíos. No permita que los curadores de datos sean los que decidan qué es útil y que repriman las solicitudes de pensamiento fuera de la caja. Los curadores de datos deben estar muy concentrados en maximizar la riqueza de datos disponibles para la organización y no ser filtros sobre cuál es el valor de los datos solicitados, dijo.

Desplazar la curación a los usuarios

Si es factible, una de las mejores prácticas es emplear a sus usuarios de BI para curar sus propios datos, dijo Sean Kandel, cofundador y CTO de Trifacta, un proveedor de herramientas de gestión de datos. Esto traslada la carga de la calidad de los datos a los usuarios y puede ser más eficiente para algunas organizaciones, ya que un pequeño grupo de trabajo de curación de datos se reemplaza con un equipo mucho mayor de usuarios empresariales que tienen una mejor comprensión de los datos y sus requisitos. El departamento de TI todavía puede intervenir para organizar mejor el trabajo para un consumo más amplio. Pero los usuarios de negocios pueden tomar mayor responsabilidad para decidir qué es aceptable, qué es necesario refinar y cuándo pasar al análisis dentro del contexto de su departamento.

Gestionar el ciclo de vida de los datos

La administración de datos, conocida en inglés como data stewardship, es el proceso de administrar el ciclo de vida de los datos, desde la curación hasta la jubilación. Esto implica definir y mantener modelos de datos, documentar los datos, limpiarlos y definir las reglas y políticas. Permite la implementación de procesos de gobernabilidad de datos bien definidos que abarcan varias actividades, incluyendo monitoreo, reconciliación, refinación, deduplicación, limpieza y agregación, para ayudar a entregar datos de calidad a las aplicaciones y usuarios finales.

"Debido a que la gente de la línea de negocios conoce mejor sus datos, deben contribuir a la creación de los conjuntos de datos seleccionados y al gobierno de los datos en general", dijo Isabelle Nuage, directora de marketing de productos para big data en Talend.

A largo plazo, los gerentes de TI tienen la oportunidad de crear un lugar donde todos puedan ir y encontrar sus datos, mientras les permiten colaborar compartiendo comentarios, advertencias, anotaciones y más. Un catálogo de datos bien organizado puede crear una experiencia en la empresa para los usuarios de BI de autoservicio de conjuntos de datos seleccionados similar a la que Wikipedia ha logrado para compartir conocimientos.

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close