ENTREVISTA.

Luis Reina: "El gobierno del dato no está reñido con la ética"

Entrevista
Foto_Luis Reina_apaisada

Con ocasión del evento Chief Data Officer Day - CDO Day 2022, organizado por iKN Spain, publicamos la entrevista a Luis Reina, Data & AI CTO en IBM Spain, realizada por José Ramón Moratalla y Carlos Porras.

1.- Buenos días Luis, usted interviene como ponente en el evento Chief Data Officer Day. Para aquellos que no estén muy familiarizados con el papel que desempeña el CDO en las compañías ¿cuál considera usted que es su misión en las empresas?

La figura del CDO surge cuando muchas empresas se dan cuenta que los datos son su activo más valioso y que, a su vez, existe un gran descontrol en su gestión. Entonces, para poner orden en lo que yo llamo el caos del dato, surge esta figura íntimamente ligada al gobierno y la calidad del dato.

Un CDO hoy en día tiene una misión muy amplia, aunque su principal papel es establecer la estrategia de los datos de la empresa en sintonía con los objetivos de negocio.

En la actualidad, el objetivo soñado de muchas empresas es ser Data Driven, esto es, empresas dirigidas por los datos, donde cualquier decisión empresarial que tome cualquier empleado sea basándose en los datos y en la analítica de los mismos. Para esto, el CDO debe crear una cultura del dato en la empresa, preocupándose por las personas, proporcionando las herramientas necesarias y comunicando de forma sencilla y fluida las estrategias a seguir. Una de las misiones del CDO, muy relacionada con el mundo legal, es la de asegurar el cumplimiento regulatorio de los datos, tanto a nivel europeo con el Reglamento General de Protección de Datos (GDPR) como en el plano nacional con La Ley Orgánica de Protección de Datos (LOPD).

2.- ¿Considera que en materia de gestión y administración de la Big Data de la que se responsabiliza el CDO, es preferible apostar por un modelo Data Fabric o en su lugar por uno Data Mesh o incluso ambos modelos pueden ser complementarios?

El modelo Data Mesh supone la descentralización del dato, dividiéndolo en dominios según las áreas de negocio y convirtiendo cada dominio de datos en un producto de datos (data product) con un responsable asignado. Para poder implementar, de forma independiente y ágil, estos data products es necesaria una plataforma Data Fabric que proporcione la funcionalidad y las herramientas analíticas necesarias. Por lo tanto, no se puede construir un modelo Data Mesh sin una plataforma Data Fabric. Un buen ejemplo de este tipo de plataformas Data Fabric es IBM Cloud Pak for Data.

Por otro lado, Data Fabric, además de ayudar a construir un modelo Data Mesh, permite implementar otros sistemas de datos como son Data Warehouses o Data Lakes que, en contraposición con Data Mesh, proponen una arquitectura centralizada de los datos. Por lo tanto, Data Fabric puede existir sin un modelo Data Mesh, pero no al contrario. Además, es importante destacar que no todas las empresas necesitan implementar un Data Mesh y esto dependerá de muchos factores como, por ejemplo, la necesidad de una alta escalabilidad.

3.- ¿Qué aconsejaría para hacer más eficaz la labor del CDO en las compañías Data Driven a la hora de generar valor, medir o impactar en la cuenta de resultados?

Una buena analítica lo es sólo si genera un impacto en el negocio. Hoy en día, lo cierto es que las empresas llevan a cabo analíticas de datos que no generan dicho impacto. En este sentido, un CDO debe alinear su estrategia de datos con los objetivos de negocio. Aunque parece obvio, cualquier arquitectura de datos o proyecto analítico debe hacerse empezando por los casos de uso de negocio que resolverá.

Otro gran problema es que los usuarios de los datos muchas veces dudan de la calidad de los mismos y, por consiguiente, no tienen confianza en la analítica. Un buen gobierno, que además sea capaz de indicar la trazabilidad del dato, es fundamental para generar esa confianza.

Desde IBM proporcionamos tecnología que permite medir el impacto de los datos alineando los KPIs técnicos y de negocio. Por ejemplo, para entender cómo la calidad de los modelos de Machine Learning impacta en el incremento en las ventas.

4.- ¿Es preciso dotar de un control ético a las labores del Machine Learning y la analítica avanzada de datos para garantizar un uso corporativo correcto e idóneo de los datos?

Absolutamente, cada vez más muchas de las decisiones empresarias van a ser producidas automáticamente por los sistemas de Inteligencia Artificial y es fundamental implementar un control ético. Hace muchos años que IBM identificó esta necesidad y ha creado herramientas que ayudan a garantizar este control.

Por ejemplo, proporcionamos una herramienta capaz de detectar si un modelo tiene sesgos en sus predicciones de Machine Learning, y que, por ejemplo, perjudica a una etnia frente a otra. Una vez detectado el sesgo, esta herramienta además es capaz de producir un modelo equivalente sin dicho sesgo.

Ocurre también que muchos de los modelos de Machine Learning avanzados actúan como cajas negras, donde no se pueden explicar las decisiones que toman. Por ello, desde IBM proporcionamos una herramienta que monitoriza cada decisión producida y es capaz de explicar en qué variables se basa y cuál es su peso en la decisión.

5.- ¿Hasta qué punto gobernar los datos personales en las organizaciones derivándolos a la creación de una Big Data llega a ser ético al tener que obligar a los usuarios a aceptar los términos y condiciones para que las empresas puedan explotar sus datos? ¿Cómo podríamos trabajar para lograr un Big Data de Datos Personales más ético?

El gobierno del dato no está reñido con la ética, sino todo lo contrario. Gracias al gobierno de dato las empresas van a poder tener mejor control de los tipos de datos que almacenan, establecer reglas y políticas que aseguren las normas éticas, y aplicar de forma ágil normativas. Por ejemplo podrán implementar la regulación acorde al derecho al olvido, donde, gracias al gobierno del dato, se va a poder localizar inmediatamente dónde se guarda información personal para que, en caso de que sea requerido por un individuo, pueda ser eliminada por completo. Otra cosa es almacenar información obtenida de forma poco ética; a este respecto existe una normativa europea muy exigente que pone en guardia a las empresas por las sanciones que puede suponer, pero, además, es necesario concienciar y crear una cultura de ética del dato dentro de la empresa.

6.- Pensando en nuestro público lector compuesto por abogados, asesores, responsables de compliance, CDOs… ¿Qué recomendaría a los profesionales del Dato para que puedan desempeñar su labor profesional de una forma más ética?

Estos profesionales son los mejores conocedores de las normativas existentes y están muy concienciados con la ética del dato, por lo que únicamente haría una recomendación relacionada con el lenguaje de los términos y condiciones que los usuarios tienen que aceptar. En ocasiones, los usuarios finales aceptan estos términos porque se les abruma con documentos largos y complejos que no son capaces de entender, por lo que yo animaría a estos profesionales a hacer más sencillas y transparentes las comunicaciones de este tipo.  Para ello es recomendable utilizar un lenguaje que cualquier usuario pueda entender y recalcar o resumir la información más importante. Esto hará que el almacenamiento y el uso de los datos sea más respetuoso con el usuario.