Los datos se asemejan al oro. Como él, su valor crece con el tiempo; son infinitamente fraccionables, permitiendo transacciones entre las partes de forma práctica y sencilla; y tienen un valor inherente que permite mejorar la posición financiera de quien los posee.
En este libro, los autores se adentran de forma amena —pero no exenta de rigor— en el mundo de los datos para mostrar el cambio de paradigma en el que estamos inmersos. La inteligencia artificial, la robótica, el machine learning y la analítica avanzada son distintas caras del poliedro que, hoy, conforma una economía y una sociedad basada en los datos. Basándose en casos reales, con un doble objetivo: por un lado, mostrar cómo el big data y la ciencia de los datos nos rodean sin que nos demos cuenta y, por otro, comprobar cómo tanto las empresas y las instituciones públicas como los consumidores y ciudadanos mejoran gracias a una toma de decisiones basada en datos.
Dedicatoria Juan Manuel López Zafra.
Dedicatoria Ricardo A. Queralt.
Introducción
Los datos son el petróleo del siglo XXI . La portada de The Economist del 6 de mayo de 2017 certificaba algo que se palpaba en el ambiente empresarial desde hacía unos cuantos años. Jack Ma, el empático fundador de Alibaba, lo corroboraba en 2019. A los que nos dedicamos al mundo de la ciencia de datos no nos produjo sorpresa alguna, pero la mayor parte de la población se plantea dudas acerca de la importancia y, sobre todo, de las aplicaciones e implicaciones que tienen los datos y los sistemas de tratamiento en su vida diaria.
Un par de años antes de la portada de The Economist, el Real Madrid se enfrentaba a una situación delicada. Su carismático defensa central y capitán, Sergio Ramos, negociaba la renovación con el club. Se manejaban cifras muy importantes, se hablaba de diez millones de euros. Nosotros llevábamos varios años compartiendo despacho y cocacolas en CUNEF y trabajando datos de todo tipo. Mientras nosotros discutíamos sobre la bondad del suavizado de una serie temporal y charlábamos sobre la última librería de R para análisis clúster,
Por entonces, todo era big data. Decidimos entonces promover un máster en ciencia de datos para cubrir una necesidad creciente en el mercado. Tuvimos la enorme suerte de contar con el apoyo de la dirección del CUNEF, y conseguimos elaborar un programa en el que, por fin, quedaban claras las diferencias con el terreno de los arquitectos de sistemas, los auténticos interlocutores del big data. Logramos transmitir la necesidad de formar a los profesionales que darían valor a los datos, los profesionales que no sólo explicarían qué ha pasado, sino por qué ha pasado y que tendrían la capacidad de anticipar los movimientos del mercado.
Hoy, por fin, empieza a distinguirse entre analytics, business intelligence, ciencia de datos y big data. Pero seguimos observando confusión. Durante muchas de nuestras conversaciones con directivos de todo tipo de empresas, hemos comprobado que sigue faltando lo que, pomposamente, denominamos «cultura del dato». Bajo esa expresión integramos todos los aspectos que giran en torno al dato, a las modificaciones corporativas que provoca, a la redistribución de las tareas en el seno de la empresa, a la nueva forma de trabajo de los distintos departamentos, al modo, en fin, de enfocar el proceso de toma de decisiones. Muchas empresas han entendido que el dato es esencial para la transformación, y han empezado a integrar a analistas y científicos de datos en sus plantillas. A pesar de tratarse de una decisión que refleja la voluntad de mejora, desgraciadamente en muchas ocasiones no se logra el resultado esperado por las diferencias culturales entre el equipo directivo y el equipo de científicos de datos. Esas diferencias provienen de la distinta forma de abordar los problemas, y de la absoluta novedad que supone la introducción del método científico en la gestión del cambio. Y se generan, entonces, ineficiencias que pueden dar al traste con el proyecto. Entendimos que resultaba imprescindible incorporar una nueva figura que enlazase el trabajo de unos con las expectativas de otros. Una capa intermedia entre la dirección ejecutiva de la empresa, pegada al negocio, con más conocimiento que nadie en la empresa de qué debe hacerse para lograr los objetivos, y los encargados de la identificación de las palancas del cambio en el océano de los datos. Esa figura es la del data translator, que, más que un traductor de datos en sí, desarrolla la labor, aguas abajo, de comunicar al equipo de ciencia de datos qué deben conseguir, cuáles son sus objetivos, hablando su mismo lenguaje, que no es el de los directivos; y, al mismo tiempo, es capaz de trasladar, aguas arriba, las características de los modelos empleados, el conocimiento adquirido a partir de los datos, empleando un lenguaje que los directivos sean capaces de entender, definiendo y elaborando los KPI para dar respuesta a esa necesidad creciente en las empresas: perfiles con un buen conocimiento del negocio a los que añadir la capa de ciencia de datos sin convertirlos en científicos de datos. Cuadros medios que sean capaces de entender qué hace un científico de datos, que hablen su mismo lenguaje, que conozcan las capacidades de los modelos, así como sus limitaciones, y que puedan trasladar ese conocimiento a sus organizaciones en el proceso de transformación digital.
Una de las primeras consecuencias de no aceptar el cambio de paradigma es la obsolescencia. Como co-CDO, nos permitió entender que muchos de nuestros problemas de imposible resolución ya lo habían sido para otros muchos, lo que nos permitió tomar la distancia adecuada y, sobre todo, enfrentarnos a los retos con una perspectiva distinta, con humildad, entendiendo que no éramos, nunca, los primeros en nada.
Con el ánimo de compartir lo que hemos aprendido a lo largo de todos estos años y de arrojar algo de luz, nos lanzamos a la aventura de tratar de explicar la importancia del dato de un modo sencillo. Llevamos más de veinte años trabajando todos los días con ellos, explicando a nuestros alumnos la necesidad de contar con los datos para adoptar decisiones. Como consultores, nuestros clientes nos retan día tras día, un proyecto tras otro, a resolver muy distintos problemas y, sobre todo, a buscar la forma de destilar valor de los datos que acumulan en sus servidores. Sólo conociendo el potencial de los datos y de los métodos que los transforman hemos podido llegar hasta aquí. Somos actores del cambio, y pretendemos que todos puedan serlo.