Entender el ‘big data’: el potencial dormido de los datos

La visita a ideas4all Innovation del físico Antoni Trias Bonet, especialista en este terreno, nos ha servido para despejar incógnitas en torno al big data, dejando las minas a un lado, y observar el gran potencial de una industria en ciernes.

big data y el procesamiento ética de la privacidad en los datosFoto: imelenchon

El big data pone sobre la mesa grandes oportunidades de negocio en múltiples sectores, pero también un volumen enorme de datos de low cost que exige el análisis de ingentes cantidades de información. Y es que la propuesta implica una tarea que para muchos se puede asimilar a enfrentarse a un campo de minas.

En todas las aplicaciones del big data hay una base en común, los datos, variando el trabajo de procesamiento y análisis de los mismos según cuál sea su aplicación práctica. Por ello, puede decirse que los retos a afrontar tienen más que ver con las capacidades humanas que con las tecnológicas.

Como ya hemos mencionado, a día de hoy la tecnología nos permite trabajar con grandes volúmenes de datos en bruto en cuestiones de segundo.

Todo el rastro de nuestras acciones en Internet, desde nuestras preferencias navegando o la hora de acceso a determinados servicios digitales, determina nuestro propia huella o rastro digital que permite a las empresas conocer más sobre nosotros y sobre nuestros intereses.

En ese sentido el big data es, por ejemplo, una potente herramienta para elaborar estudios de mercado, si bien puede entrar en confrontación directa con valores como la privacidad del individuo.

Big data y el dilema ético de tratar con los datos

La separación de lo público de lo privado, o incluso lo íntimo, y la garantía de valores como la libertad o la igualdad son algunas de las líneas rojas que deben respetar quienes trabajan con big data y que asimismo han de ser amparadas por el legislador. Se trata de un esfuerzo encomiable, según Trías Bonet, que debe servir para modular una industria en expansión y con un potencial de desarrollo aún desconocido.

Si por ejemplo la Stasi, la policía política de la RDA, dedicó numerosos años y recursos a recopilar información para crear una enorme base de datos con la que controlar a sus vecinos, a día de hoy esta labor podría efectuarse en cuestión de segundos gracias a la tecnología.

_______________________________________________________________________________________
Según los críticos, el miedo a un ‘Gran Hermano’ orwelliano adquiere vigencia con el big data y abre la puerta a dilemas éticos.
_______________________________________________________________________________________

Por ejemplo, tal como exponía Trías Bonet; ¿sería ético que un banco rastrease los movimientos financieros de un individuo en Internet para concederle o denegarle un crédito?.

Otros críticos hablan de una posible ‘dictadura de los datos’ al servicio de las élites, que beneficie a las minorías frente a las mayorías. A día de hoy se conocen casos de personas que han pedido a gigantes tecnológicos que borren su rastro en Internet.

Pero más allá de recelos, ¿cómo debemos trabajar con big data? Según Trías Bonet, ante estas incógnitas debe contarse con profesionales del análisis de datos -lo muestra el auge de perfiles como el del científico de datos- y con expertos en la incipiente legislación sobre la materia.

Cómo leer y hacer los datos prácticos

Trabajar con un gran volúmen de información exige de sistemas de procesado que eviten alejarnos del campo de minas del que alerta Trías Bonet. Y para ello, los datos pueden clasificarse en categorías o ‘paquetes’ de análisis, como piezas individuales y más accesibles.

Es lo que se conoce como ‘datification’, aplicable a múltiples campos. Por ejemplo, las palabras pueden reducirse y agruparse en paquetes de sílabas o incluso letras o de una canción pueden extraerse patrones comunes de agrupación a través de la longitud de onda del sonido (microsounds).

En casos como este último, elementos de intoxicación subjetivos, como el estilo personal o la maestría de diferentes intérpretes al versionar una misma canción, pueden dejarse a un lado si el elemento de análisis es la partitura, común para todos los músicos.

La teoría del ‘long tail’: cuando la cola va a la cabeza

Al manejar un alto volumen de datos también debemos cómo seleccionarlos, porque no siempre existe una correlación entre los más numerosos y los más importantes: a veces la verdadera gema se encuentra escondida en los valores menos repetidos.

el long tail nos da pistas sobre cómo aprovechar los datos en el big data

Dicho de una manera más sencilla, a veces despreciamos la ‘cola’ del gráfico (ver arriba) aun cuando la suma de todos sus valores tiene más relevancia que los más comunes o repetidos.

Es lo que se conoce como la teoría del Long Tail (de la larga cola o estela) de Chris Anderson, y que aplicada a una lógica empresarial, permite contraponer los mercados de masas (pocos productos con mucha demanda, pico de la gráfica) a los nichos de mercado, donde conviven  muchos productos con poca demanda que una vez sumados abren la puerta a un mercado mucho mayor.

En conclusión, ¿cómo operar con datos?

De todo lo dicho por Antoni Trías Bonet podemos sacar varias enseñanzas:

Llamada Más que los datos en sí, es importante su lectura, y a ello deberemos destinar la mayor parte de nuestros recursos si trabajamos con big data.

  • Para dicho cometido podremos servirnos de técnicas como las que proporciona la ‘datification’.
  • Otro punto importante es saber qué tiene uno entre manos cuando maneja el big data. En un campo complejo y relativamente nuevo, según Trías Bonet, adquiere especial relevancia contar con asesores legales que nos ayuden en nuestro trabajo.
  • Más personal es el respeto de las líneas que marca la ética. Y en ese sentido el consejo de Trías Bonet es claro: si haces big data, asegura, hazlo con ética y con humildad.

Linkedin Más sobre Antoni Trías Bonet.

Leave a Reply